SharePoint Community Mittelland - GARAIO : Enterprise Search

SharePoint Community
Mittelland
Enterprise Search
21. November 2013

Über mich
Patrick Mäschli
pm@garaio.com
Senior Consultant / Solution Architect
GARAIO AG
www.garaio.com

SharePoint Community
Mittelland

• Plattform für SharePoint Developer, IT Professionals und
Power User im Espace Mittelland
• Offen für alle interessierten Personen (Kunden und Microsoft
Partner)
• Gratis
• Geplant 9 Events / Jahr
• Website: http://ww.sharepointmittelland.ch
• Yammer: http://bit.ly/134JEcq
• XING: http://bit.ly/Xxgjm1
• Kontakt: Roger Haueter, David Schneider und Patrick Mäschli

Suchen, Finden, Suchen,
Finden..

ENDLESS POSSIBILITIES

Enterprise Search
Enterprise Search bzw. Unternehmensweite Suche bezeichnet ein
Teilgebiet von Information Retrieval und bezeichnet den
Vorgang der computergestützten inhaltsorientierten Suche mit
Hilfe einer unternehmensinternen Suchmaschine, welche Content
mittels so genannter Crawler indexiert.

http://de.wikipedia.org/wiki/Enterprise_Search
Verwandte Themen
• Semantische Suche
• Taxonomie
• Big Data

Enterprise Search
•
•
•
•
•
•
•
•
•
•
•
•

Relevanz
Security!
Entity Extraction
Federated Search
Word Stemming / Breaking
Linguistic Support
Alerting
Query Suggestions
Saved Searches
Classification
Enterprise Content Aggregation
Skalierbarkeit

Los geht’s


Definitionen
• Strukturierte Inhalte
Klar definierte Metainformationen, z.Bsp Datenbanken
• Unstrukturierte Inhalte
Eine Sammlung von Informationen wie z.Bsp
Dokumenteninhalte
• Unstrukturierte Suche
Volltextsuche in einem Index
• Strukturierte Suche
Suche nach Metadatum(Author:Arno Meister)

Theorie
• Metadatenkonzept

• Alles gem. Konzept

Praxis
• Metadatenkonzept?

• Keine Grüne Wiese
• Inhalte ausserhalb «kontrolliertem»
Repository / Legacy Systeme

Herausforderungen
• Schlechte Metadaten, schlechte Resultate

• Unzufriedene Benutzer..

Logische Architektur


Content Processing
• Verarbeitet die gecrawlten Inhalte

• Parsing der Inhalte
• Mapping der Properties

• Lingustische Operationen (Entity Extraction)

Entity Extraction


Entity Extraction
Parsing der Inhalte und Mapping auf Termstore

Es stehen 2 Varianten zur Verfügung
• Company Name Extraction
Auslesen der Inhalte und Mapping auf ein Termset
• Custom Extraction
Erstellung eines eigenen Termsets und Mapping auf Refiner

Hands-On I


Company Name Extraction
• Definieren eines Managed Property als «Company Name
Extraction»
z.Bsp Body
• Befüllen eines Termsets mit den zu extrahierenden Namen

• Konfiguration Refiner

Hands-On II


Custom Extraction
• Erstellen eines CSV für das Termset
• Import des Termsets
$searchApp = Get-SPEnterpriseSearchServiceApplication
Import-SPEnterpriseSearchCustomExtractionDictionary –SearchApplication $searchApp –Filename
serverc$folderWordPartExtraction.csv –DictionaryName
Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.3

• Konfiguration Refiner

Wordpart & Co
• Word Extraction
Case-Insensitive, das gesamte Wort muss passen
• Word Part Extraction
Case-Insensitive, der Wortteil muss passen

• Word Exact Extraction
Case-Sensitive, das gesamte Wort muss passen
• Word Part Exact Extraction
Case-Sensitive, der Wortteil muss passen

Fazit
• Strukturiertere Suche mittels Refinements

• Auch auf Fremdinhalten nutzbar (Fileserver, Externes DMS)
• Nicht der Schlüssel zum Glück – Entity Extraction erlaubt
Extraktion auf bestehenden Inhalten, kein «Mehrwert»

Kontext ist King


Kontext ist King
Durch Anreicherung der eigentlichen Inhalte mit Informationen aus
dem Kontext kann der Inhalt *verbessert* werden
• Informationen von übergeordneten Ebenen
• Informationen des Bearbeitenden Benutzers
• Informationen aus einem LOB / Umsystem Z.Bsp SAP / DB /
etc..

Echtes Information Retrieval

Content Enrichment


Content Enrichment
Zur Anreicherung der Index Daten kann der Content Enrichtment
Web Service genutzt werden
Jedes Element welches im Content Processing Schritt durchlaufen
wird, kann ergänzt werden

Einerseits um Kontextinformationen hinzuzufügen, oder um eigene
prozessierungen durchzuführen (Spracherkennung, Erstellung
Vorschaubilder usw)

Content Enrichment
Content Processing

Processed
Item

To
Index

Webservice
Callout

Magic
Code

Content Enrichment

Magic
Code

Content Enrichment: How To
• Webservice erstellen der IContentProcessingEnrichmentService
implementiert.
• In public ProcessedItem ProcessItem(Item item) die
Businesslogik implementieren

• Managed Property erstellen
• Powershell zur Konfiguration des Services aufrufen (Service Endpoint,
Input & Output Property
set-SPEnterpriseSearchContentEnrichmentConfiguration
• Full Crawl

Hands-On III


Content Enrichment
Anreicherungen von Daten in bestehendem Index
Vorteile:
• Suchabfragen sind performant
• Businesslogik kann im Suchprozess abgedeckt werden
• Dadurch *einfache* Integration
• Anreicherung auch Asynchron möglich
• Mit dem Content Search WebPart kann direkt der Index
abgefragt werden
• Ergänzung von Daten durch Umsysteme oder hierarchische
Informationen
Szenarien
• Anreicherung aus Kontext
• Integration von LOB Daten direkt auf dem Element
• Erweitertes processing (Spracherkennung usw)

Fazit
Content Enrichment ermöglicht die Ergänzung und
Anreicherungen des SharePoint Such-Indexes
Im Gegensatz zu Entity Extraction auch mit eigener Logik
Dies erlaubt es, der Suche Zusatzinformationen mitzugeben, um
die Resultate «Intelligenter» zu gestalten!

Bessere Resultate –
Zufriedene Nutzer

Mehr..
REST API
http://msdn.microsoft.com/en-us/library/office/jj163876.aspx
Company Name Extraction
http://technet.microsoft.com/en-us/library/jj591605.aspx

Erstellen eines Custom Entity Extractors
http://technet.microsoft.com/en-us/library/jj219480.aspx
Content Enrichment Webservice Callout
http://msdn.microsoft.com/en-us/library/jj163982.aspx
Conten

WETTBEWERB!
Gutschein für ein gratis eBook von O’Reilly
http://www.sharepointmittelland.ch/

Save the Date
SharePoint Apps Hack Day
SA 30. November 2013, 12.00 Uhr – 18.00 Uhr
isolutions AG, Bern

Danke…


Kontaktperson
Patrick Mäschli
+41 58 310 70 58
pm@garaio.com

GARAIO AG – Laupenstrasse 45 – Postfach 6249 – 3001 Bern – www.garaio.com

SharePoint Community Mittelland - GARAIO : Enterprise Search

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Andere mochten auch

Andere mochten auch (20)

Ähnlich wie SharePoint Community Mittelland - GARAIO : Enterprise Search

Ähnlich wie SharePoint Community Mittelland - GARAIO : Enterprise Search (20)

SharePoint Community Mittelland - GARAIO : Enterprise Search