Viel wurde bereits über die neue Suche in SharePoint 2013 geschrieben. Wir gehen dem Ganzen auf den Grund, und schauen uns die spannendsten Funktionen an, welche im Bereich des „Information Retrieval“ zur Verfügung stehen. Primär geht es darum, wie ich auch bei Inhalten ohne explizite Metadaten gute Resultaten erzielt werden. Dazu gehören unter anderem automatische Extraktion von Metadaten und Ergänzung der Suche um eigene Informationen – und was da genau dahinter steckt.
3. SharePoint Community
Mittelland
• Plattform für SharePoint Developer, IT Professionals und
Power User im Espace Mittelland
• Offen für alle interessierten Personen (Kunden und Microsoft
Partner)
• Gratis
• Geplant 9 Events / Jahr
• Website: http://ww.sharepointmittelland.ch
• Yammer: http://bit.ly/134JEcq
• XING: http://bit.ly/Xxgjm1
• Kontakt: Roger Haueter, David Schneider und Patrick Mäschli
5. Enterprise Search
Enterprise Search bzw. Unternehmensweite Suche bezeichnet ein
Teilgebiet von Information Retrieval und bezeichnet den
Vorgang der computergestützten inhaltsorientierten Suche mit
Hilfe einer unternehmensinternen Suchmaschine, welche Content
mittels so genannter Crawler indexiert.
http://de.wikipedia.org/wiki/Enterprise_Search
Verwandte Themen
• Semantische Suche
• Taxonomie
• Big Data
8. Definitionen
• Strukturierte Inhalte
Klar definierte Metainformationen, z.Bsp Datenbanken
• Unstrukturierte Inhalte
Eine Sammlung von Informationen wie z.Bsp
Dokumenteninhalte
• Unstrukturierte Suche
Volltextsuche in einem Index
• Strukturierte Suche
Suche nach Metadatum(Author:Arno Meister)
16. Entity Extraction
Parsing der Inhalte und Mapping auf Termstore
Es stehen 2 Varianten zur Verfügung
• Company Name Extraction
Auslesen der Inhalte und Mapping auf ein Termset
• Custom Extraction
Erstellung eines eigenen Termsets und Mapping auf Refiner
18. Company Name Extraction
• Definieren eines Managed Property als «Company Name
Extraction»
z.Bsp Body
• Befüllen eines Termsets mit den zu extrahierenden Namen
• Konfiguration Refiner
20. Custom Extraction
• Erstellen eines CSV für das Termset
• Import des Termsets
$searchApp = Get-SPEnterpriseSearchServiceApplication
Import-SPEnterpriseSearchCustomExtractionDictionary –SearchApplication $searchApp –Filename
serverc$folderWordPartExtraction.csv –DictionaryName
Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.3
• Konfiguration Refiner
21. Wordpart & Co
• Word Extraction
Case-Insensitive, das gesamte Wort muss passen
• Word Part Extraction
Case-Insensitive, der Wortteil muss passen
• Word Exact Extraction
Case-Sensitive, das gesamte Wort muss passen
• Word Part Exact Extraction
Case-Sensitive, der Wortteil muss passen
22. Fazit
• Strukturiertere Suche mittels Refinements
• Auch auf Fremdinhalten nutzbar (Fileserver, Externes DMS)
• Nicht der Schlüssel zum Glück – Entity Extraction erlaubt
Extraktion auf bestehenden Inhalten, kein «Mehrwert»
24. Kontext ist King
Durch Anreicherung der eigentlichen Inhalte mit Informationen aus
dem Kontext kann der Inhalt *verbessert* werden
• Informationen von übergeordneten Ebenen
• Informationen des Bearbeitenden Benutzers
• Informationen aus einem LOB / Umsystem Z.Bsp SAP / DB /
etc..
Echtes Information Retrieval
26. Content Enrichment
Zur Anreicherung der Index Daten kann der Content Enrichtment
Web Service genutzt werden
Jedes Element welches im Content Processing Schritt durchlaufen
wird, kann ergänzt werden
Einerseits um Kontextinformationen hinzuzufügen, oder um eigene
prozessierungen durchzuführen (Spracherkennung, Erstellung
Vorschaubilder usw)
29. Content Enrichment: How To
• Webservice erstellen der IContentProcessingEnrichmentService
implementiert.
• In public ProcessedItem ProcessItem(Item item) die
Businesslogik implementieren
• Managed Property erstellen
• Powershell zur Konfiguration des Services aufrufen (Service Endpoint,
Input & Output Property
set-SPEnterpriseSearchContentEnrichmentConfiguration
• Full Crawl
32. Content Enrichment
Anreicherungen von Daten in bestehendem Index
Vorteile:
• Suchabfragen sind performant
• Businesslogik kann im Suchprozess abgedeckt werden
• Dadurch *einfache* Integration
• Anreicherung auch Asynchron möglich
• Mit dem Content Search WebPart kann direkt der Index
abgefragt werden
• Ergänzung von Daten durch Umsysteme oder hierarchische
Informationen
Szenarien
• Anreicherung aus Kontext
• Integration von LOB Daten direkt auf dem Element
• Erweitertes processing (Spracherkennung usw)
33. Fazit
Content Enrichment ermöglicht die Ergänzung und
Anreicherungen des SharePoint Such-Indexes
Im Gegensatz zu Entity Extraction auch mit eigener Logik
Dies erlaubt es, der Suche Zusatzinformationen mitzugeben, um
die Resultate «Intelligenter» zu gestalten!
Bessere Resultate –
Zufriedene Nutzer