Cognitive Search

Avatar of David Zimmermann David Zimmermann - 29. November 2018 - Dynamics 365, Strategic IT

Beim Cognitive Search werden durchsuchbare Informationen aus nicht durchsuchbaren Inhalten erstellt, indem KI-Algorithmen an eine Indizierungspipeline angefügt werden. Die KI-Integration erfolgt über kognitive Fähigkeiten, indem Quelldokumente auf dem Web zu einem Suchindex „angereichert“ werden.
Zu den Fähigkeiten in Bezug auf die Verarbeitung natürlicher Sprache gehören Entitätserkennung, Spracherkennung, Schlüsselbegriffserkennung, Textbearbeitung und Stimmungserkennung.
Mithilfe dieser Fähigkeiten wird unstrukturierter Text zu strukturiertem Text, der durchsuchbaren und filterbaren Feldern in einem Index zugeordnet ist.
Die Bildverarbeitung umfasst OCR und die Identifizierung von visuellen Features, z.B. Gesichtserkennung, Bildinterpretation, Bilderkennung (berühmte Personen und Wahrzeichen) oder Attribute wie Farben oder Bildausrichtung. Sie können Textdarstellungen von Bildinhalt erstellen, indem Sie alle Abfragefunktionen von Azure Search verwenden.

1. Phase der Entschlüsselung von Quelldaten und Dokumenten

       Am Anfang der Pipeline befindet sich unstrukturierter Text oder Nicht-Text-Inhalt (z.B. Bilder und gescannte Dokumente als JPEG-Dateien).

       Die Daten müssen in einem Azure-Datenspeicherdienst enthalten sein, auf den ein Indexer Zugriff hat.

       Indexer können Quelldokumente entschlüsseln, um Text aus Quelldaten zu extrahieren.

 2. Phase der kognitiven Fähigkeiten und Anreicherung

       Die Anreicherung erfolgt durch kognitive Fähigkeiten, die atomische Vorgänge durchführen. Sobald Sie über Textinhalte aus einer PDF-Datei verfügen, können Sie beispielsweise die Entitätserkennung, die Sprachenerkennung oder die Schlüsselbegriffserkennung anwenden, um neue Felder in Ihrem Index zu erstellen, die nativ in der Quelle nicht verfügbar sind. Die Auflistung der in Ihrer Pipeline verwendeten Fähigkeiten wird als Fähigkeitengruppe bezeichnet.

3. Suchindex und abfragebasierter Zugriff

Nach Abschluss der Verarbeitung verfügen Sie über einen Suchkorpus mit angereicherten Dokumenten, die mit Azure Search im Volltext durchsucht werden können.

Entwickler und Benutzer greifen über das Abfragen des Indexes auf den von der Pipeline generierten angereicherten Inhalt zu.

Die Kommentarfunktion ist für diesen Artikel deaktiviert.

0 Kommentare

<