iX 2/2020
S. 108
Wissen
Natural Language Processing

Natürliche Sprache zielgenau verarbeiten mit semantischer Textanalyse

Wortgewandt

Richard Hudson

Menschen verstehen meist problemlos die Bedeutung einer Aussage, Maschinen nicht. Die Prädikatenlogik hilft im Machine Learning, die Semantik hinter der Syntax zu erfassen.

Beim Natural Language Processing (NLP) geht es oft darum, Texte oder Textstellen miteinander zu vergleichen und Dokumente nach Aussagen mit einem gegebenen Sinn zu durchsuchen. Die allgemeine Herausforderung dabei: Sätze, die für einen menschlichen Leser ganz offensichtlich dasselbe bedeuten, bestehen an der Oberfläche oft aus völlig unterschiedlichen grammatikalischen Strukturen. Auch enthalten sie nicht selten unterschiedliche Begriffe für ähnliche Ideen. Die Ausdrucksweise ist unterschiedlich, die Bedeutung gleich. 

Bei der Verarbeitung natürlicher Sprache durch Computersysteme braucht es deshalb eine Strategie, um nicht nur die einzelnen Wörter, sondern auch den Sinn einer Äußerung herauszuarbeiten. Dieser Artikel zeigt einige Lösungsansätze auf und stellt die wichtigsten Anwendungsfälle vor, die sich dadurch ergeben. Dazu gehören das Extrahieren strukturierter Informationen, eine flexible Gestaltung von Conversational Interfaces und Chatbots, die thematische Textsuche sowie die überwachte Dokumentenklassifizierung.

Kommentieren