Texte verstehen
Referenzen erkennen

Texte verstehen

Entitätserkennung und Annotationen in Textdokumenten.

Die Extraktion von Metadaten aus Texten ist so alt wie der Erfindung von Karteikarten. Während der Prozess früher manuell ablief und auf wenige Daten beschränkt war, kann man heute fast beliebig detaillierte Informationen extrahieren. Neben den üblichen Fakten wie erwähnte Personen, Orte und Organisationen kann man auch Preise, Markennamen oder Produktnennungen extrahieren, um nur einige Beispiele zu nennen.

In Verbindung mit Text Klassifikation (siehe auch unseren Use Case E-Mail Klassifikation) kann man zusätzlich Texte beliebigen Taxonomien zuordnen und so z.B. das behandelte Thema oder den Stil des Textes erkennen lassen.

Das nachfolgende Video basiert auf einer Demo des DBpedia Spotlight Web-Service und veranschaulicht, wie weitreichend Informationen aus Fließtext extrahiert und verlinkt werden können. Die Verlinkung mit der Datenbank von DBpedia ist hier nur ein Beispiel, verdeutlicht aber gut, wie Texte angereichtert und für eine tiefere Analyse aufbereitet werden können.

Erfahrungsgemäß verfügen die meisten unserer Kunden über eigene Listen z.B. von Personen, Organisationen oder Produkten, die von besonderem Interesse für sie sind. Als Teil unsere Dienstleitung erstellen wir auch für Sie dedizierte Entitätserkenner für nahezu beliebige Entitätstypen. In Verbindung mit unserer Lead-Crawler Technologie durchsuchen wir ggf. auch des Web für Sie nach entsprechenden Erwähnungen.

Named Entity Recognition

Noch Fragen?

Kontakt

Haben Sie Fragen oder Interesse an einer unverbindlichen Beratung? Wir freuen uns, wenn Sie Kontakt mit uns aufnehmen!