(nach idw)
In einem gemeinsamen Forschungsprojekt des Hasso-Plattner-Instituts (HPI) Potsdam und der ZBW – Leibniz-Informationszentrum Wirtschaft und haben Forscher ein Computermodell namens „DECENT“ entwickelt, das Texte nach wichtigen Informationen durchsuchen kann. Dazu werden Erwähnungen von Entitäten in Texten erkannt, wie beispielsweise Personen, Orte oder Organisationen. Diese Entitäten werden in sehr feingranulare Klassen klassifiziert. Mit diesem Modell können potenziell bessere Suchmaschinen und Wissensdatenbanken erstellt werden, indem nützliche Informationen aus großen Textmengen extrahiert werden. Im Vergleich zu herkömmlichen Methoden bietet die ultrafeine Klassifizierung eine weit größere Vielfalt an potenziellen Klassen, die in die Zehntausende gehen können. Dies steigert natürlich den Aufwand für die Erkennung und Klassifizierung erheblich. An dieser Stelle setzt DECENT an: Das Modell verwendet maschinelles Lernen und lernt aus Daten, bei denen zuvor die vorkommenden Entitäten von Menschen manuell gekennzeichnet wurden. Dank einer geschickten Verarbeitung dieser Daten ist es deutlich effizienter als bestehende Modelle.
>> mehr: https://www.zbw.eu/de/