Categories: SoftwareUnternehmen

Tool für semantische Suche kommt bald auf den Desktop

Seit fünf Jahren brütete das Projekt hinter den Mauern des Middlebury College im US-Bundesstaat Vermont, doch in den nächsten Wochen wollen die Forscher unter der GPL (General Public License) eine Version für den Desktop veröffentlichen.

Die Einfachste Form einer semantischen Suche ist die Indexierung von Synonymen. Ein weiterer Schritt ist die Suche über Wortgruppen oder Wortfamilien. So würde die Sucheingabe ‘Hund’ auch Ergebnisse zum Beispiel mit ‘Pudel’ oder ‘Labrador’ liefern. Nächsten Monat will Aaron Coburn, der Leiter des Projektes ‘Semantic Indexing’ unter dem Namen ‘Standalone Engine’ eine Version für den Desktop vorstellen.

In einigen Projekten hat Coburn die neuen Möglichkeiten einer bedeutungsbasierten Suche vorgestellt, vor allem in Bereichen akademischen Forschung. In einem nächsten Schritt will Coburn möglichst viele elektronische Texte in einer Datenbank erfassen.

Doch das Projekt soll noch weiter gehen. Coburn hat auch eine Visualisierung integriert. So visualisiert die Software zum Beispiel Romane. In einem ersten Projekt haben die Forscher aus Middlebury in Zusammenarbeit mit einem spanischen Lehrstuhl einen elektronischen Reader von Cervantes’ Don Quixote erarbeitet, der sich auf bestimmte Muster hin durchsuchen lässt.

Erste Gehversuche unternahm das Projekt mit den Romanen von Jane Austen. Ein Tool sorgt für die Visualisierung der einzelnen Charakteren in den Romanen. Ein Algorithmus stellt dann Bezüge zwischen den Personen in den einzelnen Werken dar. Dieser Algorithmus sei inzwischen schon so weit ausgereift, dass sich die Bezüge zwischen den Personen relativ treffsicher darstellen lassen, heißt es von dem Projekt.

Ein zweites Einsatzgebiet ist ein Crawler, der Blog-Seiten indexiert. Das ‘Discourse Analytic Project’ indexiert Tausende dieser oft meinungsgetriebenen Seiten und visualisiert hier Schlagworte und bestimmte Textmuster.

Gegenüber dem Branchendienst Newsforge erklärte Coburn: “Ich hoffe, dass diese Tools uns helfen werden, eine andere Sichtweise auf Daten zu bekommen und Muster in Texten zu finden, die uns mit einer Schlagwortsuche bisher verborgen geblieben sind.”

Silicon-Redaktion

Recent Posts

Kubernetes in Cloud-Umgebungen

Ein elementarer Bestandteil einer effektiven Cloud-Strategie ist nach erfolgter Implementierung die künftige Verwaltung des Dienstes.

2 Tagen ago

Aras erweitert seine PLM-Plattform

Die Neuerungen sollen den Digital Thread, die Low-Code-Entwicklung, die Visualisierung komplexer Baugruppen und das Lieferantenmanagement…

2 Tagen ago

Manufacturing-X: Zurückhaltung überwiegt

Eine Bitkom-Umfrage attestiert der Datenraum-Initiative des Bundes hohe Bekanntheit in der Industrie. Doch noch ist…

2 Tagen ago

Ransomware „Marke Eigenbau“

Ransomware-as-a-Service ist ein lukratives Geschäft und in den Händen professionell organisierter Gruppen. Jetzt können Kriminelle…

3 Tagen ago

Bad Bots: Risikofaktor mit hohen Folgekosten

Bad Bots richten nicht nur wirtschaftlichen Schaden an. Laut dem Bad Bot Report von Imperva…

4 Tagen ago

IT-Verantwortliche setzen auf KI-Hosting in Europa

Studie von OVHcloud verdeutlicht Stellenwert von Datenresidenz und Datensouveränität bei KI-Anwendungen.

5 Tagen ago