Google-artige Suche kommt mit OS in die kleinste Hütte

Projekte mit Suchfunktionen auf Open-Source-Basis bieten sich an, wenn Firmen mit schmalem Budget Suchfunktionen in ihre Websites integrieren wollen. Mittlerweile gibt es davon eine ganze Reihe.

Sie heißen beispielsweise Hadoop, Lucene and Nutch und stellen gemeinsam mit On-Demand-Computing von Amazon eine skalierbare Alternative zu Funktionen dar, wie sie sonst vor allem Google für Geschäftskunden anbietet.

Die Projekte, so heißt es in der US-Presse, hätten sich langsam aber sicher gemausert. Hinter dem Namen Hadoop verberge sich beispielsweise ein Framework, das die Funktionen verteilter Google-Files und den ‘MapReduce’-Algorithmus für die Berechnung großer Datensätze imitiert und Cluster beherrscht.

Lucene glänzt demnach als Java-basiertes Such- und Indexierungssystem; Notch erweitert dessen Funktionen um webbasiertes Crawling in großen Datenmengen nach bestimmten Kriterien, außerdem verfügt es noch über weitere Suchfunktionen, die heute von Geschäftskunden erwartet werden. Die Funktionen werden bereits von Firmen wie Wikipedia eingesetzt. Auch Krugle, eine Suchmaschine für Programmierer, setzt solche Techniken ein.