Suchmaschine für Dokumente
Für einen Telekommunikationsanbieter entwickeln wir eine Suchmaschine für interne Dokumente auf Basis von Apache Solr und Python. Dabei kommt neben den "klassischen" Algorithmen zur Informationsgewinnung auch TextRank zum Einsatz, um in der Ergebnisliste eine Zusammenfassung als Voransicht anzuzeigen. Sehr hilfreich: Neben der Suche nach Schlagworten gibt es auch eine Suche für komplette Texte, die ähnliche Dokumente im Archiv findet.