Yoah Geschrieben 5. Januar 2005 Geschrieben 5. Januar 2005 Tach auch! Bin hier ganz schön neu und habe direkt eine Frage! Kennt jemand Tools/Programme für eine automatische Verschlagwortung? Ein paar habe ich schon gefunden, aber leider sind alle in Content oder Document Management Systemen eingebettet. Ich muss eine Liste mit Vergleichen aufstellen, damit ich sagen kann, warum eine selbst programmierte Lösung zu empfehlen ist! Danke im voraus! Zitieren
Bubble Geschrieben 5. Januar 2005 Geschrieben 5. Januar 2005 Wofür willst Du Schlagwörter bilden (Bücher, Texte?) und da das automatisch geschenen soll, woraus und nach welchen Kriterien? Zitieren
Yoah Geschrieben 5. Januar 2005 Autor Geschrieben 5. Januar 2005 Wofür willst Du Schlagwörter bilden (Bücher, Texte?) und da das automatisch geschenen soll, woraus und nach welchen Kriterien? Momentan sieht es so aus, dass ich gar nicht weiß, was das für Texte sind, bzw. sein sollen. Ich habe momentan Dokumente in Form von HTML. In diesen html-dateien sind Texte, die analysiert werden sollen (die Verschlagwortung), Das Kriterium bei der Sache ist, das ich nur ne Tabelle mit den Ausschluss-Wörtern bekomme und die Wörter die dann quasi übrig bleiben, sind meine Schlagwörter. Die Schlagwörter müssen dann der Datei zugeordnet werden. Taucht das gleiche Schlagwort noch in einer anderen Datei auf, muss diese Datei dem Schlagwort zugeordnet werden. Mehr weiß ich auch noch nicht, so suche ich mir seit gestern morgen schon den Wolf, nach einem vergleichbaren ETWAS, das dem nahe kommt. Zitieren
Bubble Geschrieben 5. Januar 2005 Geschrieben 5. Januar 2005 Gut, Du willst dann aber keine Schlagwörter erstellen, sondern einen Index über die Wörter von Texten bilden, um die Stellen (oder Texte) in denen die Einträge vorkommen, zu finden. Schlagwörter sind in der Regel wenige Begriffe, die den Inhalt eines Textes kategorisieren, so dass man z.B. in einer Bibliothek Bücher zu einem Thema findet. So etwas kann man IMO nicht automatisieren. Einen Index bauen hingegen schon. Das was Du machen willst (Index über Wörter mit Ausschlußwörterbuch für zu häufige Begriffe) ist vom Prinzip her das, was Suchmaschinen machen. Die Idee ist einfach zu verstehen, die Umsetzung für sehr große Textmengen (WWW-Suchmaschine) schwer. Grundsätzlich mußt Du eine Liste über die Index-Wörter bilden, bei dem dann jeder Eintrag auf die Dokumente, in denen das Wort auftritt verweist. Was möchtest Du denn genau dazu wissen? Zitieren
Yoah Geschrieben 5. Januar 2005 Autor Geschrieben 5. Januar 2005 Ich möchte wissen, ob es für so etwas schon Tools, oder Programme gibt, die eine Indexierung oder Verschlagwortung automatisch generieren. Gefunden habe ich nämlich noch gar keine, es sei denn, diese automatische Verschlagwortung war in CMS/DMS inbegriffen. Zitieren
Bubble Geschrieben 5. Januar 2005 Geschrieben 5. Januar 2005 Klar gibt es so etwas. Ich z.B. bin gerade mit etwas so ähnlichem beschäftigt, wenn auch in einem komplett anderen Zusammenhang. Der Index ist dabei immer nur das Mittel zum Zweck. Als fertiges Programm wirst Du einen reinen Index-Generator sicherlich nicht finden, denn nur den Index zu erstellen ist für sich alleine sinnlos. Erst wenn man an den Index Anfragen stellt, macht es Sinn. Ich vermute Du wirst so etwas im Bereich der Dokumenten-Indizierung finden (Volltextsuche). Deswegen bist Du sicherlich auch auf Dokumenten-Management-Systeme gestoßen. Ich glaube Google stellt eine Intranet-Search-Appliance her, IMO gab es auch einmal von AltaVista eine Such-Software. Gibt es sicher auch noch von anderen Anbietern. Damit könntest Du evtl. Deine HTML Dokumente durchsuchbar machen. Ich weiß ja nicht, was die Anforderungen sind (Zahl der Dokumente und deren Größe). Zitieren
Yoah Geschrieben 6. Januar 2005 Autor Geschrieben 6. Januar 2005 Morgen! @ Bubble, sonst ist zwar keiner aktiv hier, aber egal. Ich habe dann gestern am späten Nachmittag noch erfahren, das diese automatische Verschlagwortung bei einem von unserer Firma gemachten DMS eingesetzt werden soll. Konnte aber nicht mehr hier reinschreiben! Sorry! Und der Ablauf des Ganzen soll so aussehen: Ich habe nen Ordner mit Dokumenten, den ich dann angebe, lasse dann nen Algorithmus, den ich noch nicht habe, drüberlaufen. Dabei heraus kommen soll dann z.B: Schlagwort Abfall Datei-Titel Müllverbrennung Abfallbeseitigung Containerstandorte ..... Schlagwort Gebäude Datei-Titel Haus A Halle Lager So etwas ungefähr soll dabei herumkommen! Vielleicht ist es jetzt verständlicher, auch für mich! Zitieren
Jaraz Geschrieben 6. Januar 2005 Geschrieben 6. Januar 2005 Moin, ich wüßte nicht wie sich sowas komplett automatisieren lassen sollte. Die Schlagworte wirst du wohl beim Einstellen des Dokuments ins DMS selbst vergeben müssen. Oder irgendwo eine allgemeine Schlagwortliste Pflegen und mit einer Volltextsuche verknüpfen. Eine Volltextsuche, ist je nach Produkt natürlich automatisch möglich. Ein Volltextsuche Produkt was man in eigene (Java) Anwendungen einbauen kann ist Lucene. http://jakarta.apache.org/lucene/docs/index.html Gruß Jaraz Zitieren
Bubble Geschrieben 6. Januar 2005 Geschrieben 6. Januar 2005 @Yoah: Wenn es sich um Schlagworte im eigentlichen Sin handelt, dann wird man sie per Hand anlegen müssen, denn ein Computer kann den Inhalt von Texten nicht verstehen. Ein Volltext-Index ist hingegen automatisch erstellbar, für große Zahlen an Dokumenten muß man sich aber schon einige Gedanken über die Realisierung machen. Letzlich könnte man die Index-Suche dann noch mit einer Art Thesaurus koppeln, um bei der Suche nach Müll auch nach dem Bergiff Abfall zu suchen, aber letzlich wäre das eine Erweiterung der Index-Suche. Ich befürchte die Aufgabe ist, wenn Du sie alleine und richtig lösen willst und viele viele Dokumente zu verwalten hast, schwieriger, als Du Dir derzeit vorstellst ;-) Zitieren
topiczoom Geschrieben 7. Mai 2011 Geschrieben 7. Mai 2011 Hallo, wir haben einen Webservice zur automatischen Verschlagwortung: http://www.topiczoom.de:2207/start.html Bei Fragen gerne: levin.brunner@topiczoom.de Grüße Levin Brunner TopicZoom GmbH -- Semantische Technologie Zitieren
habbeda Geschrieben 10. Mai 2011 Geschrieben 10. Mai 2011 Glückwunsch! Einen 6 Jahre alten Thread ausgraben, um Werbung zu platzieren und einen nicht funktionierenden Webservice anzubieten. Reife Leistung. Zitieren
topiczoom Geschrieben 10. Mai 2011 Geschrieben 10. Mai 2011 Hallo, wollte nur kurz fragen, warum der WS angeblich nicht funktioniert? Wird von einigen Systemen schon genutzt. Also funktionieren tut der WS. Und warum soll man auf einen alten Thread nicht antworten? Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.