HUDU

Text Mining: Wissensrohstoff Text


€ 39,90
 
kartoniert
Sofort lieferbar
März 2006

Beschreibung

Beschreibung

Ein großer Teil des Weltwissens befindet sich in Form digitaler Texte im Internet oder in Intranets. Heutige Suchmaschinen nutzen diesen Wissensrohstoff nur rudimentär: Sie können semantische Zusammen-hänge nur bedingt erkennen. Alle warten auf das semantische Web, in dem die Ersteller von Text selbst die Semantik einfügen. Das wird aber noch lange dauern. Es gibt jedoch eine Technologie, die es bereits heute ermöglicht semantische Zusammenhänge in Rohtexten zu analysieren und aufzubereiten. Das Forschungsgebiet "Text Mining" ermöglicht es mit Hilfe statistischer und musterbasierter Verfahren, Wissen aus Texten zu extrahieren, zu verarbeiten und zu nutzen. Hier wird die Basis für die Suchmaschinen der Zukunft gelegt.

Inhaltsverzeichnis

1 Wissen und Text (Text Mining Aufbau & Struktur v. Text, Wissensverarb. gestern & heute) 2 Grundl. der Bedeutungsanalyse ( Syntagmat. Relationen, Paradigmat. Rel., Semantische Rel., Logische Rel., Fach- & Allgemeinsprache) 3 Textdatenbanken (Textressourcen, Aufbau v. Textdatenbanken, Segmentierung v. Text, Datenstrukturen, Abfragemöglichkeiten) 4 Sprachstatistik (Zipfsche Gesetze, Differenzanalyse, Probabilistisches Sprachmodell, Hidden Markov-Modelle, Tagging, Signifikante Kookkurrenzen, Visualisierung von sign. Kookk., Anwend. auf andere Sprachen, Kookk. höherer Ordnung, Netze v. Kookkurrenten, Small Worlds u. skalenfreie Netze, Disambiguierung, Communities) 5 Clustering (Clustering-Verfahren, Dokumentenähnlichkeit, Clustern v. Wortformen, Merkmalsextraktion) 6 Musteranalyse (Reguläre Ausdrücke, Syntaktische Muster, Morphemmuster) 7 Hybride Verfahren (Lexikalische Filter, Kombination versch. Wissensquellen, Bootstrapping 8 Beispielanwendungen / Anhang (Ling. Grundlagen u. Statistik)
EAN: 9783937137308
ISBN: 3937137300
Untertitel: Konzepte, Algorithmen, Ergebnisse. 1. , Aufl. Studierende und Praktiker mit fachlichem Schwerpunkt in der Informatik, Wirtschaftsinformatik und/oder Linguistik.
Verlag: W3L GmbH
Erscheinungsdatum: März 2006
Seitenanzahl: XII
Format: kartoniert
Es gibt zu diesem Artikel noch keine Bewertungen.Kundenbewertung schreiben