Textanalyse
LCCore
Unser Leistungspaket zur Gewinnung linguistischer Informationen aus Texten
- Sie wollen wissen, welches Vokabular in Ihren Texten vorkommt und mit welcher Häufigkeit einzelne Wörter darin auftreten?
- Sie wünschen zusätzliche Informationen zu einzelnen Wörtern wie z. B. die Wortart oder das grammatische Geschlecht der Substantive?
- Sie sind daran interessiert, mit welchen Wortformen einzelne Wörter in Ihren Texten belegt sind oder welche Wortformen falsch geschrieben sind?
- Sie wüssten gern, welche Wörter auf denselben Wortstamm zurückzuführen sind oder welche Wörter in einzelnen Wortzusammensetzungen vorkommen?
- Und Sie wüssten gern, welche stilistisch markierten Wörter in Ihren Texten vorkommen (z. B. Umgangssprache oder veraltetes Vokabular)?
Das alles - und noch viel mehr - bietet Ihnen LCCore, unser leistungsstarkes Angebot zur Textanalyse basierend auf linguistischen Analyseverfahren.
Linguistische Analyse
LCCore basiert auf einer tief gehenden morphologischen Analyse der einzelnen Wörter eines Texts. Dabei nutzt LCCore umfassende und detaillierte morphologische Wörterbücher, die die vielfältigen Wortbildungen unterschiedlicher Sprachen abbilden. Auf dieser Grundlage werden verschiedene Wortformen auf die jeweilige Grundform reduziert (Lemmatisierung) und mit den entsprechenden grammatischen Merkmalen versehen. Die vielfältigen Ableitungen von Wörtern werden auf systematische Weise erkannt. Die für das Deutsche charakteristischen Wortzusammensetzungen (Komposita) sind quasi unbegrenzt analysierbar. So gibt es kaum ein Wort im Deutschen, das wir nicht kennen!
Über 750.000 deutsche Wörter werden zusätzlich in einem Lemmawörterbuch des Deutschen vorgehalten, das viele Fachwörter aus unterschiedlichen Bereichen umfasst und semantische und pragmatische Information für die einzelnen Wörter bereitstellt. Der Zuwachs an Einträgen in diesem Wörterbuch beträgt 10.000 – 12.000 pro Jahr. Zusätzlich existieren Spezialwörterbücher zur Abdeckung von Abkürzungen, Maßeinheiten oder feststehenden Wendungen.
Die grammatische Analyse von LCCore nutzt das Wissen, das die morphologische Analyse bereitstellt, um grammatische Strukturen zu identifizieren. Phrasen, Verbgruppen, Satzbaumuster werden ausgezeichnet, um auf dieser Grundlage Mehrdeutigkeiten auszuräumen (Disambiguierung). So ist Satz für Satz sichergestellt, dass die einzelnen Wörter in der zutreffenden Lesart erfasst werden.
Features
- Lemmatisierung
- Wortableitungen
- Kompositazerlegung
- grammatische Merkmale
- Mehrwortausdrücke
- Abkürzungen
- neue/alte Rechtschreibung
- Fachvokabular
- Sprachregister
- grammatische Strukturen
- Disambiguierung
Sprachen
- Deutsch (AT, CH, DE)
- Englisch (GB, US)
- Französisch
- Spanisch
- andere auf Anfrage
Haben wir Ihr Interesse geweckt?
Kontaktieren Sie uns mit Ihrem Anliegen zur Gewinnung linguistischer Informationen aus Ihren Texten. Wenn Sie spezielle Anforderungen an die Textanalyse haben, können wir Ihnen sicherlich weiterhelfen.
Flyer
Der Inhalt dieser Seite als Download-PDF.