extraTerm

Ihre Terminologie auf den Weg gebracht

  • Sie haben noch keine firmeneigene Terminologie?
  • Oder wollen Sie Ihre Terminologie auf der Grundlage Ihres Dokumentbestands erweitern?
  • Sie haben Terminologie bisher manuell extrahiert?
  • Oder setzen Sie bereits Tools für die Termextraktion ein?

Unsere auto­matische Termextraktion bietet Ihnen die ideale Unterstützung für grundlegende Arbeitsschritte beim Terminologieaufbau. Vergleichen Sie auch die Ergebnisse Ihrer bisherigen Termextraktionsmethoden mit den Ergebnissen von extraTerm und überzeugen Sie sich von den Vorzügen. Wir scheuen keinen Vergleich!

Termextraktion online

Jetzt auch online!

Mit extraTerm – de und extraTerm – en können Sie ab sofort in unserem Webshop Terme aus deutschen bzw. englischen Texten extrahieren lassen - auf höchstem sprachtechnologischen Niveau und zu sehr günstigen Preisen. Nutzen Sie hierzu auch unsere gestaffelten Credit-Point-Pakete.

Linguistische Analyse

Bei der Analyse Ihrer Textdaten setzen wir die ausgereiften sprachtechnologischen Verfahren von LCCore ein. Dabei ermittelt die morphologische Analyse für jede einzelne Wortform die Grundform, die Wortart und zugehörige grammatische Information wie z. B. das Genus von Substantiven. Durch die automatische Grundformenberechnung werden Vorkommen unterschiedlich gebeugter Formen zusammen­gefasst (z. B. Dieselmotor, Dieselmotoren, Dieselmotors). Die grammatische Analyse erkennt Wortgruppen und Satzbau­muster. Auf dieser Basis werden Termkandidaten unter­schiedlicher Bildungsmuster ermittelt:

  • Nominalphrasen bestehend aus Adjektiv und Substantiv wie z. B. dieselhydraulischer Antrieb
  • zusammengesetzte Substantive wie z. B. Dieselmotor
  • einfache Substantive wie z. B. Differenzial

Statistische Auswertung

Statistische Auswertungsverfahren ermitteln die Vorkommenshäufigkeit der Termkandidaten und die Anzahl der Belegdokumente pro Term. Diese Zahlen unterstützen Sie bei dem Entscheidungsprozess für die Festlegung Ihrer Terminologie.

Features

  • lexikografische Grundform
  • grammatisches Geschlecht
  • unterschiedliche Bildungsmuster
  • Vorkommenshäufigkeit
  • Anzahl der Belegdokumente
  • Liste der Belegdokumente
  • Vorkommenskontexte
  • Aufbereitung als Excel-Tabelle

Sprachen

  • Deutsch
  • Englisch

Kontextermittlung

Die Ermittlung der Vorkommenskontexte von Termkandidaten basiert auf der Kombination von statistischen und linguistischen Ver­fahren. Hierbei werden die Kontexte, in denen ein Termkandidat verwendet wird, auf linguistische Plausibilität überprüft. So können Sie sich bei der Sichtung der Kontexte schnell und umfassend ein Bild von der sprachlichen und fachlichen Verwendung eines Termkandidaten machen.

Zuordnung von Metadaten

Durch die Zuordnung von Dokument-Metadaten gemäß Ihren spezi­ellen Anforderungen (z. B. Dokumentart, Bau­gruppe, Abteilung) können wir Ihnen spezifische Sichten auf die Extraktionsergebnisse ermöglichen. So erfahren Sie beispielsweise, welche Terme abteilungsübergreifend verwendet werden und welche nicht oder welche Terme für bestimmte Dokumentarten oder Baugruppen spezifisch sind.

Berücksichtigung der Bestandsterminologie

Bei Durchführung einer Termextraktion können wir auch Ihre Bestandsterminologie berücksichtigen. Terme, die schon in Ihrer Terminologie erfasst sind, werden gesondert ausgezeichnet. So können Sie sich ein umfassendes Bild davon machen, wie häufig und in welchen Dokumenten Bestandsterme überhaupt vorkommen. Sie wissen abschließend, welche Terme dringend in Ihrer Terminologie zu ergänzen sind und welche Bestandsterme offensichtlich irrelevant sind, da Sie in keinem oder kaum einem Dokument verwendet werden.

Evaluierung der extrahierten Terme

Kombinieren Sie die Termextraktion mit einer Evaluierung auf der Grundlage von evalTerm. So erfahren Sie beispielsweise, welche Termkandidaten nur in falscher Schreibung belegt sind, welche Termkandidaten unter Termbildungsgesichtspunkten problematisch sind (z. B. sehr komplexe Wortzusammensetzungen ohne Bindestrich wie Umleitdampfeinführungsversteifungsrohr) oder welche Termkandidaten möglicherweise Varianten voneinander sind (z. B. Abdichtband - Dichtband - Dichtungsband).

Termextraktion oder Terminologieextraktion?

Mit extraTerm gehen Sie den ersten Schritt in Richtung Terminologieaufbau, indem Sie aus Ihren Dokumentbeständen alle Termkandidaten extrahieren und mit linguistischen Merkmalen, statistischen Kennzahlen und Vorkommenskontexten auszeichnen lassen. Welche der ermittelten Termkandidaten letztlich Eingang in Ihre Terminologie finden, welche Termkandidaten den Status einer Vorzugsbenennung erhalten und welche als erlaubte Terme oder Negativterme ausgewiesen werden, entscheidet sich erst im weiteren Prozess des Terminologieaufbaus. Deshalb bieten wir Ihnen auch hier eine Termextraktion und keine Terminologieextraktion an. Den Weg hin zur Terminologie können wir nur gemeinsam gehen. Mit den qualitativ hochwertigen Ergebnissen unserer Termextraktion und mit unserem Angebot einer zusätzlichen Evaluierung der Termkandidaten wollen wir Sie auf diesem Weg aufs Beste unterstützen.

Haben wir Ihr Interesse geweckt?

Kontaktieren Sie uns mit Ihrem Anliegen zur Extraktion von Terminologie aus Dokumentbeständen. Wenn Sie spezielle Anforderungen an die Termextraktion haben, können wir Ihnen sicherlich weiterhelfen.

Flyer

Der Inhalt dieser Seite als Download-PDF.

Dokumentation: extraTerm - de

Erfahren Sie mehr über das Termextraktionsverfahren und die zu erwartenden Ergebnisse einer Termextraktion aus deutschen Texten.

Dokumentation: extraTerm - en

Erfahren Sie mehr über das Termextraktionsverfahren und die zu erwartenden Ergebnisse einer Termextraktion aus englischen Texten.

Preisübersicht

Erfahren Sie mehr zu unseren attraktiven Preisen und unseren günstigen Credit-Point-Paketen.