LCTidy

Unser Leistungspaket zur Bereinigung sprachlicher Daten

  • Sie haben es bisher nicht gewagt, Ihre sprachlichen Altdaten auf den heutigen Stand sprachlicher Qualitätsstandards zu heben?
  • Ihre Produktstammdaten und die dazugehörigen Texte sind durchgängig in Großbuchstaben verfasst, kennen weder Umlaute noch ß oder folgen der alten Rechtschrei­bung?
  • Leerzeichen sind wahllos gesetzt, Wörter teils abgeschnitten oder willkürlich abgekürzt?
  • Standards für spezielle Datentypen wie Maßangaben, Schraubenbezeichnungen oder Teilenummern werden nicht konse­quent eingehalten?
  • Ganz zu schweigen von termi­nologi­schen oder redaktionellen Vorgaben?

Dann ist es höchste Zeit, Ihre sprachlichen Altdaten einer Verjüngungskur zu unterziehen!

Datenbereinigung auf linguistischer Grundlage

Mit unseren linguistischen Analyseverfahren wandeln wir Ihre Alt­daten Schritt für Schritt in Texte um, die nicht nur den allgemeinen sprachlichen Qualitäts­standards genügen, sondern auch Ihre terminologischen und redaktio­nellen Vorgaben berücksichtigen. Ihre Texte sind damit fit für den Einsatz moderner Sprach- und Informationstechnologien wie etwa einem Translation Memory oder einem Authoring Memory.

Leerzeichen normalisieren

Datentypen standardisieren

  • Maßangaben
  • Schraubenbezeichnungen
  • Teilenummern u.a.

Strings regelbasiert ersetzen

  • Schreibvarianten
  • Abkürzungen u.a.

Rechtschreibung korrigieren

  • Versalschreibung
  • Umlautkonvertierung
  • alte Rechtschreibung
  • Falschschreibungen u.a.

Terminologie vereinheitlichen

  • Negativterme
  • Termvarianten

Von der Dublettenreduktion zur Variantenermittlung

Nach der Bereinigung Ihrer Altdaten werden sich bereits viele Texte als Dubletten erweisen. Darüber hinaus können Gruppen ähnlicher Texte ermittelt werden. Die Ähnlichkeitsberechnung orientiert sich dabei zunächst strikt an den Zeichen­folgen der Texte:

Ein erweitertes Verfahren der Ähnlichkeitsberechnung berücksichtigt die linguis­tischen Wortanalysen und lässt die Wortstellung außer Acht. Terminolo­gische Konzepte können in die Ähnlichkeitsberechnung einbezogen und dabei stärker gewichtet werden als andere Inhaltswörter:

Haben wir Ihr Interesse geweckt?

Kontaktieren Sie uns mit Ihrem Anliegen zur Bereinigung und Konsolidierung Ihrer sprachlichen Altdaten: Produktstammdaten, Stücklisten, Teilekataloge usw. Wenn Sie spezielle Anforderungen an die Sprachdatenbereinigung haben, können wir Ihnen sicherlich weiterhelfen.

Flyer

Der Inhalt dieser Seite als Download-PDF.