korrekturen.de | Portal für Rechtschreibung

Vermischtes

Interview mit Daniel Naber, LanguageTool

Viele der Funktionen auf korrekturen.de, etwa die Rechtschreibprüfung, die Flexionsdatenbank und die Synonymsuche, sind auf unsere Kooperation mit dem Unternehmen LanguageTooler zurückzuführen, hinter dem der Computerlinguist Daniel Naber steckt. Hierbei ist die Grammatik- und Rechtschreibprüfung keine statische Anwendung, sondern wird in ihrer Leistungsfähigkeit fortwährend verbessert und erweitert.

LanguageTool Plug-in für Microsoft Word
LanguageTool Plug-in für Microsoft Word

Speziell an Textprofis wendet sich die Premium-Version von LanguageTool, die nicht nur mit einer erweiterten Fehlererkennung, sondern auch mit ihrer nahtlosen Integration in Microsoft Word punktet. Weiterhin sind Add-ons für Firefox und Chrome verfügbar, die die Funktionalität von LanguageTool auf jeder beliebigen Website und in jedem Webformular zur Verfügung stellen – so auch auf Facebook oder Twitter. Wir haben Daniel Naber, dem Chefentwickler von LanguageTool, einige Fragen zu seiner Arbeit gestellt:

Hallo Daniel, danke für deine Bereitschaft, ein paar Fragen zu beantworten. Vielleicht zunächst ein Blick in die Vergangenheit: Viele kennen dich vor allem durch dein Projekt OpenThesaurus, ein »offenes deutsches Wortnetz«, wie du es einmal genannt hast, welches Substantive in Synonymgruppen sowie in Ober- und Unterbegriffe gliedert. Wie kam es zu diesem Projekt und wohin entwickelt es sich heute?

OpenThesaurus entstand im Jahre 2003 aus dem Wunsch, einen Thesaurus im kostenlosen Softwarepaket OpenOffice, das damals gerade als Open-Source-Anwendung veröffentlicht worden war, nutzen zu können. Noch heute ist OpenThesaurus der deutschsprachige Standard-Thesaurus in LibreOffice und OpenOffice. Die Website openthesaurus.de kennt inzwischen ca. 40.000 Wortbedeutungen und wächst weiterhin jede Woche um einige hundert Beiträge aus unserer Community.

Die Wortdaten stehen zum freien Download – und für Entwickler über eine Programmierschnittstelle – zur Verfügung, was von Websites wie dwds.de und ja auch korrekturen.de genutzt wird.

Die kostenlose Grammatik-, Stil- und Rechtschreibprüfung von korrekturen.de, welche auf LanguageTool basiert, gehört zu den beliebtesten Anwendungen unserer Website. Kannst du den Mehrwert gegenüber einfacheren Rechtschreibprüfungen – technisch und aus Nutzersicht – genauer beschreiben?

Die klassische Rechtschreibprüfung schaut nur auf das einzelne Wort und nicht auf dessen Kontext. Fehler wie »auf diese Art und Wiese« (»Wiese« statt »Weise«) werden deshalb nicht gefunden. Und von solchen leicht zu verwechselnden Wortpaaren gibt es eine ganze Menge, z. B. dar/der, Nacheile/Nachteile, seit/seid, passioniert/passiert. LanguageTool kann zwar nicht alle Verwechslungen finden, aber eben doch viele.

Außerdem findet LanguageTool bestimmte Inkonsistenzen im Text, wenn zum Beispiel verschiedene Schreibweisen verwendet werden, die beide korrekt sind, aber eben doch besser einheitlich verwendet werden sollten, wie Delphin / Delfin oder demographisch / demografisch. Auch Datumsangaben werden auf Konsistenz geprüft: Den 29. Februar 2019 gibt es nicht bzw. nur in Schaltjahren (aber auch das weiß LanguageTool), und mit »Dienstag, dem 11.02.2019« kann etwas nicht stimmen, denn dieses Datum fällt auf einen Montag.

LanguageTool folgt, wenn ich es richtig verstanden habe, einem Big-Data-Ansatz, das heißt, das Tool gleicht die Nutzereingaben mit einer großen Datenbank ab und »schlägt Alarm«, wenn Wendungen und Wortfolgen gefunden werden, die dort als falsch markiert sind. Wie schätzt du das Potenzial, aber auch die Grenzen dieser Technik ein? Wäre eine Weiterentwicklung zu einem tatsächlich selbstlernenden System denkbar?

LanguageTool nutzt derzeit eine Mischung aus manuell geschriebenen Regeln, Statistik und künstlicher Intelligenz (KI). Der allgemeine Trend im Bereich Sprachwerkzeuge geht ganz klar in Richtung KI und ein Ende der Entwicklung ist noch nicht abzusehen. Damit entstehen aber auch Probleme, die derzeit öffentlich diskutiert werden: Kann ich einem KI-System trauen, dessen Vorschläge schwer nachvollziehbar sind? Stecken in den Daten, mit denen das System trainiert wird, systematische Verzerrungen, von denen vielleicht selbst die Entwickler nichts ahnen? Ein rein KI-basiertes System könnte vielleicht vorschlagen, »Pilotin« durch »Pilot« zu ersetzen, weil das Wort »Pilot« in den Trainingsdaten viel häufiger vorkommt. Wir Entwickler müssen also dafür sorgen, dass die Nutzer sich bewusst sind, dass es sich nur um Vorschläge handelt.

Die neueste Weiterentwicklung von LanguageTool ist ein Browser-Add-on, welches sich in Firefox und Chrome einklinkt. Was sind die Vorteile und Features dieses Add-ons?

Das Add-on kann die Eingaben des Benutzers auf fast jeder Webseite prüfen, von Twitter bis zum Webmailer. Es erkennt auch die Sprache des Textes automatisch und ist damit nützlicher und bequemer als die Rechtschreibprüfung des Browsers, die fast nur klassische Rechtschreibfehler findet (wie oben beschrieben) und die bei jeder Änderung der Sprache auch noch manuell umgestellt werden muss. Das Add-on sieht in Aktion etwa so aus:

languagetool_anim.gif

Die Blogkultur und Social Media bringen es mit sich, dass das Internet heute viel stärker aktiv genutzt wird – auch und gerade von Menschen, die ansonsten eher wenig oder nicht in ihrer Muttersprache schreiben. In diesem Zusammenhang bietet LanguageTool speziell in der Variante als Browser-Add-on eine effektive Unterstützung und fördert somit die Teilhabe von Menschen, die im Schreiben eher ungeübt sind.

LanguageTool gibt es auch in einer Premium-Version, die im Jahresabo knapp 5 Euro pro Monat kostet. Welche Vorteile bringt die kostenpflichtige Version mit sich und an welche Zielgruppen richtet sich das Angebot?

Die Premium-Version wurde um viele Regeln erweitert, sie kann also mehr Fehler finden und funktioniert auch mit längeren Texten. Außerdem stellen wir ein Add-on zur Verfügung, um LanguageTool direkt aus Microsoft Word nutzen zu können. Zielgruppe sind alle Menschen, die online Texte schreiben, die über rein private Chatnachrichten hinausgehen.

Vielen Dank für das Interview.

Julian von Heyl am 11.02.19 | Kommentare (0) | Visits: 1768

Rubrik Vermischtes:

Alles, was in keine andere Kategorie passt, finden Sie hier: Neues zur Website, aber auch den einen oder anderen Beitrag, der mit Sprachlichem nur sehr am Rande zu tun hat.

Wenn Sie bei neuen Einträgen in der Rubrik »Vermischtes« benachrichtigt werden möchten, tragen Sie bitte hier Ihre E-Mail-Adresse ein:

Kommentare

Schreiben Sie einen Kommentar:

Kommentar

*

*

 Ja  Nein

 Bei Antworten auf meinen Kommentar benachrichtigen


Die mit einem * markierten Felder müssen ausgefüllt werden.
Ihre E-Mail-Adresse wird nicht veröffentlicht!

Nutzen Sie bitte für Suchanfragen die Wörtersuche rechts oben im Kasten oder das obenstehende Google-Suchfeld. Mit der benutzerdefinierten Google-Suche wird die gesamte Website durchsucht.