SUTSCHE trainiert Custom KI für Fachübersetzungen bei DMG MORI

Das Training einer Custom KI eröffnet DMG MORI neue Möglichkeiten im internationalen Konzernalltag: In Zusammenarbeit mit SUTSCHE ist mit minimalem Aufwand eine Lösung für die automatisierte Übersetzung von Inhalten mit Spezialvokabular entstanden, die bereits jetzt bessere Ergebnisse als herkömmliche maschinelle Übersetzungen liefert - und weiter verbessert werden kann.

 

Projekt

Custom KI

 

Projektlaufzeit

01 | 2021 – 09 | 2021

 

Projektinhalte

Aufbereitung von Trainingsdaten

Findung von Satzpaaren DE-EN

Training einer Basis KI

Bereitstellung einer trainierten Custom KI

 

Über DMG MORI

Die DMG MORI Aktiengesellschaft - bis September 2013 die Gildemeister AG - ist einer der größten Hersteller von spanenden Werkzeugmaschinen in Deutschland und auch weltweit ein führender Hersteller von CNC-gesteuerten Dreh- und Fräsmaschinen. 

Das Angebot umfasst neben Dreh- und Fräsmaschinen auch die Advanced Technologies, wie Ultrasonic, Lasertec und Additive Manufacturing. Daneben entwickelt der DMG MORI ganzheitliche Technologie- und Automatisierungslösungen bis hin zu digitalen Produkten und Lösungen für Industrie 4.0. Das Servicegeschäft beinhaltet Dienstleistungen wie Training, Instandsetzung, Wartung und Ersatzteilservice.

Das Unternehmen hat weltweit 14 Produktionsstätten sowie 157 internationale Vertriebs- und Servicestandorte in 79 Ländern.Die Konzernzentrale befindet sich in Bielefeld. Der Hauptsitz des Mutterkonzerns, der DMG MORI Company Limited, befindet sich in Tokio, Japan.

Ihr Kontakt bei uns

Alexander Stahlkopf

+49 (0)521 - 923 742 22

alexander.stahlkopf@sutsche.com

Über das Projekt

Wie war die Ausgangslage?

Als einer der größten Hersteller von spanenden Werkzeugmaschinen in Deutschland ist DMG MORI auch international tätig. Daraus ergibt sich im Alltag ein massiver Übersetzungsbedarf. Insgesamt werden im Konzern 24 unterschiedliche Sprachen benötigt. Diese kommen nicht ohne ein umfangreiches Fachvokalubar im Bereich Maschinenbau aus. In der Vergangenheit hatte sich gezeigt, dass Standardlösungen aus der maschinellen Übersetzung dieses Fachvokabular gar nicht oder nur in unzureichender Qualität verwendeten. Die Automatisierung der Übersetzungsprozesse war damit massiv erschwert.

Welche Ziele sollten erfüllt werden?

Im gemeinsamen Projekt sollte damit zunächst herausgefunden werden, ob durch das Training einer Custom KI eine Übersetzungsqualität erzielt werden kann, die an die bisher verwendeten manuellen Übersetzungen heranreiche würde. Der Übersetzungsprozess sollte auf diesem Weg deutlich vereinfacht und beschleunigt werden. Voraussetzung und Gradmesser hierfür war vor allem die korrekte Verwendung des branchenspezifischen Fachvokabulars bei DMG MORI. Erprobt wurden diese Prozesse zunächst an der Übersetzung von internen Dokumentationen. Bei erfolgreichem Verlauf sollten weitere Anwendungsfälle in der Kundendokumentation, Schulungsunterlagen und Maintenance hinzukommen.

Was waren Besonderheiten/Herausforderungen im Projekt?

Die maschinelle Übersetzung von Inhalten stand in der Vergangenheit nicht nur vor qualitativen sondern auch datenschutzrechtlichen Herausforderungen. DMG MORI stellt für seine Inhalte hohe Anforderung an den Datenschutz, die auch bei der Übersetzung und durch den Betrieb einer Custom KI erfüllt werden müssen.

Auf Seiten von SUTSCHE lag die Herausforderung darin, aus umfangreichem Ausgangsmaterial einen nutzbaren Trainingskorpus zu erzeugen. DMG MORI stellte aus bisherigen Übersetzungen mehr als 80.000 Datensätze zur Verfügung, die als Basis für das notwendige Training aufbereitet werden mussten. Dabei galt es sicherzustellen, dass das für DMG MORI besonders relevante Spezialvokubular korrekt und zuverlässig übersetzt wird.

Welche Aufgaben/Rolle hat SUTSCHE dabei übernommen?

Um die korrekte Verwendung der Fachsprache bei der automatisierten Übersetzung zu gewährleisten, wurde zunächst ein umfassendes Glossar aufgesetzt. Anschließend galt es, die umfangreichen Ausgangsdaten für das bevorstehende Training der Custom KI aufzubereiten.

Aus den mehr als 80.000 Rohdaten in deutscher und englischer Sprache wurden in einem ersten Schritt 20.000 Basisdaten extrahiert. Dafür wurden die Rohdaten automatisiert durchsucht, um deutschen Ausgangsformulierungen jeweils die korrekte englische Übersetzung zuzuordnen. Um im weiteren Verlauf eine hohe Übersetzungsqualität zu gewährleisten, wurden nur Satzpaare in den so entstehenden Trainingskorpus aufgenommen, die im Vergleich von Ausgangs- und Zielsprache eine Übereinstimmung von mindestens 85% aufwiesen.

Nach einer weiteren Bereinigung der Basisdaten ergaben sich draus etwa 16.000 Trainingsdaten. Hiervon wurden wiederum 30 Prozent für ersten Valdierungen und Tests des KI-Trainings verwendet, die übrigens 70 Prozent bildeten den finalen Trainingskorpus. SUTSCHE trainierte das frei verfügbare und erst 2020 erschienene mBART-Sprachmodell der Facebook Research AI mit diesen Trainingsdaten.

Was wurde erreicht?

Bereits nach der ersten durchgeführten Iteration des erstellten Trainingskorpus zeigten sich positive Ergebnisse: Die Übersetzungsqualität konnte gegenüber einem untrainierten Basismodell deutlich gesteigert werden. Das trainierte Sprachmodell wird in weiteren Schritten zusätzlich kalibriert und die Übersetzungsqualität für das Sprachpaar Deutsch-Englisch durch einen Re-Trainingsprozess damit verbessert. Die entstandene Custom KI kann von DMG MORI betrieben werden und erfüllt damit die gesetzten Datenschutzstandards. Im Konzern kann die Custom KI über die bereitgestellte API problemlos in Übersetzungsprozesse eingebaut werden.

Das sagt DMG MORI dazu:

“Für ein internationale Unternehmen wie DMG MORI ist Kommunikation über Sprachgrenzen hinweg essentiell. Das Training einer Custom KI hat uns in diesem Bereich neue Möglichkeiten eröffnet: Eine zuverlässige automatisierte Lösung bietet das Potenzial, unseren Übersetzungsprozess deutlich zu beschleunigen.

SUTSCHE hat diesen Prozess in unserem Konzern vertrauensvoll ins Rollen gebracht und uns eine vielversprechende Custom KI bereitgestellt. Wir sind gespannt, wie es weitergeht!”

Jan Möllenhoff
Geschäftsführer DMG MORI Academy GmbH

Ihr Weg außerhalb der Öffnungszeiten und während der Heimspiele

Ich bestätige, dass ich die Datenschutzerklärung gelesen habe und akzeptiere diese *

Übersetzungen Ihrer Fachsprache

Corporate Language, sicher und in Echtzeit

Content Erstellung mit KI

Effizientes Content Marketing

Content Marketing mit KI und digitalen Services

Contentagentur

Beratung für Digitalisierung

Wir eröffnen Ihnen neue Blickwinkel!

Digitalberatung

Was bedeutet der Begriff SUTSCHE?

Was wirklich dahinter steckt? Eine Einstellung.

Über SUTSCHE