Zu Hauptinhalt springen
Translator
Diese Seite wurde automatisch vom maschinellen Übersetzungsdienst von Microsoft Translator übersetzt. Weitere Informationen

Microsoft Translator Blog

Microsoft Translator veröffentlicht Sprachübersetzung Korpus öffentlich

christian_federmann
Christian Federmann, Senior Programm-Manager

Als Teil der laufenden Bemühungen von Microsoft, die Genauigkeit von Systemen der künstlichen Intelligenz (KI) zu verbessern, veröffentlicht Microsoft Translator öffentlich einen Datensatz, der mehrere Gespräche zwischen zweisprachigen Sprechern, die Französisch, Deutsch und Englisch sprechen, beinhaltet.

Dieser Korpus, der von Microsoft unter Verwendung zweisprachiger Sprecher erstellt wurde, soll einen Standard schaffen, mit dem Menschen messen können, wie gut ihre Konversations-Sprachübersetzungssysteme funktionieren. Es kann als standardisierter Datensatz zum Testen von zweisprachigen Konversations-Sprachübersetzungssystemen wie dem Microsoft Translator Live-Feature Und Skype-Übersetzer.

Christian Federmannein leitender Programm-Manager, der mit dem Microsoft Translator-Team zusammenarbeitet, sagte, dass es nicht so viele standardisierte Datensätze für den Test zweisprachiger Sprachübersetzungssysteme gibt. "Man braucht qualitativ hochwertige Daten, um qualitativ hochwertige Tests durchführen zu können", sagte Federmann.

Das Microsoft-Team hofft, dass der frei verfügbare Korpus dem gesamten Bereich der Konversationsübersetzung zugute kommt und dazu beiträgt, standardisierte Benchmarks zu schaffen, an denen Forscher ihre Arbeit mit anderen messen können.

"Das hilft, das Feld vorwärts zu treiben", sagte er. Will Lewis, ein leitender technischer Programmmanager im Microsoft Translator-Team, der auch an dem Projekt mitgewirkt hat.

Laden Sie den Microsoft Speech Language Translation Corpus herunter. Hier.

Erfahren Sie mehr über diese Version und andere Möglichkeiten, wie Microsoft daran arbeitet, die KI intelligenter und genauer zu gestalten. Microsoft Research-Blog.

 

Weitere Informationen