跳轉至主要內容
線上翻譯

微軟翻譯博客

微軟自定義翻譯器將翻譯品質欄推近達到人類水準

在機器翻譯技術前沿的定製翻譯之旅仍在繼續。

2020 年 8 月初,我們開始從基於長短期內存(又名 LSTM)的神經機器轉換架構(或 V1)到 Microsoft 轉換器的最先進的基於變壓器的架構(或 V2)進行自定義轉換器升級。V2 是同一翻譯體系結構,它支持標準非本地化翻譯 API,以及 Microsoft Office 365、語音、Bing.com/translator、邊緣等中的翻譯。

8 月版本使客戶能夠使用 字典 (短語或句子)文件類型,用於在 V2 平臺上構建自定義模型,以快速提高 V1 平臺的翻譯品質。

如今,自定義翻譯完成完整的 V2 平台升級,以提供比之前更大的翻譯品質提升。客戶現在可以使用全文文檔(如 Office 文檔、PDF、HTML 和純文字)構建具有所有文檔類型的自定義模型(培訓、測試、調整、短語詞典和句子詞典)。

通過此版本,企業、中小型企業、應用開發人員和語言服務提供者可以構建先進的自定義神經翻譯系統,這些系統尊重其定義的業務術語,並將這些系統無縫集成到現有或新的應用程式、工作流和網站中,以吸引客戶並發展業務。

我們採用嚴格的人工評估流程,將每個新的基準語言模型都置於嚴格的人工評估流程中,以確保翻譯品質繼續滿足所有域通用輸入的高標準。但是,藉助經過定製培訓的專門翻譯系統,客戶可以通過對以前翻譯的域中文檔進行自定義翻譯系統的培訓,對特定於域的術語和樣式進行更高的遵守。這些以前翻譯的文檔允許自定義翻譯人員學習上下文中的首選翻譯,因此翻譯器可以在上下文需要時應用這些術語和短語,並在目標語言中生成流利的翻譯,同時尊重目標語言的上下文相關語法。

升級的好處

我們使用 BLEU 評分 (研究社區中的標準方法)測量新培訓的基線模型的翻譯品質。一兩個BLEU分是有價值的成就。與之前的 V1 平臺相比,自定義翻譯器 V2 平台升級將帶來顯著的改進。下面的條形圖顯示了某些BLEU的翻譯品質、分數改進以及訓練數據集大小的影響。

使用標準翻譯器BLEU翻譯器 V1 和自定義翻譯 V2 時,範例域翻譯品質將提高分數。
訓練數據集大小(以千計)("auto-28k"表示汽車領域有 28,000 個並行句子)

需要注意的是,實際品質的提高取決於客戶數據品質、培訓數據集大小和域覆蓋範圍。

"我們希望通過神經網络進行翻譯不僅能提高品質和速度,而且能在大數據評估方面提供進步," 大眾汽車股份公司語言質量和供應商管理主管尼古拉·邁耶-奧恩說

自定義翻譯將提供免費升級到V2。您可以免費將工作區中每個專案中的一個模型重新訓練到 V2 平臺。查看專案時,如果仍有該專案的免費升級積分,則應看到一條消息。優惠從今天開始,到2021年1月31日結束。2021年1月31日之後,每次再培訓需要支付正常的培訓費用。

您可以在下面的常見問題解答中瞭解有關升級到版本 2 的詳細資訊。

常見問題

  1. 你在 V2 中發佈什麼?
    我們將發佈自定義翻譯平臺升級 (V2),使用 Microsoft 最先進的神經機器翻譯架構提供顯著的翻譯品質改進。用戶體驗與 V1 中相同。沒有什麼新東西可以學習, 只是更好的翻譯。如可快速複習,請觀看此 YouTube 上的快速入門視頻.
  2. 將當前部署的模型升級到 V2 平臺的好處是什麼?
    大大改善了翻譯品質;與標準翻譯器和以前的 V1 平臺相比,自定義翻譯 V2 平臺升級將帶來顯著改進。上面的條形圖顯示了某些BLEU域的翻譯品質以及訓練數據集大小的影響。
  3. 如何使用我的免費升級到 V2 信用?
    當您查看專案詳細資訊時,免費信用消息將變為可見(參見下圖),並將繼續可見,直到您成功重新訓練模型或產品/服務在 2021 年 1 月 31 日結束。

  4. 如何將部署(或未部署)的自定義模型升級到 V2 平臺?
    如果您有一個已部署或未部署的僅字典模型,該模型在 2020 年 8 月 3 日之後重新訓練,則該模型已升級到 V2 平臺。否則,您應該啟動新的模型訓練。成功訓練新模型后,"交換"按鈕將可見。單擊"交換"部署新模型。注意:「交換」按鈕可實現無停機時間部署。也就是說,所有轉換請求將繼續由以前的模型提供,直到新模型部署並正常運行,然後新模型將服務於新的翻譯請求,並且以前的模型將取消部署。
  5. V2 平台升級後,能否繼續重新部署 V1 自定義型號?
    是的。我們知道,客戶希望繼續使用 V1 平台上培訓的型號的原因可能。V1 型號可以在 V2 平臺上運行。將來,V1 型號將不能重新部署。注意:重新訓練 V1 型號后,新型號將放在 V2 平臺上。模型模型選項卡將顯示所有新 (V2) 和以前的 (V1) 型號。
  6. 我是自定義翻譯的新鮮人,如何開始使用自定義翻譯?
    要構建自定義模型,請觀看上面的「快速入門」視頻,並參考docs.microsoft.com: https://docs.microsoft.com/azure/cognitive-services/translator/custom-translator/overview

您可以使用微軟自定義翻譯器做什麼。

使用域特定術語構建自定義模型,並使用 Microsoft 翻譯 API 即時翻譯。

使用 Microsoft 自定義翻譯與您的翻譯解決方案,以説明全球化您的業務和改善客戶互動。

有關微軟翻譯解決方案的更多資訊,請造訪: https://www.microsoft.com/translator/business.