跳轉至主要內容
線上翻譯

微軟翻譯博客

新的微軟翻譯自訂功能説明為每個人釋放人工智慧的力量

今天, 我們正在改變公司如何對待自動翻譯, 利用我們的 人工智慧 專業知識, 使任何人都可以快速、輕鬆地定制翻譯系統, 即使沒有大量以前翻譯過的句子。此外, 隨著更多資料的出現, 我們也為您提供了逐步改進系統的機會。

我們之所以進行這些更新, 是因為每個公司都是獨一無二的, 其翻譯需求也是如此。直到幾年前, 自動翻譯解決方案在翻譯內容時只提供了兩種方法--使用預設的翻譯引擎, 為主要翻譯網站和應用 (如 Bing.com/translator, 或從頭開始痛苦地構建自己的自訂系統。

2012年, 微軟翻譯打破了這一不靈活的模式, 推出了 微軟翻譯器集線器.這只是微軟正在開展的更廣泛的工作的一個例子 人工智慧, 以及我們對更多的個人計算體驗和提高生產率的願景, 這些系統越來越多地能夠看到、聽到、說、理解甚至開始推理。該中心允許使用者根據需要創建盡可能多的自訂系統, 方法是將 microsoft 龐大的翻譯語料庫與他們自己以前翻譯的文檔 (如內部或外部網站、摺頁冊、白皮書等) 結合起來。

現在, microsoft 翻譯 api 使用者可以使用4個常規的自訂級別, 相應地增加了資源投資和翻譯品質。

  1. 新增: 使用標準類別而不是預設類別– 我們的新標準類別允許您通過縮小 microsoft 翻譯人員用於翻譯文本的統計分析範圍, 輕鬆自訂翻譯的上下文。簡單地說, 使用標準類別, 您可以告訴 microsoft 翻譯人員正在翻譯的內容類型, 以提高其準確性。我們今天宣佈的前兩個標準類別是 "科技" 和 "演講", 更多的是在路上。
    • "技術" 類別將提高所有電腦相關內容 (軟體、硬體、網路...) 的翻譯品質, 並且是在我們翻譯產品説明檔、文檔時, 利用多年來在 microsoft 內部收集的大量資料構建的,和客戶支援我們的使用者, 以及來自其他來源, 如 陶斯.可以找到支援技術類別的語言清單 在這裡.
    • "語音" 類別是在過去18個月中開發的, 當時我們構建了 skype 翻譯器。為了讓 skype 翻譯正常工作, 能夠翻譯口語文本是至關重要的, 在大多數情況下, 這可能與書面文本有很大的不同。此類別中支援的語言是相同的 語音翻譯語言 可用於 Skype 翻譯適用于 ios 和 android 的微軟翻譯應用程式.隨著這些應用程式發佈新的語音語言, 相應的 "語音" 類別也將在我們的核心翻譯 api 中用於文本翻譯。

    在翻譯中很容易開始使用標準類別-如果您使用的是 api, 則只需將翻譯方法的 "類別" 參數的值設置為 "技術" 或 "語音", 或者在我們支援的任何產品中的 "類別 id" 框中 (如 文檔翻譯.預設值 "常規", 可以省略-只需選擇新的標準類別即可開始接收自訂翻譯。

    除了標準類別外, 我們還開發了一個 "社交媒體" 篩檢程式, 我們可以根據需要啟用伺服器端。這種用戶端 id 級別篩選器的開發是為了將文本和即時消息轉換為適當的英語, 以提高翻譯品質。例如, 一旦通過篩檢程式, "你在這裡嗎?" 將變成 "你在這裡嗎?"--這顯然會比原來的翻譯得好得多。請注意, 目前只存在英語短信篩檢程式。

  2. 新建: 上傳自訂字典– 您可以使用詞典進一步自訂您的翻譯。字典允許您製作自己的外語單字清單, 以便您的企業或行業獨有的術語將按照您想要的方式進行翻譯。例如, 如果您有一個產品名稱, 您希望以某種方式翻譯法語 (或根本不翻譯, 如果它是一個品牌名稱), 只需將產品名稱和相應的法語翻譯添加到您的詞典中即可。每次使用 微軟翻譯 API 使用從翻譯中心獲得的自訂類別 id, 您將獲得自訂翻譯。要使您的翻譯正常運行, 您只需將一個簡單的 excel 試算表與您的單字清單上傳到 翻譯中心網站 並對系統進行培訓。您可以從一個字典條目開始。使用詞典創建的自訂類別可以在常規或標準 (語音或技術) 類別之上生成, 即使使用以下選項之一自訂系統, 該類別仍然有效。
  3. 新功能: 訓練一個包含 1, 000–5, 000個並行句子的系統– 第三個級別的自訂是將預翻譯的內容添加到您的自訂類別。今天, 我們正在引入培訓一個只有 1 000個平行句子 (原文和目標語的預翻譯句子) 的系統的能力。通過訓練一個具有平行句子的系統, 你可以超越簡單的翻譯單詞和片語清單。相反, 集線器對其所有內部參數進行調整, 以生成與您提供的測試句子類似的翻譯。通過向中心提供至少 1, 000個平行句子, 您可以説明集線器選擇比標準類別更符合組織術語和色調的翻譯。如果您以其他語言 (如網頁或文檔) 創建了內容, 則可以使用它來改進翻譯。顯然, 你的句子越多, 翻譯就越好。您可以單獨使用此自訂機制, 也可以與自訂字典結合使用。
  4. 訓練一個包含超過 5, 000個平行句子的系統– 自集線器啟動以來, 您可能會這樣做, 但現在只從 5, 000個句子開始, 而不是以前的 10, 000個句子, 您可以使用超過 5, 000 的任何數量的平行句子來自訂您的翻譯。有了 5, 000多個平行句子, 你就可以開始創建一個系統, 在你的企業的正確背景和語氣中學習新的術語和短語。這將帶來更好、更定制的翻譯。如果你有一個少於 50, 000個平行句子的語料庫, 請添加字典以獲得更好的結果。如果你有超過 50, 000個平行句子, 你將能夠建立一個系統, 可以給完全定制的結果。在此級別, 電腦通過並行句子學習了上下文中的術語, 因此字典的説明較小, 並且可以在源內容中開發新主題時簡化為新術語。

該中心擁有超過 50, 000個平行句子, 理想情況下是在數千句的 100, 使您能夠創建全新的語言系統。許多微軟翻譯支援的語言是由 社區合作夥伴 包括 mong daw、yucatec maya、queretaro otomi、welweli omomi 和史瓦希里文。

一旦您培訓並部署了新的自訂系統, 它就可以在所有支援 id 的類別 microsoft 翻譯產品中使用, 例如本地版本 Sharepoint, office 應用程式 幻燈片, 該 文檔翻譯, 和 多語言應用工具組, 以及我們的許多翻譯記憶庫工具。 合作 夥伴.該集線器可以説明提高各種方案的翻譯品質, 例如 網站當地語系化, 客戶支援內部通信, 無論是線上還是在應用中。

要開始使用翻譯中心自訂您的系統, 只需訪問 www.microsoft.com/translator/hub.aspx, 並註冊工作區。您可以邀請盡可能多的其他人加入您的工作區, 以協作改進您的翻譯系統。當您準備好部署自訂系統時, 您需要註冊 microsoft 翻譯帳戶。您可以註冊 每月免費訂閱200萬字元 讓你開始。註冊後, 您可以轉到 翻譯中心網站 開始自訂!

瞭解更多資訊: