google翻譯的發展曆程快速,10年前,google推出翻譯服務,並以片語式機器翻譯(phrase-basedmachine translation)作為首要運算體例。從過去僅支援幾種說話,到現在可支援103種說話,且天天翻譯跨越1400億個單詞,google翻譯的品質有了很大的進展翻譯
他指出,機械進修是很重要的議題,大家在會商google翻譯的學習功能之際,也會聯想到人工電腦alphago打敗真人世界棋王翻譯現在也有人提出讓alphago打alphago,學習能力可以更快的說法,就像是金庸小說「西嶽論劍」裡全真派的周伯通,用自己的左手和右手對打,使出的「左右互搏」。
google神經機械翻譯(gnmt)將中文句子翻譯成英詞句子的進程,透過編碼器 (encoder),起首,gnmt將中詞句子的每個單詞進行向量(vector)編碼,而每一個向量將顯示出今朝為止單詞被讀取到的所成心義。
結合報系資料照片 google台灣董事總司理簡立峰說,google翻譯比之前好用太多了!就算有人惡作劇,刻意在「提出點竄建議」欄位寫下錯的翻譯,也不會影響系統的運作。簡立峰诠釋,google翻譯有進修及資料庫的功能,不息積累經驗,錯誤也是一種經驗,除非幾乎所的人都在「點竄建議」欄寫下一模一樣的錯誤,才會積非成是,但事實上這種環境並不可能發生翻譯
其實不只簡體中文、繁體中文的語法不異,他泄漏,日文、韓文在機器翻譯上也可算是語法不異,用同一套系統。
他認為,雖然簡體中文、繁體中文有些不異的字詞有著不同的意義,或相同的字已衍生出新的意義,但因簡體、繁體中文語法不異,在機械翻譯上仍採用一套系統,可視為專有名詞,透過進修建樹資料庫來校訂。
曩昔,為翻譯任意兩種說話,google需要建構多個分歧的翻譯系統,運算本錢相當可觀翻譯相較於曩昔的片語機械學習(pbmt),神經機械翻譯(nmt)僅需要較少的系統架構設計翻譯剛起頭推出神經機械翻譯時,這兩種翻譯體式格局的精準度分庭抗禮。
數年前,google採用遞歸神經網絡(recurrentneural networks)將句子視為一個單位進行翻譯,之後的片語式機器翻譯方式(pbmt),則是將句子切割成零丁的字和詞組做自力翻譯。
本文引用自: https://udn.com/news/story/6811/2440774有關翻譯的問題歡迎諮詢天成翻譯社
留言列表