search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

谷歌翻譯又出新神器,重返中國路有多長?

一、谷歌最新推出Google Translate無需轉錄

谷歌最新的機器翻譯使人們與那些講不同語言的人交流起來更加容易,可以直接將語音轉換成他們能夠理解的語言文本。

語音機器翻譯的常規工作模式是先將語音轉換成文本,然後將其翻譯成另一種語言,但語音識別中的任何錯誤都會導致轉錄過程中的錯誤以及翻譯錯誤

這家科技巨頭的深度學習研究機構Google Brain的研究人員利用神經網路取代了中間環節。通過這種跳過轉錄的方法,使得翻譯更準確、更快捷。

該小組對其系統進行了幾百小時的西班牙音頻培訓,並附有相應的英文文本。在任意一種情況下,它使用數層神經網路——在人類大腦上大致建模的計算機系統,將口語西班牙語與書面翻譯進行匹配。為了做到這一點,它分析了西班牙音頻的波形,學習哪些部分看起來與哪些部分的英文書面對應。當它開始翻譯后,每個神經層都運用這些知識來操縱音頻波形,直到它變成相對應部分的書面英文。

它通過學習去找到源語言和書面文本中的波形之間的對應關係模式。」加拿大蒙特利爾大學的Dzmitry Bahdanau表示,他不參與此項工作。

在一個學習周期之後,谷歌的系統完成了一個質量較高的英文譯本,比先將語音轉錄成西班牙語之後寫成西班牙語文本的效果要好。工作人員使用BLEU評分對其進行評估,該分數旨在它與專業人員的翻譯結果進行比對,根據接近程度來評判機器翻譯成果。

英國愛丁堡大學的沙龍·戈德沃特(Sharon Goldwater)表示,這個系統對於翻譯小語種語言特別有用例如,國際救援隊可以利用它迅速建立一個翻譯環境來與他們正在努力救助的人交流。Goldwater說,2010年發生地震時,海地的克里奧爾語就缺少一個能用得上的翻譯軟體。

Goldwater的團隊正在使用類似的方法將Arapaho從語音翻譯成文本,這個語言只有1000人左右在使用,是美國原住民部落的同名語言;而Ainu,則是日本少數人所講的語言。

該系統也可以用於翻譯那些極少被寫成文字的語言,因為它不需要藉助源語言的書面版本來完成翻譯。

Goldwater說,在測試一個規模比這大得多的數據集之前,人們無法將這種新方法與更常規的翻譯系統進行真正意義上的比較,效果很難分辨。但她認為這可以為未來的機器翻譯設定標準

有些服務之前已經利用機器翻譯來幫助那些語言不通的人之間實現實時對話。Skype在2014年推出了帶有語音翻譯功能直播,現在支持九種語言,包括普通話和阿拉伯語以及最普遍的歐洲語言。但是像現有的其他翻譯方法一樣,Skype在將語音翻譯成不同的語言之前需要將其轉化為文本。

在文本翻譯服務方面Google Translate已經將神經網路運用在它流行度最高的語言上,這樣使得它可以一次性分析整個句子,從而完成最恰當的書面翻譯。有趣的是,該系統似乎使用了某種「中間語言」——一種用於不同語言但相同含義的句子間的通用表示方法,來將一種語言翻譯成另一種語言,這意味著它可以在沒有進行專門「學習」過的語言之間進行翻譯。谷歌大腦研究人員提出,以文字方式進行新的語音處理或許能夠建立一種可以翻譯多種語言的系統。

Bahdanau表示,雖然機器翻譯不斷改善,但卻很難說得清神經網路是如何實現它們的解決方案的。「很難理解這當中發生了什麼。」

二、谷歌翻譯在華上線:正努力重返市場

美媒稱,谷歌公司3月29日推出了一款在一定程度上專門針對用戶而且在可以使用的更新版翻譯應用,這是該公司繼續努力在部分領域重返市場的一個跡象。

報道稱,隨著新版翻譯應用的推出,這似乎是用戶第一次不必使用特殊軟體就能夠在安卓和蘋果手機上下載和使用谷歌翻譯服務。據了解,此次更新包括,語音翻譯、點按翻譯、實景翻譯、離線翻譯,而且還增加了英語與韓語間即時相機翻譯功能。

谷歌方面稱谷歌翻譯此次更新最大的變化是「改善用戶的使用體驗」,事實上也的確如此。自2010年宣布退出市場后,谷歌一直保持著低調的姿態。他們看重的不但是廣闊的市場,還有大量的創新人才。更新軟體看起來是一件小事,卻代表著谷歌的某種期許。可以說,沒有的世界經濟是不完整的,沒有市場的國際市場也是殘缺的。要回歸,谷歌還有很長的路要走。

三、谷歌翻譯面對百度遭「水土不服」?

闊別市場七年之後,谷歌翻譯在產品體驗上與國內這一領域的領頭羊百度翻譯有了較大的差距。

谷歌想在市場獲得其在美國同樣的領先優勢並不容易,由於缺少大量、優質的語料訓練,谷歌翻譯在中英文互譯的實際效果中和深耕市場的,被認為是最懂中文的百度短時間內還無法比擬。

可以想見,為了提高翻譯的效果,谷歌此番低調開放內地市場的翻譯App,第一階段很大程度上是出於積累更多中文語料數據的目的,通過實時實景翻譯等比較酷的玩法吸引用戶更多的使用。

不過考慮到翻譯本身的嚴肅性,在細節上略遜一籌的谷歌面對百度翻譯的競爭依然缺少一定的底氣。尤其是谷歌離開市場的這幾年間,深度學習被應用到機器翻譯領域,而機器學習的基礎則是足夠龐大的數據量。

在這方面,作為中文搜索市場份額最大的搜索引擎百度,自然是更具優勢。從另一個角度來看,谷歌翻譯此番重返市場本身也承載著為谷歌積累更多中文數據的重要任務。

本文來源New Scientist網站、參考消息、俊世太保,由Atman機器自動翻譯,億歐編輯整理。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦