假如上帝真的存在,他(tā)最近可(kě)能(néng)有(yǒu)些心事。
在猶太人的古老傳說中(zhōng),人類曾試圖修建一座通向天堂的“巴比倫塔”。為(wèi)阻止這個瘋狂的計劃,上帝想出一個絕招——賦予不同族群不同語言,讓人們難以溝通。
最終,語言的隔閡讓“巴比倫塔”計劃擱淺。直到今天,即便信息和交通技(jì )術把世界變成了“地球村”,語系之間的交流,依然隻能(néng)依靠對彼此語言的專業學(xué)習。
但是現在,人工(gōng)智能(néng)在語言翻譯領域的突飛猛進,又(yòu)讓人們重新(xīn)看到了“巴比倫塔”竣工(gōng)的希望。
九成六級考生不如“它”
這段時間,機器翻譯技(jì )術可(kě)謂高調。
微軟剛剛在12月13日放出“大招”——推出實時語音翻譯應用(yòng)MicrosoftTranslator,支持多(duō)人、多(duō)語言、跨設備交流。國(guó)内企業并未示弱。上個月底科(kē)大訊飛在其年度發布會上也展示了類似的技(jì )術,可(kě)以将中(zhōng)文(wén)會議演講實時翻譯成英、日、韓、維吾爾等多(duō)種語言顯示在大屏幕上。發布會上推出的語音翻譯機“曉譯”還瞄準了更廣闊的應用(yòng)場景——出國(guó)遊玩。
平時不顯山(shān)不露水的在線(xiàn)翻譯應用(yòng)也已華麗升級。今年9月,谷歌翻譯啓用(yòng)了谷歌神經機器翻譯(GNMT)系統,在人工(gōng)智能(néng)界引起騷動。而追溯至去年5月,則是百度翻譯發布基于神經網絡的機器翻譯(NMT)系統的時間。
機器翻譯的高調,依賴于人工(gōng)智能(néng)技(jì )術在這一領域的顯著進展。
百度主任架構師何中(zhōng)軍介紹,自上世紀40年代起,基于規則、實例以及統計的機器翻譯方法漸次登場。2014年起,人工(gōng)神經網絡開始在機器翻譯領域引領風騷。
“最終的翻譯效果就是更加流暢了。”科(kē)大訊飛機器翻譯研究主管劉俊華告訴科(kē)技(jì )日報記者,科(kē)大訊飛所展示的會議實時翻譯系統和“曉譯”翻譯機便應用(yòng)了基于神經網絡的機器翻譯方法。
若問人工(gōng)智能(néng)的到來把機器翻譯“提”到了什麽水平,何中(zhōng)軍舉出一道大學(xué)英語六級翻譯真題。這道題需要把一句中(zhōng)文(wén)翻譯成英文(wén),而百度翻譯應用(yòng)給出的答(dá)案,從詞彙和語法來看都挑不出什麽毛病。
無獨有(yǒu)偶,科(kē)大訊飛在推介其“曉譯”翻譯機時也曾表示它可(kě)以達到大學(xué)英語六級水平。“大學(xué)英語六級的翻譯題目滿分(fēn)為(wèi)15分(fēn),目前機器翻譯答(dá)題可(kě)以達到11分(fēn)。”劉俊華解釋說,這意味着機器翻譯技(jì )術大概可(kě)以超過90%的英語六級考生。
“煉丹爐”取代了“流水線(xiàn)”
就在兩三年前,“流暢”和“自然”還是讓機器翻譯研究人員感到頭痛的字眼。那時,基于統計的機器翻譯方法是大熱門。
短短兩年多(duō)時間内,基于神經網絡的機器翻譯系統,就在多(duō)個公(gōng)開測試集上超越了基于統計的機器翻譯系統。
單從翻譯步驟來看,劉俊華的體(tǐ)會是,基于神經網絡的機器翻譯比其前任“簡潔了非常多(duō)”。比如,要把一句中(zhōng)文(wén)翻譯成英文(wén),基于統計的機器翻譯方法首先要對句子的詞彙、短語進行切分(fēn),然後分(fēn)别對每個單元進行翻譯,再把翻譯結果組合起來,最後還要進行調序等等。每個步驟都對應着十分(fēn)複雜的模型。
形象地說,如果基于統計的方法是一條長(cháng)長(cháng)的流水線(xiàn),基于神經網絡之後隻需一個“煉丹爐”。
新(xīn)方法被稱為(wèi)“從端到端”的翻譯。“基本的神經機器翻譯模型包含兩個部分(fēn),編碼器和解碼器。”何中(zhōng)軍解釋說,編碼器将源語言句子表示為(wèi)一個向量,解碼器根據此向量逐詞産(chǎn)生目标譯文(wén)。也就是說,一個句子經過一次“加工(gōng)”就能(néng)夠直接輸出目标語言。
不僅翻譯效率得到了極大提高,結果也更加流暢自然。這是因為(wèi),神經機器翻譯方法是對整個句子進行編碼處理(lǐ),可(kě)以照顧到詞彙的上下文(wén)信息,因此翻譯出的答(dá)案不像統計機器翻譯方法那樣生硬。
正是“流暢”和“自然”将機器翻譯技(jì )術推向更加實際的應用(yòng)。而且在與其他(tā)人工(gōng)智能(néng)技(jì )術相結合後,機器翻譯可(kě)以真正觸到人們語言不通的“痛點”,從而深度切入商(shāng)務(wù)、旅行、學(xué)習等多(duō)個場景。
例如,無論是微軟的MicrosoftTranslator,還是科(kē)大訊飛的會議實時翻譯系統以及“曉譯”翻譯機,都結合了語音識别技(jì )術來為(wèi)語言交談架起橋梁。而融入了光學(xué)字符識别(OCR)技(jì )術的百度翻譯APP,則可(kě)以在國(guó)外購(gòu)物(wù)或旅遊的場景下,幫助人們翻譯看不懂的英文(wén)路牌、菜單和說明書等。
等待打破“歎息”之牆
可(kě)以看到,人工(gōng)智能(néng)正在一點一點“捅破”人與人之間的語言隔閡。有(yǒu)網友戲言,或許不久後的一天,揣着裝(zhuāng)了高效語言翻譯APP的手機,鄰居大媽也能(néng)來一場說走就走的世界旅行。所有(yǒu)國(guó)家的學(xué)生将徹底掙脫外語課的“黑暗統治”。
不過,要把重建“巴比倫塔”的美夢寄托給當前、乃至未來一段時間内的機器翻譯技(jì )術,還是有(yǒu)點不太現實。
“基于神經網絡的翻譯技(jì )術雖然帶來了機器翻譯質(zhì)量的較大提高,但是本身還存在諸多(duō)技(jì )術挑戰。”何中(zhōng)軍說。他(tā)把神經網絡比作(zuò)一個“黑盒子”,中(zhōng)文(wén)句子進去,英文(wén)句子出來,但是這個“黑盒子”為(wèi)何要這麽翻譯,技(jì )術人員還難以對其進行合理(lǐ)的解釋。
更重要的是,複雜、多(duō)變,我們自己都掌握不住的“人性”,仍然是所有(yǒu)人工(gōng)智能(néng)發展的歎息之牆。
雖然對單個句子的翻譯可(kě)以實現流暢和自然,但是在整個篇章的上下文(wén)理(lǐ)解方面,機器翻譯并不給力。一旦涉及歇後語、詩句、雙關語甚至口語化的表達,機器翻譯更會毫不掩飾地掉鏈子。而對于如何将知識融合到機器翻譯系統中(zhōng),讓機器真正“理(lǐ)解”人類的語言,目前還沒有(yǒu)較好的解決方案。
從另一個角度來看,無論是基于統計的機器翻譯,還是基于神經網絡的機器翻譯,都以龐大的語料庫為(wèi)基礎。然而劉俊華告訴科(kē)技(jì )日報記者,雖然中(zhōng)、英等主要語種的語料相對充足,一些小(xiǎo)語種的翻譯,比如科(kē)大訊飛目前關注的國(guó)内少數民(mín)族語言的翻譯,依然會面臨語料短缺的問題。
“目前的成果可(kě)以證明,神經網絡在語言翻譯領域的應用(yòng)效果不錯,但它的潛力還沒有(yǒu)完全發揮出來。”劉俊華給出的方案是,可(kě)以考慮将其他(tā)技(jì )術路線(xiàn)與基于神經網絡的機器翻譯方法融合起來,使其各施所長(cháng),實現更好的翻譯效果。
人工(gōng)智能(néng)會不會取代專業的同聲傳譯?這個簡單的問題竟讓機器翻譯領域的專家們感到為(wèi)難。何中(zhōng)軍用(yòng)“任重道遠(yuǎn)”作(zuò)為(wèi)回答(dá),而在劉俊華看來,對照傳統的翻譯規則——“信、達、雅”,人工(gōng)智能(néng)目前僅能(néng)實現“信”,離後二者尚有(yǒu)距離。
這麽說來,上帝或可(kě)放寬心:就算人工(gōng)智能(néng)要幫助人類重建“巴比倫塔”,也不過剛剛撿起幾塊磚瓦而已。
隻是,未來呢(ne)?