從去年至今,人工智能得到了前所未有的關(guān)注,從馬斯克、霍金等大佬對(duì)人工智能的大膽預(yù)測,到《超能陸戰(zhàn)隊(duì)》、《超能查派》和《機(jī)械姬》等電影中出現(xiàn)的強(qiáng)人工智能角色,再到百度、微軟、谷歌等科技巨頭頻頻發(fā)布在人工智能領(lǐng)域的研究成果,歷史上從來沒有像今天樣對(duì)這個(gè)領(lǐng)域有如此多的狂熱和討論。
但熱度終究會(huì)退卻,真正回歸產(chǎn)業(yè)、產(chǎn)品和用戶需求時(shí),我們除了那些科幻式的暢想和預(yù)測,還需要理解,基于現(xiàn)有的研究進(jìn)展,人工智能可以給我們帶來什么真正有價(jià)值的東西,幫助我們解決哪些切實(shí)需求。比如說,我們可以得到更好的搜索結(jié)果;手機(jī)上的語音助手帶給我們種全新的、更加省力的人機(jī)交互方式;計(jì)算機(jī)能夠讀出、辨別圖像中的內(nèi)容等等。除此之外,人工智能還有個(gè)非常重要的應(yīng)用領(lǐng)域,也是可以改變?nèi)澜缃涣鞣绞降墓ぞ?mdash;—機(jī)器翻譯。
人工智能狂熱背后:機(jī)器翻譯的革新
1、語言和機(jī)器翻譯的重要性
機(jī)器翻譯之所以重要的原因是在于語言對(duì)人類的重要性,《圣經(jīng)·創(chuàng)世記》有個(gè)故事,當(dāng)時(shí)人類聯(lián)合起來興建希望塔頂通天能傳揚(yáng)己名的巴別塔。為了阻止人類的計(jì)劃,上帝讓人類說不同的語言,使人類相互之間不能溝通,計(jì)劃因此失敗,人類自此各散東西。科幻作斯蒂芬森也在著名科幻小說《雪崩》中將語言稱為人類大腦的底層結(jié)構(gòu),對(duì)人類的精神起到了至關(guān)重要的作用。LeraBoroditsky認(rèn)為我們使用的語言在影響著我們對(duì)世界的感知,塑造了我們的行為方式和思維模式,Alan Yu稱之為“語言塑造世界觀”。不同的語言帶來了文化的多樣,也對(duì)每個(gè)個(gè)人產(chǎn)生了決定性影響。但世界上存在的多種語言給我們帶來的不便也是顯而易見,它影響了人類基本的需求——溝通交流。
語言是人類智能的體現(xiàn),是人類區(qū)別于其它生物的基本能力。而人工智能長久以來的目標(biāo)就是讓機(jī)器完成那些以前只能靠人類自身才能完成的任務(wù),所以在人工智能的具體應(yīng)用,如何讓機(jī)器幫助人類進(jìn)行語言翻譯就顯得尤為重要了。
2、機(jī)器翻譯的產(chǎn)生與發(fā)展
機(jī)器翻譯直被公認(rèn)為是人工智能領(lǐng)域難的課題之。讓機(jī)器理解語言,進(jìn)而實(shí)現(xiàn)不同語言之間的翻譯,不僅僅是幾代科學(xué)們孜孜追求的技術(shù)夢想,也寄托著普羅大眾實(shí)現(xiàn)自由溝通交流的美好愿望。《星際迷航:企業(yè)號(hào)》里有這樣的情景:星艦通訊指揮官佐藤星利用翻譯器發(fā)明了linguacode矩陣,通過把翻譯器集成到星艦人員佩戴的交流別針上或者植入耳朵里,說不同語言的人們就可以進(jìn)行自由交流。這就是理想態(tài)的機(jī)器翻譯。
機(jī)器翻譯是人們早設(shè)想的計(jì)算機(jī)應(yīng)用領(lǐng)域之,1949年由Weaver提出。機(jī)器翻譯技術(shù)的發(fā)展直與計(jì)算機(jī)技術(shù)的發(fā)展緊密相隨。從早期的詞典匹配,到詞典結(jié)合語言學(xué)專知識(shí)的規(guī)則翻譯,再到基于語料庫的統(tǒng)計(jì)機(jī)器翻譯,隨著計(jì)算機(jī)計(jì)算能力的提升和多語言信息的爆發(fā)式增長,機(jī)器翻譯技術(shù)逐漸走出象牙塔,在近10年中開始為普通用戶提供實(shí)時(shí)便捷的翻譯服務(wù)。而近幾年,許多科技巨頭也公布了和機(jī)器翻譯相關(guān)的產(chǎn)品或服務(wù)。
機(jī)器翻譯在近幾年取得突破進(jìn)展的原因在于兩方面:
是深度學(xué)習(xí)(模擬神經(jīng)網(wǎng)絡(luò))技術(shù)的出現(xiàn),比如說百度此次發(fā)布的翻譯系統(tǒng),就是借助計(jì)算機(jī)模擬的海量神經(jīng)元仿效人腦“理解語言,生成譯文”,同時(shí)結(jié)合百度已有的統(tǒng)計(jì)機(jī)器翻譯技術(shù),使得機(jī)器翻譯質(zhì)量實(shí)現(xiàn)了質(zhì)的飛躍?;谏疃葘W(xué)習(xí)的翻譯系統(tǒng)的核心是個(gè)擁有無數(shù)結(jié)點(diǎn)(神經(jīng)元)的深度神經(jīng)網(wǎng)絡(luò)。種語言的句子被向量化之后,在網(wǎng)絡(luò)中層層傳遞,轉(zhuǎn)化為計(jì)算機(jī)可以“理解”的表示形式,再經(jīng)過多層復(fù)雜的傳導(dǎo)運(yùn)算,生成另種語言的譯文??萍季揞^在機(jī)器翻譯方面取得的成績和他們在自然語言處理、深度學(xué)習(xí)等領(lǐng)域的布局和積累是分不開的。
第二是海量數(shù)據(jù)的積累,百度的人工智能專曾把算法比作火箭的發(fā)動(dòng)機(jī),把數(shù)據(jù)比作火箭的燃料,這兩者缺不可。還是以百度舉例,百度已有的統(tǒng)計(jì)翻譯系統(tǒng)是用大量文本語料庫的統(tǒng)計(jì)信息來訓(xùn)練概率模型而建立起來的。這種方法并不需要個(gè)復(fù)雜的中間語言概念本體,不需要手工建立源語言和目標(biāo)語言的語法,也不需要人工標(biāo)記的數(shù)據(jù)庫。它所需要的只是數(shù)據(jù)——翻譯實(shí)例,從這些翻譯實(shí)例中可以學(xué)習(xí)得到翻譯模型。就像百度副總裁王海峰所說,百度翻譯在基于大數(shù)據(jù)的翻譯模型、翻譯知識(shí)獲取、樞軸語言翻譯等方面取得了重大技術(shù)突破。倪光南院士也把大數(shù)據(jù)比作“第四種科學(xué)范式“,稱其為”個(gè)強(qiáng)大的工具”。而數(shù)據(jù)的積累是搜索巨頭得天獨(dú)厚的優(yōu)勢,也成為了能夠在機(jī)器翻譯方面取得進(jìn)展的必備條件。
3、機(jī)器翻譯應(yīng)用的重要意義
上文提到,對(duì)于人工智能,我們現(xiàn)在為關(guān)心的是該項(xiàng)技術(shù)的應(yīng)用場景,能夠在哪些方面解決我們的切實(shí)需求。對(duì)于機(jī)器翻譯來說,不管是它應(yīng)用范圍的廣度,還是其發(fā)揮作用的重要性,都具有不可估量的想象空間。值得慶幸的是,我們已經(jīng)可以從這些科技公司發(fā)布的產(chǎn)品看到機(jī)器翻譯在未來的廣泛應(yīng)用。百度副總裁王海峰在第十屆中電子信息技術(shù)年會(huì)互聯(lián)網(wǎng)機(jī)器翻譯論壇的演講中表示,通過在理論、技術(shù)、應(yīng)用上的創(chuàng)新和突破,百度機(jī)器翻譯已經(jīng)實(shí)現(xiàn)了大規(guī)模產(chǎn)業(yè)化。通過免費(fèi)開放API,該項(xiàng)技術(shù)成果支持了包括華為、金山等企業(yè)的超過7000個(gè)第三方應(yīng)用。
不同語言造成信息交流的障礙?;ヂ?lián)網(wǎng)的出現(xiàn)使世界變平,這更有利于信息的流動(dòng)和共享,但再進(jìn)步來說,我們不只要獲得信息,還要讀懂這些信息,這就對(duì)不同語言間的信息交流產(chǎn)生了影響,提高了信息交流成本。而機(jī)器翻譯的出現(xiàn)就幫我們所有人解決了這個(gè)難題,除了書面信息以外,機(jī)器翻譯和語音識(shí)別技術(shù)的結(jié)合可以為我們在語音通話時(shí)提供實(shí)時(shí)便捷的翻譯。
對(duì)于每個(gè)用戶來說,我們在出旅游時(shí),借助個(gè)APP就能與當(dāng)?shù)厝诉M(jìn)行實(shí)時(shí)的無障礙溝通,通過拍照識(shí)別路牌和菜單;瀏覽外網(wǎng)站也可以及時(shí)翻譯成本語言。從行業(yè)來講,機(jī)器翻譯的出現(xiàn)對(duì)互聯(lián)網(wǎng)教育、旅游、金融、傳媒和外貿(mào)等行業(yè)都能產(chǎn)生積影響。
從層面來講,機(jī)器翻譯的意義同樣重要,這也是中、美、日本和歐盟都對(duì)機(jī)器翻譯大力投入的原因。清華大學(xué)計(jì)算機(jī)系孫茂松教授稱,從戰(zhàn)略角度看,機(jī)器翻譯是重要的軟實(shí)力之,從老百姓角度看,包括做生意、旅游等,機(jī)器翻譯都是不可缺少的工具,它的社會(huì)、經(jīng)濟(jì)效益是不可低估的。比如說,機(jī)器翻譯在響應(yīng)“帶路”的戰(zhàn)略構(gòu)想上也有著非凡意義。孫茂松表示, “帶路”涉及俄羅斯、印度等超過六十個(gè),人口逼近三四十億,想要打造政治互信、經(jīng)濟(jì)融合、文化包容的利益共同體,語言不通將會(huì)造成很大障礙,而機(jī)器翻譯卻可在其中發(fā)揮舉足輕重的作用。
機(jī)器翻譯技術(shù)正在逐步改變著我們的工作、生活方式甚至外貿(mào)外交。也許三五年之后,看似“高大上”的機(jī)器翻譯會(huì)融入大日常生活的方方面面,而機(jī)器翻譯產(chǎn)業(yè)浪潮也必將達(dá)到個(gè)新的高度。