近年來,機器翻譯(英文Machine Translation,簡稱MT)取得了長足的進步,并獲得一些可喜的成果。作為人工智能領域的關鍵核心技術,MT普遍受到人們的關注和專家的研究。然而,目前MT存在譯文質量整體不高、譯后修改工作量較大等問題;這些問題有待解決。
MT技術的發展一直與計算機科學、語言學、心理學、控制論、信息論等學科的發展緊密相隨。從早期的詞典匹配,到詞典結合語言學專家知識的規則翻譯,再到基于語料庫的統計翻譯;隨著計算機算力的提升和多語言信息的爆發式增長,MT技術逐漸走出象牙塔,開始為普通用戶提供實時便捷的翻譯服務。
目前主流的MT技術是神經網絡翻譯(NMT);它是最近幾年才提出來的一種翻譯方法。相比于傳統的翻譯方法而言,NMT能夠訓練一張能夠從一個序列映射到另一個序列的神經網絡,輸出的可以是一個變長的序列,這在翻譯方面能夠獲得比較好的表現。可以說,NMT技術已經成為當下研究的關鍵和熱點。
目前市場上MT技術相對成熟的是谷歌翻譯和微軟翻譯;它們原來背后的技術即為基于統計的翻譯方法,基本運行原理是通過搜索大量的雙語網頁內容,將其作為語料庫,然后由計算機自動選取最為常見的詞與詞的對應關系,最后給出翻譯結果。而現在谷歌和微軟采用神經網絡和深度學習的原理和框架,從而使MT技術有了很大的進步。
然而,無論是哪種翻譯方法,目前影響MT發展的最大因素在于譯文質量。就MT已有的成就來看,譯文質量離理想目標(達到高級譯員的翻譯水準)仍相差甚遠。眾所周知,人工翻譯(簡稱“人譯”)的過程是人工譯者集理解、分析、選擇及再創造為一體的綜合操作,是大腦系統思維活動的過程。
MT的譯文質量要達到人譯的水準,就必須解開大腦處理語言信息之謎。其實早在20世紀90年代初,中國科學家及未來學家周海中教授就指出:在人類尚未明了大腦是如何進行語言的模糊識別和邏輯判斷的情況下,MT要想達到“信、達、雅”的程度是不可能的。他的這一預言今天已經基本成真,很可能成為今后MT發展的現實。
近年實施的歐洲大腦計劃、美國大腦計劃、中國大腦計劃、日本大腦計劃等都旨在利用計算機模擬人類大腦, 其核心內容是神經信息學。這一新興前沿學科的研究成果將有助于人們了解大腦是如何進行自然語言處理的,并有望為人工智能領域,尤其是MT技術的進展鋪平道路。
MT要達到人譯的程度還有很長很難的路要走,要解決這一人工智能領域的關鍵核心技術還有待未來科技的發展,尤其是大腦科學的重大突破。目前人們只能將MT與人譯結合起來,相輔相成;這既能節省翻譯的時間和成本,又能翻譯出高質量的譯文。
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:[email protected]。