用導圖讀論文 技術進步視域下機器翻譯技術對語

 博魚平臺新聞資訊     |      2022-07-26 03:35

  十九大報告提出,中國要堅持和平發展道路,推動構建人類命運共同體。語言服務可以促進國與國之間的交流,是實現人類命運共同體構想的有力推手,而語言服務技術的進步,尤其是機器翻譯技術的創新與變革,是促進語言服務業發展的重要因素。本研究基于技術進步視角,重點探討了以下三個問題:(1)神經機器翻譯技術對語言服務企業績效產生何種影響?(2)面對機器翻譯技術進步時的決策如何影響語言服務企業的未來發展?(3)機器翻譯技術進步如何驅動全球語言服務業內的并購重組?研究發現:神經機器翻譯技術對語言服務企業績效具有顯著的積極影響;相較于未采用機器翻譯技術的語言服務企業,采用機器翻譯技術的企業業績增長明顯;機器翻譯技術進步推動了語言服務業內的并購重組,并顯著提升了相關企業的績效。研究結果表明,機器翻譯技術進步是現代語言服務業飛速發展的主要原因之一,語言服務企業應順應時代變化,積極擁抱新技術,促進自身與行業的發展。

  語言服務產業的主要驅動力是技術進步,尤其是以機器翻譯為代表的語言服務技術的創新與變革。2013年,Nal Kalchbrenner & Phil Blunsom提出了端到端神經機器翻譯的“編碼-解碼”框架,催生了神經機器翻譯研究的熱潮。百度和谷歌分別于2015年和2016年上線了各自研發的神經機器翻譯系統,標志著神經機器翻譯技術的正式商業應用。近年來,神經機器翻譯的發展使機器翻譯的質量得到了性的提升,在多個指標上顯著超越了傳統的統計機器翻譯并逐漸向人工翻譯靠近,并在谷歌翻譯、必應翻譯、百度翻譯等多個機器翻譯平臺上被快速推廣應用,被視為重大的語言技術突破。

  機器翻譯技術的發展與應用,為語言服務業帶來了深遠的影響,主要體現在以下兩個方面:首先,機器翻譯對人工翻譯的輔助作用越來越大。神經機器翻譯的譯文輸出質量已經達到較高的水平,這使“機器翻譯+譯后編輯”生產模式中譯后編輯的工作量和工作時間大大減少。因此,采用新技術可以提升工作效率,從而擴大增加業務量與提升市場競爭力的空間。其次,語言服務產業的整體市場不僅不會萎縮,反而可能會因為機器翻譯的應用而擴大。一些原來因為人工翻譯不方便、成本過高等原因而被忽視甚至被放棄的語言服務細分業務,如出國旅行的翻譯服務、信息量龐大的電商網站的本地化、社交媒體信息的即時翻譯等,其業務量隨著機器翻譯技術的成熟獲得了較快增長。

  語言服務業作為實現人類命運共同體構想、推動“一帶一路”沿線各國的合作與發展、助力脫貧攻堅、參與全球抗疫的中堅力量,日益受到學界和各級政府部門的關注。本文從技術進步視角出發,采用定量與定性相結合的分析方法,全方位考察機器翻譯技術進步對語言服務行業的影響。

  語言服務是實現知識和經驗人際或組織間轉移的社會經濟過程(李瑞林,2017)。語言服務業是以實現跨語言的文化交流和融合為目標,提供翻譯、本地化服務、語言技術工具開發、語言培訓和教學、多語言信息咨詢等服務

  的行業(趙軍峰、寇瑩瑾,2017)?,F階段,語言服務業已成為全球產業鏈中非常重要的一環(邵珊珊,2017),相關研究方興未艾。

  在技術創新不斷為不同行業帶來產業范式變遷(Paradigm Shift)的時代背景下,以機器翻譯技術為代表的語言服務技術也在持續重塑語言服務行業。截至目前,語言服務業內共出現了三次主要的技術變革:自20世紀80年代末期開始的計算機輔助翻譯工具(Computer-Assisted Translation Tool)的廣泛應用,20世紀90年代末期統計機器翻譯技術(Statistical Machine Translation)的普及應用,以及目前神經機器翻譯技術(Neural Machine Translation)的推廣和應用。在推動語言服務產業結構升級的同時,機器翻譯技術的不斷進步與創新也為語言服務企業與產業帶來了范式變遷。而頻繁的國際經貿活動使得各國對語言服務的需求與日俱增,這對語言服務產業的生產力水平帶來了前所未有的挑戰,進一步推動了機器翻譯技術的快速發展(Hutchins,1998;Chatzikoumi,2020)。

  既往研究語言服務技術(以機器翻譯為代表)與語言服務產業關系的文獻中,一部分研究表明技術進步顯著地影響了語言服務產業的發展。司顯柱、郭小潔(2018)認為語言服務業發展的源動力在于技術進步。Luo et al.(2018)指出,技術創新將會重塑語言服務業的產業結構和增長模式。另一部分研究則認為語言服務技術仍不足以顯著影響語言服務業。Drugan & Babych(2010)發現機器翻譯難以妥善處理語言距離較遠的兩種語言的互譯,對語言服務業的影響有限。崔啟亮(2014)指出,原始的機器翻譯產品仍存在較多錯漏,因此機器譯文的譯后編輯環節仍是不可或缺的。以上研究主要探討的是統計機器翻譯的影響,而統計機器翻譯的準確度顯著低于神經機器翻譯(Bentivogli et al.,2018),因此對前者的分析不一定適用于后者。此外,過往文獻以定性分析為主,缺乏定量分析,且未對語言服務企業所受到的影響進行深入研究。

  有鑒于此,本文將通過事件分析法與案例分析法,在系統梳理語言服務業主要技術類型的基礎之上,從技術進步的視角探討當前語言服務業面臨的機遇與挑戰,并聚焦于以下三個問題:(1)神經機器翻譯技術對語言服務企業績效產生何種影響?(2)面對機器翻譯技術進步時的決策如何影響語言服務企業的未來發展?(3)機器翻譯技術進步如何驅動語言服務業內的并購重組?

  近年來,技術在語言服務業中的作用與日俱增,且很大程度上決定了語言服務業未來的走向。本節將從語言技術業務出發,介紹當前語言服務業中主要的技術類型。如圖1所示,2015—2019年間,全球語言技術市場規模呈穩步增長趨勢,在神經機器翻譯技術正式商業應用的2016年更是出現了爆發式增長。

 ?。?)管理與處理(此類技術主要負責對翻譯項目進行支持和管理,可以細分為三種類型:內容管理集成連接器、筆譯管理系統、口譯管理系統);

 ?。?)翻譯與交付(此類技術為具體的翻譯過程提供幫助,主要包括機器翻譯、語音處理、本地化工程、術語管理、質量評估和檢查、翻譯記憶、翻譯環境等);

 ?。?)內容創建與發布(此類技術能夠對翻譯結果進行潤色提升,主要包括視聽工具、內容管理系統、風格檢查、信息提取和發現、出版輔助、自動內容豐富等)。

  圖2—圖4呈現了2015—2019年間,以上三大類語言技術細分類型占語言技術業務總營收的比例情況。

  近年來,筆譯管理系統、機器翻譯、內容管理集成連接器和口譯管理系統是語言技術總營收占比最高的四項技術,圖5總結了五年間(2015—2019)這四項技術占比的發展趨勢。由圖5可知,自2016年后(即神經機器翻譯技術正式商業應用后),機器翻譯技術的營收占比出現了明顯的上升,而其他三種技術所占營收份額或出現明顯的下降(口譯管理系統),或基本維持不變(筆譯管理系統、內容管理集成連接器)。

  上一節的分析表明,近年中,以機器翻譯為代表的語言服務技術營收出現明顯的上升趨勢。一方面,新技術驚人的學習速度可以幫助語言服務企業大幅提高翻譯效率,另一方面,高科技公司也在借助這些新技術進入語言服務行業,成為語言服務企業的競爭者。因此,語言服務技術進步對語言服務業而言,既是機遇,也是挑戰。本節將從三個不同維度,采用定量與定性分析相結合的方法,探討機器翻譯技術進步對語言服務業的影響。小節4.1將采用事件研究法分析谷歌正式發布其神經機器翻譯系統對語言服務業上市公司的沖擊;小節4.2采用案例分析的方法進一步探討企業面對機器翻譯技術進步時的決策如何影響其未來發展;小節4.3探討機器翻譯技術進步如何驅動語言服務業內的并購重組。

  2016年11月15日,谷歌宣布將其研發的谷歌神經機器翻譯系統2016年11月15日,谷歌宣布將其研發的谷歌神經機器翻譯系統(Google Neural Machine Translation,GNMT)正式應用于谷歌翻譯,取代原先使用的統計機器翻譯系統;同時,谷歌還在免費翻譯服務的基礎上,提供付費的API服務,使得第三方機構(包括語言服務企業)也可以在它們的業務中使用谷歌的神經機器翻譯系統。這個事件標志著神經機器翻譯具有全球影響力的首次大規模商業應用,對語言服務業具有深遠的影響。一方面,這標志著以谷歌為代表的高科技公司借助技術進步進入語言服務行業,與語言服務企業形成競爭關系,從而對后者的市場份額與經營績效產生負面沖擊。另一方面,語言服務企業可以通過采用新技術來提高翻譯效率,降低成本,提升業績。換言之,神經機器翻譯技術對語言服務業既有負面沖擊,也有正面影響。

  為了量化神經機器翻譯技術的凈影響,本小節聚焦于語言服務業上市公司的股價變化。由于神經機器翻譯技術是語言技術的一項重大突破,所以投資者應該會意識到該技術對語言服務企業經營績效的正面與負面影響,并通過股票交易將影響反映到語言服務上市公司的股價上。具體而言,谷歌的公告向資本市場提供了豐富全面的信息,使所有人(包括投資者)都可以直觀地體驗新技術對翻譯質量的提升,從而能更好地評價該技術的應用前景及其為語言服務企業帶來的潛在競爭和潛在收益,所以此公告導致的語言服務上市公司的股價變化能夠準確地反映該技術未來對企業績效的影響。因此,本小節將通過事件研究法來量化神經機器翻譯技術的影響。所用到的語言服務上市企業的股票數據來自于標準普爾的Capital IQ數據庫。以下是對這一方法的簡單介紹。

  該方法首先選定公告日為事件日0,然后選取[– 210,– 11],即事件日前第210個交易日到前第11個交易日作為估計窗口,共200個交易日。接著運用估計窗口的數據對每一家公司分別估計如下的市場模型:

  其中,Rjt為企業j在t日股票收益率,Rmt為企業所在國家在t日的市場收益率,ejt是除了市場收益率之外的影響公司股票收益率的其他因素。由此可以得到兩個系數的估計值:

  隨后選定事件窗口[t1,t2],即股價會被公告所影響的時間段。由于消息可能會提前泄露,使得股價提前做出反應,同時市場有時候也需要一些時間來理解和消化公告的信息含量,所以文獻上一般選擇公告日前后一至幾個交易日作為事件窗口,如t1= – 1,t2=1。事件窗口的累計異常收益率(cumulative abnormal return,CAR)可由異常收益率加總得到:

  然后,對所有樣本企業的CAR求均值,這里均值代表了某一類型事件對樣本企業的平均影響。最后,使用t檢驗來檢驗以下原假設:CAR的均值等于0。如果能拒絕原假設,即CAR的均值在5%水平下顯著地不等于0,則代表投資人預期神經機器翻譯技術將對語言服務企業績效產生顯著影響;反之,如果不能拒絕原假設,則代表投資人預期神經機器翻譯技術不能對語言服務企業績效產生顯著影響。

  語言服務上市公司的股價在GNMT技術正式商業應用的公告期間出現顯著上漲?;谝陨鲜录芯糠ǖ姆治霰砻?,CAR的均值在事件窗口[– 1,1]這三個交易日期間為0.81%,在[– 1,2]這四個交易日期間為0.88%,并且都在1%的水平下顯著(t統計量分別為2.77和2.60)。這說明投資者在見識到神經機器翻譯技術的商業應用之后,預期神經機器翻譯技術將顯著提升語言服務企業的績效,即投資者認為新技術對語言服務企業的正面影響大于其負面沖擊。

  GNMT事件研究的結論是通過對一個較大樣本進行計量分析得到的,雖然不失一般性,但計量分析無法描述新技術對單個企業的具體影響過程。為彌補這一不足,本小節選取兩個典型的語言服務企業,采用案例分析的方式進一步探討企業面對機器翻譯技術進步時的決策如何影響其未來發展。

  Lionbridge公司成立于1996年,是一家全球領先的語言服務提供商,主要營業范圍涵蓋翻譯和在線營銷,并提供全球內容和測試解決方案,在不同語言環境中,都可以確??蛻舻钠放埔恢滦?、本地性和技術的可使用性。

  Lionbridge是翻譯和本地化專業服務的領導者。2005年,Lionbridge收購了Bowen Global Solutions(其規模曾在2000年排名全球第二),一舉成為最大的語言服務企業。目前,超過800個全球品牌依靠Lionbridge來管理跨渠道、跨平臺和跨語言的關鍵業務內容,應用程序和通信。如表1所示,在CSA Research發布的語言服務行業報告中,Lionbridge連續多年位列榜單前三名,在語言服務領域具有非常強的綜合實力。

  Lionbridge營業收入的持續增長和在語言服務行業穩固的龍頭地位得益于其長期戰略的實踐,即通過新的垂直行業、新的客戶和新的平臺來獲得增長。這些業務增長的關鍵原因之一就是對最新機器翻譯技術的利用。

  Lionbridge在機器翻譯領域的投入最早可以追溯到20世紀90年代末期。這一時期,傳統的統計機器翻譯方法初步形成,Lionbridge便進行積極的嘗試和探索。在2004年之后,其已經形成了全面的機器翻譯譯后編輯能力。

  2009年,Lionbridge推出了Workspace,這是一款面向譯者和機構、基于云端的CAT工具,允許譯者進行合作、知識共享和提供一致的結果。

  2011年,Lionbridge和IBM合作,基于IBM的機器翻譯引擎推出了GeoFluent。這是一種面向普通客戶的、基于云的可定制第二代實時自動翻譯技術,在原始的機器翻譯的基礎上加入了語言增強技術,可以識別并適應俚語、簡寫和拼寫錯誤;同時更加考慮客戶體驗,可立即將內容和通信翻譯成多種語言。

  2014年,Lionbridge發布了onDemandAPI,這是第一款可以為多種專業級別的文本提供機器翻譯及譯后編輯服務的API。

  2018年,Lionbridge宣布與亞馬遜AWS合作,新推出的產品可以利用深度學習和神經網絡技術提供快速、高質量、經濟實惠的翻譯服務。服務質量和性價比的提升幫助Lionbridge在翻譯和本地化領域鞏固了市場地位。

  2019年1月,Lionbridge收購了總部位于東京的語言技術服務公司Gengo,后者的主營業務是人工智能數據培訓和服務,例如數據注釋、搜索相關性、聊天機器人數據培訓等。

  截至目前,Lionbridge已經擁有了以機器翻譯、人工智能和云計算技術為核心的,包括內容連接器、API、項目門戶與在線平臺、任務管理與工作流平臺、質量測評技術等在內的一整套完備的技術體系。一方面,這些技術的應用極大提升了Lionbridge翻譯服務的質量,將語言、文化、行業專家們更緊密地連接在一起,滿足了客戶種類繁多的需求,幫助客戶實現其任務的實時管理,另一方面,機器翻譯技術的運用幫助Lionbridge提高了翻譯的效率,并且隨著翻譯數量、范圍和時間的增長,云端可利用的數據越來越多,神經機器翻譯的過程會變得更加高效。翻譯質量和效率的不斷提升使Lionbridge的競爭力進一步加強。

  在近20年的時間里,Lionbridge與時俱進,不斷擁抱新技術,在語言服務行業長期保持領先地位,持續將自己的業務拓展到新的垂直行業、客戶和平臺。如圖6所示,除個別年份,Lionbridge的營業收入一直在穩步增長。

  AAC Global是北歐領先的全球語言服務提供商之一,提供的服務主要包括翻譯和本地化服務、培訓和學習服務、營銷內容服務等。在翻譯服務方面,AAC Global是芬蘭翻譯服務市場的領導者,擁有廣泛的合作伙伴網絡和長期積累的術語庫,立足于芬蘭語這樣的小眾語言,面向北歐以及全世界的企業提供服務。在財務數據方面,AAC Global營業收入總體上呈不斷下滑的趨勢。如圖7所示,相比于在巔峰時期的營業收入(2008年,4900萬美元),2017年其營業收入已經下滑至1800萬美元。

  與此同時,AAC Global在CSA Research報告的排名中,雖然一直位列全球50強,但其排名在不斷下滑,接連被同行超越(如表2所示)。

  2017年,歐洲語言服務市場占全球市場的49%,連續多年成為全球最重要的語言服務市場。其中,北歐市場占全球總份額的24.51%,由此可知,AAC Global所處的外部總體環境并沒有出現明顯惡化。與此同時,北歐的另一家語言服務企業Semantix,在2007年營業收入與AAC Global大致相當,為4 373萬美元,到2017年則增至1億美元左右,是AAC Global的五倍有余。

  究其原因,AAC Global業績的下滑與其對待機器翻譯技術的戰略不無關系。Semantix重點推出了機器翻譯系統,依靠其高效和便捷性獲取了大量的市場份額。與競爭者相比,AAC Global對機器翻譯技術基本采取了忽視的態度。據其官網介紹,AAC Global認為芬蘭語這樣的小眾語種不適宜采用機器翻譯,所以其翻譯服務主要基于人力團隊和傳統翻譯技術,而未重視機器翻譯和云計算等新技術。從發展結果來看,未采用機器翻譯技術的AAC Global的表現并不理想。

  從上述兩個案例可以看出,機器翻譯技術的出現對于語言服務企業來說,是一把雙刃劍,隨著技術的不斷更新,全球語言服務提供商都面臨著新的挑戰,如何應對新的變化成為重要的課題之一,但與此同時,新的機器翻譯技術也意味著新的機遇和新的可能。

  一直以來,并購重組都是語言服務業的熱門話題。在美國及歐洲的語言服務市場上,行業內的領軍企業頻繁通過并購活動進行擴張,以占據更大的市場份額(Olohan,2007)。

  CSA Research(2007)的全球語言服務市場并購報告指出,語言服務業的并購浪潮始于2005年Lionbridge并購Bowen Global Solutions。2008年以來,全球大型語言服務企業的并購活動此起彼伏,SDL、Lionbridge、Merrill、RWS、TransPerfect、Welocalize等語言服務企業均進行了多次并購,目的多為增強技術實力、進入新的領域和市場、擴大規模、增強競爭優勢等??v觀近年全球語言服務市場的并購案例可以發現,技術是產業內并購重組活動頻發的重要驅動因素。在由技術驅動的語言服務并購重組活動中,并購標的公司通常為技術類公司,收購方主要以獲得新技術、提升技術含量和科技競爭力等為目的。以下將通過一個具體的案例說明對機器翻譯技術的需求如何驅動語言服務行業內的并購活動。

  2010年7月15日,全球領先的語言服務提供商SDL宣布將以4 250萬美元現金收購統計機器翻譯領域先驅Language Weaver公司85%的股權。

  SDL成立于1992年,在語言和內容管理解決方案領域是全球的領導者與創新者,主要提供全球信息管理解決方案。SDL在全球38個國家和地區設有70余個分公司,全球100強品牌中有90家是SDL客戶,包括Adobe、DELL、Intel、Siemens等。Language Weaver作為統計機器翻譯領域的先驅,起源于美國南加州大學信息科技研究所,該研究所由統計機器翻譯領域著名教授Kevin Knight領導。Language Weaver主要提供企業級的用戶服務。

  為探究此次收購事件是否創造價值,圖8對比了2010年1月1日至2010年12月31日SDL的股價和FTSE 100指數。在并購之前,SDL股價的走勢與市場指數基本一致。并購之后,SDL股價的總體趨勢是上行,而市場指數卻在下行。這說明此次并購得到了市場的認可,為公司創造了價值。

  表3展示了SDL公司2008年至2012年的營業收入和增長率。在并購之前,SDL公司的營業收入持續下降,但在并購之后顯著回升,說明并購提升了企業的經營績效。

  Language Weaver作為典型的依靠機器翻譯技術進步而發展起來的新型語言服務企業,與SDL整合之后可以產生巨大的協同效應,這是這起并購能夠創造價值的主要原因。傳統的語言服務業屬于人力密集型產業,一家語言服務企業能承接的業務基本是由公司人員規模決定的,并且由于人員管理問題,公司管理人員的邊際成本非但不會隨著公司規模變大而減少,反而會增大。但是機器翻譯技術不僅可以大幅度減輕公司對翻譯人員的依賴程度,提高翻譯人員的語言處理效率,同時隨著處理業務數量增多,翻譯算法的準確率也會不斷提高,屬于邊際成本遞減的模型。此外,伴隨互聯網的發展,全球正處于信息爆炸的時代,信息的呈現方式越來越紛繁復雜?;ヂ摼W用戶需要以快捷的方式閱讀更豐富的內容,若僅依靠人工翻譯將難以滿足。因此,SDL需要Language Weaver的機器翻譯技術,而且后者在機器翻譯技術領域的專長可以和SDL在內容與語言技術解決方案方面的經驗實現較好的互補,產生協同效應。

  本研究首先系統梳理了語言服務業的主要技術類型,以深化讀者對處于技術變革時期的語言服務業的認識。在此基礎上,本文從技術進步的視角探討了當前語言服務業面臨的機遇與挑戰。因為神經機器翻譯是近年來最重要的語言技術突破,本文聚焦于該技術進步,采用事件分析法實證檢驗了GNMT正式商業應用對語言服務企業績效的影響,發現神經機器翻譯技術的正式商業應用顯著提升了語言服務企業績效。通過案例分析法,本文進一步探討了語言服務企業面對機器翻譯技術進步時的決策如何影響其未來發展,并發現相較于未采用新技術的語言服務企業,擁抱新技術的企業業績增長明顯。由于市場集中度低、競爭者數量多、競爭較為激烈是語言服務業的主要特點,而兼并收購是語言服務企業成長擴張的重要途徑,因此本文結合具體案例深入分析了由機器翻譯技術進步驅動的業內并購重組活動的價值創造模式,發現基于技術的并購顯著提升了語言服務企業的經營績效。

  近年來,我國人工智能、云計算等技術正處于快速發展階段,為語言服務業帶來了新的機遇。十九大報告提出“推動互聯網、大數據、人工智能和實體經濟深度融合”,表明推動人工智能發展已上升至國家戰略層面。自2010年至2020年的10年中,國務院、工信部先后出臺相關政策,大力發展云計算產業鏈,進而推動云計算的實質性應用。這些政策都為我國語言服務業的發展提供了驅動力。鑒于此,我國語言服務企業應順應時代變化,積極擁抱以神經機器翻譯技術為代表的各類新時期語言服務技術,促進自身與行業的發展;在“構建人類命運共同體”“一帶一路”倡議的背景下,繼續在促進各國之間的互聯互通、推動各國增進共識與深化合作、讓各國的文化與經濟聯系更加緊密等方面起到重要作用。

  徐珺:中國政法大學外國語學院教授,博士生導師,研究方向:翻譯理論與實踐、外國語言學及應用語言學、商務英語、語言服務。博魚體育APP官網