媒體聚焦 來源:中譯語通日期:2021-01-07瀏覽次數(shù):1864
中譯語通的機(jī)器翻譯戰(zhàn)績近年來一直優(yōu)異。
2020國際機(jī)器翻譯評(píng)測比賽結(jié)束,來自中國的中譯語通科技股份有限公司展現(xiàn)出機(jī)器翻譯領(lǐng)域的領(lǐng)先實(shí)力。其參賽6個(gè)語言方向,在高棉語-英語、英語-高棉語、普什圖語-英語、英語-普什圖語、泰米爾語-英語等5個(gè)語言方向上獲得冠軍,在英語-泰米爾語方向位居第二,奪冠數(shù)量全球居首。
國際機(jī)器翻譯大賽(WMT)由國際計(jì)算語言學(xué)協(xié)會(huì) (ACL)主辦,是全球?qū)W術(shù)界公認(rèn)的規(guī)模最大的國際頂級(jí)機(jī)器翻譯評(píng)測比賽之一,自2006年以來,已連續(xù)舉辦15屆。比賽的主要宗旨是評(píng)估機(jī)器翻譯最新發(fā)展水平,傳播通用測試數(shù)據(jù)集和公共訓(xùn)練數(shù)據(jù),改進(jìn)機(jī)器翻譯評(píng)估評(píng)測方法。此次大賽共發(fā)布中文-英語、捷克語-英語、法語-德語、德語-英語、因紐特語-英語、泰米爾語-英語、日語-英語、普什圖語-英語、波蘭語-英語、俄語-英語、高棉語-英語等11個(gè)語言對(duì)、22個(gè)語言方向的機(jī)器翻譯評(píng)測任務(wù)。
中譯語通在2020國際機(jī)器翻譯評(píng)測比賽的成績單
中譯語通的機(jī)器翻譯戰(zhàn)績近年來一直優(yōu)異,令同行刮目相看。在2019年國際機(jī)器翻譯大賽中,中譯語通與全球60余家頂級(jí)團(tuán)隊(duì)同臺(tái)競技,獲得3個(gè)語言方向冠軍,奪冠數(shù)量與微軟亞洲研究院、Facebook并列第一。在2018年國際機(jī)器翻譯大賽中,中譯語通僅參賽英中方向自動(dòng)評(píng)測,獲得第一名。在2017年國際口語機(jī)器翻譯評(píng)測比賽(IWSLT2017)的20個(gè)語言方向翻譯評(píng)測中,中譯語通囊括了16個(gè)語言方向的第一名。
驕人的成績源自不斷創(chuàng)新與堅(jiān)持。中譯語通是國內(nèi)率先開展機(jī)器翻譯研究的企業(yè)之一,多年來,該公司科研人員在領(lǐng)域機(jī)器翻譯和語種機(jī)器翻譯模型研究上持續(xù)突破,并擁有了海量高質(zhì)量語料和先進(jìn)的數(shù)據(jù)清洗技術(shù),使其機(jī)器翻譯優(yōu)勢更為凸顯。目前,中譯語通的產(chǎn)品可支持金融、科技、醫(yī)療等多個(gè)垂直領(lǐng)域以及多達(dá)60個(gè)語種、3000個(gè)語言方向的翻譯,積累的高質(zhì)量專業(yè)領(lǐng)域平行語料超過52億句對(duì)。在數(shù)據(jù)清洗上,中譯語通采用了語言模型和翻譯模型分別對(duì)語料進(jìn)行清洗,設(shè)計(jì)了循環(huán)語料生成和清洗方法,來不斷重復(fù)提高翻譯質(zhì)量和語料質(zhì)量。在訓(xùn)練技術(shù)上,采用了預(yù)訓(xùn)練模型調(diào)優(yōu)、知識(shí)蒸餾、多模型融合解碼、聯(lián)合訓(xùn)練、翻譯重排序等技術(shù),來提高訓(xùn)練的質(zhì)量。
如今,中譯語通已構(gòu)建了完善的機(jī)器翻譯應(yīng)用生態(tài)體系。應(yīng)用范圍覆蓋文本、網(wǎng)頁、音視頻等多模態(tài)數(shù)據(jù),應(yīng)用產(chǎn)品形態(tài)涉及文件夾翻譯、文檔翻譯、Word翻譯插件、字幕通、網(wǎng)頁翻譯、輔助翻譯平臺(tái)等,應(yīng)用場景更為廣泛,包括國際會(huì)議同傳、遠(yuǎn)程辦公教學(xué)、翻譯項(xiàng)目管理、跨語言語義檢索、多語種數(shù)據(jù)加工等。中譯語通的應(yīng)用模式十分多樣化,除成熟軟硬件產(chǎn)品外,還支持行業(yè)機(jī)器翻譯模型定制、私有云及本地化部署、軟硬件一體機(jī)、云端調(diào)用等多種模式。
來源:上觀新聞
欄目主編:樊江洪
文字編輯:樊江洪