网易旗下有道搜索今日推出在线翻译服务测试版(http://fanyi.yodao.com),成为国内首家采用自主技术开发机器翻译的搜索引擎厂商。
这是自7月份谷歌、百度纷纷发力推广在线翻译服务后,又一家进入该市场的搜索厂商。据有道负责人介绍,机器翻译在后台实现上分为规则翻译和统计翻译两大派别。
简单说,规则翻译是通过构建词典和语法规则库,进行从词到句的拼接组合;而统计翻译则是由大量的语料库构成知识源,既不需要词典也不需要规则,以统计规律进行自动匹配为主。
目前,谷歌和有道均采用此类统计方法进行机器翻译,而借助金桥翻译入局的百度使用的是传统规则方法。
据了解,在国内搜索引擎厂商中,有道率先使用搜索技术研发机器翻译,舍弃了“语言专家将语法规则和字典输入计算机,计算机再根据语法规则进行翻译”的传统模式,通过首创的网络释义和海量例句等创新功能在短短半年内已积聚500万装机用户,并试图将这一领先优势延展至在线翻译市场。
有道翻译通过汇集数以亿计的中英文网页及文档,以整句为单位使用统计算法对原文进行多重模糊匹配,并结合语法规则进行优化与校正,从而形成相对准确的译文。经过2年来在专利“网页萃取”技术上的不断改进,有道对互联网上出现的中英文单词与短语实现了更佳的对译效果,而这又为以句为单位的全文翻译提供了良好的基础。
以北京奥运口号为例,“同一个世界 同一个梦想”与“One world One dream”时常在网络上匹配出现,于是有道在线翻译中就可以准确得到这一互译结果。
此外,有道搜索所抓取积累的海量网页及文档资源以及网易十年来积累的丰富新闻资讯,也为有道全文翻译服务提供了良好的“语料”基础保证。(新闻来源:网易科技)
|