据了解,此次百度机器翻译项目的获奖主要在于突破了四个世界性难题:提出了创新的基于互联网大数据的翻译模型,实时准确地响应多文体、多领域的复杂翻译请求;研发了基于互联网大数据的海量高质翻译知识获取技术,制定了语言内容处理的国际标准;提出了基于深度语义的语言分析和翻译技术,突破了机器翻译中公认的消歧和调序等世界难题;提出了基于枢轴语言的翻译技术,使得资源稀缺的小语种翻译成为可能,并实现了多语种翻译的快速部署。
百度技术副总裁王海峰表示,“语言是人类区别于其它生物的基本能力。不同语言之间的翻译更是只有少数人才能做到。采用器翻译技术自动实现语言之间翻译是人工智能的终极目标之一。过去几年里,我们取得了一系列基于互联网大数据的机器翻译关键技术突破,百度翻译每天收到的翻译请求量已经上亿,满足了广大用户多方面的翻译需求,也带动了很多相关产品和产业的发展。“
本次获奖的项目成果应用于“百度翻译”产品及7000多个企业和第三方应用中,极大地带动和促进了相关产业的发展。出国旅游只要携带装有百度翻译APP的手机,就可以在不同语言间进行自由交流,真正实现“一机在手,走遍全球”;知名手机品牌将翻译服务集成到其手机的摄像头翻译应用中,提升了该手机的市场竞争力,带有翻译功能的手机被销往法国、德国、俄罗斯、西班牙、英国等30多个国家和地区;B2B跨境电子商务平台“敦煌网”使用“百度翻译”进行跨境贸易,服务超过100万家国内供应商,帮助其将商品销往全球224个国家和地区,有力地促进了我国对外贸易的发展。
值得一提的是,机器翻译在响应国家“一带一路”的战略构想上也有着非凡的意义。学者在论坛上表示,虽然也许“一带一路”涉及俄罗斯、印度等国家超过六十个,人口逼近三四十亿,想要打造政治互信、经济融合、文化包容的利益共同体,语言不通将会造成很大障碍,而机器翻译却可在其中发挥举足轻重的作用。“从国家战略角度看,机器翻译是必不可少的,从老百姓角度看,包括做生意、旅游等,机器翻译都是不可缺少的工具,它的社会、经济效益是不可低估的。”
在全球化发展的快速进程中,机器翻译技术正在逐步改变人们的工作和生活方式,就像我们今天看到的小度一样,它能随时随地帮助我们解决语言障碍,让语言不通的人们自由交流。在政府、学术界及产业界的共同努力下,机器翻译研究和产业化也取得了突破性进展,其所蕴含的巨大产业价值也将不断被发掘和释放,必将带来新一轮产业浪潮。
机器翻译是人工智能领域最难的课题之一。1947年,机器翻译步入历史舞台,50年代机器翻译研究持续升温,美国、前苏联等国家均出现了研究热潮。然而多年来机器翻译却一直处在象牙塔中,因为让机器理解人类语言,要经历从分析、理解到转换生成等繁杂步骤,让原本只认识“0”和“1”的计算机去实现不同语言之间的翻译,涉及到语言现象的灵活多样、翻译知识获取难度大、翻译模型计算复杂度高等多个难题。
此次由百度与中科院自动化所、计算所、浙江大学、哈尔滨工业大学、清华大学等共同研发的“基于大数据的互联网机器翻译核心技术及产业化”项目,突破了机器翻译领域内的四大技术难题——(1)提出基于大数据的互联网机器翻译模型,快速响应高负荷翻译需求;(2)基于大数据的翻译知识获取,克服语言数据噪声问题;(3)通过深度语义分析和翻译技术,解决语言语义歧义问题;(4)提出枢轴语言机器翻译技术,实现了稀缺语种的多语言翻译。
据悉,百度机器翻译技术目前已实现支持27种语言,702个翻译方向,每天响应近亿次翻译请求。除了在学术领域取得丰硕的研究成果外,该项目成果已应用于国家多个重要部门以及百度翻译PC端和移动端产品中。
在技术应用方面,百度机器翻译目前在全球拥有超过5亿用户,支持的中文、英文、西班牙语、日语、韩语、法语、俄语等27个语种在全球覆盖超过47亿人口,同时支持上万家第三方应用,服务海量用户、惠及人们的日常生活。