2018 ai challenger机器翻译大赛 金山团队一举包揽冠亚军
12月19日,“2018 ai challenger全球ai挑战赛”总决赛答辩暨颁奖典礼上传来了好消息:金山软件集团(以下简称“金山”)旗下ai lab的两支队伍第一次参加此项大赛,便以黑马姿态一路领先,与来自全球81个国家的企业、高校研发团队经过多轮比拼,最终以大比分优势包揽了本年度ai challenger“英中文本机器翻译”比赛的冠亚军。
创新工场董事长兼首席执行官李开复与金山办公副总裁姚冬、金山ai lab负责人李长亮博士合影
ai challenger旨在“用ai挑战真实世界的问题”,架设了面向全球人工智能人才的开源数据集和编程竞赛平台,致力于推动ai在科研与商业领域结合,打造良性可持续的ai科研与应用新生态。
此次金山派出的两支参赛队伍双双获奖,不仅证明了金山团队在人工智能科技领域的团队实力与创新潜能,还以出色的成绩为金山成立三十周年奉上了一份贺礼。
全球ai挑战赛2018冠军团队合影
机器翻译技术领域新生力量崛起
机器翻译被誉为自然语言处理领域“皇冠上的明珠”,它能够促进消弭文化隔阂、加强世界交流,使语言不再成为妨碍不同语言文化民众的沟通壁垒。
1954年,ibm启动了“georgetown-ibm”实验,用一台大型机将60个俄语句子翻译成英文。这项实验被学术界视为历史上首次机器翻译。其后的几十年里,许多科学家不断尝试各种技术思路,如基于样例、基于规则、基于统计等等,机器翻译的研究几经起落,直到基于神经网络、深度学习的机器翻译技术出现,才让“全世界无障碍沟通”的梦想成为可能。
2018 ai challenger“英中文本机器翻译”赛道上,所有的参赛队伍均可自由选择机器翻译技术,但都需要根据评测方提供的数据,训练自己的机器翻译系统。评测方使用机器翻译的客观考核指标(bleu、nist、ter)来评分,其中bleu是最主要的评估指标。在今年的比赛中,数据总量达到1300万句对,且其中具有上下文情景的中英双语数据达到300万句对,相比去年大幅扩容。
来自金山ai lab的一支参赛队伍以客观成绩领先其他对手3个bleu值,答辩成绩超过其他队伍30分的明显优势获得冠军;另一支参赛团队则以优异成绩获得亚军。
第一次参加这样的世界性大赛,就能与斯坦福大学、清华大学、中科院、bat、科大讯飞、网易等“顶级豪门”同享人工智能盛宴,并且在机器翻译主赛道取得不俗的成绩,这表明,近年来坚决投入ai研发的金山开始逐渐收获回报。机器翻译技术领域,新生力量已然崛起。
金山ai lab年轻且富于朝气,事实上,团队参与本次比赛的初衷就是用奖项来检验团队能力――2017年5月,由雷总亲自挂帅,金山开始加大在ai领域的研发投入,成立了涵盖图像、语音、语言等多个研究方向的ai团队,汇集了来自中科院、北京大学、墨尔本大学、哈工大等高校的优秀毕业生。金山ai团队在短时间里建立了鲁棒的机器翻译框架,搭建了训练和调优的基础设施,并且配备了强大的底层计算服务能力,最终在本次大赛中全程领跑、一举折桂。
探索核心技术加速ai落地
百年前,严复先生提出“信达雅”的翻译质量三原则,当前由机器翻译的文字刚刚触及“信”与“达”的层次,还远达不到“雅”的要求,但从实用的角度考虑,机器翻译技术已足以打造出高效、可依赖的跨语言智能辅助翻译服务。今后,金山将努力为wps、词霸等产品的用户提供稳定的、接近人工水平的翻译,用户将可以体验即时文本转译、同声语音传译等智能服务。
除机器翻译以外,金山ai lab还在图像、文本、语音等多个方向展开深入探索。金山邀请中科院李长亮博士加盟,主持ai lab。正是在李博士的带领下,在此次大赛上,几名年轻研究人员才能创新出层次注意力机制、高斯搜索等独特算法,在工程细节、特征提取等方面积累先进经验。目前,金山已为相关算法、技术申请专利,并在国际顶级会议上发表相关论文。与此同时,金山更关注将技术与产品服务深度融合,完成技术落地。目前金山正在探索集成多种人工智能技术,实现人机协作,助力金山办公场景智能化。
周虽旧邦,其命维新。今天,三十岁的金山始终坚持技术立业,不断自我突破转型,不断打造创新产品,服务亿万用户。当前,ai已成为金山的长期战略,公司正全力以赴探索核心技术,寻求持续突破。
金山未来,ai在路上。
(金晨)