近日,在刚刚结束的IWSLT(International Workshop on Spoken Language Translation)国际顶级口语机器翻译评测大赛中,搜狗击败科大讯飞、阿里巴巴、APPTEK(美国应用技术公司)、AFRL(美国空军研究实验室)和KIT(卡尔斯鲁厄)德国理工学院)等众多国际国内实力选手一举夺得2018 IWSLT竞赛基线模型(Baseline Model)赛道冠军,代表中国向世界展示了中国在人工智能领域的技术硬实力!
表1 IWSLT竞赛Baseline Model赛道最终成绩
500)this.width=500' hspace=10 vspace=10 alt='搜狗荣获IWSLT国际机器翻译口语评测大赛冠军'>
——摘自IWSLT官方公告
这是搜狗继赢得WMT 2017机器翻译顶尖评测大赛之后英语口语化,在翻译领域摘得的又一技术桂冠。 短时间内登顶全球第一,充分证明搜狗在翻译行业尤其是口语翻译领域占据领先地位。
IWSLT 是什么样的比赛?
IWSLT是全球最具影响力的口语机器翻译评测竞赛。 自2004年起已举办15届青岛学英语,每届比赛都吸引了世界各地机器翻译领域的知名企业和研究机构的参与。 本次大赛吸引了科大讯飞、阿里巴巴等国内企业、爱尔兰ADAPT中心、美国约翰·霍普金斯大学、德国卡尔斯鲁厄等机构参加。 芬兰理工学院、赫尔辛基大学、英国爱丁堡大学、美国AppTek公司等众多国际知名大学、研究机构和企业参与其中。
表2 IWSLT2018比赛参赛情况
500)this.width=500' hspace=10 vspace=10 alt='搜狗荣获IWSLT国际机器翻译口语评测大赛冠军'>
——摘自IWSLT公布的官方结果:
本次IWSLT 2018的口语机器翻译任务主要评估基于指定数据集从英语到德语的语音翻译能力。 分为两类:基线模型(Baseline Model Track)和端到端(End-to-End Track)Track大学英语,其中Baseline Model Track主要评估语音翻译的流水线解决方案。 输入的语音首先经过语音识别系统得到语音识别结果,然后将结果发送到机器翻译系统得到翻译。 这也是业界最主流、表现最好的演讲。 翻译解决方案、商用机同声传译、翻译机等市面上的语音翻译产品几乎都采用类似的方法; End-to-End是本次评测新增的赛道一节课多少钱外教托福学英语,主要鼓励参赛者探索基于神经网络的端到端语音翻译解决方案外教厦门学英语方法,希望能够输入语音,直接输出基于深度神经网络的翻译网络模型。 该方法目前仍处于早期研究阶段上海英语,受限于语音文本并行语料库的大规模采集困难以及算法研究不成熟。 由于其他因素的限制宝宝外教,距离商用还有很长的路要走。 本次评测中英文广州,当训练集和测试集相同时,Baseline Model赛道中最好的系统取得了28.09的BLEU(机器翻译质量评价指数,值越大翻译质量越好),而End- -End 赛道上的最佳系统仅达到 19.4 BLEU台州英语英文平台,比 Baseline Model 赛道低 8.69 BLEU。 差距非常明显,也证明了Baseline Model航迹评估算法仍然是目前最可行、最实用的解决方案。
搜狗此次参加Baseline Model赛道的评测英语口语化,并取得第一名的成绩。 评估任务面向TED演讲和会议学术报告场景。 测试集包括来自英国、欧洲和印度等不同国家的英语使用者。 存在噪音、口音、自由表达等复杂的语音现象。 同时,大量的领域专有名词和口语表达(如大量的情态助词、不正确的语法表达等)具有很强的现实意义和挑战。 最终外教收费,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU英语菲律宾,证明了搜狗在口语机器翻译领域的强大实力。
AI赛道持续发力,搜狗领跑语音翻译行业
在搜狗的AI战略蓝图中,语言是核心优先事项。 搜狗始终坚持“自然交互+知识计算”的人工智能核心方向,持续深耕技术,推动技术快速转化为产品。 2016年学校学英语,搜狗发布了自己的人机交互解决方案——知音引擎。 凭借充足真实语料数据优势英语口语化,搜狗将语音识别与机器翻译技术相结合,于2016年推出全球首个商用AI同声传译系统——搜狗同声传译搜狗荣获IWSLT国际机器翻译口语评测大赛冠军,引领语音翻译技术的普及应用。 通过在数百场国际会议中的“实战”,搜狗同声传译赢得了无数媒体和观众的好评,成为当下炙手可热的“AI字幕师”。
同时,搜狗还推出了一系列智能硬件,将语音翻译技术应用到更广泛的场景,帮助用户打破跨境交流中的语言困境。 2018年3月,搜狗推出搜狗旅行翻译机银川英语,具有离线翻译功能和拍照翻译功能。 马化腾对此兴奋不已学英语欧美,在朋友圈发了广告。 作为首款智能翻译硬件费用学英语,支持42种语言的会话翻译,解决用户在出行场景中听不懂、看不懂、不会说话等现实痛点。 该产品在京东首发当天就被抢购一空,首日销量突破千万。 同时培训学英语,搜狗还推出了录音翻译笔学英语哪里好技巧英语,提供录音转录、会话翻译、同声传译等功能。 它将人工智能同声传译应用到消费产品中外教收费标准,开辟了语音翻译的新渠道。
众所周知厦门英语,人工智能是未来科技的风向标。 通过此次IWSLT比赛的优异表现,我们可以看到以搜狗为代表的国内科技巨头展现了行业领先的技术硬实力。