如果你是一个科幻电影迷,那么对影片中出现的各种“外星语”一定不会陌生。好莱坞导演、编剧们总是热衷于创造一个逻辑严谨的科幻世界,语言作为异星世界架构中重要的组成部分当然不容忽视。从经典的克林贡语到充满自然野趣的纳美语,乃至于今天流行的、属于小黄人的“香蕉语”,实际上都是具备基本语言要素的人造语言。其中克林贡语更是发展成了一门仅次于世界语的完善人造语言,甚至为国际标准化组织(ISO)所承认,拥有自己的使用人群、出版物以及网站。
如果你想翻译一句英语到克林贡语,克林贡语专家谢耳朵一定很愿意帮助你。然而,但如果想将小黄人的“Tatata bala tu”直接翻译到纳美语,我想即便博学如谢耳朵,也会对此束手无策。不过,机器翻译也许可以为你解决这个难题。在今年举办的第53届ACL(计算语言学国际年会)上,由百度公司推出的小度机器人就曾在颁奖环节担任英文翻译,现场演示将中文翻译为英文,提供了近似“同声传译”的服务。当然,这对于小度而言,不过是小试牛刀,小度的翻译能力远不止如此。
得益于其先进的自然语言处理内核,小度具备一流的多语言翻译能力。通过将机器翻译与语音识别完美结合,小度可以流畅应对多语言情景下的翻译工作,让来自不同国家、文化背景的人民实现无障碍的交流。小度所使用的百度翻译在基于大数据的翻译模型、翻译知识获取、枢轴语言翻译等方面都取得了重大的技术突破,解决了消歧、调序、语种覆盖等传统机器翻译公认的难题,将机器翻译技术推到了一个全新的高度。在这一切的背后,NLP技术居功至伟。
自然语言处理技术(NLP)一直被认为是人机交互领域“皇冠上的明珠”,是融计算机科学,人工智能,语言学于一体的科学,关注计算机和人类(自然)语言之间相互作用的领域。而它也正在成为发展次时代搜索引擎的核心技术之一。
相对于基于关键词的传统搜索模式,早已被语音助手们宠坏的用户更加习惯于直接对搜索引擎描述自己的需求。今天的用户们已经失去了阅读《善用百度的若干方法》这样使用说明式经验文章的兴趣。当用户向搜索引擎问出“姜发芽了还能吃吗”的时候,他们已经失去了在众多选项中遴选正确答案的耐心,他们希望答案立刻出现在自己的眼前。理解用户的问题,尽可能直接地呈现答案,这是次世代搜索引擎的必备特征。NLP技术正是实现这一切的关键。
不仅百度,对于任何一家互联网公司而言,NLP技术都有十分重要的意义。尽管许多公司都声称我们已经处在一个大数据的时代,但实际上离依靠大数据产生广泛的经济效益还有一段很长的距离。在这些庞杂的数据中,直接由用户生产的内容无疑是最有价值的,但如果想顺利地解读这些信息,基于人工智能的NLP技术必不可少。有业内人士曾预言,也许未来的互联网企业都会是数据公司。从这一点上讲,能否掌握先进的自然语言处理技术也许将会是国内互联网企业的一个杀手锏。
百度CEO李彦宏曾在今年 “两会”上提交 “中国大脑”提案,建议从国家战略层面建立人工智能发展计划。而在国务院不久前发布的《关于积极推进“互联网+”行动的指导意见》中,就已经明确人工智能作为我国推进“互联网+”重点布局的十一个领域之一,其中自然语言处理技术作为人工智能领域的关键技术,将给我们带来人机交互界面领域最为重要的变革。
也许在未来的工厂中,每个工人都可以通过语音控制系统的辅助完成对更多机器的精细操作:手术室中的护士与助手,也会为更加高效与精确的机器人所取代,主刀医生只需通过语音指令就可以指挥医疗机器人完成任务。我们有理由相信,NLP技术将成为构筑我们智能生活和人机交互最为重要的几块基石之一。
标签: #百度翻译英语怎么读