【本报讯】4月14日消息,百度正式发布“语音输入服务”并宣布百度大脑和罗技达成合作,将领先的AI技术全面赋能罗技外设硬件,以“智能鼠标”为起点,罗技VOICE M380语音鼠标首次亮相。
百度集团副总裁吴甜指出:“百度大脑当中两个经典的AI技术就是语音技术和机器翻译。语音技术可让用户免去打字输入的麻烦,以更自然的交互方式搜索信息,找到所求;而机器翻译则在全球化进程发展的今天,为跨语种的交流带来巨大便利。”
据介绍,罗技VOICE M380语音鼠标可实现自由说、实时译的功能。百度大脑语音识别赋能下的语音鼠标可支持中文、英文、日文3种语言语音输入,中英混合输入,以及粤语、四川话、东北话、河南话、山东话、西安话、合肥话等7种方言语音输入,尤其在长篇内容输入时方便用户获得轻松畅快的输入体验。此外,新品语音鼠标中还添加百度大脑语音翻译功能,可自由实现中译英、中译日、中译韩、中译法、中译西、中译泰、英译中、日译中8种语音翻译,服务人群更加广泛,帮助不同国界的用户跨越语言障碍。
事实上,百度AI技术的进化和产业赋能在不断深化。以百度大脑语音技术为例,2019年百度推出并上线使用的流式多级的截断注意力模型SMLTA应用到了百度输入法当中,大幅提升了自身语音识别的准确率;此外,在远场交互的场景下,百度推出的基于麦克风阵列的声音增强以及声学建模一体化端到端识别技术,也应用到了小度音箱等场景下,优化了整体交互时的准确率。截至目前,百度语音技术服务日调用量已超155亿次;在移动端的设备上,百度搜索、输入法、百度地图等产品,以及智能设备的场景上,比如智能家居、智能车载系统、语音IoT设备等中都有非常广泛的应用。
另外,机器翻译也是百度很早就开始积累和打造的AI系统技术之一。2015年5月,百度发布全球首个互联网神经网络翻译系统;2019年在国际权威机器翻译评测WMT中,百度超越国内外知名企业,在中英翻译领域位列第一;而在多语言翻译方面,针对语言数量多、分布不均衡、实现难度大等难题,百度研发了基于神经网络的多语言翻译统一框架,首次突破203种语言互译。
据悉,百度大脑目前已对外开放270多项核心AI技术能力,广泛地落地生根于互联网、工业、农业、金融、城市、医疗、能源、教育等诸多行业。
請先登錄再提交評論