智能语音技术是最早落地的人工智能技术,也是市场上众多人工智能产品中应用最为广泛的。
机器交互的发展过程: 命令行界面(CLI) -> 图形用户界面(GUI) -> 自然用户界面(NUI)
语音交互界面(Voice User Interface,VUI)就是NUI最重要的一种。
常见的语音交互场景
- 手机/pc的语音助手 Siri、Google Assistant、Cortana、Bixby等等
- 自动化客服(在线客服、电话客服)
- 车载语音控制系统
- 智能音响、电视、开关、扫地机、家教机、电视盒子 等家庭电子产品
- 智能穿戴设备
- 服务行业交互机器人
- 其他场景如:医疗场景病历录入、教育场景的语音平板、地图导航
智能语音发展的几个阶段
技术萌芽阶段:
1952年,第一个语音识别系统Audry诞生
技术突破阶段:
1984年计算机第一次开口说话,IBM发布的语音识别系统在5000个词汇量级上达到了95%的识别率
1988年,世界上首个非特定人大词汇量连续语音识别系统SPHINX诞生
产业化阶段:
1997年,语音听写产品问世。次年,可识别上海话、广东话和四川话等地方口音的语音识别系统被成功开发
2002年,美国首先启动了“全球自主语言开发”项目
2009年,微软Win7集成语音功能
快速应用阶段:
2011年,苹果个人手机助理Siri诞生
2015年,首个可智能打断纠正的语音技术问世
2017年,智能语音系统集中扩展深度学习应用技术终于取得了突破性进展
智能语音交互系统模型及发展
- 语音识别(Automatic Speech Recognition):简称ASR,是将声音转化成文字的过程。
- 自然语言处理(Natural Language Processing):简称NLP,是理解和处理文本的过程。
- 语音合成(Text-To-Speech):简称TTS,是把文本转化成语音的过程。
不断满足人的体验的人机语音交互系统
我们不难发现其实国内做语音唤醒、语音识别、语音合成很多,其实并不是人机交互的难点
而重要的是语音理解,是要能根据已有的数据进行语音理解,理解用户的这句话的对话意图,
从而给出对应的操作。
今天的文章智能语音技术_智能语言分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/65652.html