More Related Content Similar to 讯飞语音云及示范应用讯飞语点 Similar to 讯飞语音云及示范应用讯飞语点 (20) More from geekparknet (20) 讯飞语音云及示范应用讯飞语点2. 讯飞 2010 年 10 月发布语
音云
201 0 年 1 0 月 28 日
,科大讯飞在业界率先发
周光召致辞 柳传志致辞 布“ 讯飞语音云” ,为手机
、汽车、智能家电等终端
提供高质量语音合成、语
音搜索、语音听写等智能
语音交互服务能力。
语音云启动仪式
4. 语音云用户规模加速增
长
语音云用户 4000 万 每日请求 800 万次
4000 万
1 000 万
1 00 万
201 1 年 1 - 6 月 201 1 年 7- 1 2 月 201 2 年 1 - 3 月
共同开启“ 语时代” 的时机已经成熟
5. 语音云典型应用领
域
讯飞语音云
语音识别
语音合成
手写识别
声纹识别 智能教学
手机等移动设备
汽车 智能家电
6. 语音云示范应用:讯飞输入法
• 201 1 全球移动互联网大会上,荣获专业评委奖第一名
• 讯飞输入法用户总评价在所有中文输入法中排名第一
全球移动互联网大会专业评委奖第一名
201 1 安卓市场 应用汇 安智市场
10. 新一代语音云发布
• 201 2 年 3 月 22 日,以“ 语音点亮生活” 为主题的科大讯飞新
一代“ 语音云” 发布暨语音开发者大会在北京国家会议中心隆重
举行,到场开发者超过 2500 名
12. 语音合成技术最新进
展
中英文语音合成技术均是业界自然度唯一超过真人
发音水平( 4.0 分)的系统;连续 6 年荣获国际最权
威的英文合成大赛 Blizzard Challenge 冠军。
13. 语音合成技术最新进
展
B lizzard C h alle n g e 201 1 国际英文合成大赛比赛结果
自然语音
科大讯飞:唯一自然度大于 4 分的系统
热烈欢迎各位来宾出席今天的发布会,
He refused to identify governments he suspected,
感谢大家长期以来对科大讯飞的关心和支持,
but German press reports said investigations
were focusing on North Korea and Pakistan
祝大家身体健康、工作顺利!
其他参赛单位 合成样例
美国 Mic ro s o ft 、 IB M 、 MIT 、 C MU
英国 E d in b u rg h 日本 N ITe c h 、 ATR 等 英 中 ■
14. 覆盖全面的多语种合成系
统
法、俄、西、日、
韩等语种合成
• 多语种合成逐步实现世界语言覆盖
正在研发德、意、
葡、阿拉伯、印地
英文合成 等语种合成
欢迎参加科大讯飞召开的
新一代语音云发布暨语音开发者大会 !
中文合成
16. 语音识别三大技术创
新
• 提出 PLA 、 JF A 、 IVN 综合噪声补偿算法,系统抗噪性能达到国际领先水平
• 实现 MS D T 声学模型训练算法,大幅增强系统口音适应性能
• 提出 LS A 语言模型自学习算法,个性化词汇识别准确度首次达到实用
噪声环境识别性能提升 口音适应性能相对提升 个性化词汇识别性能提升
30.4% 50.3% 36.3%
17. 语音云的个性化语音服
务
通知王珩吃饭地点改为京临饭店 个性化 云存储
语音引擎
帐号管理
电视 数据
优化
跨终端的语音空间
手机
语音
通行证
• 用户对口音、专用词汇进行个性化
训练可进一步提升语音识别准确率
• 语音通行证实现用户个性化识别在
Pad PC
不同终端共享,保持体验一致
Editor's Notes 首先我向大家演示一下讯飞语点的功能 按照“语点演示环节设计思路”进行演示 语音云在实际应用中表现如何? 基于语音云开发的语音输入法在全球互联网大会上,荣获专业评委奖第一名,这里的评委包括各大互联网企业高管和资深媒体记者, 不光是专业人士的肯定,越来越多的普通用户也通过口碑相传了解、使用语音交互: 这里举一个例子,基于语音云开发的 iphone 语音输入软件讯飞口讯,上线后两天就到达 appstore 排行榜第一, 85% 的用户给了我们 5 星评价。 42s/6m 首先我们来看语音合成技术的最新进展 这是我们 3.22 发布会上庆峰董事长向大家展示的效果,我们来听一下。 首先是中文 接着我们听一下英文合成效果 在暴风雪竞赛中,我们的得分是 4.2 分, 4.9 分是美国国家播音员的发音,可以说,我们中国人做的英文合成效果甚至比外国人还要好。 下面我们再看看世界范围内语音合成的研究进展 在语音识别方面,大家通过使用我们的语点,语音输入法已经能够很好的感受到它的效果了 我这里列出一组数字,让大家有个更系统的了解 这是在移动互联网应用环境中,通过第三方的测试方法和数据得出的识别率效果,可以看出目前在短信、微博、搜索、导航、数字数值等方面,讯飞的准确性要高于各个国际巨头厂商 大家都知道,在识别应用中,噪音、口音以及个性化词汇方面是识别的三大难题,目前我们通过各类算法,已经很好的解决了这三大难题,很红的提升了用户的使用体验 演示语音通行证 我们以一个小 baby 成长为例,有了耳朵有了嘴巴,能听会说了,我们还需要他的大脑会思考会分析,这样爱能更好成长。 这张图列出了目前在各个应用领域,讯飞的语音理解技术所能达到的正确率,已经完全达到实用,并且基于我们的语音云, NLP 形成了持续的自学习和进化能力。