搜狗推出“唇语识别”技术 垂直场景下达到90%准确率
凤凰科技讯(作者/二维马)12月14日消息,搜狗今日推出了一种人机交互新技术唇语识别,通过机器视觉识别说话人唇部动作,来解读说话者所说的内容。搜狗官方表示,通过复杂端到端深度神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。在非特定人开放口语测试集上,该系统达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率,在垂直场景如车载、智能家
2017-12-15 07:59:46
来源:凤凰科技  

凤凰科技讯(作者/二维马)12月14日消息,搜狗今日推出了一种人机交互新技术唇语识别,通过机器视觉识别说话人唇部动作,来解读说话者所说的内容。

搜狗官方表示,通过复杂端到端深度神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。在非特定人开放口语测试集上,该系统达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率,在垂直场景如车载、智能家居等场景下甚至已经达到90%的准确率。

作为人机交互的形式之一,未来唇语识别技术可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。比如在车载场景下,周围噪音过大时会对语音指令产生干扰,通过唇语识别技术则可以规避干扰,保证人车交互的准确性和稳定性,日常不便发声的公共场所也可以保证说话内容的私密性;在安防领域,由于目前多数监控只有摄像头没有麦克风,往往只能看清嘴型却不知道在说什么,给案情分析带来很多难题,而唇语识别技术可以帮助公安人员获取重要的讲话信息,为公共安全提供有效支持。除此之外,唇语识别技术还能发挥巨大的公益价值,帮助先天性听障人群或老年人,让他们更好地理解和表达自己。

最新文章
1
快手商家38上新季生意爆发,多维拆解增长解法
2
你的青春又有歌了!周杰伦《太阳之子》上线,多重限定玩法快手同步开启
3
快手千人共跳五禽戏,为南宁三月三注入非遗力量
4
透视美的海尔TCL海信创维2025财报,穿越波动周期靠这三点
5
37.81亿港元!TCL控股索尼家庭娱乐业务,电视王座之争向中国倾斜
6
行业洞察 | TMIC×Flywheel飞未联合发布《2026天猫音箱音响行业白皮书》
7
华帝潘叶钊:中国文化与时尚美学,品牌价值升维的新路径
8
华帝潘叶江:坚守初心,以长期主义锚定高质量发展新航道
9
携手新晋顶流代言人张凌赫,中国高端厨电华帝用一张“年轻牌”掀翻厨电圈!
10
华帝韩伟:重构厨电产业新逻辑
11
华帝x张凌赫!厨电潮牌携手顶流演员,书写品牌年轻化新篇章
12
从“心价比”出发,华帝“瓷话套系”回应新一代消费者审美渴望
13
海信视像发布2025可持续发展报告:让科技有温度,绿色有深度
14
80亿净利润收官2025,这个面板巨头的“赚钱密码”的是什么?
15
开启平板4K时代,vivo Pad6 Pro正式发布
16
重塑移动影像新高度,vivo X300 Ultra及vivo X300s正式发布
17
存储价格走势如何,哪些规格最紧俏?专家揭秘
18
AI从“对话”转向“做事”,半导体行业如何创新?
19
4月空调排产下滑9.4%,这是旺季前的低迷蓄势吗?
20
原材料普涨下的家电“生死局:巨头微利 小厂失守
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512