AI“读唇术”,靠什么让“失语者”重新“开口”?
[钉科技编译]不出声,仅仅通过喉咙和下颚的皮肤震动就能知道想说什么。说道这,首先想到的可能是“古老的读唇术”。现在,人工智能可能会让这门显得颇神秘的“技艺”被更多人掌握。之前,有科研人员研发AI唇语识别:运用机器视觉技术从视频中识别出说话人的人脸,提取此人连续说话时口型变化的特征。通过机器视觉识别,不用听声音,仅靠识别说话人的唇部动作,解读说话者所说的内容。近日,不同于运用机器视觉技术识别说话人的
原创
2020-04-06 07:30:49
来源:钉科技  

[钉科技编译]不出声,仅仅通过喉咙和下颚的皮肤震动就能知道想说什么。说道这,首先想到的可能是“古老的读唇术”。现在,人工智能可能会让这门显得颇神秘的“技艺”被更多人掌握。

之前,有科研人员研发AI唇语识别:运用机器视觉技术从视频中识别出说话人的人脸,提取此人连续说话时口型变化的特征。通过机器视觉识别,不用听声音,仅靠识别说话人的唇部动作,解读说话者所说的内容。近日,不同于运用机器视觉技术识别说话人的唇部动作的的技术,一种仅靠检测喉咙运动的“读唇术”据说也被研发出来了。

图片 1.png

据《itmedia》网站消息,近日,东京大学和索尼计算机科学研究所共同研发出的AI系统“Derma”,通过将传感器贴合在喉咙周围的皮肤上,就能成功实现从口形(无声说话)到语音的转化。

研究灵感最初来源于视听障碍者的触诊唇读法,他们会用手指触摸说话者的嘴唇和下巴周围,以此读取说话内容。也就是说,他们通过触摸障碍者嘴唇周围的皮肤得知他们的说话内容。

AI系统“Derma”应用时,在下颚皮肤的两个位置安装加速度计和角速度传感器,辅之机器学习,通过随着说话发生的下颚运动和舌肌运动引起的从下颚到喉咙的皮肤颤动,进行无声“语音识别”。(钉科技编译,消息来源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
海信、Vidda全场景新品发布会定档5.8,三大王牌提前曝光,彩蛋会是智能穿戴吗?
2
2026“红点奖”公布!海信大力神空调U6问鼎设计界“奥斯卡”
3
MOVA全球首创技术获批国家专利!16cm极致外扩超级机械臂重构清洁边界
4
Meta宣布与亚马逊云科技深化合作 采用Amazon Graviton赋能其Agentic AI发展
5
政策东风与情绪需求共振,热水器行业如何借势破局?
6
一人千面唤醒场景革命,情绪价值激活净水器增长密码
7
北京车展人气爆棚!智驾展区人头攒动,打卡必冲
8
苹果有望成为今年第三大笔记本电脑制造商
9
去年亏损近3亿元,今年的火星人将如何走出困境?
10
另类的竞争方式和格局,加速中国家电行业全球化的布局
11
当LABUBU走进厨房:泡泡玛特如何用IP重塑小家电消费?
12
美的集团与伊莱克斯再次携手,为并购铺路?
13
政策东风与情绪需求共振,热水器行业如何借势破局?
14
联发科首发智能体座舱解决方案,为车企建立竞争新优势
15
最轻薄阔折叠手机!三星Galaxy WideFold要来了
16
苹果新CEO特努斯9月1日上任 万元折叠屏iPhone Ultra成首秀
17
两大清洁电器巨头2025年营收近200亿,两大方向成增长关键
18
中国代工企业或无缘美国最大规模退税,海尔为何受益?
19
快手电商举办618商家大会 千亿流量扶持优质供给
20
全球南方成为出海热土,AI视频生成技术正为全球视听产业注入新动能
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512