AI“读唇术”,靠什么让“失语者”重新“开口”?
[钉科技编译]不出声,仅仅通过喉咙和下颚的皮肤震动就能知道想说什么。说道这,首先想到的可能是“古老的读唇术”。现在,人工智能可能会让这门显得颇神秘的“技艺”被更多人掌握。之前,有科研人员研发AI唇语识别:运用机器视觉技术从视频中识别出说话人的人脸,提取此人连续说话时口型变化的特征。通过机器视觉识别,不用听声音,仅靠识别说话人的唇部动作,解读说话者所说的内容。近日,不同于运用机器视觉技术识别说话人的
原创
2020-04-06 07:30:49
来源:钉科技  

[钉科技编译]不出声,仅仅通过喉咙和下颚的皮肤震动就能知道想说什么。说道这,首先想到的可能是“古老的读唇术”。现在,人工智能可能会让这门显得颇神秘的“技艺”被更多人掌握。

之前,有科研人员研发AI唇语识别:运用机器视觉技术从视频中识别出说话人的人脸,提取此人连续说话时口型变化的特征。通过机器视觉识别,不用听声音,仅靠识别说话人的唇部动作,解读说话者所说的内容。近日,不同于运用机器视觉技术识别说话人的唇部动作的的技术,一种仅靠检测喉咙运动的“读唇术”据说也被研发出来了。

图片 1.png

据《itmedia》网站消息,近日,东京大学和索尼计算机科学研究所共同研发出的AI系统“Derma”,通过将传感器贴合在喉咙周围的皮肤上,就能成功实现从口形(无声说话)到语音的转化。

研究灵感最初来源于视听障碍者的触诊唇读法,他们会用手指触摸说话者的嘴唇和下巴周围,以此读取说话内容。也就是说,他们通过触摸障碍者嘴唇周围的皮肤得知他们的说话内容。

AI系统“Derma”应用时,在下颚皮肤的两个位置安装加速度计和角速度传感器,辅之机器学习,通过随着说话发生的下颚运动和舌肌运动引起的从下颚到喉咙的皮肤颤动,进行无声“语音识别”。(钉科技编译,消息来源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
智联万物 AI赋未来! 2025电博会即将开幕!
2
BOE(京东方)携新能源领域新品亮相2025服贸会 引领绿色转型新动能
3
海尔松下引领四筒洗衣机“争夺战”,分区洗护谁执牛耳?
4
库克献出奇招!iPhone Air是在为苹果折叠屏手机铺路?
5
AI时代终端大变局I端侧AI成物联终端进化“芯”引擎
6
IFA 2025:中国电视走向全世界,智能Ai成行业主旋律
7
空调价格进入一个变盘阶段
8
17999元起!华为Mate XTs三折叠今天首销:10.1英寸+麒麟9030
9
iPhone Air在华发售延期!苹果回应:力争尽快在中国推出
10
华帝股份半年报公布:整体毛利率水平攀升至43.54%,同比提升2.86%
11
IFA、RE+双展亮剑全球:华宝新能重构“从户外到户用”绿电生态
12
快手发布多模态大模型Keye-VL-1.5 8B性能领先、视频理解能力更强
13
快手“我的哇赛时刻”公益影像展览举行,科技向善为乡村学生架起梦想桥梁
14
2025年中德可持续发展论坛举行,快手推动女性在经济转型中稳步发展
15
智媒融合 赋能未来 ——CCNS & ISBT 2025在乌鲁木齐隆重召开
16
万和电气上半年业务结构生变:厨电扛大旗,生活热水承压前行
17
支持双eSIM!苹果iPhone 17 Air首发eSIM版本
18
壁挂炉市场大盘趋稳,“家电化”引领下行业如何升级?
19
“三句话”说说新能源汽车产业发展成效
20
追觅正式官宣入局电视赛道,能否带来差异化价值是关键
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512