微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
美菱冻鲜生·宋雅冰箱首发亮相 打造新鲜与国风融合新范式
2
格力、海信、美的均未销售铝空调,“铝代铜”系恶意营销借题发挥
3
压箱底技术下放,SQD-Mini LED王炸组合杀到,TCL在下一盘怎样的大棋?
4
美国CES展看中国智造出海新范式:长虹AI家电让科技多一份温情
5
AI驱动增长,国产半导体设备加速突围
6
CES 2026:从卷智能、卷AI到卷技术,智能电视回归画质竞争
7
即时零售开年迎重磅新闻:阿里落子,美团、京东如何应对?
8
你的手机屏幕多大?近6成安卓手机已经超过6.7英寸
9
三星发布2026款OLED电视:S99H、S95H、S90H、S85H四大系列
10
荣耀Magic8 Pro Air支持eSIM:机身仅6.1mm/155g!
11
惠科也入局,百吋RGB-Mini LED电视“打样”,刺激终端企业加紧布局?
12
追觅电视CES首秀:拳拳到肉的创新 用三重AI重新发明电视!
13
长虹AI人感空调的爆卖逻辑:AI赋能、国补加持、十年包修兜底
14
回归画质本真,2026年电视行业技术之争全面升级
15
厨电缺席2026年“新国补” 其原因决定结果
16
一边卖铝空调一边涨价?假的!别被带节奏
17
AI抢芯大战白热化!云厂商溢价60%扫货存储芯片:手机厂商被迫涨价
18
最新安卓手机处理器份额出炉:高通占比超7成 小米玄戒第四
19
低端市场将“裸价竞争”,低能效空调进入“退场”时刻?
20
首秀即焦点!海信全新一代RGB-Mini LED电视116UX引爆CES 2026
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512