微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
打破边界!Zeroth元点 M1成为全球首个接入OpenClaw的人形机器人
2
出售传闻频出,线下净水第一的A.O.史密斯,中国市场实力几何?
3
透过壁画电视、AI人感等家电,看618大促家电选购的“三大逻辑”
4
国产电视称霸中国市场!三星、索尼等外资品牌合并份额不足3%
5
一张照片就能开门?央视曝光智能门锁安全隐患
6
国内一年仅卖2763万台彩电,当代年轻人为什么不爱看电视了?
7
电视整机厂面板采购表现分化,5月TV面板及整机价格保持持平
8
下滑成空调行业短期常态 多家中小企业面临生死考验
9
vivo X500系列曝光:全球首发天玑9600系列,预计将有三款机型
10
英特尔重新杀入苹果供应链:为苹果代工部分iPhone/Mac芯片
11
快手发布2025年度ESG报告:绿色运营持续深化,AI拓展ESG实践边界
12
巴西文化部长访问快手:深化中巴数字创意与技术应用合作
13
全域联动,赢战618,金牛全新玩法指南重磅上线
14
RGB-Mini LED显示器与智能投影领衔,海信、Vidda六大3C潮品重磅发布
15
小米 17 Max或本月下旬发布 8000mAh +100W闪充
16
iPhone 18系列分批发布,背后藏着什么“秘密”?
17
英特尔最新人事变动,藏着什么大招?
18
利润暴跌68%、现金流为负,小家电的“倒春寒”有多冷?
19
蔚来新款NIO Phone宣传图曝光:多彩拼接设计+未来美学
20
iQOO 15T官宣:iQOO最强天玑旗舰来了
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512