微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
27.9mm迄今最薄!创维壁纸电视A10H系列震撼发布
2
鸿蒙世界,日新月异:华为鸿蒙智家“1+3+N”解决方案焕新,即将亮相AWE
3
从引领到定义:方太携手顶尖行业伙伴,开启产业协同新范式
4
方太发布全球首个智慧厨房能力等级,携手伙伴构建开放生态
5
AWE前瞻:海信空调携世界杯定制阵容亮相,定义“新一代AI智能空调”
6
电视市场为何销量走低?李东生指出关键原因,破局思路也有了
7
爱普生第六代墨仓式®️打印机重磅上新!三重“超进化”引领家用打印智能新突破
8
最新报告:宇树人形机器人2025年出货量和市场占比均居全球第一
9
AWE2026风向标提前锁定 :光色场同控RGB MiniLED
10
比亚迪发布第二代刀片电池及闪充技术,首批搭载仰望U7等车型
11
国补退场催生厨电新局 智能正成为市场增长新引擎
12
追觅AURORA手机将首秀AWE2026:双系列布局高端市场
13
苹果首款折叠屏手机来了 iPhone Fold最新CAD图出炉 外观已无悬念
14
联想AI平板小新Pro 13性能官宣:搭载第四代骁龙8S!跑分262万
15
苹果发布iOS 26.4开发者预览版Beta 4:可关闭液态玻璃刺眼高亮效果
16
7连跌结束!电视市场2月重回增长,TCL海信创维拿下6成份额
17
年度科技盛宴将至 AWE2026 核心亮点提前解密
18
AWE前瞻:这个韩系巨头遗憾缺席,但索尼RGB LED电视来了,什么信号?
19
两会热议量子科技 中国电信锚定国家战略新方向
20
2026年全国两会关注未来产业 量子手机走进生活
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512