微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
Q1或是全年高点:BOM成本失控,2026年PC市场面临“倒春寒”
2
2026年Q1中国大陆智能手机出货量同比降1%,华为位居榜首
3
量产推迟至8月 苹果iPhone Ultra折叠屏秋季发布计划不变
4
3月电视整机出货量同比下降12.1%,4月55英寸以上面板价格微涨
5
从亏损5.89亿到净利连翻四倍:惠而浦做对了什么?
6
适老家电政策元年,如何用科技填补隐性需求的缺口?
7
REDMI K Pad 2配置公布:天玑9500+8.8英寸165Hz高刷屏
8
2nm时代来了!高通骁龙8E6蓄势待发:小米18系列首发
9
家电不好做?Q1电视冰箱空调超3倍增长,这家企业冲千亿目标
10
两大机构数据“打架”!一季度全球智能手机市场,涨还是跌?
11
电动两轮车一季度内销下滑17.1%,行业拐点何时出现?
12
这些你知道吗?家电不撕膜会有哪些影响
13
第二批625亿元下达:今年“以旧换新”已加码至1250亿元
14
告别“泛智能内卷”,AI眼镜“场景为王”
15
品牌格局正面临洗牌,电视行业围绕技术、应用以及智能的厮杀正在展开
16
Linux 7.0重磅发布!Intel、AMD齐欢喜
17
华为Pura 90 Pro Max搭载2亿像素长焦:支持20倍长焦视频
18
线上线下双杀!1-3月海尔系、美的系强势领跑,传统净水品牌怎么办?
19
LG采购1万片三星QD-OLED面板,是显示器“刚需”还是商业“默契”?
20
Q1或是全年高点:BOM成本失控,2026年PC市场面临“倒春寒”
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512