微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
2026年85寸电视选谁?刚出炉的618榜单给出了答案
2
618全周期第一,SQD-MiniLED百吋游戏多赛道夺冠,TCL电视这次赢得太狠
3
全球消费级具身智能开创者元点Zeroth携全球首款自主回充家用机器人亮相 2026 巴黎 VivaTech
4
数字抽真空能成行业标配吗?空调售后标准化难题待解
5
国内微增0.4%,欧洲暴涨81.4%:中国清洁电器正在海外“收割”高端市场
6
618进入最后蓄势爆发区,众多家电品类依然挡不住颓势
7
冰箱不是“保险箱”!夏天避开这些误区,越用越省电、越健康
8
世界杯战火已燃,中国家电的“全球赛”踢到了第几轮?
9
存量博弈新周期,厨电未来五年的机会在哪里?
10
小米首款阔折叠MIX Fold 5正式入网:搭载UWB技术 定位万元高端市场
11
内存、存储成本持续飙升!库克确认:苹果产品涨价不可避免
12
中国电竞显示器5月最新榜单出炉:AOC霸榜第一
13
京东方率先量产8.6代AMOLED产线:从“行业领跑”到“定义赛道”的战略跨越
14
BOE(京东方)中国首条第8.6代AMOLED生产线量产 开启全球高端显示新篇章
15
推荐系统走向新范式 快手技术沙龙聚焦生成式推荐技术落地
16
快手种、快手收:连通种收信号,让种草走向成交
17
端午竞渡燃情凤凰古城!6月18至20日快手龙舟季重磅开启,共赴民俗狂欢
18
开启夏日健康局,快手“老铁健康加油站·健康点亮我家乡”沈阳站收官
19
空调“15分钟抽真空”,是黑科技还是营销噱头?
20
一季度洗碗机下滑7%,地方补贴与新国标能否成为“破局双翼”?
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512