微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
屏耀天工丨一块好屏,特别护眼,天马独供OPPO Find X9系列屏幕
2
“AI+熊猫”演绎东方智慧,从广交会看长虹对话国际市场“新路径”
3
“影游机皇”海信E8S Pro首发价16599元起,影游性能全面狂飙
4
十一彩电市场总结:规模缩水但韧性犹在
5
苹果发布M5芯片,AI算力跃升四倍,新款MacBook Pro与iPad Pro同步革新
6
强化技术保护背后:LGD的OLED优势正在动摇?
7
台上讲蓝图,台下拼刺刀,厨电还是没躲掉“价格战”?
8
9月中国电视市场出货量为292万台,同期下降环比上涨
9
“以产定销”转为“以销定产”,全球LCD TV面板市场迎利好
10
海信夺2025Q3中国电视市场出货量第一 小米第三
11
全球首发全场景1nit!天马独供OPPO Find X9系列屏幕
12
美学破局,影目INMO GO3新品发布,掀起AI眼镜“颜值”的降维打击
13
创维亮相第138届广交会:以全场景智慧生态引领“中国智造”全球化新征程
14
代替Plus的iPhone Air究竟是何方神圣?
15
2025全球最佳品牌榜出炉:苹果第13年蝉联榜首 小米、华为上榜
16
家电市场冷热不均,双十一是打破还是延续这一格局?
17
冰箱产能大战,争的是什么?
18
9月中国电视市场出货量为292万台,同期下降环比上涨
19
三大运营商开启“无卡”时代:iPhone已先行,eSIM手机呼啸而来?
20
索尼探梦科技馆于北京隆福寺焕新启幕,打造 “创意娱乐新地标”
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512