微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
俞浩梦想奖学金2026年度申报启动,双通道面向全国开放
2
零售额同比下滑13.8%,618大促也难以扭转空调市场下行周期
3
集体刹车、战略减法:家电行业的新一轮自我革新
4
存量里的电热水器:需求+技术+政策正在驱动一个新周期
5
iPhone 18e屏幕方案确定:连续三代无缘高刷,4000元档仍配60Hz
6
2026年骁龙峰会定档9月22-24日:骁龙8 Elite Gen6系列将登场!高通首款2nm
7
首发2nm骁龙8E6 Pro!小米18系列预计9月24日发布
8
渗透率20%!欧洲人不买空调经不起推敲,中国品牌如何抢市场?
9
卢泰文到访为面板?三星电视、手机业务离不开中国供应链
10
亚马逊云科技中国峰会召开 助力企业在Agentic AI爆发拐点加速实现业务价值
11
亚马逊全球副总裁、亚马逊云科技亚太区联席总裁储瑞松:Agentic AI不仅是技术创新,更是业务变革
12
亚马逊全球副总裁、亚马逊云科技亚太区联席总裁储瑞松:AI Agents 将重塑协作关系,五层技术栈助力企业实现Agentic AI业务转型
13
亚马逊全球副总裁、亚马逊云科技亚太区联席总裁储瑞松:Agentic AI爆发的拐点已然来临
14
海信空调法国销量同比增长超100%,移动空调多国脱销
15
体育营销协同本地化布局,解码中国家电业的全球化新逻辑
16
量额同步暴涨超 50%!运动相机赛道成618消费电子稀缺高增长赛道
17
618 刚结束苹果突然涨价!苹果多款产品宣布涨价!最高涨幅3500!
18
机器人的“脚”,能否赢下佛得角?
19
万亿级市场“低空轰鸣”,各地低空经济拼什么?
20
继续5月停涨、6月持平之后,液晶电视面板7月将转跌
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512