微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
从RGB-Mini LED到全球首发RGBX!海信引领下一代显示全新色彩赛道
2
2026海信空调大力神杯中国行首站落地石家庄!解锁新风科技与世界杯的夏日碰撞
3
打造AI轻办公神器 vivo X Fold6折叠旗舰新品正式发布
4
音质与降噪全面升级,vivo TWS 5 Pro带来旗舰级TWS耳机体验
5
链接全渠道·把握新增长 ——2026 高端家电价值增长峰会重庆圆满落幕
6
民俗IP赋能会员营销:快手龙舟季×美团18会员日全域破圈
7
扎根“中国童装之都”,快手电商选品与商家服务中心落地湖州织里
8
探遍闽都烟火!快手《我的家乡很好玩·福州京喜大真探》书写文旅营销新答卷
9
名师坐镇,大咖唠嗑!快手2026高考志愿季全方位助力考生逐梦
10
快手推出品宣新IP「这里的人」,系列短片开启中国叙事新篇章
11
西门子家电重磅推出全新「水玲珑」Q5系列嵌饮机,以智能净饮科技焕新品质生活
12
电商平台“百亿补贴”被整改,给行业带来哪些启示?
13
“度量体验,标定未来”首批通过家电行业用户体验国标产品发布会在京举办
14
为家庭能源装上“AI大脑”的Jackery Ark AI EMS,到底有多“颠覆”?
15
618终极战报:海信电视全渠道销冠,RGB-Mini LED成世界杯观赛首选
16
直击海尔智家股东大会:逆风局中的“进击者”,李华刚详解竞争力跃升逻辑
17
直击海尔智家股东大会:逆风局中的“进击者”,李华刚详解竞争力跃升逻辑
18
华宝新能Intersolar全球首发AI能源管家Jackery Ark Al EMS,家庭能源从“被动使用”迈向“主动优化”
19
周鸿祎ISC.AI 2026现场“发证”,360 ADE认证纳入工信部紧缺人才培养工程
20
360纳米Work亮相ISC,周鸿祎透露新一代AI工作平台
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512