微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
快手发布2026春节招商通案,携品牌共赴“玩逛看聚购”盛宴
2
观看量破亿 互动超1.2亿 快手直播“超级大舞台·百城大战”总决赛引爆全民狂欢 
3
快手启动“AI灵境计划”:投入千万现金与亿级流量,全周期扶持AI创作者
4
快手捐赠500万港元支援香港火灾救援及灾后恢复
5
首款夸克AI眼镜上市,阿里再次冲击智能硬件赛道
6
家电行业如何突破存量困境,高品质、高价值才是关键
7
双11中国电视市场销量同比大幅下降22%,面板价格保持稳定
8
市场阶段性触顶,电动牙刷如何撬动新增长?
9
天玑座舱 S1 Ultra算力全面跃级!深蓝 L06首搭联发科3nm旗舰车芯
10
双11国内手机销量:苹果暴增37% 小米、华为分别下滑11%、22%
11
一加Ace 6T首发8300mAh冰川电池:电池最大的性能旗舰
12
双11“带不动”彩电业,75吋大屏增长见顶,机会还剩这三个?
13
1999起 华为全新畅享70X开售:麒麟芯片、一键发送北斗消息
14
惠普为何要裁员超4000人?AI可替代人工,存储芯片价格大涨
15
海信空调引领智能家电“新国标”制定  定义智慧健康好空气
16
解码三星OLED电视:技术围绕需求来,创新跟着用户走
17
HUAWEI Mate X7正式发布,折叠引领者,巅峰之上再突破
18
每百户家庭平均拥有彩电108.7台,电视行业进入存量时代
19
iPhone 17系列卖爆 苹果将超越三星成为行业第一
20
挑战漠河极寒!米家空调冬测开启:涵盖挂机、柜机等
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512