微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
一季度洗碗机下滑7%,地方补贴与新国标能否成为“破局双翼”?
2
苹果折叠iPhone最新消息:今年看得到、买不到,明年初才上市
3
小米阔折叠浮出水面:首发澎湃OS4,或成“最贵徕卡旗舰”
4
以国瓷之名,致敬每一场热爱与荣光——华帝以非遗国瓷助力西班牙队逐梦绿茵
5
冰箱入驻国博,M鲜生启动焕新计划,美菱接下来还有 “大招”?
6
海信RGB-Mini LED亮相世界杯,这个“世界第一”到底有多强?
7
亮相世界杯!原色RGB Mini LED跨代领先,东芝电视站稳全球高端赛道
8
20倍增长!2026年RGB-Mini LED电视销量冲击50万台,TOP3几乎包圆
9
洗碗机行业迎“新国标”大考:Q1内销遇冷,海外扛起增长大旗
10
微信开放AI Agent接入能力,美的、海尔、TCL率先布局智能家居新入口
11
方形前摄成新风向?曝国产TOP5厂商全员跟进
12
内存升级换屏幕降级?iPhone 18标准版为AI妥协引争议
13
索尼退出PC市场等于放弃中国!《死亡搁浅2》近半销量来自中国
14
中国技术直面世界杯考场,海信RGB-Mini LED电视拿下全球超七成份额
15
霸屏世界杯!海信RGB-Mini LED赛场吸睛,中国科技闪耀美加墨
16
“致敬经典 传承新鲜” 美菱联合京东开启全国家电焕新升级新篇章
17
行业首个!海尔净水进驻国家奥林匹克体育中心
18
长虹打造足球专列,家电品牌体育营销进入“场景即内容”时代
19
三登世界杯的海信冰箱,在变与不变间,跑出全球化新范式
20
Arm预判:未来PC将分化为两大品类
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512