微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
从战略到行动,海信空气产业如何造出“四个好空气”?
2
新标准落地!海信小墨E5S Pro成为首批金E权威护眼认证电视
3
龚杨杰:百变声线,科班青年在快手找到职业新赛道
4
《快手2025年度企业社会责任报告》发布:快手平台带动4860万个就业机会
5
快手15周年,程一笑谈AI时代竞争力:“经验”保质期缩短,业务认知才是竞争力
6
快手亮相2026金砖产融合作论坛:直播短视频出海赋能金砖合作
7
快手发布未成年人保护报告 从严治理筑牢数字安全防线
8
618 买电视参考热销榜单:海信全渠道量额双冠,RGB-Mini LED 成换代首选
9
宇树和英伟达的这次合作,是“身体”与“大脑”的理性结合
10
志高空调破产清算:沉浮背后,空调行业路在何方?
11
消息称vivo X500 Pro Max采用索尼 LOFIC主摄,2nm天玑配2亿像素潜望长焦
12
苹果MacBook Ultra首发全新OLED:Mini-LED落幕
13
首款2nm芯片成本上涨!三星Galaxy Z Flip8放弃自研方案:被逼重回高通怀抱
14
暂停3万亿韩元扩张计划,LGD为何在OLED电视市场“踩刹车”?
15
从“烧不坏”到“信得过”:为什么这些国民家电品牌值得“入手”?
16
专有云+Agent深度落地,如何撑起工业品供应链AI跃迁?
17
良品率达90%,三星8.6代OLED产线7月正式全面量产
18
Quick Share落地!安卓苹果实现隔空互传
19
八大亮点加持!iPhone 18 Pro全方位升级,唯独价格悬了
20
iPhone18 Pro电池参数实锤!2nm芯片加持,续航要翻身?
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512