微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
西葡“双雄会”即将打响,华帝如何用非遗棋局改写世界杯营销规则
2
国民级游戏开启新玩法,快手「捉迷藏大赛」解锁娱乐赛事新范式
3
快手研究院发布《视听新生态下微短剧发展研究报告》:从“流量江湖”迈向“价值码头”,微短剧加速走向精品化
4
8人团队撑起千万生意,大伟户外如何在快手把“老铁信任”做成核心竞争力
5
快手全程直播2026EWC电竞世俱杯,共享全球电竞盛宴!
6
从日均10万单到年销超3亿,义乌商家棠晟如何在快手找到增长密码
7
10天2张罚单+实控人股份遭冻结,倍轻松“轻松”不再
8
安兔兔6月安卓性能榜:骁龙旗舰领跑高端,天玑8500系列掌控次旗舰市场
9
涨价函批量生效,电子元器件“涨涨涨”何时休?
10
“国补”以旧换新继续,第三批“国补”625亿元资金7月全面开放
11
存储涨价风暴持续蔓延:骁龙8E6新旗舰起步价或突破6000元
12
vivo X500系列9月四舰齐发:全新E成员补位,全系长焦微距
13
苹果iOS 27公测版本月上线:iPhone 18 Pro出厂预装正式版
14
三星首款阔折叠Galaxy Z Fold8机模上手:神似华为Pura X Max
15
不认可手机跑分成绩!安兔兔点名某企业,手机营销不可乱来
16
618笔记本线上下滑15%:联想第一,苹果暴增,小米华为份额接近
17
家庭具身智能领导者乐享科技完成近5亿元Pre-A轮融资,发布家庭具身智能品牌“元点Zeroth”,累计融资达10亿元
18
三星首款阔折叠新机,Galaxy Z Fold 8锁定7月22日登场
19
百年一遇的成本风暴:iPhone 17系列涨价在即,生产计划削减15%
20
5月全球大尺寸液晶电视面板出货量同比增长2.2%,环比微降0.3%
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512