微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
群星贺岁,福启马年,快手马年星晚多重惊喜嗨翻新春
2
喜迎马年新春,首部AI贺岁动画短片集《马上有戏》温情上映
3
快手电商春节不打烊,优选年货48小时极速发
4
快手电商启动“心动情人节”活动 联合大牌美妆打造节日礼赠消费狂欢
5
极米行业显示携手成都市美术馆,共塑2026成都双年展
6
终端焕新计划:华帝让用户体验“所见即所得”
7
多家电视巨头相继叫停8K电视布局,8K电视发展遇瓶颈
8
跌破3000万台后,中国彩电行业如何重塑增长逻辑?
9
A股大热的脑机接口巨头岩山科技将亮相AWE2026东方枢纽展区
10
年暴增500%!冰洗空下跌,这个家电品类卖疯了,有什么启示?
11
消息称苹果2月19日发布iPhone 17e:25W满血MagSafe,沿用刘海屏
12
苹果AI硬件蓝图首曝光:库克宣布进军AI终端 无屏眼镜、智能胸针率先落地
13
vivo跨界布局Vlog相机:对标大疆Pocket,预计2026年发布
14
2025年厨房小家电零售额同比上3.8%,未来增长依赖价值突破
15
从制造到流通集体承压,家电行业的“寒冬”来了?
16
集体涨价!空调行业迎来关键转折
17
国补第三年:拉动效应递减 家电行业迎“常态化”大考
18
全球清洁电器市场持续增长,中国品牌如何实现“价值战”突围?
19
苹果iPhone Fold搭载顶级薄膜材料:耐用度直接拉满
20
库克预告苹果将推出全新AI硬件:苹果首款智能眼镜来了
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512