微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
次元漫游,沉浸娱乐——Sony Expo 2025于 Bilibili World举办
2
《2025智慧生活科技好物以旧换新选购指南》正式发布
3
解锁2025CIC中国智慧生活大会五大亮点,畅享未来生活新范式
4
助力文化传承 快手推出国内首档二次元IP非遗跨界综艺《IP中国行》
5
快手电商618“星成长主播”案例合集:好方法 好内容 引爆增长
6
北京网络视听艺术大会主题打卡活动超3000万人次观看,全面赋能城市副中心文旅发展
7
锚定行业发展方向,2025中国家电健康趋势高峰论坛在京举办
8
海信视像荣获“中国卓越管理公司”大奖,以长期主义诠释中国企业成长范式
9
空调线上市场半年观察:价格战凶猛 美的格力小米居销量前三
10
三星Galaxy Z Flip7正式发布:AI赋能轻巧机身 智能外屏焕新升级
11
三星Galaxy Z Fold7正式发布:树立Galaxy智能手机新标杆
12
央视探访海信空调实验室,揭秘赛场外的黑科技
13
1-2nm 水分子革命:华帝如何用技术重构沐浴逻辑
14
2025年“湾区杯”网络安全大赛启航 面向全国开放报名 ——守护智慧安全未来城市
15
华润入主康佳,半导体和消费电子起飞在即?
16
快手集中整治“虚假回收”类违规行为,保护用户权益免遭损失
17
快手直播大舞台遍地开花,打造现象级文旅新爆款
18
科技副总裁宋婷婷:数字技术赋能女性发展,繁荣生态绽放“她力量”
19
第三届北京网络视听艺术大会成功举办,“新大众文艺”主题研讨引热议
20
美的格力海尔都布局的厨房空调,鸡肋还是刚需?
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512