微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
联想股价大涨原因竟是它!天禧AI 4.0发布引发资本看好
2
618热销开局!海信登顶电视销量第一,多款产品登热销榜
3
智领教育,无界未来,海信商用显示亮相第64届高等教育博览会
4
“天空工场”成员亮剑ASC26超算赛场:清华浙大两支队伍获佳绩
5
今年618 空调千元机还会卷土重来吗?
6
2026年4月中国电视市场品牌出货量222万台,同比下降6.1%
7
谷歌等多家头部厂商发布智能眼镜新品,行业有望迈入千万台量级市场
8
谷歌等多家头部厂商发布智能眼镜新品,行业有望迈入千万台量级市场
9
卡萨帝20年:从原创科技到主导制定国际标准
10
电饭煲保温暗藏健康风险,厨房小家电如何平衡需求矛盾?
11
18A工艺加持!英特尔至强6+开启量产:288核+576MB缓存
12
努比亚Z80 Ultra官宣接入DeepSeek V4:不用更新系统就能用
13
重磅更名升级!深圳国际移动电子展正式转型为消费电子展,AI与新能源双板块赋能产业发展
14
4月电竞显示器线上市场:ROG、HKC份额下滑,联想华为进前十
15
星火动漫携手火山引擎、AMD协同发力,AI漫剧《西游:五指山上贴瓷砖》登顶春节档
16
618开局夺冠、SQD-Mini LED成王牌:解码TCL电视爆卖背后的核心逻辑
17
最后的守夜人离场,全球显示面板产业进入“中国时间”
18
中国平板市场出货量承压:告别价格战,生态与AI成突围核心
19
今晚 19 点准时开售!小米王炸新品集体登场
20
Token售卖“流量化”,运营商到底在抢什么?丨聚焦智能经济新形态
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512