微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
奕斯伟计算 | RISC-V OLED触控产品斩获“中国芯”优秀技术创新产品奖
2
DTC2025|TCL华星印刷OLED小尺寸突破,全产业技术创新布局
3
九昆仑低碳科技:以科技构建全球碳中和新生态
4
好设计 见未来:2025家电行业“好设计”评测发布会在北京盛大启幕
5
快手电商“宝藏小城”南通站收官,高效引爆南通家纺商达粉丝与生意增量
6
一加联动快手超级新品日打爆新品营销,首销日品牌GMV超千万
7
iQOO新机首发撬动双11爆发,超级新品日首销单品GMV破1500万
8
单款羽绒服两日爆卖千万,骆驼快手双11如何将品牌力转为购买力?
9
AI+显示:一场“双向奔赴”的产业革命
10
中国电视市场10月整机出货量324万台,创今年最大跌幅
11
三星首款三折叠手机Galaxy Z TriFold配置曝光:搭载5600mAh电池,预计12月5日发布
12
AMD官方确认:Zen6 CPU性能提升70%!
13
首发新麒麟!华为Mate X7全新外观揭晓
14
OPPO Find X9 Pro卫星通信版开售:同时能装四个号!双eSIM+双SIM卡
15
酷风空调突袭千元市场,行业价格战一触即发?
16
电视行业增长逻辑迭代:从规模扩张到“技术+场景”赋能
17
双11全渠道销量销额双冠王!海信电视创新驱动再登高峰
18
TCL电视双11全周期霸榜销量第一,SQD技术站稳顶级画质地位
19
9月洗衣机内销市场需求走低 出口市场放量
20
9月空调产销双双下滑
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512