微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
快手“老铁,这被窝嘎嘎暖!”榜单发布,亿级流量赋能商家年终生意爆发
2
前赴后继的入局电视行业,瞄准电视未来客厅核心地位
3
工信部:以人形机器人为小切口带动具身智能大产业发展
4
国补加持AI眼镜赛道,家电企业如何从中“掘金”?
5
4499元起!荣耀Magic8 Pro Air首销:行业最强Air
6
谷歌Pixel 10a全角度渲染图曝光:7年系统更新+120Hz屏,3月正式上市
7
11299元起!京东京造Au99.99黄金手机壳上线,既是配件也是随身资产
8
TCL索尼合作,茂佳的全球电视代工“老大”的地位更稳了
9
当五恒成为好房子标配:一场由AI驱动的技术觉醒正在发生
10
荣耀最强旗舰!荣耀Magic8 RSR保时捷设计明天首销:7999元起
11
索尼牵手TCL后,除了True RGB,SQD-Mini LED会不会提上日程?
12
国补新政落地:家电线下的品质转型与流量求索
13
高世代OLED浪潮下,发光材料迎来新一轮技术革命
14
2026年“国补”首批资金625亿已下达,家电行业迎机遇
15
创新技术与智能AI融合的新时代,智能电视成家庭智慧中心
16
荣耀终止保时捷合作 传统豪华品牌联名手机去向何方?
17
iPhone 18系列售价曝光:起步款定价不变,高存储版本或大幅涨价
18
月月有更新!OPPO ColorOS16一月体验升级正式推送
19
彩电业大变局来了!索尼与TCL联手,剑指全球第一?
20
台积电3nm产能紧缺:Intel的18A/14A春天来了 苹果博通考虑用
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512