微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
阳光、年轻、积极三重buff!吴磊代言创维剃须刀,科技美学+年轻力激活品牌年轻力
2
创维剃须刀官宣全球品牌代言人吴磊,高颜值实力派共赴科技美学新境
3
SUSE Linux Enterprise Server (SLES) 16全新发布:AI赋能,智领企业管理
4
亮相“国家橱窗”,影目INMO成唯一入驻中国馆的AI眼镜企业
5
OPPO Reno15真机首次亮相:iPhone同款冷雕工艺、2亿像素主摄
6
苹果新一代Siri将于明年春季登场:融入谷歌Gemini大模型,智能水平全面跃升
7
vivo S50系列入网:搭载骁龙8 Gen5与潜望长焦,标配90W快充
8
苹果 iPhone 18 Air 新增48Mp超广角镜头
9
在线视频火热,2030年全球电视与视频市场预计突破1万亿美元
10
铜价飙升、巨头降价空调小品牌还能活几年?
11
康佳R10易AI电视:三体遥控终结多设备混战,观影终于从容了
12
线上量减价跌、线下稳健升级,高端化与性价比重塑冰箱格局?
13
马斯克:特斯拉AI5芯片明年出样品 台积电三星共造
14
TCL科技三季报:面板大幅盈利,光伏亏损修复,代工增长亮眼
15
荣膺国家级荣誉!海信视像入选第九批制造业单项冠军
16
科大讯飞发布讯飞星火X1.5及系列AI软硬一体方案
17
抓住秋冬焕新商机,快手电商“宝藏小城”助力南通家纺商达生意爆发
18
快手双十一皮草节上线 首日皮草GMV同比增长286%
19
快手达人张小四登上中国文明乡风大会,数字社区成文明乡风建设新载体
20
夏普造车!新增长极or病急乱投医?
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512