微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
近4000万人次在快手围观时装周!老铁时装周:每种时尚都被看见
2
描绘月子中心众生相,短剧《实习生菜菜》拓宽女性议题表达空间
3
Vidda爆款信息提前曝光:搭载IMAX激光影院同款技术 5月8日正式亮相
4
卖了990万!周鸿祎的“阳谋”成功了
5
营收利润双降,专业集成灶企业陷入困境的原因是创新不足?
6
国内空调市场的困局:除了零售,成本、出货和库存都在飙升
7
超5600万家庭将配8K电视,预计2025年8K电视将实现突飞猛进
8
新能源汽车“卷”起“含SiC量”
9
AI大模型为工业机器人注入“灵魂”
10
安卓5G Soc之王!联发科天玑9300+蓄势待发:vivo全球首发
11
安卓板皇!曝OPPO Pad 3试产:全球首款骁龙8 Gen3平板
12
IPC超越苹果A17 Pro?爆料称天玑9400搭载X5超大核
13
电商“双12”消失之后,“618”退场进行中?
14
光伏行业供需关系失衡,TCL中环力求“穿越周期”
15
BOE(京东方)ADS Pro专场技术策源地论坛举办 聚焦行业领先技术共研显示新未来
16
BOE(京东方)携手合作伙伴亮相北京车展 引领智慧驾舱新风潮
17
快手电商广州举办“2024女装夏季新品订货会暨美妆双选会”,发布“手选好产地”IP
18
以绝美风景疗愈心灵,快手星芒短剧《孤单旅行团》欢乐来袭
19
海信璀璨509真空魔方Pro全嵌冰箱全国开售
20
满足用户高品质生活,海信这款搭载了真空魔方pro的冰箱有魔力!
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512