微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
2025年全球Mini LED电视出货量将突破1300万台,迈入成熟阶段
2
新一代影像旗舰!vivo X300 Ultra规格曝光
3
首款骁龙8E5折叠屏手机!OPPO Find N6核心配置揭晓
4
总投资630亿元!京东方宣布提前点亮中国首条第8.6代AMOLED生产线
5
不是简单滤镜!小米揭秘徕卡一瞬如何实现:端侧模型+胶片建模
6
2026国补唯一新增智能眼镜!抢占下一代智能终端战略赛道
7
RGB电视抢市场!三星或将尺寸下放到55寸,LG玩“田忌赛马”?
8
RGB-Mini LED量产难?这个芯片巨头给出了靠谱的“端侧AI引擎”方案
9
不再“想用就用”,家电再生材料新国标明年5月正式实施
10
2026年苹果六大重磅新品前瞻 含折叠iPhone、轻薄Mac
11
2999元 闪极loomos AI拍摄眼镜L1发布:全天候主动AI录制
12
铜等大宗商品飞涨!格力回应制定相应管控政策:空调不会铝代铜
13
多角度“剖解”RGB Mini LED技术,LG的心情有多复杂?
14
“超激鼓”兼顾孩子与办公,让居家打印成为一件轻松简单的事
15
曝!海信将携全新一代RGB-Mini LED电视亮相CES 2026,再次领先一代
16
大冰与无声骑士的一顿饭,吃出了冬至该有的味道
17
存量深处、竞争升维:厨电企业紧抓战略窗口期
18
一加Turbo 6配置公布:骁龙8系旗舰+9000mAh超大电池
19
美的海思联手!空调业首款AI变频芯片诞生,家电业“拼大脑”?
20
性能、续航、散热全面夯到顶!电竞旗舰荣耀WIN系列正式发布
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512