微软的新图像字幕算法,准确性或超人类
[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会
原创
2020-10-18 09:46:38
来源:钉科技  

[钉科技编译] 综合《thesouthafrican》和《theverge》消息:微软开发了一种新的图像字幕算法,该算法在某些有限的测试中准确性超过了人类,据称其将被合并到该公司用于视力障碍者的应用程序“Seeing AI”及其更大的Office产品系列中。

image.png

图像字幕技术满足了诸如为图像创建替换文本的任务,该功能对于增加可访问性特别重要。微软AI团队的软件工程经理Saqib Shaikh在新闻发布会上说:“理想情况下,每个人都将在文档、网络、社交媒体中为所有图像添加替代文本,因为这使盲人可以访问内容并参与互动。但是,人们没有。因此,有一些应用程序使用图像标题作为替代文本的方式”。

微软表示,新算法效果是当前算法的两倍,对于使用诸如微软 Seeing AI之类的应用的用户来说,这将意味着极大改善用户体验。

Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。微软算法不仅能够识别人和物体,还能够识别物体之间的关系,这意味着该算法能够将某人描述为“坐在椅子上或读书”。

在9月份的一篇论文中,新算法在一个被称为 "nocaps "的图像字幕基准测试上取得了有史以来最高的分数。nocaps基准测试由超过166000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15100张图片,这些图片涵盖了从运动到假日抓拍,再到美食摄影等等的一系列场景。 (钉科技综合《thesouthafrican》和《theverge》消息编译)

最新文章
1
“大力神杯”来中国!海信大力神空调全球首发!
2
年维护成本1.5万,罗永浩吐槽大金,中央空调买得起、用不起?
3
中国电竞显示器最新销量TOP 10:小米暴涨110% 增幅第一
4
销量好转?1月空调内销排产884万台,同比增长32%
5
eSIM产业爆发背后,紫光同芯的“中国方案”
6
成本飙升叠加需求井喷,储能行业涨声四起
7
超轻薄手机遇冷,真“AI手机”登场? 聊聊2025年手机行业的新玩意
8
MacBook Pro明年重磅升级:首发全新OLED+M6芯片
9
小米17 Ultra今天官宣:最强Ultra 价格涨了
10
与大力神杯同框的海信冰箱,用真空锁鲜科技缔造“冠军时刻”
11
致敬电视百年史 海信RGB-Mini LED和激光电视斩获科技创新大奖
12
打造健康场景,完善健康预警,2025年中国北京·第五届健康家电大会召开
13
打通RGB-Mini LED技术升级、市场普及“堵点”,TCL Q9M到底“改进”了什么?
14
2026电视市场:存储芯片涨价抑制销量TOP5或有品牌被“挤出”
15
家电进入存量时代,企业需把握技术创新创造更高溢价
16
iPhone 18 Pro或取消灵动岛:传将采用单孔屏与屏下Face ID方案
17
全球首款2nm手机芯片登场!三星Exynos 2600 10核3.9GHz性能刷新纪录
18
马斯克放话:xAI三年内击败竞争对手 明年实现通用人工智能
19
涨价函满天飞,家电却“涨不动”?
20
最强编程模型!OpenAI发布GPT-5.2-Codex
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512