【AI时刻】GPT-4最强对手出现!Claude-3 AI模型发布
就当我们还在为OpenAI的Sora实际效果感到震撼,惊叹未来已来的时候。短短一个月,OpenAI的“家”就被人偷了,昨晚北京时间凌晨Anthropic公司宣布Claude-3正式发布,带有三个高性能的模型形态,并宣布在AI逻辑基准测试中超过了ChatGPT-4。 可能国内的小伙伴很少知道Claude,这是一个在海外备受关注且用户基数较大的一个AI模型,其从诞生以来就一直与GPT相爱相杀,在AI
2024-03-11 11:03:18
来源:PConline  

就当我们还在为OpenAI的Sora实际效果感到震撼,惊叹未来已来的时候。短短一个月,OpenAI的“家”就被人偷了,昨晚北京时间凌晨Anthropic公司宣布Claude-3正式发布,带有三个高性能的模型形态,并宣布在AI逻辑基准测试中超过了ChatGPT-4。

可能国内的小伙伴很少知道Claude,这是一个在海外备受关注且用户基数较大的一个AI模型,其从诞生以来就一直与GPT相爱相杀,在AI性能排行榜上紧追不舍。其也是基于GPT(Generative Pre-trained Transformer)技术的大型语言模型,通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。

亚马逊于今日宣布使用Claude3来优化其商业逻辑

该系列包含三款各具特色的型号:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,它们在性能与应用功能上各有侧重,旨在满足多样化的应用场景需求。

Claude 3 Haiku

Haiku 型号凭借其极速处理能力和高性价比脱颖而出。它能够在短短三秒内完成对一篇含有约 10,000 个标记、信息浓缩且数据密集的 arXiv 研究论文的阅读工作,包括对图表和图形的理解。Haiku 尤其适用于那些对处理速度有极高要求但性能负荷相对较轻的平台。

Claude 3 Sonnet

Sonnet 型号在处理大多数工作负载时的速度是 Claude 2 以及 Claude 2.1 的两倍,且模型效果与性能一致,并提供更高层次的智能分析能力。它特别擅长处理那些需要快速反应的任务,例如知识检索和销售流程自动化等。

Claude 3 Opus

Claude 3 Opus 是系列中的高端型号,具备与市场上其他顶尖模型相匹敌的复杂视觉处理能力,能够处理多种视觉格式,包括照片、图表、图形以及技术图解。相较于 Claude 2.1,Opus 在解决开放性问题上的准确度提升了一倍,同时也显著降低了错误答案的比例。

其他亮点

全系列模型均能处理超过 100 万个标记的输入,为那些需要更强大处理能力的客户提供可靠支持。Claude 3 系列在执行复杂多步骤指令方面表现卓越,尤其在遵循品牌语调和响应指南上,能够为用户打造出值得信赖的客户体验。此外,这些模型还擅长生成流行的结构化输出格式,如 JSON。

目前,Opus 和 Sonnet 已经通过 API 对外开放,开发者现可直接注册并开始体验这些尖端模型的强大功能。比如,POE就已经支持Claude-3-Opus模型,购买POE“月卡”后就可以体验。

超越GPT-4;兼顾视觉功能

根据Anthropic的说法,Claude 3 Opus 在10项人工智能标准测试中超越了GPT-4,包括MMLU(本科水平知识)、GSM8K(小学数学)、HumanEval(编程)以及HellaSwag(常识)。

其中一些胜利的优势非常微小,例如Opus在MMLU五次尝试中得到86.8%的得分,而GPT-4得到86.4%,一些差距则较大,例如在HumanEval上Opus得到90.7%的得分,而GPT-4得到67.0%。这可能就意味着Claude 3对于新手码农要更加友好。

与前代模型相比,Claude 3系列在分析、预测、内容创作、代码生成以及多语言对话等方面展现了改进。据报道,这些模型还具备了增强的视觉能力,允许模型处理照片、图表和图解等视觉格式,类似于GPT-4V和谷歌的Gemini

在实际测试中,Claude 3相比于GPT-4V对于PDF的解读要更加快速,同时对于中文输出的逻辑与优化也要明显好于前代,也是达到了GPT-4平替的水准。

最新文章
1
2026年85寸电视选谁?刚出炉的618榜单给出了答案
2
618全周期第一,SQD-MiniLED百吋游戏多赛道夺冠,TCL电视这次赢得太狠
3
全球消费级具身智能开创者元点Zeroth携全球首款自主回充家用机器人亮相 2026 巴黎 VivaTech
4
数字抽真空能成行业标配吗?空调售后标准化难题待解
5
国内微增0.4%,欧洲暴涨81.4%:中国清洁电器正在海外“收割”高端市场
6
618进入最后蓄势爆发区,众多家电品类依然挡不住颓势
7
冰箱不是“保险箱”!夏天避开这些误区,越用越省电、越健康
8
世界杯战火已燃,中国家电的“全球赛”踢到了第几轮?
9
存量博弈新周期,厨电未来五年的机会在哪里?
10
小米首款阔折叠MIX Fold 5正式入网:搭载UWB技术 定位万元高端市场
11
内存、存储成本持续飙升!库克确认:苹果产品涨价不可避免
12
中国电竞显示器5月最新榜单出炉:AOC霸榜第一
13
京东方率先量产8.6代AMOLED产线:从“行业领跑”到“定义赛道”的战略跨越
14
BOE(京东方)中国首条第8.6代AMOLED生产线量产 开启全球高端显示新篇章
15
推荐系统走向新范式 快手技术沙龙聚焦生成式推荐技术落地
16
快手种、快手收:连通种收信号,让种草走向成交
17
端午竞渡燃情凤凰古城!6月18至20日快手龙舟季重磅开启,共赴民俗狂欢
18
开启夏日健康局,快手“老铁健康加油站·健康点亮我家乡”沈阳站收官
19
空调“15分钟抽真空”,是黑科技还是营销噱头?
20
一季度洗碗机下滑7%,地方补贴与新国标能否成为“破局双翼”?
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512