亚马逊云科技成功助力TII训练400亿参数规模的大语言模型Falcon 40B
6月7日,亚马逊云科技宣布,位于阿联酋首都阿布扎比的全球领先科研中心TII(Technology Innovation Institute)在亚马逊云科技上训练了其性能卓越的开源模型Falcon 40B。Falcon 40B是拥有400 亿参数的大语言模型(LLM),在Apache 2.0许可下提供,并在Hugging Face的开源大语言模型排行榜上位列榜首。该排行榜在多个基准测试中跟踪、排名和
2023-06-08 10:15:49
来源:丁科技网  

6月7日,亚马逊云科技宣布,位于阿联酋首都阿布扎比的全球领先科研中心TII(Technology Innovation Institute)在亚马逊云科技上训练了其性能卓越的开源模型Falcon 40B。Falcon 40B是拥有400 亿参数的大语言模型(LLM),在Apache 2.0许可下提供,并在Hugging Face的开源大语言模型排行榜上位列榜首。该排行榜在多个基准测试中跟踪、排名和评估大语言模型,最终评选出最佳模型。客户现在可以将Falcon 40B部署在Amazon SageMaker JumpStart上,这是一个机器学习中心,提供预训练模型,使客户无需从头构建自己的模型即可获得Falcon 40B最先进的准确性和行业领先的性能。要开始使用Amazon SageMaker JumpStart,请访问aws.amazon.com/sagemaker/jumpstart

大语言模型是机器学习(ML)模型的一个分支,专注于语言领域,可以支持各类生成式AI应用,包括文本处理、总结摘要和会话问答。虽然这些大语言模型具有改变行业的潜力,但构建、训练和部署大语言模型可能需要数周甚至数月的时间,并耗资数千万美元,这将许多公司拒之门外。为了在整个开发过程中实现更好的性能和成本效益,包括Stability AI、AI21 Labs、Hugging Face和LG AI在内的众多客户使用亚马逊云科技端到端的机器学习服务Amazon SageMaker来构建、训练和部署他们的大语言模型。

这也正是TII使用Amazon SageMaker构建其Falcon 40B模型的原因。得益于SageMaker是一项完全托管的服务,TII可以专注于开发自定义的训练机制和优化功能,而无需管理其机器学习基础设施。为了最大限度地降低训练成本并缩短上市时间,TII采取了多项优化措施,包括编写自定义矩阵乘法以加快训练速度。在整个训练过程中,亚马逊云科技还与TII密切合作以利用SageMaker增强可用性,确保训练顺利进行,减少对开发人员的干扰。

TII于2023年5月在Apache 2.0许可下发布了其Falcon 40B模型。自发布以来,Falcon 40B 在各种基准测试中的表现都优于当下的同类模型,展示了无需专门微调的卓越性能。为了让客户更轻松地访问该模型,亚马逊云科技让Falcon 40B可以通过Amazon SageMaker Jumpstart部署。现在,各个行业、各种规模的客户都可以快速轻松地部署自己的Falcon 40B模型,并对其进行定制以满足他们的特定需求,如翻译、问答、信息总结、图像识别等应用程序。

“Falcon 40B的开源版本使机构能够利用其卓越性能来推动AI赋能的解决方案的发展。这是我们致力于促进 AI 创新的重要里程碑,也体现阿联酋深远的科学贡献。”TII跨AI研究中心执行总监兼LLM项目负责人表示,“通过将Falcon大语言模型开源,我们希望将这一先进的技术能力普惠化,为全球研究人员和组织赋能。下一步,我们即将推出新模型,为人工智能和先进技术领域的进一步发展做出贡献。”

最新文章
1
4K Live原相机,帧帧丝滑真清晰,vivo S60系列正式发布
2
回归舒适观影本质,长虹墨玉Q50S以“极黑画质+润眼科技”刷新体验标准
3
玻璃基封装热度走高,面板巨头的新增长曲线还有多远?
4
助力教育数字化发展,快手公益启动“启智星”计划AI赋能教育创新案例征集
5
快手2027快Star顶尖技术人才计划启动,技术高管带教、前沿业务场景助力青年人才成长
6
音画未来,即刻启程:索尼发布True RGB旗舰电视及家庭影院新物种Trio
7
MediaTek 以边缘到云端的次世代技术,全面赋能 Agentic AI 时代
8
近40款智能投影新品密集上市,预计618主流电商渠道仍下滑20%
9
未来三年,厨电市场的赢利点在哪?
10
618前国补升级 家电能打出翻身仗吗?
11
小红书宣布拿下2026世界杯转播权:App、网页、手机投屏免费看球
12
6-8月排产两位数下滑!家用空调市场拉响警报,如何应对?
13
618观察:“伪AI空调”泛滥,锚定“四大标准”可避坑
14
一季报观察:小米将加速大家电出海,国内家电企业松口气?
15
均价1310元创历史新高!小米手机继续高端化、提升盈利质量
16
运动相机鼻祖GoPro市值蒸发99%,将考虑出售或合并?
17
Q1全球大尺寸液晶电视面板出货量下降3.2%,出货面积微降0.9%
18
手机挑战专业转播:iPhone 17 Pro独力完成MLS全场直播
19
谁是手机里最值得留的AI?DeepSeek排第一 豆包第二
20
华为nova 16系列关键配置出炉:三款机型有望吃上麒麟9010S芯片
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512