可灵AI推出“多图参考”功能 进一步攻克AI视频一致性难题
近日,快手可灵AI正式面向全球推出“多图参考”模式,该功能能够理解和整合多个图片中的不同主体,根据用户的文字描述,创造性地生成融合视频,进一步攻克了AI视频生成中的一致性难题。
2025-01-23 15:06:26
来源:丁科技网  

近日,快手可灵AI正式面向全球推出“多图参考”模式,该功能能够理解和整合多个图片中的不同主体,根据用户的文字描述,创造性地生成融合视频,进一步攻克了AI视频生成中的一致性难题。

目前,全球用户均可在可灵1.6模型下,使用“多图参考”功能。用户只需选择图生视频,上传1-4张参考图,框选图片中需要使用的人物、动物、物品或场景,并通过“提示词”描述它们之间的变化或互动,可灵AI即可结合所有参考内容并遵从指令生成视频。

用户可以上传一张或多张同一主体(人物、动物、影视角色或物品等)的图片,模型会以这些图片为参考,生成统一风格的视频,帮助用户在制作AI视频时保证多镜头中的主体一致。例如,用户上传猫、夹克、太阳镜三张图片,并输入提示词“一只身穿夹克、戴着太阳镜的拟人化猫在舞台上转身并对着镜头摆姿势,”随后进行生成,就可以得到符合指令的视频。

此外,用户还可以通过参考图来指定场景、服装和动作等,让人物在特定环境中完成特定“演出”,大幅提升创作的可控性。例如,我们分别上传一个老爷爷、一杯咖啡、咖啡馆场景三张参考图片,并输入相应提示词“一个卡通风格的老爷爷在咖啡馆里,端起咖啡杯”来进行生成,便可得到老爷爷坐在咖啡馆里喝咖啡的视频 。

同时,“多图参考”还可以支持不同角色之间的互动。用户可以上传多个人物、动物或者影视角色等图片,并用文字描述他们之间的互动。例如,我们分别上传小男孩、柯基犬两张参考图,并输入提示词“一个可爱的小男孩在抚摸一只柯基犬”,即可生成下图所示的视频。

此前,可灵AI已在全球上线“人脸模型”功能,支持用户通过上传多段视频来训练、定制人脸模型,并参照该人脸模型继续生成视频内容。作为业内首个视频模型定制功能,“人脸模型”创新性地满足了用户创作多个包含同一人物镜头的需求。

随着“多图参考”功能的推出,可灵AI进一步解决了视频生成中的一致性难题,帮助用户充分发挥创造力,自由组合各种图片元素,打造独特的创意场景,探索更多可能。

最新文章
1
国民级游戏开启新玩法,快手「捉迷藏大赛」解锁娱乐赛事新范式
2
快手研究院发布《视听新生态下微短剧发展研究报告》:从“流量江湖”迈向“价值码头”,微短剧加速走向精品化
3
8人团队撑起千万生意,大伟户外如何在快手把“老铁信任”做成核心竞争力
4
快手全程直播2026EWC电竞世俱杯,共享全球电竞盛宴!
5
从日均10万单到年销超3亿,义乌商家棠晟如何在快手找到增长密码
6
10天2张罚单+实控人股份遭冻结,倍轻松“轻松”不再
7
安兔兔6月安卓性能榜:骁龙旗舰领跑高端,天玑8500系列掌控次旗舰市场
8
涨价函批量生效,电子元器件“涨涨涨”何时休?
9
“国补”以旧换新继续,第三批“国补”625亿元资金7月全面开放
10
存储涨价风暴持续蔓延:骁龙8E6新旗舰起步价或突破6000元
11
vivo X500系列9月四舰齐发:全新E成员补位,全系长焦微距
12
苹果iOS 27公测版本月上线:iPhone 18 Pro出厂预装正式版
13
三星首款阔折叠Galaxy Z Fold8机模上手:神似华为Pura X Max
14
不认可手机跑分成绩!安兔兔点名某企业,手机营销不可乱来
15
618笔记本线上下滑15%:联想第一,苹果暴增,小米华为份额接近
16
家庭具身智能领导者乐享科技完成近5亿元Pre-A轮融资,发布家庭具身智能品牌“元点Zeroth”,累计融资达10亿元
17
三星首款阔折叠新机,Galaxy Z Fold 8锁定7月22日登场
18
百年一遇的成本风暴:iPhone 17系列涨价在即,生产计划削减15%
19
5月全球大尺寸液晶电视面板出货量同比增长2.2%,环比微降0.3%
20
挑战台积电英特尔!三星杀入1.4nm赛道:2029年投产
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512