可灵AI推出“多图参考”功能进一步攻克AI视频一致性难题--丁科技网

首页家居家电手机数码 IT互联网电商零售汽车出行游戏娱乐半导体新基建酷品评测

2025-01-23 15:06:26

来源：丁科技网

近日，快手可灵AI正式面向全球推出“多图参考”模式，该功能能够理解和整合多个图片中的不同主体，根据用户的文字描述，创造性地生成融合视频，进一步攻克了AI视频生成中的一致性难题。

目前，全球用户均可在可灵1.6模型下，使用“多图参考”功能。用户只需选择图生视频，上传1-4张参考图，框选图片中需要使用的人物、动物、物品或场景，并通过“提示词”描述它们之间的变化或互动，可灵AI即可结合所有参考内容并遵从指令生成视频。

用户可以上传一张或多张同一主体（人物、动物、影视角色或物品等）的图片，模型会以这些图片为参考，生成统一风格的视频，帮助用户在制作AI视频时保证多镜头中的主体一致。例如，用户上传猫、夹克、太阳镜三张图片，并输入提示词“一只身穿夹克、戴着太阳镜的拟人化猫在舞台上转身并对着镜头摆姿势，”随后进行生成，就可以得到符合指令的视频。

此外，用户还可以通过参考图来指定场景、服装和动作等，让人物在特定环境中完成特定“演出”，大幅提升创作的可控性。例如，我们分别上传一个老爷爷、一杯咖啡、咖啡馆场景三张参考图片，并输入相应提示词“一个卡通风格的老爷爷在咖啡馆里，端起咖啡杯”来进行生成，便可得到老爷爷坐在咖啡馆里喝咖啡的视频。

同时，“多图参考”还可以支持不同角色之间的互动。用户可以上传多个人物、动物或者影视角色等图片，并用文字描述他们之间的互动。例如，我们分别上传小男孩、柯基犬两张参考图，并输入提示词“一个可爱的小男孩在抚摸一只柯基犬”，即可生成下图所示的视频。

此前，可灵AI已在全球上线“人脸模型”功能，支持用户通过上传多段视频来训练、定制人脸模型，并参照该人脸模型继续生成视频内容。作为业内首个视频模型定制功能，“人脸模型”创新性地满足了用户创作多个包含同一人物镜头的需求。

随着“多图参考”功能的推出，可灵AI进一步解决了视频生成中的一致性难题，帮助用户充分发挥创造力，自由组合各种图片元素，打造独特的创意场景，探索更多可能。

原创文章

1

亮相世界杯！原色RGB Mini LED跨代领先，东芝电视站稳全球高端赛道

2

20倍增长！2026年RGB-Mini LED电视销量冲击50万台，TOP3几乎包圆

3

长虹打造足球专列，家电品牌体育营销进入“场景即内容”时代

4

三登世界杯的海信冰箱，在变与不变间，跑出全球化新范式

5

OLED笔记本渗透率不到10%！中尺寸OLED迎降价拐点，PC企业机会来了

6

狂飙28%！中国彩电在海外做对了什么？GfK给出三条线索

7

渗透率差距悬殊！每户1.62台与0.08台，中国空调企业该看向哪里？

8

三星退场，True RGB和OLED两手抓，索尼“加固”高端统治力

最新文章

1

亮相世界杯！原色RGB Mini LED跨代领先，东芝电视站稳全球高端赛道

2

20倍增长！2026年RGB-Mini LED电视销量冲击50万台，TOP3几乎包圆

3

洗碗机行业迎“新国标”大考：Q1内销遇冷，海外扛起增长大旗

4

微信开放AI Agent接入能力，美的、海尔、TCL率先布局智能家居新入口

5

方形前摄成新风向？曝国产TOP5厂商全员跟进

6

内存升级换屏幕降级？iPhone 18标准版为AI妥协引争议

7

索尼退出PC市场等于放弃中国！《死亡搁浅2》近半销量来自中国

8

中国技术直面世界杯考场，海信RGB-Mini LED电视拿下全球超七成份额

9

霸屏世界杯！海信RGB-Mini LED赛场吸睛，中国科技闪耀美加墨

10

“致敬经典传承新鲜” 美菱联合京东开启全国家电焕新升级新篇章

11

行业首个!海尔净水进驻国家奥林匹克体育中心

12

长虹打造足球专列，家电品牌体育营销进入“场景即内容”时代

13

三登世界杯的海信冰箱，在变与不变间，跑出全球化新范式

14

Arm预判：未来PC将分化为两大品类

15

宽折叠屏崛起：折叠手机的下一代形态革命

16

16%不合格！夏普、双立人登黑榜，净水器市场火爆中藏隐忧

17

三星两款新品亮相印度认证机构！Galaxy Z Fold8与Watch Ultra 2上市临近

18

疑似小米万元折叠旗舰曝光：无感折痕+2亿影像，自研芯片悬念待解

19

OLED笔记本渗透率不到10%！中尺寸OLED迎降价拐点，PC企业机会来了

20

2026年上半年中国电视市场关键词：大尺寸化、绿色节能、技术创新

家庭互联网标签库

关于我们

微信扫一扫，加关注

商务合作

QQ:61149512