可灵AI推出“多图参考”功能进一步攻克AI视频一致性难题--丁科技网

首页家居家电手机数码 IT互联网电商零售汽车出行游戏娱乐半导体新基建酷品评测

2025-01-23 15:06:26

来源：丁科技网

近日，快手可灵AI正式面向全球推出“多图参考”模式，该功能能够理解和整合多个图片中的不同主体，根据用户的文字描述，创造性地生成融合视频，进一步攻克了AI视频生成中的一致性难题。

目前，全球用户均可在可灵1.6模型下，使用“多图参考”功能。用户只需选择图生视频，上传1-4张参考图，框选图片中需要使用的人物、动物、物品或场景，并通过“提示词”描述它们之间的变化或互动，可灵AI即可结合所有参考内容并遵从指令生成视频。

用户可以上传一张或多张同一主体（人物、动物、影视角色或物品等）的图片，模型会以这些图片为参考，生成统一风格的视频，帮助用户在制作AI视频时保证多镜头中的主体一致。例如，用户上传猫、夹克、太阳镜三张图片，并输入提示词“一只身穿夹克、戴着太阳镜的拟人化猫在舞台上转身并对着镜头摆姿势，”随后进行生成，就可以得到符合指令的视频。

此外，用户还可以通过参考图来指定场景、服装和动作等，让人物在特定环境中完成特定“演出”，大幅提升创作的可控性。例如，我们分别上传一个老爷爷、一杯咖啡、咖啡馆场景三张参考图片，并输入相应提示词“一个卡通风格的老爷爷在咖啡馆里，端起咖啡杯”来进行生成，便可得到老爷爷坐在咖啡馆里喝咖啡的视频。

同时，“多图参考”还可以支持不同角色之间的互动。用户可以上传多个人物、动物或者影视角色等图片，并用文字描述他们之间的互动。例如，我们分别上传小男孩、柯基犬两张参考图，并输入提示词“一个可爱的小男孩在抚摸一只柯基犬”，即可生成下图所示的视频。

此前，可灵AI已在全球上线“人脸模型”功能，支持用户通过上传多段视频来训练、定制人脸模型，并参照该人脸模型继续生成视频内容。作为业内首个视频模型定制功能，“人脸模型”创新性地满足了用户创作多个包含同一人物镜头的需求。

随着“多图参考”功能的推出，可灵AI进一步解决了视频生成中的一致性难题，帮助用户充分发挥创造力，自由组合各种图片元素，打造独特的创意场景，探索更多可能。

原创文章

1

显示器的“体验战争”正式打响：TCL实业凭什么一出手就定义了三条赛道？

2

电动两轮车半年观察：TOP3下滑，九号小牛极核成唯一增长集团

3

海信近4亿“战投”惠科，电视与面板的“深度捆绑”时代来了？

4

AI转型助力海尔智家《财富》500强排名稳步提升

5

罗永浩吐槽，京东和主流品牌迅速行动，电视适老化要来真的

6

《财富》世界500强观察：中国互联网巨头亮眼，家电业谁上榜？

7

X3B显示器、Q系列回音壁齐发，TCL完成高端消费电子“关键卡位”

8

创维凶猛！2026冲刺年销50万台壁纸电视，技术场景构建增长飞轮

最新文章

1

显示器的“体验战争”正式打响：TCL实业凭什么一出手就定义了三条赛道？

2

从技术领跑到标准引领，海信牵头制定我国首个RGB-Mini LED行业标准

3

OpenAI正在打造”AI伴侣”：为什么它选择从一台智能音箱开始？

4

2026半年报 | 承压中的结构重塑：上半年熨烫市场总结

5

洗碗机：上半年弱V型反转，下半年能否延续增长?

6

2026年家电半年报：大考来了，“国补”免疫下的多品类量额齐跌

7

电动两轮车半年观察：TOP3下滑，九号小牛极核成唯一增长集团

8

上半年量额双增，洗碗机如何延续增长势头？

9

骁龙游戏赏释放重磅消息：iQOO新旗舰搭载视效三核架构，手游视效迎来里程碑升级！

10

卢伟冰：REDMI K100 Pro打造4K档全能旗舰！无短板

11

苹果被指正测试长鑫芯片！库克回应：正评估所有选择主要有三家供应商

12

海信近4亿“战投”惠科，电视与面板的“深度捆绑”时代来了？

13

国产首颗OLED TDDI芯片量产，集创北方ICNA3611实现商业化落地

14

上半年我国集成电路制造行业利润飙涨2579.5%

15

7月下旬TV面板价格快报来了，各尺寸跌幅维持在1~2美金

16

上半年烟灶：刚需也不“刚”，市场两位数下滑

17

上半年量额双增，洗碗机如何延续增长势头？

18

确认了！REDMI K100系列明天亮相2026ChinaJoy

19

华为MatePad Pro官宣：大尺寸OLED搭配手写笔鸿蒙生产力利器

20

三星首款耳夹耳机！Galaxy Buds On示意图首次揭晓外观

家庭互联网标签库

关于我们

微信扫一扫，加关注

商务合作

QQ:61149512