可灵AI推出“多图参考”功能 进一步攻克AI视频一致性难题
近日,快手可灵AI正式面向全球推出“多图参考”模式,该功能能够理解和整合多个图片中的不同主体,根据用户的文字描述,创造性地生成融合视频,进一步攻克了AI视频生成中的一致性难题。
2025-01-23 15:06:26
来源:丁科技网  

近日,快手可灵AI正式面向全球推出“多图参考”模式,该功能能够理解和整合多个图片中的不同主体,根据用户的文字描述,创造性地生成融合视频,进一步攻克了AI视频生成中的一致性难题。

目前,全球用户均可在可灵1.6模型下,使用“多图参考”功能。用户只需选择图生视频,上传1-4张参考图,框选图片中需要使用的人物、动物、物品或场景,并通过“提示词”描述它们之间的变化或互动,可灵AI即可结合所有参考内容并遵从指令生成视频。

用户可以上传一张或多张同一主体(人物、动物、影视角色或物品等)的图片,模型会以这些图片为参考,生成统一风格的视频,帮助用户在制作AI视频时保证多镜头中的主体一致。例如,用户上传猫、夹克、太阳镜三张图片,并输入提示词“一只身穿夹克、戴着太阳镜的拟人化猫在舞台上转身并对着镜头摆姿势,”随后进行生成,就可以得到符合指令的视频。

此外,用户还可以通过参考图来指定场景、服装和动作等,让人物在特定环境中完成特定“演出”,大幅提升创作的可控性。例如,我们分别上传一个老爷爷、一杯咖啡、咖啡馆场景三张参考图片,并输入相应提示词“一个卡通风格的老爷爷在咖啡馆里,端起咖啡杯”来进行生成,便可得到老爷爷坐在咖啡馆里喝咖啡的视频 。

同时,“多图参考”还可以支持不同角色之间的互动。用户可以上传多个人物、动物或者影视角色等图片,并用文字描述他们之间的互动。例如,我们分别上传小男孩、柯基犬两张参考图,并输入提示词“一个可爱的小男孩在抚摸一只柯基犬”,即可生成下图所示的视频。

此前,可灵AI已在全球上线“人脸模型”功能,支持用户通过上传多段视频来训练、定制人脸模型,并参照该人脸模型继续生成视频内容。作为业内首个视频模型定制功能,“人脸模型”创新性地满足了用户创作多个包含同一人物镜头的需求。

随着“多图参考”功能的推出,可灵AI进一步解决了视频生成中的一致性难题,帮助用户充分发挥创造力,自由组合各种图片元素,打造独特的创意场景,探索更多可能。

最新文章
1
信创启新局 智惠向未来 2026智能云生态大会·信创云生态合作论坛 暨信创产业联盟发展论坛圆满举办
2
魔法原子全球具身智能创新大会硅谷落幕 中国机器人迎来主场时刻
3
海信空调一季度逆势突围:新风赛道超50%份额强势第一,线下稳居TOP4
4
智能云生态大会·智能云应用论坛在闽举办 中国电信携产业伙伴发布多项创新成果
5
EDA智能体杀入车规级芯片,谁来为“错误”买单?
6
车载存储亟待突破“结构性缺货”
7
三星即将推出首款83英寸QD-OLED电视面板,最快2027年落地
8
国产厂商包揽清洁电器全球前五,引领行业全场景+技术生态主导时代
9
“戴帽”、亏损、暴跌……集成灶的崩塌还是没挡住
10
性能操控赛主机!一加 Ace 6 至尊版首销期间3499元起售
11
北美也失势,伊莱克斯持续退守,靠中国家电企业“赋能”?
12
阿里千问成今年用户增长最猛APP 月活同比暴涨42倍
13
中文视觉大模型洗牌:豆包斩获总榜第一 国内模型全面反超海外
14
海信视像2026年一季报:高端大屏驱动价值提升,多元业务打开成长新空间
15
可灵AI发布创作者计划3.0,从创作者支持到商业化赋能全面加码
16
快手电商商家产品中心负责人杜保江:全域协同+AI赋能,驱动商家长效经营
17
KSG和平精英分部、 KSG三角洲行动分部落户杭州滨江,快手电竞生态再添新布局
18
华帝股份2025年报深读:利润引擎换挡,渠道变革与高端化重塑增长逻辑
19
谁在打造“适老化”家电,为3亿银发用户拆除“科技孤岛”?
20
Q1跌超20%!开年失利、格局生变:智能投影进入“生死突围期”
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512