可灵  可灵AI

新一代AI创意生产力平台

keling

多样化生成模式

可灵升级至 2.6 模型与 O1 统一视频生成引擎,核心支持文生音画、图生音画两大核心功能,重构 “音画同出” 创作流程。文生视频方面,用户输入 “阳光明媚的海边,一位少年迎着海风快乐奔跑” 等文本,可直接生成包含中英双语语音、环境音效与画面动作深度对齐的 1080P 高清片段,最长支持 10 秒时长,还能通过续写功能延伸至 3 分钟连贯内容。图生视频功能进一步强化,上传山水画作等静态图片,可智能解析元素并赋予动态效果,让溪水流动、树叶摇曳,同时同步匹配自然环境音,彻底告别 “无声画面”。此外支持 3-10 秒灵活时长调节与自由宽高比切换,适配多平台创作需求。

卓越的模型能力

以可灵 2.6 模型与 O1 引擎为核心,性能实现全方位跃升。语义响应上,采用 MVL 架构与 Chain-of-thought 推理机制,复杂指令理解能力提升 15%,可精准执行 “角色先弯腰捡花、直身后微笑,镜头从全景推进至特写” 等含时序、运镜的复合指令,跨镜头角色一致性达行业顶尖水平。动态质量上,通过 3D 时空联合注意力机制优化,动作幅度更大、流畅度显著提升,武术打斗等复杂动作细腻自然,物理模拟逻辑严谨,对比 Seedance 1.0 盲测胜率达 285%。画面美感上,支持 HDR 色彩与景深虚化,影视级光影渲染让画面质感媲美专业制作,文生视频可完美响应电影级场景描述,产出大片质感内容。

多模态交互体验

引入多模态交互语言(MVL),支持文字、图片、视频片段等多种输入方式组合生成视频。当用户想要创作一个特定风格的舞蹈视频时,可上传一段喜欢的舞蹈参考视频片段,再配上文字描述舞蹈动作细节、想要的场景氛围,甚至添加几张风格参考图片,可灵便能综合这些信息,生成符合用户期望的舞蹈视频,解决了仅靠文字难以精准描述复杂创意的问题。

强大的视频编辑功能

基于升级后的多模态视觉语言(MVL)架构,实现 “一个输入框,全能创作”。支持文字、图片、视频片段、运动轨迹等多类型输入组合,用户创作舞蹈视频时,可上传参考片段 + 动作文字描述 + 风格图片,系统综合解析后精准生成目标内容。新增 “主体库” 功能,上传多角度参考图即可构建专属素材库,视频创作最多可复用 7 个主体,图片创作支持 10 个主体组合,配合 AI 补图功能可自动生成多视角图像与智能描述。同步推出 “对比模板”,输入素材与生成结果同框展示,方便效果对比与传播。

丰富的图像相关功能

可图 2.0 图像模型持续优化,语义遵循能力进一步提升,支持 60 余种风格转绘,涵盖吉卜力动画、赛博朋克、纸雕等类型。指令遵循上,对多元素、颜色位置、复杂构图的响应精准度极高,生图异质性强、可用率突出。画面呈现电影级质感,构图高级,光影色彩营造独特美学调性。新增局部重绘与自由扩图功能,可精准修改图片特定区域,或无缝延伸画面边界生成全景图;支持上传普通照片一键风格转换,配合 AI 补图功能,单张参考图即可生成多视角图像,为创意创作提供更多可能。

广泛的商业应用覆盖

可灵全球用户规模已突破 4500 万,月活增长达 25 倍,累计生成视频超 2 亿个,服务企业客户超 1 万家。商业合作持续拓展,已接入小米、亚马逊云科技等企业,与《逆水寒》手游达成深度合作,赋能游戏内容创新,并登陆 Artlist 等全球知名创作平台。应用场景全面延伸:影视行业助力特效场景与虚拟角色生成;广告领域可一键生成含旁白、对白、音效的完整短片,降低制作成本;电商行业通过 “AI 模特” 快速产出商品展示视频;在线教育领域制作创意教学内容;自媒体领域支持多人对白、唱歌说唱等多类型创作,大幅降低创作门槛。