0次浏览 发布时间:2025-04-15 20:33:00
4月15日,可灵AI举行2.0版本模型发布会,发布可灵2.0视频生成模型及可图2.0图像生成模型。据悉,可灵2.0上线了一种可以将文字、图片、视频等不同格式的文件结合起来一起编辑生成视频的新交互模式,此举改变了以往只能用文字生成视频的单一模态编辑方式。
记者了解到,当前视频生成主要分“文生视频”和“图生视频”两种。快手副总裁、可灵AI负责人张迪就披露,85%的视频创作通过“图生视频”完成。一般情况下,AI视频制作者往往通过文字生成图片,再用图片生成视频。而可灵AI此次上线多模态视频编辑功能,使得文字或图片不再成为唯一的AI编辑语言,也可让AI生成的视频更加符合制作者的描述。
根据发布会上的演示,用户能够结合图像、视频片段等多模态信息,将脑海中的多维度复杂想法传达给AI。这也意味着,用户在使用AI生成视频时,提示词中可以夹带图片或视频。业内也将这种全新的交互模式称为MVL(Multi-modal Visual Language,即多模态视觉语言)。
“仅仅用文字描述自己的想象是不够的,人和AI的交互需要新的语言。”快手高级副总裁、社区科学线负责人盖坤说道,例如,用户可以将视频中主人公的面容、服装、背景的参考图片及人物动作的参考视频全部添加到描述中,视频中的人物便可更贴近用户的想象来呈现。此外,这一功能不仅可以灵活理解用户意图,还能支持对视频内容进行局部的增、删、改。
此外,主打“文生图”功能的可图2.0的能力也将迎来升级,其指令遵循能力、电影美学表现力均大幅提升,在多元化的艺术风格方面,可图2.0目前可支持60多种风格化的效果转绘。
据悉,可灵2.0版本发布即上线。即日起,全球用户即可使用可灵AI 2.0模型。“AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、用户复杂创意的精确传达上仍有很多挑战。”盖坤表示。
来源:北京日报客户端
记者:鹿杨
关于进一步规范人工智能生成合成内容标识的公告绿色、安全的微信平台生态离不开广大用户的共同构建,为进一步营造真诚、健康、安全的平台氛围,根据《人工智能生成合成内容标识办法》要求,平台应对AI生成合成内容添加显式标识和隐式标识。为保障用户信息获取的透明度与可信度,平台进一步优化内容识别能力。用户通过平台
8月28日,有网友发布视频称,开车路遇价值4000多万的帕加尼风神,高德地图提醒他前方车辆价格昂贵,注意避让。视频一经发出,很多网友“破防”称“高德不但贴心,还懂扎心”。高德地图真的有这种“穷人提醒”吗?高德地图相关负责人回应记者称,目前,高德地图并未推出该类提醒,网上流传的视频内容来源可能是早前的
11岁的加沙女孩雷娜德·阿塔拉因发布烹饪视频走红海外社交媒体,她在近日发布的视频中说:“现在拍视频让我伤心和绝望,因为我没东西可拍。”在以色列的炮火与封锁下,饥荒席卷加沙地带,死于饥饿与营养不良的儿童人数与日俱增,加沙儿童的处境令人担忧。(记者:孙澳;视频:孙澳)
近日,徐女士向澎湃公众互动平台“服务湃”投诉称,2024年下半年起,她发现自己使用很久的闲鱼账号被限制登录。2025年7月,徐女士联系闲鱼客服询问原因,被告知该账号存在被盗风险,需要她提供身份证信息及人脸信息才可以正常使用。徐女士说,沟通过程中客服拒绝告知系统检测账号风险的判定标准,拒绝采用人工检测
文 | 蒋昌盛作为一名用户研究员,我的整个职业生涯都在试图理解一件事,人究竟是如何与技术互动的。我们通过访谈、观察和数据分析,绘制用户的行为旅程图和共情地图,努力去探寻每一个点击、每一次停留、每一声赞叹或叹息背后的“为什么”。我们总是在寻找那个“啊哈!时刻”,那个用户恍然大悟、产品价值得以彰显的瞬间