0次浏览 发布时间:2025-04-15 20:33:00
4月15日,可灵AI举行2.0版本模型发布会,发布可灵2.0视频生成模型及可图2.0图像生成模型。据悉,可灵2.0上线了一种可以将文字、图片、视频等不同格式的文件结合起来一起编辑生成视频的新交互模式,此举改变了以往只能用文字生成视频的单一模态编辑方式。
记者了解到,当前视频生成主要分“文生视频”和“图生视频”两种。快手副总裁、可灵AI负责人张迪就披露,85%的视频创作通过“图生视频”完成。一般情况下,AI视频制作者往往通过文字生成图片,再用图片生成视频。而可灵AI此次上线多模态视频编辑功能,使得文字或图片不再成为唯一的AI编辑语言,也可让AI生成的视频更加符合制作者的描述。
根据发布会上的演示,用户能够结合图像、视频片段等多模态信息,将脑海中的多维度复杂想法传达给AI。这也意味着,用户在使用AI生成视频时,提示词中可以夹带图片或视频。业内也将这种全新的交互模式称为MVL(Multi-modal Visual Language,即多模态视觉语言)。
“仅仅用文字描述自己的想象是不够的,人和AI的交互需要新的语言。”快手高级副总裁、社区科学线负责人盖坤说道,例如,用户可以将视频中主人公的面容、服装、背景的参考图片及人物动作的参考视频全部添加到描述中,视频中的人物便可更贴近用户的想象来呈现。此外,这一功能不仅可以灵活理解用户意图,还能支持对视频内容进行局部的增、删、改。
此外,主打“文生图”功能的可图2.0的能力也将迎来升级,其指令遵循能力、电影美学表现力均大幅提升,在多元化的艺术风格方面,可图2.0目前可支持60多种风格化的效果转绘。
据悉,可灵2.0版本发布即上线。即日起,全球用户即可使用可灵AI 2.0模型。“AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、用户复杂创意的精确传达上仍有很多挑战。”盖坤表示。
来源:北京日报客户端
记者:鹿杨
5月30日,段某(网名“两个小段(小)”)通过其抖音账号发布道歉视频,面对镜头鞠躬:“真诚地向胖东来道歉”,承认此前未充分核实商品质量问题,表示“愿意服从法院的判决”。相关阅读:2025年5月28日,许昌市魏都区人民法院依法公开开庭审理了原告许昌市胖东来商贸集团有限公司与被告段某名誉权纠纷案,并当庭
备受瞩目的魅族 Note 16 系列,首批新机大部分版本目前已在多平台迅速售罄。618 期间,星纪魅族加大马力、全力备货,这款同价位段的性能标杆手机,于 5 月 30 日 10:00 在魅族商城和魅族线上授权店补货开售,为消费者带来更多惊喜。在首轮销售中,魅族 Note 16 取得了京东手机竞速排行
离大谱,全键盘手机要复活了!据外媒NoteBookCheck爆料,近日,Unihertz在他们官网上架了全新的5G手机——Unihertz Titan 2,这款产品最大的特征就是自带全键盘,预计会在今年六月登陆Kickstarter平台进行众筹。(图片来源:Unihertz)只能说,相比现在这群一天
来源:台海网近日,晋江市人民法院安海法庭在审理一起买卖合同纠纷案中,对在收条上自行添加文字伪造证据的被告许某依法作出罚款3000元的处罚决定,这是安海法庭今年以来的首个司法制裁案件。在余某(原告)与许某(被告)买卖合同纠纷一案中,许某在收条原件上自行添加文字,对付款情况这一关键事实环节作出虚假陈述,
潮新闻客户端 执笔 宋彬彬 沈烨婷5月26日凌晨,在法国巴黎戴高乐机场,浙江省非物质文化遗产乌镇竹编传承人钱利淮刚参加完第七届国际工艺创新双年展,准备搭乘回国的航班。这次法国之行,他收获满满,不仅自己的代表作《江山》大受欢迎,还向法国总统马克龙赠送了竹编作品《宋锦团花》。“总统先生对作品所承载的文化