湖北日报全媒记者 张歆 通讯员 左盈
晨曦中,华中科技大学校园被悄然唤醒。
用一段5秒的镜头语言表达如上场景,你会怎么做?可以选择起个大早前往喻家山,在睡眼蒙眬中放飞无人机,捕捉下拂晓时的校园光影,之后再进行人工剪辑,前后耗时半天;或者直接在办公室打开“爱乌”,导入华科大南大门图片,写入提示词,用“图生视频”功能生成“晨晖中的华科大”,再摄制环绕运镜,即可得到一段不差实拍的镜头,耗时总共不超过5分钟。
4月底,华中科技大学光影交互服务技术文旅部重点实验室主任蔡新元向记者们展示了“爱乌”的神奇魔力。凭借这款自主研发的新一代企业级多模态AI创意生产平台,设计师不出办公室,即可将脑海中的创意变成视频。
【针对视频生成模型痛点 研发控制系统】
AI视频并不是一件新鲜事。DataEye数据显示,仅在今年1月,国内AI漫剧上线数量就创下新高,平均每天有470多部新剧上线;截至2月末,在播AI剧/漫剧总数已达12.78万部,是2025年全年的整整两倍。
行业一边迎来爆发式增长,一边在制作痛点上反复磋磨——“文生图”要“抽卡”,后台算力产出数百张图片,能用的仅为个位数;“图生视频”缺乏一致性,稍微长一些的视频,人物、布景全走样,“穿帮”频现;高峰时段算力争抢,生成时间长,设计师“披星戴月”,只为“错峰打工”,节省等候时间。
蔡新元教授和学生交流。湖北日报全媒记者 张歆 摄
“视频生成模型好比一个充满能量的发动机,当我想把它变成一辆好车,让它在期待的路线上奔跑,就需要有好的减震轮胎、导航系统等等,核心是给它一些程序上的‘控制’。”蔡新元比方道,光影交互服务技术重点实验室具有跨学科优势,针对行业的痛点,团队着手“爱乌”的研发,把人工智能、机器学习领域的新技术应用到研发设计上,核心在于赋予其“控制系统”。
如在业内普遍面临的“抽卡”难题上,团队通过结构化提示词框架,将自然语言的提示词转化为计算机能理解的结构性语言,避免提示词污染与理解偏差,进而控制了生成的边界;引入全链路控制系统应对“穿帮”,保障长视频角色、场景、调性的一致性,促进镜头的自然衔接;“小样本自主学习模型”技术则是通过上传少量样本,引导“爱乌”自主联网搜寻,构建知识库,有效避免海量样本“投喂”,大幅降低了算力消耗与样本依赖。
蔡新元介绍,“爱乌”是职业设计师的辅助工具,研发目标是辅助生成15分钟到120分钟的电影级长视频。AI的应用也加速了研发的进程,研发仅历时半年,“爱乌”的代码有三分之一由AI编写完成。
蔡新元教授向记者们介绍《新江汉揽胜图》不同版本的差异。湖北日报全媒记者 张歆 摄
【“爱乌”让创意创作更高效、更普惠】
当前,人工智能已迈入规模化、普惠化、产业化的全新阶段。AI不再是科技巨头与专业实验室的专属工具,而是深度融入创意、设计、影视、教育、制造等各行各业,成为重构生产方式、提升创作效率、释放创新活力的底层动力。
对于AI,创意设计师常常一边使用一边畏惧,得益于AI技术带来的便利,也惧怕AI最终成为取代自己的工具与对手,让多年积累的专业能力失去价值。
“2030年短视频行业市场规模将有望达万亿元。AI不仅能够解决创意生成的质量和内容的问题,更重要的是,在下一阶段,它会真正成为吸纳就业的主力军。”蔡新元表示,AI的更新以周为周期,高校人才培养以4年为周期,时间的缝隙要用技术填补,必须正视技术引发的创作理念和创作实践的变革,作为高校研发团队,他愿意去花时间来研究如何开发更好的平台、引入更好的技术。
马年春节当天,蔡新元在“爱乌”上耗费三小时制作了一段1分钟的小视频,视频中,一匹AI小红马勇闯设计学院,它漫步、奔驰、腾跃,和人亲昵,尚还年幼但充满活力、雄心勃勃,在视频的最后,蔡新元动情地解说:“华科大设计学院就像这匹小马,承载着很多人的希望,也承载着我们对未来设计的理解和想象。新年快乐!”
放映AI视频《新江汉揽胜图》。湖北日报全媒记者 张歆 摄
今年3月,团队依托该平台,仅历经不到200小时的连续攻关,制作出AI视频《新江汉揽胜图》,让“武汉魅力”以超燃姿态“出圈”,发布后被中国外交部发言人官方账号在X、Facebook等海外平台转发,收到全球网友围观点赞。4月27日,团队制作的《新江汉揽胜图》电影版上线,将原版由4分钟扩充至10分钟,制作效率也大幅升级,初剪版由6人学生团队在48小时内完成,这是团队创造的又一个效率奇迹。
经测算,和实拍相比,通过“爱乌”制作的视频可降低实景拍摄方式95%以上的制作成本,目前平台已对10余家北京、武汉的设计公司开放试用。“‘爱乌’的英文名是‘ARTIOO’,把AI和ART(艺术)融合,最后三个字母形似‘100’,我们想在数字创意产业做到满分。”蔡新元说。