
NEWS
更新时间:2025-09-09 22:39:29 浏览: 次
9月9日,AIGC赛道明星公司生数科技通过官方账号正式发布Vidu Q1参考生图,新功能支持多达7张参考图同时输入,达国内多图参考数量上限,并在多主体一致和高还原度方面取得关键突破,实现多人、多场景生成中精准保持主体的面貌与特征。此次发布距离Google Nano Banana生图认领发布仅10天,且该创业公司首次发布生图产品就坐稳头部,彰显了中国创新AI企业在生图核心赛道上已具备与国际巨头正面竞争的自信与实力。
9331.png data-resourcesrc=/capital/image/202509/09/68bfd5376b8e905bd1d8ac5e_m.png data-from=dams data-damsstoid=po68bfd5386b8e905bd1d8ac5f data-damslibid=capital data-width=600 data-height=337 id=img-68bfd5376b8e905bd1d8ac5e_m />
9331.png data-resourcesrc=/capital/image/202509/09/68bfd5376b8e905bd1d8ac5e_m.png data-from=dams data-damsstoid=po68bfd5386b8e905bd1d8ac5f data-damslibid=capital data-width=600 data-height=337 id=img-68bfd5376b8e905bd1d8ac5e_m /
作为AIGC赛道的头部玩家,生数科技自成立以来一直备受行业关注。2024年4月,它率先发布中国首个全面对标Sora的视频大模型产品Vidu,并于7月正式全球上线个月,其年度经常性收入(ARR)突破2000万美元,业务覆盖全球200+国家和地区,成为近年来AI赛道炙手可热且极具影响力的创新公司之一。而本次官宣推出Vidu Q1参考生图,既在意料之外,又在合乎情理之内。
意料之外的是,一直专注在AI视频生成领域深耕的Vidu,事先并未透露任何要进军AI生图领域的迹象,发布前甚至未做预热便直接上线Web产品,使大厂慌张。合乎情理之处则是在于,作为国内首个提出参考生概念的平台,Vidu对突破多主体一致性执念颇深,发布如此之快看起来是早有技术储备。公司发言人曾在多个场合表示,多主体一致是实现复杂叙事的前提。AI生图作为AI视频的前站,如果能在一致性上同样取得惊艳效果,则意味着生数科技这家公司已完成产品关键功能布局,为构建下一步更大商业生态奠定坚实基础。
在AI生图领域,“参考图”数量直接决定了创作者对生成结果的控制精度。当前,业内常见的参考生图功能一般支持1-3张,极少能做到4-5张,而Vidu Q1一举将国内常规的1-3张参考图上限提升至7张乃至更多,直接实现了量级上的跨越。更重要的是,与Nano Banana、即梦、Flux Context等模型的生成案例对比,Vidu Q1参考生图在保持参考图特征的同时,能够保持高还原度,完美贴近用户原始输入,解决行业内其他模型常出现“参考模糊”“相似但不像”的问题,保证“所见即所得”。
在使用中,用户可同时输入人物、场景、道具、风格等多种元素参考图,对最终画面进行精准合成或者替换,最终生成复杂构图、多主体、多元素交互的场景,为专业级内容生产提供强大支持。这一功能也带来了更多创新玩法,如用户可实现与偶像同框合影,或将历史名人“穿越”到现代场景中,体验现代物品,创造强烈的反差感和趣味性,展现文化再生的魅力。
不过,很明显的是,Vidu Q1参考生图的核心优势并不止于娱乐应用,从过往的节奏来看,生数科技的野心并不满足于让Vidu AI仅仅作为“辅助工具”存在。相反,将Vidu升级为真正的“商业生产力”,似乎才是这家公司线日,利用生数科技Vidu AI生成的50集动漫短剧《明日周一》正式上线集”的极效创作模式,上线三天即实现单平台超百万播放,5天破500万的亮眼成绩。创下无流量扶持单平台高播放的AI行业纪录。播放数据和付费收入的双重成功,不仅验证了AI漫剧的商业化成熟性,也使该剧成为国内AI动漫短剧赛道首个商业化现象级案例。此前,该公司还推出了30集全AI流程制作的《一品布衣》、北京中轴线献礼AIGC四部曲《中轴线上的北京》,以及与好莱坞联合制作的50集AI科幻短剧等多部作品,成为影视动漫AI领域落地最快的企业。在广告电商领域,凭借7月发布的Vidu Q1参考生“1080P+超高一致性”视频功能,目前公开信息可查的是,生数科技已与包括安踏、京东、蓝标、小米 、亚马逊、华润等在内的多家行业头部客户达成合作。
或许正是基于前期商业化探索中的显著成果,生数科技将“超高一致性”作为视频大模型的必经之路。Vidu Q1参考生视频,重点攻克的也是多主体一致,而参考生图的发布,则可以看作是对一致性探索的坚实延续。新发布的Vidu Q1参考生图的核心优势在于,能确保多个主体在复杂场景切换下保持绝对一致,人物面貌、服饰细节丝毫不差。这项能力直接切中了电商、广告、影视IP开发等高价值行业的刚需,传统拍摄需要的三耗(耗时、耗精力、耗成本)不再成为难题,在产品类广告中,仅需几秒,就可以让商品在不同场景360°无死角精准展示,达到以假乱真的程度,为企业降本提效提供全新解决方案。
Vidu Q1参考生图的发布,也直接成为AI生图领域的热门事件,当天多次登上行业热门新闻榜。与前几天大火的Nano Banana相比,由Vidu Q1参考生图创造的2个月完成从规划到训练再到产品上线的“中国速度”又一次为人们津津乐道。凭借过硬的技术储备和产品优势,生数科技正与即梦、可灵等国内企业共同推动AIGC市场,并与国际巨头展开正面竞争。
在AI视频生成领域,以生数科技为代表的中国公司,提供了一种“高质价优”的中国AI模式,这为推动AI更大规模、更快速度扩展至普通用户提供了有效可能。与国际对手Veo3、Runway相比,高额的订阅费从来都是人们快速体验AI产品的一大阻碍。AI生图的推出则让竞争不再停留在性价比,更是中美之间AI企业大商业生态比试的重要一环,对于提升中国AIGC技术生态自信心,显得尤为重要。
也是在7月,生数科技发布与清华大学联合研发的具身视频基座模型Vidar,它作为视频大模型Vidu在具身智能领域延伸的重大突破,是全球首个采用多模态生成模型架构解决物理世界问题,并达到该领域SOTA水平的机器人大模型。这不仅彰显了Vidu的强大基模能力及其架构的卓越扩展性,也将通过强化对物理世界的认知,反哺Vidu在数字世界视频创作中对物理规律的理解与生成能力。
同月,在世界人工智能大会(WAIC)上,生数科技还展示了以AI视频生成为样本的硬件设备合作成果——气味播放器及“沉浸式虚拟内容播放”的VR设备,并展示了在影视文旅、AI+教育、智能硬件等领域的一系列解决方案。
如此,以视频大模型架构为基础,构建一个更宏大的技术生态,并快速在商业模式中大规模落地应用正成为可能。从Vidu参考生视频、参考生图等核心产品的上线,从视频生成到与具身智能模型Vidar的结合,从AI硬件到影视、互联网等多领域拓展,中国AI公司正在展现其 “战略眼光+技术储备+商业生态” 的长远布局,为下一代人机交互和内容创作范式定义新的世界标准。