2023年4月16日,在第三届中国AIGC产业峰会上,生数科技的产品副总裁兼Vidu产品负责人廖谦宣布,全球将于下周推出创新的Vidu Q1模型。此次模型升级的核心目标是显著提升内容创作的可控性,特别是在位置控制、运动布局和音频生成方面,以更好地符合人类的审美观和自然规律。
廖谦进一步指出,Vidu Q1模型的推出将引领多模态大模型新时代的到来,大幅提高个性化内容生成的能力,对社交媒体、游戏开发以及虚拟现实和增强现实(VR/AR)等领域带来深远的影响。这不仅将改变内容创作的方式,还会提升用户体验和互动性。
生数科技(北京生数科技有限公司)成立于2023年3月,是一家致力于多模态生成模型和应用产品开发的高科技公司。其核心团队来自清华大学人工智能研究院,凭借强大的研究背景和创新能力,生数科技在行业内迅速崭露头角。
公司率先开发了基于Transformer的U-ViT架构,结合了Diffusion模型与Transformer的优势,能够支持多模态任务的统一建模。这一架构首次应用于2023年开源的UniDiffuser模型,成为全球第一个基于Diffusion Transformer的多模态扩散模型,领先于Stable Diffusion 3使用的DiT架构,标志着技术上的重大突破。
基于U-ViT架构,生数科技计划于2024年4月推出Vidu视频大模型,该模型能够一键生成16秒的1080P高清视频,具备多镜头切换、高时空一致性以及物理世界模拟能力,其性能可与OpenAI的Sora媲美,为行业树立新的标准。
文章总结
总体而言,生数科技通过其在多模态生成模型领域的领先技术和创新,正在推动内容创作和互动体验的革命。随着Vidu Q1模型的推出,预计将进一步加强在社交、游戏和虚拟现实领域的影响力,促进数字内容的多样化和个性化发展。这一进步不仅代表着技术的演变,也为未来的内容创作带来了无限可能。