巨人网络发布“千影”有声游戏大模型,加码“游戏+AI”赛道
12月12日,巨人网络在2024年度中国游戏产业年会上发布“千影 QianYing”有声游戏生成大模型,加码“游戏+AI”赛道。“千影 QianYing”包含游戏视频生成大模型YingGame、视频配音大模型YingSound,实现了有声可交互游戏视频生成的新突破。
与此同时,巨人网络启动“千影共创计划”,基于大模型底座技术,对外开放模型技术、模型应用、原创游戏项目等方面的合作共创、应用落地、人才招募,加速布局“游戏+AI”从降本增效向颠覆式创新的快速转化。
YingGame由巨人网络AI实验室联合清华大学SATLab研发,是首个实现角色多样运动与个性化、具备强物理模拟特性的游戏视频生成大模型,可生成开放世界游戏视频,通过文本、图像或键盘、鼠标操作实现角色动作的交互控制,并自定义游戏角色,同时具备更好的游戏物理仿真特性,无需传统游戏的3D模型制作和引擎渲染环节。结合自研视频配音大模型YingSound,能够根据画面生成与之匹配的复杂音效,实现有声游戏视频。
YingSound是由巨人网络AI实验室、西北工业大学ASLP Lab和浙江大学联合研发的视频配音大模型(Video-to-Audio Model,V2A),拥有超强的时间对齐、视频语义理解能力,无需人工输入提示词,端到端为各类视频生成多种类型的高精细度音效,涵盖真实场景视频、动漫视频与游戏视频等,具备多样化应用场景泛化能力。
今年以来,大模型技术在视频领域取得了突破性进展。对于游戏行业,视频生成能力有望替代传统游戏生产方式,极大提高游戏发行内容的创作效率;长期来看,其涌现出对3D模型的理解以及强大的物理世界仿真能力和泛化能力,将对游戏生产管线、交互方式、游戏玩法产生深远影响,被认为是完全由数据驱动的下一代“游戏引擎”。
巨人网络表示,“千影 QianYing”有声游戏大模型展示了通过文字描述实现游戏创造的一种可行性,目前尚处于技术打磨阶段,AI实验室将持续推进模型能力的升级迭代。
据「TMT星球」了解,巨人网络已建立起以自研大模型为核心的全方位基础能力,拥有行业领先的AI 工业化生产全流程解决方案。旗下通用认知对话大模型“GiantGPT”、语音大模型“Bailing-TTS”、高效编码大模型“CodeBrain”等在核心游戏业务规模化应用,已形成高效的生产链路闭环。首创基于自研多智能体大模型的全新产品范式,实现大模型在复杂决策场景落地从0到1的突破。随着“千影 QianYing”有声游戏生成大模型的发布,巨人网络实现了多模态全矩阵布局。
今年初,巨人网络董事长史玉柱提出该公司在“游戏+AI”领域的愿景,希望探索打造一个AI游戏孵化平台,旨在降低游戏开发的门槛,让普通人也能开发游戏。“千影 QianYing”游戏大模型的最新进展,意味着这一愿景迈出了新一步。