从“会说话”到“懂世界”:腾讯布局AI空间智能
- 2025-11-14 22:48:27
- 2
当人工智能不再只满足于“会说话”,而是开始尝试“看懂世界”时,一场真正关乎未来的竞赛已经悄然展开。最近,腾讯的动作引人注目——它正大举投入“世界模型”的研发,试图让AI不仅理解语言,还能感知空间、模拟物理,甚至在虚拟环境中像人类一样行动和推理。这不仅是技术路径的升级,更可能是通向通用人工智能的关键一步。
据腾讯混元团队3D生成与世界建模负责人郭春超介绍,当前主流的大语言模型,比如ChatGPT或DeepSeek的R1,本质上还是“文字高手”,擅长处理符号和逻辑,却对现实世界的三维结构和物理规律几乎一无所知。而世界模型的目标,正是补上这一课:让AI真正拥有视觉和空间智能,能理解物体如何摆放、力如何作用、机器人该如何绕过障碍——这些看似简单的能力,恰恰是AI走向现实应用的门槛。
为了推动这一方向,腾讯近期开源了多个世界模型,包括HunyuanWorld 1.0、HunyuanWorld-Voyager和FlashWorld。开发者只需输入一段文字或上传一张图片,就能生成一个可探索、可交互的3D世界。这些工具迅速在Hugging Face等开源社区走红,登上热门榜单,说明全球开发者对这类技术的需求早已蓄势待发。更关键的是,腾讯还推出了轻量化的“量化”版本,让普通电脑也能运行这些模型。“我们相信,只有开放协作,技术才能跑得更快。”郭春超说。
实际上,腾讯早已将这些技术用在自己的业务中。在其机器人训练平台Tairos上,AI通过世界模型在虚拟环境中反复演练,避免了现实中昂贵且危险的试错;而在游戏开发中,AI生成的场景不仅效率大幅提升,质量也已接近人类美术师的水准。公司上月透露,整体AI整合已让全公司的研发效率提高了20%以上——对于一家体量庞大的科技企业来说,这已经不是概念验证,而是实实在在的生产力变革。
但热潮之下,挑战同样真实。郭春超坦言,目前最大的难题之一,是如何确保虚拟世界中的物理规则足够可靠。如果AI在一个“墙壁可以穿透”或“重力忽强忽弱”的环境里训练,它学到的行为一旦用到现实,可能会引发严重后果。“模型必须明白,物体不能穿墙,也不能长时间违背重力。”他强调。这也解释了为何Google DeepMind在今年8月发布其世界模型Genie 3时格外谨慎,仅向少数学者和创作者开放,以防技术被滥用或误用。
放眼全球,这场关于“空间智能”的竞赛早已白热化。人工智能先驱李飞飞新成立的World Labs刚推出首款商业产品Marble;Meta前首席AI科学家扬·勒丘恩也被传将离职创业,专注世界模型;而DeepMind凭借Genie 3入选《时代》杂志2025年最佳发明,稳居技术前沿。在这场决定AI能否真正“走进现实”的赛跑中,腾讯或许不是最早出发的,但它手握游戏、社交、云计算等丰富场景,加上开源策略和工程落地能力,正试图走出一条自己的路。
今年12月,郭春超将在香港举行的SIGGRAPH Asia大会上发表主题演讲。届时,他或许会进一步揭示腾讯如何构建这个“数字物理世界”。而对整个行业而言,一个共识正在形成:未来的智能,不只存在于对话之中,更在于对世界的感知、理解和行动——那才是AI真正“活”起来的时候。
- 上一篇:人才回流!香港高端住宅租金明年继续看涨3%-5%
- 下一篇:没有了
