从“会说话”到“懂世界”：腾讯布局AI空间智能

2025-11-14 22:48:27
2

当人工智能不再只满足于“会说话”，而是开始尝试“看懂世界”时，一场真正关乎未来的竞赛已经悄然展开。最近，腾讯的动作引人注目——它正大举投入“世界模型”的研发，试图让AI不仅理解语言，还能感知空间、模拟物理，甚至在虚拟环境中像人类一样行动和推理。这不仅是技术路径的升级，更可能是通向通用人工智能的关键一步。

据腾讯混元团队3D生成与世界建模负责人郭春超介绍，当前主流的大语言模型，比如ChatGPT或DeepSeek的R1，本质上还是“文字高手”，擅长处理符号和逻辑，却对现实世界的三维结构和物理规律几乎一无所知。而世界模型的目标，正是补上这一课：让AI真正拥有视觉和空间智能，能理解物体如何摆放、力如何作用、机器人该如何绕过障碍——这些看似简单的能力，恰恰是AI走向现实应用的门槛。

为了推动这一方向，腾讯近期开源了多个世界模型，包括HunyuanWorld 1.0、HunyuanWorld-Voyager和FlashWorld。开发者只需输入一段文字或上传一张图片，就能生成一个可探索、可交互的3D世界。这些工具迅速在Hugging Face等开源社区走红，登上热门榜单，说明全球开发者对这类技术的需求早已蓄势待发。更关键的是，腾讯还推出了轻量化的“量化”版本，让普通电脑也能运行这些模型。“我们相信，只有开放协作，技术才能跑得更快。”郭春超说。

实际上，腾讯早已将这些技术用在自己的业务中。在其机器人训练平台Tairos上，AI通过世界模型在虚拟环境中反复演练，避免了现实中昂贵且危险的试错；而在游戏开发中，AI生成的场景不仅效率大幅提升，质量也已接近人类美术师的水准。公司上月透露，整体AI整合已让全公司的研发效率提高了20%以上——对于一家体量庞大的科技企业来说，这已经不是概念验证，而是实实在在的生产力变革。

但热潮之下，挑战同样真实。郭春超坦言，目前最大的难题之一，是如何确保虚拟世界中的物理规则足够可靠。如果AI在一个“墙壁可以穿透”或“重力忽强忽弱”的环境里训练，它学到的行为一旦用到现实，可能会引发严重后果。“模型必须明白，物体不能穿墙，也不能长时间违背重力。”他强调。这也解释了为何Google DeepMind在今年8月发布其世界模型Genie 3时格外谨慎，仅向少数学者和创作者开放，以防技术被滥用或误用。

放眼全球，这场关于“空间智能”的竞赛早已白热化。人工智能先驱李飞飞新成立的World Labs刚推出首款商业产品Marble；Meta前首席AI科学家扬·勒丘恩也被传将离职创业，专注世界模型；而DeepMind凭借Genie 3入选《时代》杂志2025年最佳发明，稳居技术前沿。在这场决定AI能否真正“走进现实”的赛跑中，腾讯或许不是最早出发的，但它手握游戏、社交、云计算等丰富场景，加上开源策略和工程落地能力，正试图走出一条自己的路。

今年12月，郭春超将在香港举行的SIGGRAPH Asia大会上发表主题演讲。届时，他或许会进一步揭示腾讯如何构建这个“数字物理世界”。而对整个行业而言，一个共识正在形成：未来的智能，不只存在于对话之中，更在于对世界的感知、理解和行动——那才是AI真正“活”起来的时候。

上一篇：人才回流！香港高端住宅租金明年继续看涨3%-5%
下一篇：没有了