谷歌、OpenAI、Anthropic 齐齐发布新一代模型;英伟达澄清芯片无后门;特朗普要求英特尔 CEO 立即辞职

  • 2025-08-11 18:58:58
  • 3

据多家科技媒体报道,苹果公司近期正在加速自研类 ChatGPT 的 AI 搜索引擎,并悄然成立了名为“Answers, Knowledge and Information”(AKI)的新团队,目标是打造能够自主爬取网络、回答通用知识问题的“答案引擎”,以提升 Siri、Spotlight、Safari 等核心产品的智能搜索能力。

图源:苹果

目前,苹果官方招聘网站已出现十余个与该团队相关的职位,涵盖美国和中国,部分岗位明确要求具备搜索算法和引擎开发经验。招聘信息显示,该团队正在开发大语言模型,强调用户隐私,致力于让 Siri 能够基于个人文档更好地回答问题。

据悉,该项目由前 Siri 高管 Robby Walker 领导,团队成员大多来自 Siri 原班人马。尽管苹果高层曾对类 ChatGPT 聊天机器人持保留态度,但随着生成式 AI 技术的快速发展,以及 OpenAI、Google Gemini 等产品在市场上的普及,苹果也开始加速布局相关领域。

目前,Apple Intelligence 已集成 ChatGPT,但自有 AI 搜索功能尚处于早期探索阶段,未来可能以独立应用或深度集成的形式出现在 Siri、Spotlight 和 Safari 等产品中。

业内分析认为,苹果此举不仅是对外部 AI 技术的积极回应,也与其与 Google 的搜索合作关系面临监管压力有关。苹果希望通过自研 AI 搜索引擎,降低对第三方的依赖,为用户提供更智能、更安全的搜索体验。

GPT-5 发布在即,Anthropic 封禁 OpenAI 访问 Claude 模型

在 OpenAI 即将发布新一代大模型 GPT-5 之际,美国人工智能公司 Anthropic 宣布,因 OpenAI 违反服务条款,已撤销其对 Claude 系列模型的 API 访问权限。Anthropic 发言人表示,OpenAI 的技术团队在 GPT-5 发布前使用 Claude 进行编码和测试,这一行为直接违反了禁止“构建竞争性产品或服务,包括训练竞争性 AI 模型”以及“逆向工程或复制服务”的商业条款。

图源:Anthropic

据媒体报道,OpenAI 并非通过常规聊天界面,而是利用开发者 API 将 Claude 集成到内部工具中,进行编程、写作和安全性等方面的对比测试,并借此优化 GPT-5 的性能和安全性。OpenAI 首席传播官 Hannah Wong 回应称,行业内进行基准测试和安全评估通常会评测其他 AI 系统,“我们尊重 Anthropic 的决定,但考虑到我们的 API 依然对 Anthropic 开放,这一做法令人失望。”

Anthropic 方面表示,未来将继续允许 OpenAI 出于基准测试和安全评估等行业标准目的有限制地访问 Claude API,但具体影响尚未明确。值得注意的是,Anthropic 近期还对 Claude Code 实施了新的速率限制,并在上月以类似理由限制了初创公司 Windsurf 的访问权限。

谷歌发布 Gemini 2.5 Deep Think:多路径推理模型登陆 Gemini 应用

近日,谷歌 DeepMind 正式推出了全新 AI 推理模型 Gemini 2.5 Deep Think,并已面向 Google AI Ultra 订阅用户在 Gemini 应用中上线。这一模型以其多路径并行推理能力和创新的强化学习技术,成为谷歌目前最先进的 AI 推理系统之一。Deep Think 能够同时探索多种思路,并通过延长“思考时间”不断优化答案,显著提升了在复杂问题上的表现,尤其在数学、科学研究、算法设计和创意开发等领域展现出强大实力。

图源:DeepMind

据悉,Gemini 2.5 Deep Think 的多智能体架构允许多个 AI 代理并行解决同一问题,带来更具创造性和深度的答案。此前,该模型的变体已在 2025 年国际数学奥林匹克(IMO)中获得金牌,成为首个在该赛事中获此殊荣的 AI 系统。不过,本次面向公众发布的是“青铜级”版本,速度更快、更适合日常使用,而金牌版则仅向部分数学家和学者开放测试。

图源:DeepMind

在性能方面,Gemini 2.5 Deep Think 在 LiveCodeBench V6 代码能力测试和 Humanity’s Last Exam 综合知识推理基准中均取得行业领先成绩,超越了 OpenAI、xAI 和 Anthropic 等主要竞品。模型不仅能自动调用代码执行和 Google 搜索等工具,还能生成更长、更具细节的回答。谷歌表示,Deep Think 在内容安全和输出客观性上也有进一步提升,但其对部分善意请求的拒绝率略高于 Gemini 2.5 Pro。

目前,Deep Think 仅对 Google AI Ultra 高级订阅用户开放,月费 249.99 美元,并支持在 Gemini 应用内切换使用。谷歌还计划在未来几周内,通过 Gemini API 向开发者和企业用户开放测试接口,进一步拓展模型的实际应用场景。

ChatGPT 周活跃用户即将突破 7 亿

OpenAI 宣布,其聊天机器人 ChatGPT 的周活跃用户数将于本周突破 7 亿,较今年 3 月的 5 亿增长 40%,同比更是翻了四倍,成为历史上增速最快的软件服务之一。

图源:X

公司副总裁 Nick Turley 在 X 平台称,“每天都有更多个人和团队使用 ChatGPT 学习、创造并解决更具挑战性的问题”,显示该工具已从实验阶段走向日常必备。TechCrunch 报道指出,用户活跃度的提升与 3 月推出的 GPT-4 图像生成功能密切相关。

企业市场同样高速扩张:OpenAI 目前拥有 500 万付费企业客户,高于 6 月的 300 万;每日消息量突破 30 亿条。受此推动,公司年经常性收入已达 130 亿美元,较 6 月增加 30%,并有望在年底前超过 200 亿美元。

在用户与收入双增的背景下,OpenAI 计划于 8 月上旬发布下一代模型 GPT-5。知情人士称,新模型将把 o3 系列的高级推理能力并入主线 GPT 架构,旨在减少用户选择困扰并朝通用人工智能迈进一步。首席执行官 Sam Altman 仍提醒外界,GPT-5 达到“黄金能力”尚需数月持续优化。

Perplexity 被指控利用“隐身爬虫”恶意抓取网站内容

近日,知名网络基础设施公司 Cloudflare 发布报告,指控 AI 搜索初创公司 Perplexity 通过“隐身爬虫”技术,绕过了众多网站设定的反爬虫规则,持续抓取被明确禁止访问的网页内容。Cloudflare 表示,即便网站在 robots.txt 文件和 Web 应用防火墙中明确禁止了 Perplexity 的公开爬虫,Perplexity 依然能够访问相关内容。

图源:Cloudflare

Cloudflare 的调查显示,Perplexity 起初会以其公开身份(如 PerplexityBot 或 Perplexity-User)进行抓取,一旦遭遇封锁,就会伪装成常见浏览器(如 Google Chrome on macOS),并采用未在官方 IP 列表中的动态 IP 地址和不同的自治系统网络(ASN)进行访问。这些“隐身爬虫”每天在数万个网站上发起数百万次请求,严重违背了互联网三十年来形成的爬虫透明和遵守网站指令的行业规范。

为验证这一行为,Cloudflare 自建了带有严格 robots.txt 限制的新域名,并发现 Perplexity 仍能获取并回答关于这些受限网站内容的问题。进一步分析发现,Perplexity 的“隐身爬虫”不仅会绕过 robots.txt,还会通过更换 IP 段和 ASN 以逃避封禁,且有时甚至不会读取 robots.txt 文件。

面对指控,Perplexity 官方回应称 Cloudflare 的报告存在误解,仅为“炒作”,并否认抓取了被禁止的内容。不过,Cloudflare 已将 Perplexity 移出其“已验证爬虫”名单,并上线了新的技术手段以封锁其隐身抓取行为。

这一事件也引发了行业对 AI 公司数据抓取行为的广泛关注。此前 Perplexity 就曾因无视网站反爬协议、涉嫌内容剽窃等问题被多家媒体和出版机构质疑。相比之下,Cloudflare 指出 OpenAI 等公司目前已能够遵守 robots.txt 等行业规范,并未出现类似规避封禁的行为。

时隔六年,OpenAI 发布两款开源模型

OpenAI 时隔六年再次回归“开源”路线,于 8 月 5 日同时推出两款开源权重大型语言模型——gpt-oss-120b 和 gpt-oss-20b。前者拥有 1170 亿参数,可在单张英伟达 H100 GPU 上运行;后者仅 210 亿参数,在消费级 GPU 上即可本地推理。两款模型均以 Apache 2.0 许可证开放,允许个人与企业免费商用、自由改动,并可以离线部署以满足隐私或合规需求。

图源:OpenAI

性能方面,OpenAI 官方基准显示,gpt-oss-120b 的综合推理能力逼近自家闭源模型 o4-mini,而体积更小的 gpt-oss-20b 则与 o3-mini 相当。开源社区实测亦证实,gpt-oss-20b 在 MacBook Pro 上可维持每秒 30-40 tokens 的生成速度,最高内存占用约 12 GB。

为配合新模型,OpenAI 还同步开源了 Harmony 响应格式及其官方渲染器,支持 system、developer、tool 等多角色消息和多通道输出,进一步强化函数调用与多工具协同能力。首批生态伙伴涵盖 Hugging Face、Databricks、vLLM、Ollama 等;AWS 与 Azure 当天宣布将两款模型上线 Bedrock、SageMaker 与 ONNX Runtime,标志着 OpenAI 模型首次正式登陆 AWS 平台。

OpenAI 表示,两款模型采用 Mixture-of-Experts 架构,单 token 仅激活部分专家参数以降低算力需求,原生支持 128K 上下文窗口,并在 RL-CoT 后训练阶段引入链式思考与工具调用能力。为验证安全性,OpenAI 依据 Preparedness Framework 进行生物、网络安全对抗评估,并悬赏 50 万美元公开红队挑战,以鼓励社区发现潜在风险。

谷歌 DeepMind 发布新一代世界模型 Genie 3

8 月 5 日,谷歌 DeepMind 正式发布了新一代世界模型 Genie 3。该模型能够根据文本提示实时生成 3D 虚拟环境,用户和 AI 智能体可在其中自由互动,体验高度沉浸式的虚拟世界。与前代 Genie 2 仅能支持 10 到 20 秒的交互相比,Genie 3 可实现长达数分钟的持续交互,并且具备更强的环境记忆能力,能够在用户视角切换后保持物体和细节的一致性。

图源:DeepMind

据 DeepMind 官方介绍,Genie 3 支持 720p 分辨率、24 帧每秒的流畅体验。用户不仅可以通过文本生成世界,还能实时改变天气、添加角色等,极大提升了虚拟环境的可控性和多样性。这一模型无需手工搭建 3D 资产,全部内容均由 AI 动态生成,覆盖真实与想象世界,适用于教育、娱乐、机器人训练等多个领域。

图源:DeepMind

Genie 3 的一大突破在于其“长时记忆”机制。模型能够回溯一分钟前的场景,确保环境在长时间交互中的一致性,这项能力是自动回归式生成技术进步的体现,使得虚拟世界的物理规律和视觉细节更加真实可靠。

DeepMind 还在 Genie 3 上测试了其通用智能体 SIMA,验证了模型在复杂目标导向任务中的表现。研究团队认为,世界模型技术是推动 AGI(通用人工智能)发展的关键,未来可为 AI 智能体提供无限丰富、可控的训练场景。

不过,Genie 3 目前仍存在一定局限,如智能体可执行的动作范围有限,尚难支持多个智能体间的复杂协作,且无法精确还原真实地理位置。模型的持续交互时长也有待进一步延长。

目前 Genie 3 以“有限研究预览”形式开放,仅面向部分学者和创作者,DeepMind 正在探索未来向更广泛用户群体开放的路径。Genie 3 的发布标志着 AI 世界模型在生成式内容、智能体训练和沉浸式体验等领域迈出了重要一步,为通用人工智能的发展奠定了坚实基础。

百度携手 Lyft,将在欧洲推出自动驾驶出租车服务

美国网约车公司 Lyft 日前宣布,将与中国科技巨头百度合作,于 2026 年在英国和德国率先推出自动驾驶出租车服务。这一合作计划目前正等待两国监管机构批准,若获通过,Lyft 将在欧洲多个市场部署百度萝卜快跑(Apollo Go)无人驾驶车辆,并计划在未来几年内将车队规模扩大到“数千辆”。

图源:Lyft

此次合作是 Lyft 进入欧洲市场的重要一步。此前,Lyft 已通过收购欧洲多模式出行平台 FreeNow,正式进入包括英国、德国、法国等九个国家的 150 多个城市。未来,用户有望通过 FreeNow 应用预订百度自动驾驶出租车。

Lyft 首席执行官 David Risher 表示,公司将采用“混合网络”模式,让自动驾驶车辆与人类司机共同为乘客提供多样化选择,并强调 Lyft 致力于与当地监管部门紧密合作,确保自动驾驶出租车的安全、合规落地。

百度萝卜快跑(Apollo Go)作为中国最大规模的自动驾驶出租车服务,已在中国完成超过 1100 万次载客服务。此次与 Lyft 的合作,将有助于其进一步拓展全球市场。

此前,Uber 也与百度达成了合作,将在中东和亚洲市场部署百度无人驾驶车辆。两大网约车巨头正加速与自动驾驶技术公司达成合作,布局全球自动驾驶出行市场。

英伟达官方澄清:芯片无后门、无终止开关、无监控软件

8 月 6 日消息,英伟达官方博客近日再次明确声明,英伟达芯片产品不存在后门、终止开关或监控软件。公司强调,英伟达 GPU 广泛应用于医疗健康、金融、科学研究、自动驾驶系统和 AI 基础设施等关键行业,始终以安全性和可靠性为设计核心。

图源:英伟达

针对部分专家和政策制定者提出在硬件中设置“终止开关”或后门的建议,英伟达表示坚决反对,并指出此类做法会为黑客和敌对势力提供可乘之机,威胁全球数字基础设施安全。博客文章回顾了 90 年代美国 Clipper 芯片项目的失败案例,强调后门设计会削弱用户信心,并带来严重安全隐患。

英伟达强调,产品安全应通过严格的内部测试、独立验证和遵守全球网络安全标准实现。公司支持开放透明的软件工具,帮助用户自主控制和管理设备,而不是通过不可控的硬件后门。官方重申,英伟达芯片中没有后门、终止开关和监控软件,这一原则不可协商,未来也不会改变。

OpenAI 或将进行员工股权二次出售,估值有望飙升至 5000 亿美元

据多家媒体报道,OpenAI 正在与投资者洽谈一项潜在的二次股权出售交易,估值有望达到约 5000 亿美元。此次交易主要涉及现有和前员工出售所持股份,公司本身不会直接获得资金。知情人士透露,投资机构 Thrive Capital 可能主导本轮交易,但具体参与方和出售股份总量尚未最终确定。

图源:OpenAI

OpenAI 此前于今年早些时候完成了一轮由软银领投的 400 亿美元融资,当时公司估值为 3000 亿美元。本次若顺利完成,将较上一轮估值大幅提升近三分之二,凸显出资本市场对 OpenAI 及其核心产品 ChatGPT 的高度看好。公司最新数据显示,ChatGPT 的每周活跃用户已达到 7 亿,年化营收也有望在年底前突破 200 亿美元,较 6 月份的 100 亿美元实现快速增长。

此次二次股权出售不仅为员工提供了流动性,也有助于 OpenAI 在激烈的人才竞争中增强吸引力。近期,包括 Meta、Anthropic 等多家科技巨头和 AI 创企都在积极争夺顶尖 AI 人才,开出高额薪酬吸引跳槽。此外,OpenAI 近期还发布了两款开放权重的语言模型,并即将推出备受期待的 GPT-5 模型,持续巩固其在生成式 AI 领域的领先地位。

值得一提的是,OpenAI 目前正就公司未来的盈利模式和结构进行讨论,为未来可能的首次公开募股(IPO)铺路。公司 CFO 此前表示,只有在公司和市场条件成熟时,才会考虑启动 IPO 进程。此次二次股权出售被视为其资本运作和公司治理优化的重要一步。

Anthropic 发布 Claude Opus 4.1

近日,AI 公司 Anthropic 正式发布了其旗舰模型的最新版本 Claude Opus 4.1。该模型在真实世界的软件工程任务中取得了显著进步,尤其是在编码、推理和数据分析等方面。根据官方公告,Opus 4.1 在 SWE-bench Verified 编码基准测试中达到了 74.5% 的准确率,超过了 OpenAI 的 o3 模型(69.1%)和 Google 的 Gemini 2.5 Pro(67.2%),巩固了其在 AI 编码助手市场的领先地位。

图源:Anthropic

此次升级不仅提升了多步复杂问题的处理能力,还在大规模代码库导航和多文件重构等实际工程任务中表现突出。GitHub 表示,Claude Opus 4.1 在多文件代码重构方面有显著提升,而 Rakuten Group 则强调其在大型代码库中能够精准定位并修正错误,避免了不必要的调整和新漏洞的产生。

Anthropic 首席产品官 Mike Krieger 指出,此次更新标志着公司将持续进行模型的渐进式优化,而不仅仅依赖于重大版本迭代。当前,Opus 4.1 已面向付费用户、Claude Code 订阅、API、Amazon Bedrock 以及 Google Cloud Vertex AI 平台开放,价格与前一代保持一致。

值得注意的是,Anthropic 近年来在 AI 编码市场实现了快速增长,年化营收已达 50 亿美元,其中近一半 API 收入来自两大客户:Cursor 和微软旗下的 GitHub Copilot。这种客户结构带来了巨大的市场机会,同时也伴随一定风险。业内人士分析,随着 OpenAI 即将发布 GPT-5,AI 编码助手市场的竞争将进一步加剧,Anthropic 需要通过技术创新和产品多元化保持领先。

此外,Opus 4.1 还加强了安全保护,采用了更严格的 AI 安全等级(ASL-3),以防止模型被滥用或窃取。虽然此前 Claude 4 系列模型在极端测试下曾出现过不当行为,但企业用户对其在实际生产力提升方面的表现依然给予高度评价。

Anthropic 表示,未来几周还将推出更大幅度的模型升级,持续推动 AI 技术在企业级编码和数据分析领域的应用创新。

OpenAI 正式发布 GPT-5,统一系统架构,免费面向所有用户开放

8 月 8 日,OpenAI 正式发布其新一代旗舰大模型 GPT-5,并面向所有 ChatGPT 用户和开发者开放。OpenAI 首席执行官 Sam Altman 称其为“有史以来最智能、最快捷、最实用的模型”,并表示 GPT-5 在编码、写作、健康等领域均实现了重大突破。

图源:OpenAI

GPT-5 采用统一系统架构,集成了智能高效模型、深度推理模型以及实时路由。系统可根据对话类型、复杂度、工具需求及用户意图自动切换最合适的模型。例如,用户只需在提示中输入“认真思考一下”,系统即会自动启用深度推理模式。API 平台则同步上线了常规版、Mini 版和 Nano 版三种模型,均支持多级推理深度,满足不同场景下的性能与成本需求。

图源:OpenAI

在性能方面,GPT-5 在数学(AIME 2025 无工具 94.6%)、真实工程代码(SWE-bench Verified 74.9%)、多模态理解(MMMU 84.2%)、健康(HealthBench Hard 46.2%)等权威基准测试中刷新纪录。官方数据显示,GPT-5 的幻觉率大幅下降,启用深度推理后,事实性错误比前代 o3 低约 80%,常规模式下也比 GPT-4o 低 45%。此外,GPT-5 更擅长遵循复杂指令,显著减少了过度逢迎、盲目附和等现象。

安全性方面,GPT-5 引入“安全补全”训练范式,摆脱了传统“拒绝式”安全策略的局限。面对双用途(dual-use)或意图不明的请求,GPT-5 会在确保安全的前提下尽量提供有用信息,而非简单拒答,并会透明说明限制原因。这一机制有助于提升模型在生物、网络安全等敏感领域的实用性与合规性。

用户体验层面,GPT-5 取代了以往的多模型手动选择,ChatGPT 默认采用自动路由与推理,Plus、Pro、Team 等付费用户可享更高使用额度及“GPT-5 Pro”扩展推理功能。模型还新增了“Cynic(冷静讽刺)”“Robot(高效理性)”“Listener(温和倾听)”“Nerd(好奇学者)”等个性化风格,支持自定义界面色彩与高级语音模式。

在企业与开发者领域,微软已将 GPT-5 集成进 Windows 11 Copilot、GitHub Copilot、Azure AI Foundry 等产品,助力智能办公与自动化开发。API 端支持 27 万输入 token、12.8 万输出 token 的超大上下文窗口,并开放自由格式函数调用、响应长度控制等新特性。定价方面,GPT-5 主模型每百万输入 token 1.25 美元、输出 10 美元,Mini/Nano 版成本更低,极具市场竞争力。

值得注意的是,尽管 GPT-5 在多项能力上大幅提升,但在部分复杂科学概念(如伯努利效应)等领域仍偶见事实性错误,且对抗性提示注入攻击尚未彻底解决。

特朗普要求英特尔 CEO 陈立武立即辞职,英特尔坚决回应

8 月 7 日晚,美国总统特朗普在其社交平台 Truth Social 上公开要求英特尔首席执行官陈立武(Lip-Bu Tan)立即辞职,理由是其“涉及严重的利益冲突”,并表示“没有其他解决方案”。这一表态令正处于转型关键期的英特尔再度陷入舆论风暴。

图源:Truth

在特朗普发声前,美国共和党参议员汤姆·科顿(Tom Cotton)已于 8 月 5 日致信英特尔董事会,对陈立武与中国企业的投资关系及其在担任益华电脑(Cadence Design Systems)首席执行官期间的合规问题提出质疑。科顿指出,陈立武通过其主导的风险投资基金,在 2012 年至 2024 年间向数百家中国制造及芯片公司投资了至少 2 亿美元,其中部分企业被指与中国军方有关联。此外,益华电脑近期因违规向中国国防科技大学出售芯片设计工具而被美国司法部处以逾 1.4 亿美元罚款,相关行为发生在陈立武任内。

科顿在信中要求英特尔董事会说明,是否在聘用陈立武前已充分了解其与中国企业的关系,并要求其就相关投资撤资,以及是否向美国政府充分披露了与中国公司的剩余投资和专业角色。鉴于英特尔获得了美国《芯片与科学法案》近 80 亿美元的补贴,并承担着美国国防供应链的关键角色,科顿强调英特尔必须妥善管理纳税人资金并遵守安全规定。

针对外界质疑,英特尔回应称,公司及陈立武本人坚定致力于美国国家安全,并配合董事会的相关调查。英特尔在声明中强调:“英特尔、董事会和陈立武坚定地致力于促进美国的国家和经济安全利益,正在根据总统的美国优先议程进行重大投资。”公司还表示,将继续加大在美国本土半导体研发和制造领域的投入,包括在亚利桑那州的新工厂项目。

陈立武于今年 3 月正式出任英特尔 CEO,是该公司历史上首位华人掌门人。上任后,他大刀阔斧推动管理层精简、剥离非核心业务和大规模裁员,聚焦核心芯片制造业务。业内普遍认为,陈立武的改革对英特尔能否走出困境至关重要。当前风波若导致其被迫辞职,或将对英特尔的未来发展产生重大影响。

截至目前,陈立武本人未就特朗普的公开要求作出回应。