
AI万象
大平台动作
特斯拉中国车机拟接入豆包大模型,已完成备案
腾讯开源混元Hy3preview大模型,推理效率提升40%
小米MiMo-V2.5语音模型正式发布:一句话生成声音、克隆真人音色
新力量崛起
Kimi K2.6发布并开源,代码及Agent集群能力全面提升
投融资风向
SpaceX宣布有权以600亿美元收购Cursor
谷歌计划向Anthropic投资至多400亿美元,支持后者大幅扩展算力
OpenAI出资15亿美元成立合资公司,专攻企业AI部署
01
Meta采集员工“鼠标移动和键盘操作”,用以训练AI
AI万象
4月22日,据路透社报道,一份内部备忘录显示,Meta已开始在美国员工的工作电脑上部署追踪软件,实时采集鼠标移动轨迹、点击行为及键盘操作,并定期截取屏幕内容,所有数据将用于训练其AI模型。该工具被命名为“模型能力计划”(Model Capability Initiative,MCI),运行范围覆盖工作相关应用程序与网站。
Meta发言人Andy Stone确认,MCI采集的数据将作为AI训练的输入之一,并表示相关数据不会用于员工绩效评估或其他任何目的,同时已设置保护措施以屏蔽“敏感内容”,但未具体说明哪些类型的数据将被排除在外。
据报道,MCI的部署是Meta大规模AI转型战略的缩影。公司内部已开始要求员工使用AI智能体完成编程等任务,即便短期内会降低效率。与此同时,Meta正在打破部分岗位之间的职能边界,推行一种名为“AI构建者”(AI builder)的通用职位。
上个月,Meta新成立了应用AI(AAI)工程团队,专注于提升AI模型的编程能力,并利用这些模型打造能够承担产品构建、测试和发布工作的AI智能体。本月初,Meta已开始将“优秀”软件工程师调入AAI团队。
Meta首席技术官Andrew Bosworth在备忘录中描绘的愿景是:“我们正在构建的未来,是智能体主要承担工作,而我们的角色是指挥、审查并帮助它们改进。”他补充称,目标是让智能体“自动识别我们感到需要介入的地方,以便下次做得更好”。
这一举措在法律与劳工权益层面引发了明显争议。
耶鲁大学法学教授Ifeoma Ajunwa指出,电脑日志记录和截屏技术历史上主要被企业用于追查员工不当行为或非工作活动,而此次对键盘操作的记录则将数据采集目标推向了更深层次——使白领员工承受此前仅限于快递司机和零工经济从业者的实时监控程度。
在欧洲,法律环境则截然不同。多伦多约克大学研究技术与比较劳动法的法学教授Valerio De Stefano表示,此类监控在欧洲很可能被认定为违法。
在意大利,利用电子监控追踪员工生产力被明确禁止;在德国,法院裁定雇主仅在涉嫌严重刑事犯罪等特殊情形下方可部署键盘记录。此外,De Stefano认为,该做法还可能违反欧盟《通用数据保护条例》(GDPR)。
De Stefano还指出,雇主监控意识的提升从更宏观层面改变了职场权力格局,使天平进一步向雇主一方倾斜。
新闻拓展:
蒸馏所有员工:Meta强制收集鼠标键盘输入训练AI,社区炸了
02
GPT-5.5正式发布:多项测试超越Claude,实力重回前列
大平台动作
4月24日,OpenAI发布新一代旗舰模型GPT-5.5,并在其官网写道,是其迄今为止最智能、最直观易用的模型,也是在计算机上完成工作的新方式的下一步。
这一发布迅速引发行业关注,不仅因为它号称在智能体任务上实现突破,更因其在多项基准测试中展现出的“统治力”。
在衡量复杂终端操作的Terminal-Bench 2.0 上,GPT-5.5直接冲到82.7%;软件工程评测SWE-Bench Pro得分58.6%;内部长周期任务测试Expert-SWE则达到73.1%。值得留意的是,这三项测试它都用了更少的token就完成了任务。在跨44种职业的综合评测GDPval中,它胜出或打平的比例为84.9%;在模拟客服工作流的Tau2-bench Telecom场景中拿到98.0%;在模拟真实计算机操作的OSWorld里也做到78.7%。
在更专精的领域,它的表现同样抢眼:生物信息学评测BixBench得分 80.5%,位列所有已公布成绩的模型之首。更令人印象深刻的是,一版内部模型还证明了一个关于Ramsey数的长期猜想,并在证明助手Lean中完成了形式化验证。
从底层硬件的协作来看,这套模型针对英伟达GB200/GB300 NVL72系统做了联合设计。结果是,它的每token延迟被保持在与GPT-5.4持平的水平上,同时通过负载均衡优化,token生成速度反而提升了超过20%;在执行同样的Codex任务时,GPT-5.5所消耗的token数量也显著更少。
但与高性能一同被曝光的,还有高幻觉率。在Artificial Analysis的私有基准测试AA-Omniscience中,GPT-5.5的幻觉率高达86%,远高于Claude Opus 4.7的36%。
这意味着,当这个目前“最聪明”的AI大脑面对不确定或未知的问题时,选择“坦言不知”的概率极低,反而更倾向于“自信地虚构”一个答案。而这种高幻觉率一旦放在需要高可靠性的工作场景中,很可能导致分析偏差、决策失误甚至财务损失。
目前,GPT-5.5已向ChatGPT Plus、Pro、Business和Enterprise用户开放,Codex支持最高400K的上下文窗口;API版本也即将上线,标准定价方案是每百万输入token 5美元、每百万输出token 30美元,而GPT-5.5 Pro的API定价分别为30美元和180美元。
新闻拓展:
刚刚,GPT-5.5发布,颠覆劳动理论
03
大平台动作
此前,据网信上海消息,4月21日,上海新增1款已完成备案的生成式人工智能服务,为特斯拉车机语音大模型服务。这也是自2013年进入中国市场以来,特斯拉车机语音助手的一次大更新。
2025年8月,特斯拉与字节跳动旗下火山引擎达成合作,由火山引擎为特斯拉智能座舱交互体验部分提供大模型服务。
特斯拉中国官网的《特斯拉车机语音助手使用条款》显示,特斯拉Model车型的车机语音系统将同时接入字节跳动旗下的“豆包大模型”和深度求索旗下的“DeepSeek Chat”,两款模型均通过火山引擎接入。其中,豆包大模型将承担语音命令功能,如导航设定、媒体播放操控、空调温度调节等,同时还支持语音查询车主手册;DeepSeek则将提供AI互动功能;在支持AI互动能力的特斯拉车型上,车主可以与语音助手聊天,获取天气、新闻等资讯。
特斯拉表示,车主可以通过物理按键,“嘿,Tesla”或自定义唤醒词激活车机语音助手,进而与车辆进行语音交互。
2025年7月,特斯拉在美国先行启用AI大语言模型,该模型使用的是马斯克旗下xAI推出的人工智能Grok。和中国市场不同,美国AI互动功能仅支持搭载AMD Ryzen芯片的特斯拉车型,车主还需要订阅每月9.9美元的“高级车载娱乐服务包”。
据特斯拉4月初最新公布的2026年第一季度全球产量、交付量和部署情况,当季交付量为358023辆,其中Model3/Y交付量为341893辆;当季汽车产量408386辆,其中Model3/Y产量394611辆。同期,特斯拉储能产品装机量达到8.8吉瓦时。
一季度,特斯拉的交付量同比增长6.3%,但环比下降14.4%。根据StreetAccount数据,分析师此前预计特斯拉一季度交付量约为37万辆。
值得一提的是,特斯拉上海超级工厂3月交付电动车超8.56万辆,创年内新高;第一季度交付21.3万辆,同比增长23.5%。
新闻拓展:
特斯拉接入豆包:汽车产品定义权,又东移了一点点
04
大平台动作
这是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,也是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅提升。
据介绍,Hy3 preview可以视为混元快速探索实用性大模型、解决真实世界问题的一个开端。对此,腾讯首席AI科学家姚顺雨表示,Hy3 preview是混元大模型重建的第一步。腾讯希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助提升Hy3正式版的实用性。与此同时,腾讯也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。
目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外,Hy3 preview支持接入流行的开源智能体产品,如OpenClaw、OpenCode、KiloCode 等,并已上架腾讯云大模型服务平台TokenHub。
据悉,正式上线之前,Hy3 preview在腾讯主要AI业务进行了产品测试,获得明显正收益。
新闻拓展:
刚刚,姚顺雨带队「重建」混元,首个大模型上线了
05
大平台动作
新闻拓展:
罗福莉又上分了!小米连甩4款模型,让AI超逼真配音
06
DeepSeek-V4正式发布,昇腾超节点系列产品全面支持
新力量崛起
新闻拓展:
刚刚,DeepSeek V4 双版本正式上线!
07
Kimi K2.6发布并开源,代码及Agent集群能力全面提升
新力量崛起
据官方披露,Kimi K2.6的通用Agent、代码、视觉理解等综合能力全面提升,在博士级难度的完整版“人类最后的考试”、考察真实软件工程能力的SWE-Bench Pro、评估Agent深度检索能力的DeepSearchQA等基准测试中均取得行业领先成绩,表现持平或优于GPT-5.4、Claude Opus 4.6和Gemini 3.1 Pro等闭源模型。
作为月之暗面迄今最强代码模型,Kimi K2.6长程编码能力显著提升,测试中可连续不间断编码13小时,编写或修改超过4000行代码,完成复杂系统开发优化。在Kimi内部代码评测基准Kimi Code Bench中,该模型成绩较上一代K2.5提升约20%。
实测显示,K2.6在Mac本地部署Qwen3.5-0.8B模型时,经过4000余次工具调用、12小时不间断运行,将吞吐量从约15 tokens/s提升至约193 tokens/s,推理速度较LM Studio快20%;在重构拥有8年历史的开源金融撮合引擎exchange-core任务中,该模型连续作业13小时,迭代12套优化策略,修改4000余行代码,实现中位吞吐量185%的增幅。
Kimi K2.6的Agent集群架构同步升级,最多可调度300个子Agent并行完成4000个协作步骤,任务完成度和交付质量较K2.5显著提升,针对OpenClaw、Hermes Agent等主动式Agent框架可支持最长5天的持续自主运行。内部Claw Bench测试结果显示,K2.6综合性能较K2.5提升10%。
新闻拓展:
Kimi K2.6 这次把 Agent 玩明白了吗?
08
SpaceX宣布有权以600亿美元收购Cursor
投融资风向
09
投融资风向
新闻拓展:
谷歌跪了?400亿砸向死敌!AI御三家终结,OpenAI孤立无援
10
投融资风向
新闻拓展:
https://www.reuters.com/legal/transactional/openai-talks-commit-up-15-billion-private-equity-joint-venture-ft-reports-2026-04-22/
信息来源:WAIC综合整理

















