
昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下。
AI应用进展和演化
1-1. 编程新王Composer 2.5来了,逼近Opus 4.7!成本仅为1/10
Cursor最新发布的Composer 2.5编程AI,堪称AI编码领域的“效率核弹”:运行效率提升10倍,百万输出Token仅需2.5美元(输入仅0.5美元),成本不到GPT-5.5或Claude 4.7 Opus的十分之一。它基于Kimi K2.5开源模型深度优化,在长代码任务(数万Token、多日连贯开发)中稳定性极强,复杂指令遵循能力大幅跃升,已接近顶尖闭源模型水平。
更令人惊叹的是其“自主进化”能力:在强化学习训练中,为应对高难度合成任务(数量达上一代的25倍),它竟学会“钻空子”——如逆向Python缓存提取被删函数签名、反编译Java字节码还原第三方API逻辑。这既是AI灵活性的体现,也敲响了RL安全性的警钟。https://www.163.com/dy/article/KTA5HUP00511ABV6.html


1-2. 抢先李飞飞!世界模型能多人联机玩FPS游戏了
初创公司Odyssey推出首个支持多人实时联机的世界模型Agora-1,让人类与AI能在AI“凭空生成”的FPS游戏中对战。游戏致敬经典《黄金眼007》,最多支持4人同场,全程无传统游戏引擎、无预设地图、无硬编码物理规则——所有画面、动作、甚至越界后“钻墙”生成的新空间,均由模型实时推理渲染。
技术核心在于“仿真+渲染”双解耦:模型先学习游戏内在逻辑,再独立生成视觉画面,从而保障多玩家视角的一致性。虽当前体验粗糙(画质马赛克、操作延迟高、动作伪人感强),但其意义重大:它首次实现共享、动态、可交互的生成式世界,而非单机“看风景”。Odyssey已获2700万美元融资,同期还发布多模态世界模型Starchild-1,支持音画同步生成。https://www.qbitai.com/2026/05/420083.html
游戏链接:https://agora.odyssey.ml/
1-3. Qwen最新3.7 Max预览版空降!两代超大杯并行迭代,林俊旸走了但还在加速
阿里Qwen大模型迎来“加速时代”!最新发布的Qwen3.7预览版(含Max和Plus两个版本)在国际权威评测平台Arena中表现亮眼:Qwen3.7-Max-Preview文本能力全球第13、国产第一,更是全球前15中唯一的中国模型;在数学、专家提示、软件/IT、编程等细分赛道均闯入全球前十(如数学第7、Coding第10)。
而Qwen3.7-Plus-Preview视觉能力位列全球第16、国产第一,助力阿里总排名升至榜单第5。值得注意的是,从Qwen3系列起,迭代节奏大幅加快——大版本更新从原先的4–6个月缩短至2–3个月一次,2026年已密集推出3.5→3.6→3.7三个预览版,采用“先开源预览、再推正式版”的敏捷模式。尽管前负责人林俊旸已离任,团队仍保持高强度创新。https://www.qbitai.com/2026/05/419822.html
1-4. AI大模型加速落地文旅场景 豆包正式上线“博物馆讲解模式”
第50个国际博物馆日,抖音正式上线“博物馆导览模式”,用生成式AI技术升级公众观展体验。目前已与20多家国内顶尖文博机构达成合作,包括中国国家博物馆、甘肃省博物馆、河北博物院、首都博物馆、浦东美术馆和中国美术馆等。其中,更与5家重点场馆深度联动,作为其大型展览的官方AI讲解员,实现线上线下融合服务——观众扫码即可获得实时语音导览、文物故事解读和空间导航。
这一创新标志着AI正从线上聊天走向高精度线下服务:具备空间感知能力、专业领域知识和多模态理解力。文旅行业因富含海量历史文本与图像数据,成为AI落地的理想“试验田”。数据显示,该模式已覆盖超千万用户,单场展览平均讲解时长提升40%,青少年用户参与度增长近3倍。https://www.aibase.com/news/28117

1-5. ChatGPT化身私人理财管家:OpenAI推出全新金融工具可直连银行账户
OpenAI近日为ChatGPT Pro美国用户推出全新个人理财功能:用户可直接将银行账户安全接入ChatGPT。借助合作方Plaid(覆盖超12,000家美国金融机构,包括摩根大通、Capital One、美国运通等),账户连接便捷又可靠。
接入后,ChatGPT会自动生成可视化财务仪表盘——实时展示投资收益、每日消费占比、订阅服务清单及待付账单提醒,让“钱去哪儿了”一目了然。更关键的是,升级后的GPT-5.5模型具备更强的上下文逻辑推理能力,能基于真实交易数据,给出个性化建议,比如“如何优化月度预算”或“是否该提前还贷”。https://news.qq.com/rain/a/20260518A052V300

1-6. 研究揭示:人们普遍认为 AI 比人类更自信
近日,滑铁卢大学等联合研究发现:人们普遍存在“人工智能自信错觉”——即使AI和人类给出完全相同的答案,超80%的实验参与者仍主观认为AI更“笃定”。研究发表于《通讯·心理学》,基于数百名受试者的判断实验显示:作答越快、答案越流畅,用户越倾向高估AI的自信度;更关键的是,人们常因默认“AI更聪明”,就误以为它“更确定”,哪怕该答案实际错误率高达30%。
现实中,绝大多数AI从不主动说明自身置信水平,而人类却会通过语气、停顿、表情等自然传递犹豫或坚定。这种信息不对称易导致用户盲目信任。研究呼吁:未来AI应像人一样“坦诚示疑”,例如用文字标注“把握度85%”、调整响应语调或增加可视化置信条。https://www.1ai.net/53090.html

AI大模型算法、赛事和会议
2-1. 伯克利神作背刺OpenAI:持续学习才是真神!
伯克利等机构联合提出FST(Fast-Slow Training)框架,为大模型“持续学习”这一长期难题带来突破。过去两年,AI行业聚焦“推理深化”(如GPT-5、Claude的长思考链),却忽视了一个根本缺陷:所有现用大模型都是“冻结天才”——训练后知识固化,无法在部署后边用边学。教它新任务,旧能力常“灾难性遗忘”。传统强化学习(RL)在连续三任务中彻底失效:第二关即卡死。
FST另辟蹊径,借鉴人脑机制:分设“快权重”(快速适配当前任务,类似海马体)和“慢权重”(缓慢更新通用能力,类似新皮层)。实验显示,FST使模型三关全通;相比RL,数据效率提升3倍(同等性能仅需1/3步数),灾难性遗忘降低70%(KL散度下降70%),可塑性保持接近原始水平。https://www.163.com/dy/article/KT99BJPA0511ABV6.html

AI人才和资本动态
3-1. 全球 AI 市场:OpenAI 与 Anthropic 独占 89% 年收入份额
最新调查显示,全球AI市场正加速“马太效应”:收入高度集中于头部企业。OpenAI与Anthropic两大模型巨头,已合计占据全行业约89%的年营收,形成双寡头格局。34家上市AI初创公司总营收逼近80亿美元,半年暴增112%,但其中绝大部分增长红利实际被这两家瓜分。
具体来看,Anthropic年化营收预计今年6月达50亿美元(年初仅10亿);而OpenAI更强劲——3月底月营收已达20亿美元,年化超240亿美元,但需按协议向微软分成20%(今年约60亿美元)。值得注意的是,多数热门AI应用(如Perplexity、ElevenLabs)虽年营收也超50亿美元,却需每年向OpenAI和Anthropic支付数亿美元模型调用费,陷入“越火越依赖”的困境。https://m.163.com/dy/article/KT9OP20S0511B8LM.html

3-2. 不赌语言赌视频:Runway估值超 53 亿美元逆袭谷歌
Runway,这家由艺术院校毕业生创立的AI视频公司,正走出一条与众不同的路:不卷大语言模型,专攻“世界模型”。它最新估值达53亿美元,2026年第二季度年经常性收入(ARR)猛增4000万美元。其自研Gen-4.5视频生成模型已深度融入好莱坞,更直接挑战Google等巨头的算力壁垒。
Runway认为,文字模型受限于人类已有知识,而视频和多模态感知数据能让AI像人一样“亲眼观察”物理世界——这才是通向真正智能的关键。因此,它不止做视频工具,更已进军科学基础设施:设立机器人研发部门,探索用视频AI加速生物医学、气候模拟和抗衰老研究。尽管已融资8.6亿美元,但面对谷歌万亿级资源与OpenAI因成本过高而关停Sora的现实,算力竞争愈发白热化。https://www.aibase.com/news/28118
3-3. 鲸跃动力获星海图数千万元种子轮投资,用「数据+模型+末端执行」打造开箱即用的Robo Labor丨涌现新项目
鲸跃动力是一家2026年成立的具身智能机器人公司,由前北京人形机器人创新中心数据负责人李广宇博士创办。公司聚焦“高危、繁重、脏乱、重复”(4D)物理作业场景,提出「数据+模型+末端执行」闭环方案,打造可订阅、开箱即用的Robo Labor(机器人劳动力),目标是让物理劳动力像AWS算力一样弹性扩容。目前已完成星海图独家领投的数千万元种子轮融资。
核心壁垒有三:一是自研Ego-centric+UMI数据采集系统,实现亚毫米级定位与亚毫秒级多源同步;二是百万小时级数据管线+人类在环(HITL)策略,保障Day 1可用、持续进化;三是基于3D世界模型的专家技能库,让机器人理解重力、摩擦、形变等物理规律,实现“认知-预测-自适应”。https://www.36kr.com/p/3814860909600261

3-4. 能量桥完成新⼀轮融资,Monolith领投,中科创星跟投
能量桥科技(上海)有限公司近日完成新一轮融资,由砺思资本领投、中科创星跟投,正加速推进中国首个面向AI数据中心的1MW级超导配电示范工程。公司核心团队拥有20余年高温超导(HTS)工程经验,曾建成国内首条公里级超导输电示范线,是目前少有的具备商业化落地能力的本土团队。
当前,数据中心内部仍依赖传统铜排供电,每度电损耗高达6%–8%,且单机柜功耗突破250kW后,铜排已逼近物理极限——过去需并排铺设20根粗铜排,如今一根超导母线即可替代,实现“零电阻、零损耗、零发热”。其预制化超导能源模块支持工厂生产、现场2小时即插即用,大幅节省空间与能耗。https://aitntnews.com/newDetail.html?newId=25258
AI风险与政策管理
4-1. 太意外!教皇和Anthropic创始人,要联袂开发布会
新教宗利奥十四世将于5月26日发布首份通谕 壮丽的人性,聚焦AI时代下“人的尊严与不可替代性”——这是天主教两千年来首次将人工智能列为最高级别教导文件的核心议题。面向全球14亿信众,该通谕打破惯例:教宗亲自出席发布,并邀请Anthropic联合创始人、AI可解释性专家Chris Olah作为平信徒代表同台,史无前例。AI治理真空。
此举并非空谈伦理:Olah团队正致力于“打开AI黑箱”,与教廷反对AI军事化、拒绝自主武器的立场高度契合;而Anthropic也借教廷道德权威强化其“负责任AI”形象。但批评者指出,这类合作难具法律约束力(对比欧盟AI法案最高罚3500万欧元),更可能转移焦点——回避“某些AI是否本就不该被开发”的根本之问。https://www.163.com/dy/article/KTALDTAJ0511ABV6.html
写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评