lch
发布于 2026-05-27 / 0 阅读
0

26年5月27日,全球AI资讯约15条:英伟达世界模型训练速度飙升400%、Grok基础模型(1.5T)完成训练、1 人 AI 公司融资3000 万美金等

关注后加星:  早上七点钟, 全球AI动态在手中


昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下


AI应用进展和演化


1-1. Grok最新模型吃上Cursor「加餐」,Grok基础模型V9-Medium(1.5T)已完成训练

马斯克近日宣布,xAI全新大模型Grok V9-Medium(参数达1.5万亿,是现役主力模型v8-small的3倍)已完成基础训练,预计2–3周内正式发布。这次升级核心瞄准编程能力——训练中已加入大量Cursor平台的真实开发者数据,显著强化模型对真实工程场景的理解与响应能力。

与此同时,xAI自研AI编程代理工具“Grok Build”也已开启早期Beta测试,支持终端交互(TUI)、无界面自动化(headless)及外部调用(Agent Protocol)三种模式,可直接读项目、规划任务、修改代码,对标Claude Code等专业工具。值得注意的是,xAI上月刚以约60亿美元收购Cursor,短短一个月内,其数据、人才(包括两位联合创始人)已快速融入Grok研发体系。

https://tech.ifeng.com/c/8tPoVFeFIzO




1-2. 刚刚,国产Agent模型闯入全球第一梯队!限时免费

昆仑万维发布原生Agent模型SkyClaw-v1.0及轻量版v1.0-lite,正式闯入全球第一梯队。与传统“大模型+工具壳”不同,SkyClaw从训练第一天起就专为“执行任务”设计——深度适配OpenClaw、Claude Code、Hermes等主流Agent框架,兼容OpenAI接口,开发者换API Key即可开箱即用。

实测中,它能一键生成可交互的“电子桌宠”(含番茄钟、健康提醒、IM直连),也能自动搭建AI周报系统(含多源抓取、趋势分析、SQLite存储与定时任务)。性能上,其复杂任务能力媲美Claude Opus 4.6;成本却大幅降低:v1.0输入仅0.5元/百万tokens(输出4元),lite版更降至输入0.3元、输出2元——约为国际顶流模型价格的一半。目前限时免费开放,后续还将逐步开源。

https://www.qbitai.com/2026/05/424851.html




1-3. 算法1年翻倍,芯片2年翻倍?重磅实锤:AI正在自我加速,拦不住了

AI正经历人类科技史上前所未有的“自我加速”——算法效率约每1年翻倍,芯片效率每2年翻倍,二者叠加形成超强正反馈环。更关键的是,AI领域“点子越来越难找”的瓶颈效应远弱于半导体、制药等传统领域,因为AI的进步本身就在升级自己的研发工具,实现“自指式进化”。

模型测算显示:只要全行业研发自动化率达13%(软硬件领域达17%),反馈强度即突破临界值“1”,触发爆发式增长;而按当前增速,这一奇点可能在6年内到来。值得注意的是,无需100%替代人类——Anthropic预测2028年底有超60%概率出现“无人参与的AI研发”,Karpathy实验中AI两天就将模型性能提升11%。这不是科幻预言,而是基于实证的经济学预警:增长范式正在根本性转变。

https://www.163.com/dy/article/KTRNMNL90511ABV6.html



1-4. 一个月的活一周干完!英伟达世界模型训练速度飙升400%

英伟达推出的具身智能世界动作模型DreamZero,是通往AGI的关键一步:它以视频为学习原料,“先理解世界如何变化,再决定如何行动”,在RoboArena和MolmoSpaces两大机器人基准上双双登顶。相比传统VLA模型(如π0.5),其任务成功率提升超2倍,泛化性、跨机器人本体适配能力显著更强。但代价高昂——训练需8张H100 GPU连续运行25天,算力与显存压力巨大。

为破局,无问芯穹联合清华推出强化学习框架RLinf,对DreamZero训练全链路重构。实测显示:训练吞吐最高提升近4倍——5B模型达4.4 samples/sec/gpu(原仅1.1),14B模型加速2.7倍;更关键的是,Loss曲线稳定、任务成功率峰值达96.68%,精度零损失。1个月的训练,现在1周搞定。

https://www.163.com/dy/article/KTRNKP2S0511ABV6.html




1-5. Code Arena放榜:阿里千问3.7编程能力超越GPT、Gemini,仅次于Claude系列

全球权威编程能力榜单Code Arena最新排名公布:阿里全新旗舰模型Qwen3.7-Max以1541分位居全球第二,仅次于Claude系列,力压GPT-5.5等国际主流模型,成为突破1540分大关的国产大模型。Code Arena由LMArena平台推出,不考死记硬背的代码题,而是让模型从零开发可交互网页应用,并由全球开发者匿名盲测PK投票,公信力强。

该模型专为AI智能体(Agent)设计,在编程、长程任务和自主优化方面表现突出:能数小时内完成需专业团队2周开发的项目;可持续运行35小时、调用工具超1000次;甚至能自我编程优化芯片内核。用户实测反馈其“真正能把事情做完”,在生成质量与响应速度上优于竞品,且推理成本更低。

https://www.leiphone.com/category/industrynews/6QAaQ0MzlkBRqnwS.html




1-6. 700多个死者的大脑,正在药物测试中被重新“复活”

美国初创公司Bexorg开发了一项突破性技术——“BrainEx”系统,能在人去世后24小时内,通过灌注特制液体维持离体人脑的基本生理功能。截至目前,该公司已用该技术处理超700颗捐献者大脑,每颗平均维持约24小时,并全程使用丙泊酚等麻醉剂抑制神经电活动,确保无意识、无痛觉。

这项技术源于耶鲁团队2019年在猪脑上的开创性研究,现升级至人脑应用,核心目标是破解神经药物研发难题:传统小鼠模型预测准确率低,类器官又缺乏真实衰老与疾病背景。而这些“活体人脑”保留了捐献者60–80年的遗传、环境与病理信息,使药物测试更贴近真实人体反应——实验显示,某帕金森病候选药在人脑上仅需原定剂量的1/20即生效,为研发节省约1年时间。

https://zhuanlan.zhihu.com/p/2041220594453181181






AI大模型算法、赛事和会议


2-1. 蚂蚁灵波LingBot-VA论文被机器人顶会RSS 2026接收,让机器人边推演、边行动

蚂蚁灵波科技联合港科大等机构研发的机器人新模型LingBot-VA,近日被国际机器人顶会RSS 2026录用——该会议全球每年仅接收约15%投稿,含金量极高。简单说:它让机器人“学会预测未来”。传统机器人靠指令执行动作,而LingBot-VA能边看(视频输入)、边推演(预测环境变化)、边行动(生成动作),像人一样“先想再做”。

其核心是“因果世界建模”——严格按时间顺序,用前序观察和动作预测下一步状态,避免胡乱脑补。实测表现亮眼:在仿真平台RoboTwin 2.0的50个双臂任务中,成功率高达92.0%(Easy)和91.1%(Hard);在LIBERO基准达98.5%;真实机器人场景下,仅用50条示范数据,成功率就比业界基线π0.5提升超20个百分点。

https://www.qbitai.com/2026/05/424581.html




2-2. VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个专为多模态生成模型(如图像、音频、视频)设计的通用强化学习(RL)后训练框架,支持Qwen-Image、Qwen-Omni、BAGEL等主流架构。它基于vLLM-Omni(高吞吐异步rollout)和vLLM(奖励模型推理)构建,实现策略训练、rollout与奖励评估三者并行——例如在Qwen-Image的OCR任务中,将奖励模型部署到独立GPU,可使单步耗时降低约14%。

核心算法FlowGRPO面向扩散模型,通过SDE采样提升探索效率,并用Qwen3-VL-8B-Instruct作为OCR奖励模型,自动比对生成图中文字与真实标签打分。实测显示:在4×H200上,全参数微调达0.510图/秒/GPU;仅120步训练后,文字渲染质量即显著提升,critic与验证reward快速收敛。

https://m.163.com/dy/article/KTPS1TGI0511AQHO.html





AI人才和资本动态


3-1. 两个月融资4亿美元,国际资本与产业资本同时加码零一汽车

零一汽车成立仅四年,已成为智能重卡赛道的“现象级玩家”。2026年5月,公司宣布完成2亿美元B2轮融资,加上3月刚完成的12亿元人民币融资,两个月内累计融资达4亿美元。本轮引入紫金矿业、山东能源集团(兖矿资本)、三花控股及国内头部消费品企业等产业资本,同时获得淡马锡、毅峰资本等国际顶级机构加持,股东中已汇聚多家“万亿级”巨头。

在行业整体趋于理性背景下,零一汽车展现出强劲增长与健康经营:2026年前4月销量达去年同期的5倍;2025年Q4实现经营性现金流为正——这在高投入的新能源智能重卡领域极为罕见。其两款主力车型“惊蛰”“小满”持续热销,自动驾驶采用“场景渐进式”路线,端到端大模型技术已在封闭场景实车验证。

https://www.leiphone.com/category/industrynews/HKEei3byOc3Z0wKb.html




3-2. 最具争议的 1 人 AI 公司融了 3000 万美金,估值达到了 2.5 亿

Polsia是一家仅由1人创立、成立半年就宣称年化收入(ARR)近1000万美元的AI公司,主打“AI帮你自动开公司、运营公司、赚钱分润”——你只需输入一个创业点子,它便自动生成产品、投广告、写文案、处理客服、优化转化,全程无人工干预。其模式被比作“Shopify的升级版”:不止提供工具,更提供整套AI员工+广告代理+创业孵化器服务。

收费采用混合制:每月50美元订阅费 + 赚钱后抽成20% + 广告投放再抽20%。目前网站月流量超100万,广告收入已成第二大收入来源。尽管被质疑为“AI垃圾工厂”,甚至创始人坦承“大部分产品是垃圾,但质量每周在提升”,它仍以2.5亿美元估值完成3000万美元融资,获Ashton Kutcher等知名机构背书。

https://m.huxiu.com/article/4861419.html




3-3. YC 今年最想投的两个赛道,被这个开源项目同时干了

Ashpreet Bedi(Agno创始人)近日开源了「Scout」——一个被称作“公司大脑”的AI智能体,上线24小时内获8.8万次浏览。Scout不依赖传统向量数据库,而是采用“导航而非搜索”理念:它不复制数据到中央仓库,而是实时调用Slack、Google Drive、Linear等原生API,像程序员查代码一样动态定位信息,确保知识实时、准确、权限合规。

为简化复杂工具链,Scout首创“上下文提供者”抽象层,将每个系统封装为仅暴露两个自然语言接口,大幅压缩主Agent上下文负担。更关键的是,Scout边工作边建模:用户随口说“Josh来自Anthropic”,它自动创建CRM联系人+知识库条目+关联关系;说“v3迁移下周二讨论”,即生成待跟进任务并定时提醒。

https://aitntnews.com/newDetail.html?newId=25487






AI风险与政策管理

4-1. 上海出台 AI 微短剧新政:支持企业租用智能算力,对优秀剧本给予奖励

上海出台全国首个AI赋能微短剧专项政策(《若干措施》),提出8大方向24项务实举措,力推微短剧产业高质量发展。当前,AI生成内容(AIGC)已成微短剧核心驱动力,全流程AI创作模式加速成型;但企业普遍面临算力成本高、公共服务缺位等瓶颈。

新政明确:建设“AI+微短剧”中试基地,支持企业低成本调用市级智能算力和大模型API;对优质剧本最高奖励50万元;推行工作日“随报随审”绿色通道;在浦东打造微短剧出海基地,依托上海电视节等平台推动海外发行;徐汇、杨浦、闵行将建成三大产业集聚区;并设立AI微短剧OPC创作者社区与版权维权协作机制。政策还强化人才支撑,打通AI视听领域职称评定与职业能力认证通道。

https://www.1ai.net/53356.html




4-2. Google CEO:已为斯坦福演讲准备「应对嘘声策略」,公众对 AI 的忧虑「是合理的」

谷歌CEO皮查伊近日坦言,他将在6月斯坦福大学毕业典礼上演讲,但已预见到可能遭遇学生嘘声——这并非孤例:前CEO施密特、音乐公司高管等近期在多所高校演讲时均因AI议题被抗议。原因很现实:约50%的美国人对AI普及“忧虑多于期待”;十余家大企业已将裁员部分归因于AI提效。

皮查伊坦承,公众的焦虑“完全合理”,人类尚未进化到能从容应对如此剧烈的技术变革。他强调,自己始终对年轻人充满信心,并非回避问题,而是希望传递一个平衡视角:这届毕业生既是AI发展的推动者,也将首当其冲承受其冲击。他的演讲不打算回避争议,而是结合自身移民、求学经历,探讨技术与人的共处之道——不是AI取代人,而是如何让人在AI时代更有韧性、更富创造力。

https://www.1ai.net/53353.html






写在最后

欢迎大家关注、分享、转发本公众号,欢迎直接与小编联系 对接合作~


小问卷:公众号打分点评