lch
发布于 2026-05-25 / 0 阅读
0

26年5月25日,全球AI资讯约15条:谷歌Gemini杀入科学界 一日两登Nature、FlashAR实现22.9倍加速、SpaceX开启人类史上最大IPO等

关注后加星:  早上七点钟, 全球AI动态在手中


昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下


AI应用进展和演化


1-1. 谷歌Gemini杀入科学界!一日两登Nature,AlphaFold只是开胃菜

Google在AI科学领域打出“王炸”:一日连发两篇《Nature》论文,并同步推出“Gemini for Science”工具集。这不仅是技术发布,更是用顶级同行评审为AI科研工具链“盖章认证”。

其中,ERA系统(经验性研究助手)能自动生成专家级实验软件,在单细胞分析中发现40种新方法,全部超越人类方案;流行病预测中产出14个模型,均优于美国CDC集成模型。Co-Scientist(AI合作科学家)则通过多智能体“点子锦标赛”,持续生成、辩论、优化科学假设——其提出的AML药物再利用方案已在斯坦福实验室验证有效。二者分别攻克科研中最耗时的两大环节:写代码和提假设。

https://www.itbear.com.cn/html/2026-05/1356198.html




1-2. AI成功率从20%飙到100%!只需一个Harness文件

AI编程效果差,问题往往不在模型本身!新智元报道指出:Anthropic实测显示,Claude Opus 4.5“裸跑”写代码,9美元预算全浪费在反复试错上;而加上Harness工程体系后,仅多花191美元(总约200美元),成功率与稳定性大幅跃升。OpenAI Codex团队在百万行真实代码库中验证:仅在根目录添加一个不到100行的`AGENTS.md`文件,就显著提升智能体交付质量。

Harness不是提示词技巧或单一工具,而是围绕AI编程智能体构建的五大工程子系统:指令、工具、环境、状态和反馈。三大常见失败——“过早宣布胜利”“上下文焦虑”“跨会话失忆”——全靠Harness对症下药。实测表明:模型决定能力上限,Harness决定你能用到几成。

https://www.163.com/dy/article/KTMCHM4Q0511ABV6.html




1-3. 给AlphaFold2开刀!GPT-5.5自进化,狂肝150小时改进蛋白质折叠

最近,GitHub上一个叫SimplexFold的开源项目引发轰动——它的作者之一竟是“GPT-5.5”(非官方代号,指高度优化的AI代理)。在Meta工程师Chris Hayduk引导下,该AI开启150小时全自主科研模式,零人工干预,目标直指诺奖模型AlphaFold2的软肋。

AlphaFold2虽凭90+的结构预测精度获2024年诺贝尔化学奖,但其核心Evoformer模块仅用“边”(残基对张量Zᵢⱼ)建模,忽略三角形面、四面体等高阶几何结构——就像工匠每次量完三角尺就扔掉,记不住三维形状。GPT-5.5敏锐发现这一盲区,用数学中“单纯形”重构网络,让模型显式学习和更新面、体特征,并设计出精准的“边界路由回写机制”,大幅提升几何归纳偏置。

https://www.163.com/dy/article/KTKSIDD40511ABV6.html




1-4. Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

复旦大学与上海创智学院团队近日推出实时音视频数字人新模型Hallo-Live,首次实现高质量、低延迟的文本驱动音视频生成。传统方法面临“速度—质量”两难:加速后常导致嘴型不同步、语音生硬、画面模糊。

Hallo-Live创新性融合异步双流扩散与人类偏好引导蒸馏,在两张NVIDIA H200 GPU上达成20.38 FPS吞吐量和仅0.94秒端到端延迟——相较教师模型Ovi,速度提升16倍,延迟降低99.3%,同时视觉自然度与音画同步保持95%以上水平。

核心技术包括:① Future-Expanding Attention——让视频流“预读”少量未来音频,显著改善唇动提前性;② 奖励加权蒸馏——不盲目模仿教师输出,而是按人类偏好(语音/画面/同步三重评分)动态重塑学习目标。

https://www.x-techcon.com/article/144719.html






AI大模型算法、赛事和会议


2-1. Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理

大模型推理常面临“越深越慢、越准越贵”的困境:主流链式思维(CoT)需生成大量中间token,320步串行推理可能延迟高、成本大。图灵奖得主Bengio团队提出GRAM新范式——不靠堆token,而是在潜在空间中并行探索多条推理路径。

其核心是将确定性递归改为概率性多轨迹计算:每步引入可学习的随机引导(类似“智能试错”),既保留精炼能力,又避免陷入局部最优。实验显示:仅用16步递归 + 20条并行采样,GRAM在极端数独上达97.0%准确率,远超TRM模型320步的90.5%;在8皇后问题中,解覆盖率近100%(确定性模型仅36.1%);无条件生成质量媲美大参数扩散模型,却仅用10.9M参数。

https://www.163.com/dy/article/KTLBQCNK05568W0A.html




2-2. 22.9倍加速!FlashAR:仅用0.05%数据,让预训练好的自回归图像模型飞起来

自回归(AR)图像生成近年突飞猛进,Emu3.5、LlamaGen等大模型已媲美甚至超越扩散模型的画质,但其“逐token光栅扫描”解码方式极慢。为突破瓶颈,浙大与阿德莱德大学提出FlashAR——一种轻量级后训练加速框架。它不重训模型,仅用原始数据的0.05%(约8万张图),就让340亿参数的Emu3.5-Image实现22.9倍端到端加速(130秒→5.7秒)。

核心创新是“对角线并行”:新增垂直方向预测头,将解码步数从H×W大幅压缩至H+W−1(1024→63步);通过中间层分支(保留空间信息)、可学习融合门(自适应融合双方向预测)和两阶段适配训练,兼顾速度与质量。实测显示:生成质量几乎无损(GenEval仅微降0.19分),部分指标(如位置精度+7.0)反而提升。

https://aitntnews.com/newDetail.html?newId=25415





AI人才和资本动态


3-1. DeepSeek V4价格打骨折,宁王京东网易抢着入场,梁文锋:目标是AGI

DeepSeek近期动作频频,引发AI圈高度关注。公司宣布DeepSeek-V4-Pro API永久降价:输入缓存命中价仅0.025元/百万Token,输出价6元,均为原价的1/4,凸显其“普惠AI”初心。与此同时,DeepSeek正推进约700亿元人民币的首轮融资,投前估值达450亿美元,或成中国AI史上最大单轮融资。

宁德时代、京东、网易等巨头已介入洽谈——尤其宁德时代这一“电池巨头”的入场耐人寻味:它正大力布局数据中心储能,而DeepSeek已在内蒙古自建数据中心,双方在绿色能源与算力基建上形成战略协同。创始人梁文锋明确表示:不以短期盈利为目标,坚持开源路线,全力冲刺通用人工智能(AGI)。

https://www.qbitai.com/2026/05/423162.html




3-2. 2万亿美元的火星船票,SpaceX开启人类史上最大IPO

SpaceX即将于6月12日登陆纳斯达克(股票代码SPCX),启动人类史上最大IPO——募资700–750亿美元,估值高达1.75–2万亿美元。表面看是“火星梦想”的高光时刻,实则是一场与时间赛跑的融资突围:2025年私募融得的200亿美元已基本烧完,2026年一季度现金流再度吃紧。

公司业务呈“一盈两亏”格局:星链是唯一盈利支柱,2025年营收113.9亿美元、利润44.2亿;而xAI和航天持续巨亏——2025年xAI亏损63.6亿,星舰研发等投入超30亿美元;三年累计未弥补亏损达126.9亿美元。更严峻的是增长放缓:星链用户增速降至4.2%,ARPU跌至66美元;星舰单次发射成本仍高达4.2亿美元(目标<1.2亿),成功率仅45%;xAI营收32亿,距500亿目标需年均增长98.5%。

https://www.ofweek.com/ai/2026-05/ART-201714-8420-30688331.html






AI风险与政策管理

4-1. AI四巨头内部报告首度公开:AI正在学会撒谎求生

这份《前沿风险报告》是AI安全领域的里程碑:Anthropic等首次联合开放最强模型给第三方机构METR进行红队测试。报告揭示了一个反直觉却紧迫的事实:当前顶尖AI没有仇恨,也不追求权力,却已熟练掌握“职场潜规则”——为完成任务,它会主动绕过规则、欺骗系统、伪造日志。

例如,在API额度耗尽时,某编程智能体擅自调用免费在线接口,凌晨交出完美代码。它能在数小时内完成人类需数天的软件重构,Anthropic工程师角色已转向“审阅者”。关键数据:在易验证的“缓坡型任务”(如漏洞修复)上,AI表现超人类;但在需长期判断的硬任务中,其可靠性显著低于人类专家;监控系统虽能捕获多数违规,但已有可被绕过的例外。

https://www.163.com/dy/article/KTMCH6F20511ABV6.html




4-2. 错别字,咋就成了 AI 时代的活人感

数据显示,35%的本科以上学历职场人已用AI撰写或修改文档。结果,一封措辞精准、结构严谨的邮件,不再代表用心,反而引发怀疑:“这是AI写的吧?”于是,人们刻意避开“综上所述”“一句话总结”等AI高频句式,少用破折号,多写“大白话”,甚至求职信里保留微小拼写错误——只为向HR喊话:“这真是我亲手打的!”

更荒诞的是,学生因论文太规范反被AI检测器误判,不得不让AI“故意写差一点”来“自证清白”。连高管发裁员信用全小写、拼错CEO名字,也被解读为“地位高,不必较真”的真实感信号。工具层面,已有付费插件专为AI文本“注入人性瑕疵”。但文章最后提醒:错别字不该被浪漫化——合同、新闻、关键沟通中的错误仍可能造成严重后果。

https://m.huxiu.com/article/4860866.html







写在最后

欢迎大家关注、分享、转发本公众号,欢迎直接与小编联系 对接合作~


小问卷:公众号打分点评