智东西(公众号:zhidxcom)
编译 | 刘煜
编辑 | 陈骏达
智东西4月14日报道,4月12号,在智能电动汽车发展高层论坛上,第三方智能驾驶解决方案供应商 元戎启行 CEO周光 首次证实, DeepSeek 多模态核心研究员 阮翀 已加盟该公司,并担其首席科学家。周光称,阮翀将在2026年的北京车展首次公开发表演讲。
早在今年1月份,腾讯汽车媒体就曾援引独立信源消息,称阮翀已正式加盟元戎启行。不过彼时元戎启行并未对此作出官方回应。
元戎启行的新成员 阮翀 ,他于2018年从北京大学毕业,并且同时拥有计算机科学学士学位和计算语言学硕士学位。其中属于计算语言学范畴的自然语言处理(NLP)是他硕士期间的研究方向。
▲阮翀的学历(图源:领英)
本科期间,阮翀以 访问学者 身份赴美国卡内基梅隆大学(CMU)交流,历时约4个月。在CMU时他师从Victor Adamchik教授,围绕 格罗比纳基(Groebner Basis) 开展研究,成功实现用最少数量的多项式方程对数独规则进行代数建模,其相关成果是计算代数相关领域的原创性突破。
▲阮翀在CMU的访学交流经历(图源:领英)
据领英公开信息查证,从2017年3月开始,阮翀在做智能输入法、AI语言技术的公司 Kika Tech(触宝) 实习,实习共计约4个月。
在Kika Tech实习期间,他以第一作者身份在2018年计算语言学国际会议(CICLING)发表论文《Sparse Word Representation for RNN Language Models on Cellphones》,完成了口头报告。
▲阮翀在Kika的实习经历(图源:领英)
结束上一段实习之后,阮翀接着去到 网易有道信息技术(北京)有限公司 开始了其5个月的实习。实习期间,他参与实现iPhone 6及以上设备端 0.1秒/句的离线翻译性能 ,该成果最终集成至 有道翻译官APP的离线翻译功能 ,成功完成了产品化落地。
▲阮翀在网易有道公司的实习经历(图源:领英)
阮翀于2023年加入了 DeepSeek担任研究员 ,他曾参与了 DeepSeek-VL/VL2以及Janus系列等多模态模型 的研发。
据DBLP(计算机科学文献数字图书馆)记录,他与 DeepSeek创始人梁文锋 共同署名发表了9篇论文。阮翀发表的这些论文为Deepseek大模型推理、高效注意力机制等核心技术突破作出了关键贡献。
阮翀以 DeepSeek-VL模型研究负责人 的身份参与了题为《DeepSeek-VL: Towards Real-World Vision-Language Understanding》的论文研究。
该研究聚焦真实场景下的视觉与语言理解难题,针对文档、图表、OCR以及网页截图等复杂实际场景,实现了 DeepSeek-VL 细粒度图文理解能力,同时通过优化训练策略,一定程度上避免了 多模态模型常见的语言能力退化问题 。
▲图为阮翀发表的论文和作者名单(图源:DBLP)
之后,阮翀亦以 负责人 的身份参与了《DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding》一文的研究工作。
该研究面向高阶多模态理解任务,提出了混合专家(MoE)架构的视觉语言模型 DeepSeek-VL2 ,通过动态分块视觉编码与高效MoE语言主干设计,在DeepSeek-VL基础上进一步提升DeepSeek-VL2在真实场景下的理解能力与推理效率,在主流多模态基准上取得了一定程度上的领先性能。
▲图为阮翀发表的论文和作者名单(图源:DBLP)
同时,阮翀还作为作者之一,发表了题为《Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation》的 Janus 模型相关论文。
该研究提出了一套解耦视觉编码的 统一多模态框架Janus ,通过分别构建面向理解与面向生成的独立视觉编码通路,在同一自回归架构下同时实现了强大的多模态理解与高质量图像生成能力,有效解决了单一编码器难以兼顾两类任务的技术瓶颈。
▲图为阮翀发表的论文和作者名单(图源:DBLP)
在阮翀发表的多篇论文中,他参与撰写的一篇题为《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》的论文,获得了2025年NLP与计算语言学领域的 顶级学术会议ACL的最佳论文奖 。
▲图为阮翀发表的论文和作者名单(图源:DBLP)
而后,他参与撰写的另一篇论文《DeepSeek-R1: Incentivizing Reasoning in LLMs through Reinforcement Learning》,于同年9月刊登于 国际权威期刊《自然》(Nature),并登上当期封面 。
▲图为阮翀发表的论文和作者名单(图源:DBLP)
除上述研究外,阮翀还以第三作者身份,撰写了题为《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures》的文章。
从论文内容可见,阮翀 深度参与了DeepSeek-V3面向H800集群的整体方案设计 ,围绕计算、内存与通信等关键硬件瓶颈开展架构优化工作。
他不仅参与 MoE混合专家架构的工程化落地 ,解决大规模训练中计算与通信的效率平衡问题,还在 MLA等新型注意力机制 的设计与实现中承担核心工作,为突破模型硬件协同瓶颈、提升大模型规模化训练与推理效率提供了关键技术支撑。
▲图为阮翀发表的论文和作者名单(图源:DBLP)
可见,阮翀在AI大模型底层技术领域拥有宝贵的技术开发经验。
阮翀此次加入的元戎启行公司成立于2019年,主要为 车企设计智驾系统 。
元戎启行已与多家车企建立合作,现已有 25万辆 搭载其城市领航辅助驾驶方案的车辆进入消费者市场,覆盖 长城、吉利以及smart等 多个品牌。
截至目前,元戎启行已完成6轮融资,累计 融资金额超7亿美元(约合人民币47.82亿元) 。今年4月初,据36氪汽车报道,元戎启行已向港交所秘密递交上市材料,计划于今年年内在港交所挂牌上市。
结语:大模型人才跨界合作,打通AI与自动驾驶技术壁垒
目前,传统智能驾驶多采用感知、预测、规划、控制分模块独立优化的技术路线,存在信息割裂、迭代效率偏低、数据利用率不高等痛点。
阮翀作为AI大模型领域核心人才加盟元戎启行,或可凭借其在多模态对齐、大模型推理效率优化及稀疏架构设计等方面的深厚积累,在一定程度上为该公司VLA基座模型的规模化量产落地提供技术支撑,从而增强其产品的市场竞争力。