深圳市仪器仪表学会 关于学会| 加入学会 | 联系我们
邮箱
您当前的位置:首页>行业新闻电子电工
行业新闻

“缺算力成共识、所有实验室都忌惮字节跳动、极度敬重DeepSeek”,10天走访中国顶尖AI实验室后,美国研究者的最新观察

CSDN 2026-05-09
  • “所有中国实验室都忌惮字节跳动及其热门模型豆包,因为它是中国唯一一家处于前沿的闭源实验室;几乎所有实验室都对 DeepSeek 怀有高度敬意,认为其在工程落地与研究品味方面表现出色。

  • “中国技术人员务实、谦逊、有冲劲。”

  • “在中国接触到的几乎每一位 AI 研究员,都提到了同一个痛点:企业缺乏训练和运行 AI 模型所需的高端算力资源。”

  • “应对这一困境的办法,是极度努力地工作,还有就是更早、更快推进产品化。”

  • “中国的大模型社区,更像一个协同生态,而非互相敌对的阵营。”

这些评价,并非来自行业内部的自我总结,而是一次高密度中国 AI 实地走访后的真实观察。

近日,艾伦人工智能研究所(AI2)研究员 Nathan Lambert,联合 ChinaTalk 执行编辑 Lily Ottinger、Understanding AI 记者 Kai Williams 以及 ChinaTalk 创始人 Jordan Schneider 等人,用 10 天时间密集走访了北京、杭州、上海、深圳等地的十余家中国头部 AI 实验室与科技机构,包括 DeepSeek、字节跳动、月之暗面(Moonshot AI)、智谱AI(Z.ai)、美团、小米、01.ai、通义千问、蚂蚁灵犀、宇树等。

而在这趟走访结束后,他们得出了一个鲜明判断:在算力仍受限制的背景下,中国 AI 公司正在依靠高强度工程投入、极快的产品迭代速度,以及高度务实的落地思维,迅速缩小与全球顶尖模型之间的差距。

图片

以下内容整理自 Lily Ottinger 和 Nathan Lambert 观察实录。


图片

外部观察:中国 AI 研究者的困境与突围

“在中国接触到的几乎每一位 AI 研究员,都提到了同一个痛点:企业缺乏训练和运行 AI 模型所需的高端算力资源。”Lily Ottinger 在文章中写道。

在走访团队看来,中国并不缺顶尖 AI 人才,也不缺大规模数据,真正稀缺的,是能够持续支撑前沿模型训练的高端 GPU 资源。

尽管英伟达 CEO 黄仁勋曾公开表示,中国企业已经拥有足够算力,但 Lily Ottinger 提到,“我们接触的中国研究员,没有一个人真正相信这件事。”

不过,比“缺 GPU”本身更让走访团队印象深刻的,是中国 AI 团队面对这一现实后的工作状态。

Lily Ottinger 表示,即便算力受限,但像月之暗面、MiniMax、智谱 AI 等实验室依然笃信 AGI 愿景。对于许多研究员而言,AGI 更像是一种长期信仰。

而应对资源限制,中国研究者也采用了自己的方式方法:

  • 一是“极度努力地工作”。在五一假期和周末期间,Lily Ottinger 直言道,在多家实验室看到,大量研究员依然留在工位上:站立式办公桌前坐满人,各类含糖、含咖啡因饮料堆满桌面。

  • 二是中国大模型公司还比西方同行更早推进产品化。许多中国企业推出编码方案,用慷慨的 token 额度吸引用户从 Claude Code 转向自家产品;同时也在探索更细分的产品方向。如 MiniMax 打造了高营收的 AI 陪伴产品;智谱 AI 则与社交媒体、中国商飞等企业达成 B 端合作;阿里旗下的蚂蚁集团深耕 AI 医疗服务。

不过,一个颇具反差感的细节是:即便商业化已经成为现实压力,许多实验室更愿意谈研究、谈 AGI、谈智能体编码Lily Ottinger 称,在 MiniMax 的演示中,占据其最大收入来源的 AI 陪伴业务,也只是被轻描淡写地带过。

而在共同追赶 AGI 的氛围之外,竞争同样异常激烈。

Lily Ottinger 提到,她对中国 AI 行业的感受,与 Nathan Lambert 略有不同。“中国 AI 实验室之间,确实存在非常强烈的竞争氛围。”

在走访团队看来,中国 AI 行业接下来很可能会像中国新能源汽车行业一样,经历长期、高强度的洗牌与淘汰。只是对于仍留在牌桌上的团队来说,AGI 依旧是那个被反复提起、也被反复相信的终点。



图片

中国实验室的优势是什么?

相比 Lily Ottinger 对“高强度投入”与“快速产品化”的直观感受,艾伦人工智能研究所(AI2)研究员 Nathan Lambert 则给出了另一视角的观察结果。

图片

Nathan Lambert 在博客中写道,打造大语言模型的中国企业,堪称这一技术领域“完美的快速跟进者”。

“单看产出——支撑智能体工作流的最新、最大规模模型,再看核心要素——顶尖科学家、海量数据、加速计算,中美实验室看上去大体相似。真正持久的差异,体现在组织方式与运行逻辑上。”Nathan Lambert 坦言,他过去一直认为,中国实验室擅长追赶前沿,很大程度上源于文化与这一目标高度契合。但在真正与一线研究人员长时间交流之前,他并不愿意轻易下结论。而与中国头部实验室那些“优秀、谦逊、开放的科学家”交流后,他的许多想法得到了印证。

Nathan Lambert 表示,如今打造顶尖大模型,高度依赖全栈式精细化工作——从数据、架构细节到强化学习算法实现,每一环都能带来提升,而将这些环节整合在一起是一个复杂过程,“为了让模型实现多目标优化的整体最大化,一些才华横溢的个人成果甚至需要被暂时搁置”。

相比之下,他认为美国研究者在解决单个模块问题上同样非常优秀,但美国文化更强调“为自己发声”。作为科学家,主动为自己的工作争取关注,更容易获得成功;而当前行业环境,也在不断强化“AI 顶尖研究员”这种成名路径,而这这直接引发一些内部冲突。

他甚至提到,有传言称 Meta 的 Llama 团队,正因为个人利益与层级化组织之间的内耗而面临问题。“我还听说,有些实验室甚至需要花钱安抚顶尖研究员,才能让他们不再抱怨自己的想法没被纳入最终模型。无论传言是否完全属实,核心逻辑很清晰:自我意识与职业晋升欲,会阻碍打造最优模型。中美在这种文化上的细微差异,足以对最终成果产生显著影响。”

而中国实验室的另一大特点,是团队极度年轻化。

Nathan Lambert 观察到,中国许多大模型团队的核心贡献者中,都有相当比例是在读学生。“这些团队非常年轻,让我想起了 AI2 机构的模式 —— 学生被视为平等伙伴,直接融入大模型团队。这与美国顶尖实验室截然不同:OpenAI、Anthropic、Cursor 等机构基本不提供实习岗位;谷歌等公司虽名义上有与 Gemini 相关的实习,但实习生普遍担心自己被隔离在核心工作之外,无法接触真实项目。

在 Nathan Lambert 看来,这种文化差异,让中国团队在模型打造上形成了几项独特优势:

  • 第一,更愿意为了最终模型效果,去做那些“不够亮眼但极其关键”的基础工作;

  • 第二,刚进入 AI 领域的新人没有过往 AI 热潮周期的思维包袱,能更快适应现代新技术;

  • 第三,自我意识相对更弱,组织架构更容易扩张,减少了钻制度空子的内耗;

  • 第四,人才储备极其庞大,且非常擅长基于已有验证方案快速解决问题。

这种能力倾向,也与“中国研究者缺乏 0 到 1 原始创新”的刻板印象形成了反差。

Nathan Lambert 提到,一些偏研究导向的中国实验室,已经开始主动培养更具野心的科研文化。但不少技术负责人也坦言,短时间内想完成这种转型并不容易,因为这意味着要重构整个教育与激励体系。


图片

“把模型做到最好”,是很多人的唯一目标

该走访团队还发现,中国 AI 研究者普遍展现出一种极度务实的工程师气质。

过去几年,大模型的发展路径已经从混合专家模型(MoE)规模化,转向强化学习(RL)规模化,再到智能体能力落地。做好任何一环,都需要快速吸收大量论文、实验结果与内部技术栈知识。

Nathan Lambert 认为,许多学生研究员恰恰非常适应这种节奏。“他们愿意放下所有预设,全身心、竭尽所能投入优化模型。”

与此同时,中国研究者普遍对宏大叙事、哲学争论或 AI 道德讨论兴趣不高。

当他们被问及模型对经济、社会与长期风险的影响时,大多数研究者并不会给出复杂观点,也没有强烈意愿介入这些议题。

“他们的定位很清晰:把模型做到最好。”Nathan Lambert 写道。

他还提到,当话题转向 AI 哲学层面的问题时,不少中国研究者甚至会显得有些困惑,因为他们更习惯将 AI 看作工程问题,而不是思想实验。

有研究者引用了科技评论人 Dan Wang 的一句话:“中国由工程师治理,而美国由律师治理。”这也体现在整个行业氛围之中。

Nathan Lambert 发现,中国的大模型社区,更像一个协同生态,而非彼此敌对的阵营。

“在多次非公开交流中,研究者们对同行只有尊重。”他写道。

Nathan Lambert 还特别对比了中美实验室的差异:“在美国,非公开场合聊起同行时,往往火药味十足。”

此外,「中国研究者谦逊最突出的一点,是他们普遍不关心商业层面,直言 “这不是我的问题”;而美国从业者几乎都痴迷于各种生态级产业趋势 —— 从数据供应商、算力到融资。」Nathan Lambert 表示。


图片

不同赛道的中国 AI 力量

字节跳动:所有人都忌惮豆包

在走访多家中国 AI 实验室后,Lily Ottinger 与 Nathan Lambert 都认为,字节跳动的综合实力,是其他实验室暂时难以企及的。

Lily Ottinger 提到,字节跳动的大模型豆包是中国最受欢迎的聊天机器人,月活近 3.5 亿。豆包支持多种方言,这需要强大的语音模型 —— 因为普通话、粤语之外的中国方言大多没有文字形式(对比之下,GPT 的语音模式仍由 GPT-4o 驱动)。

相比单纯追求模型智力水平,字节跳动更强调用户留存与产品体验。

一位模型创业者甚至直言:“和字节比,我们全是中型玩家。”

而 Nathan Lambert 对字节的评价则更加直接,「所有中国实验室都对字节跳动及其热门模型豆包保持警惕——它是中国唯一一家处于前沿的闭源实验室。与此同时,所有实验室都对 DeepSeek 极度敬重,认为其在工程落地与研究品味方面表现出色。

宇树科技与银河通用:机器人赛道的两面

机器人,被走访团队视为中国 AI 野心进入物理世界的重要载体。

Lily Ottinger 提到,在中国“AI+”战略推进之前,很多地方长期认为“只有硬件才算真正科技”,这也导致大量大模型公司纷纷成立机器人部门。

但在她看来,真正的例外是宇树科技。宇树总部位于杭州,创始人并无海外名校背景,却依靠硬件创新快速崛起,并以极低成本实现了机器人产品的量产与盈利。

她发现,宇树研究员同样在高强度工作,但相比 AGI 实验室,他们并没有那种被“通用人工智能愿景”驱动的强烈氛围。“对于宇树来说,AGI 的定义就像鱼需要自行车一样无关紧要。”Lily Ottinger 在文中这样形容。

另一家机器人企业银河通用,则向该走访团队展示了其自动化仓储系统:机器人能够根据 App 订单,自动分拣感冒药、隐形眼镜并完成打包。银河通用称,其在 2025 年已完成超过 100 万单配送,其中约 20% 来自夜间传统药店关闭后的即时需求。而这些场景,并不需要所谓“超人类智能”,更多依赖的是工程集成能力与产业落地能力。

小米:年轻且务实的团队

小米给这群西方研究者团队留下的印象,是“年轻且务实”。

Lily Ottinger 提到,他们接触的小米研究员几乎全部是博士生。据介绍,小米 LLM 团队约 80% 为在读博士,平均年龄只有 25 岁。

她还观察到,小米研究员几乎都穿着黑色衣服,整个办公环境也保持着极简的黑色风格。

甚至连卫生间采用的都是蹲便器,“显然公司内部有人对此非常坚持”。

ModelScope:中国版 Hugging Face

开源,被走访团队认为是中国 AI 生态的重要底色。Lily Ottinger 表示,阿里旗下的 ModelScope,则被视作“中国版 Hugging Face”。

Lily Ottinger 形容,这里有懒人沙发、潮流公告板与开放式交流空间,是整个走访过程中“最酷的办公室”。


图片

中国 AI 产业与西方实验室的异同

在 Nathan Lambert 看来,如今打造 AI 模型,已经不再只是“把一群聪明研究员关进一栋楼里,造出工程奇迹”。

AI 公司正逐渐演变成一个融合研发、部署、融资、推广与生态协同的复杂系统。而这也让中国 AI 产业与西方实验室之间,出现了越来越明显的差异。

Nathan Lambert 根据自己的观察以及与中国 AI 实验室的交流,总结出了最核心的几点:

1. 国内 AI 需求已现早期迹象

外界常有一种说法:中国企业不习惯为软件付费,因此 AI 市场规模会很小,无法支撑起庞大的推理市场。但这只适用于 SaaS 模式 —— 中国 SaaS 市场历来很小,而云计算市场体量巨大。一个关键且尚无答案的问题(中国实验室内部也在争论):企业 AI 支出会追随小众的 SaaS 市场,还是刚需的云计算市场?

总体来看,AI 更倾向于贴近云计算,没有人真正担心新工具的市场增长。

2. 绝大多数开发者都是 Claude 忠实用户

尽管 Claude 在中国被限制使用,但中国 AI 开发者几乎都痴迷于它,深受其开发模式影响。中国历来对购买软件谨慎,但这并不代表推理需求不会爆发。中国技术人员务实、谦逊、有冲劲—— 这种特质,比不付费的旧习惯更有力量。

部分中国研究者会使用 Kimi、GLM 等自研工具,但所有人都在用 Claude 开发。他们极少提及 Codex,而这款工具在硅谷正快速流行。

3. 中国企业拥有强烈的技术自主心态

中国文化与强劲的经济动力结合,产生了难以预测的结果。Nathan Lambert  表示,自己深刻感受到,众多 AI 模型,是当下中国科技企业务实选择的平衡结果。行业没有统一的 “总体规划”,但普遍敬重字节跳动、阿里这类巨头 —— 它们手握充足资源,有望在各大市场占据大量份额。DeepSeek 是受敬重的技术标杆,但远非市场领导者,它定义方向,却没有商业化取胜的架构。

这也解释了为何美团、蚂蚁集团这类企业会让西方意外 —— 它们居然在自研大模型。事实上,它们深知大模型是未来技术产品的核心,必须掌握在自己手中。通过微调强大的通用模型,它们能加固技术栈,获取开源社区反馈,同时保留内部微调版本用于自身产品。行业内的「开源优先」心态,本质是务实:既能让模型获得优质反馈,又能反哺开源社区,还能助力自身使命。

4. 数据产业成熟度远低于西方

听闻 Anthropic、OpenAI 等机构为单个训练环境花费超千万美元,每年累计投入数亿美元推进强化学习前沿,我们很好奇:中国实验室是从美国公司购买同类环境,还是有成熟的国内生态支撑?

答案并非完全没有数据产业,而是国内数据产业质量偏低,企业往往选择自建训练环境与数据体系。研究员会花大量时间亲自搭建强化学习训练环境;字节、阿里等大型企业则有内部数据标注团队支持。这完全契合上文 “自研而非外购” 的心态。

6. 极度渴求更多英伟达芯片

英伟达算力是训练的黄金标准,几乎所有实验室都因芯片不足而受限。只要供应充足,它们一定会采购。

这些观察,勾勒出一个与西方截然不同的 AI 生态。


图片

结语

这场为期 10 天的密集走访,没有给出“中国 AI 是否会超越美国”的简单答案。

但它至少揭示了一个越来越清晰的现实:在算力受限、资源不对称的背景下,中国 AI 行业更强调工程效率、更强调组织协同、更强调快速落地。

它未必总能率先定义下一代 AI 范式,但却正在以极强的执行能力,将前沿技术迅速转化为真实产品、真实市场与真实产业能力。

而真正值得关注的问题,或许已经不再只是“中国模型距离美国还有几个月”。而是当两种完全不同的 AI 生态,开始沿着不同逻辑持续演化,它们最终会不会走向两种截然不同的 AI 未来。

38 好文章,需要你的鼓励
留言咨询