-
行业资讯
INDUSTRY INFORMATION
近期,阿里通义千问(Qwen)核心人物林俊旸的离职消息在技术圈引发了广泛关注。外界对于其去向有诸多猜测,但拨开八卦的迷雾,这起人事变动留给企业管理者与HR的一个硬核问题是:在拼算力、拼人才的大模型赛道,顶尖技术人才的流失,多大程度是被不适配的考核机制“挤”出去的?前沿研发的高不确定性与组织内部对确定性的渴求,构成了天然的张力。当这套张力无法被有效缓冲,离职便成了必然的泄压阀。探讨林俊旸离职的个案,其更大价值在于透视大厂研发体系下,人员考核的底层逻辑该如何重构。

一、前沿研发的“慢”与商业考核的“快”
大模型研发不是写传统业务代码,它是基础科学的工程化探索,有着截然不同的产出规律。这种规律的核心特征就是“慢”和“不确定”。一个底层模型的训练,可能需要数月的算力调度、数据清洗和参数调优,期间伴随着无数次的失败与推倒重来。然而,身处大厂,研发团队头顶悬着的是按季度甚至按月滚动的商业考核时钟。
这种快慢之间的错位,是研发考核痛苦的根源。业务线需要新功能上线来打市场,销售线需要模型能力作为卖点去拿单,资本需要新的故事来维持估值。这些压力层层传导,最终都落在了研发负责人的肩上。当考核周期成为不可逾越的硬约束,研发团队的行为就会发生变形。为了在季末考核中交出答卷,团队可能会放弃难度更大但价值更高的底层架构优化,转而去做短平快的应用层微调;为了证明工作量,可能会将一个完整的训练过程拆分成无数个毫无实质意义的中间节点来汇报。
林俊旸在带队Qwen的过程中,必然面临过这种拉扯。通义千问要在开源社区保持领先,要在各项评测榜单上刷出好成绩,这些都需要长周期的投入。如果考核机制只盯着短期的产出指标,或者用衡量业务开发的标尺去丈量基础研究的进度,就会逼着搞科研的人去干工程的活,逼着仰望星空的人去低头数米。长此以往,要么团队失去技术锐度,要么核心人才心生去意。
二、研发负责人的夹缝生存
在错位的考核体系下,大模型团队的技术Leader往往活得像个夹心饼干。对下,他们是团队的保护伞,需要为工程师和研究员争取必要的试错空间与研发节奏;对上,他们是承诺的兑现者,必须面对管理层对产出进度和商业转化的拷问。
一个优秀的研发负责人,很大一部分精力其实消耗在“翻译”和“博弈”上。他们需要把底层技术的进展,翻译成管理层能听懂的业务语言;他们需要在绩效盘点会上,据理力争为那些长期没有产出但正在攻坚关键难题的成员争取合理的评级。这种博弈极度消耗心力。当保护团队的努力屡屡被冷冰冰的考核指标挫败,当自己坚守的技术路线因为短期内看不到商业回报而被质疑,离职往往不是因为钱没给够,而是因为心太累。
林俊旸的离开,折射出技术管理者在现有组织架构下的弱势。尽管大厂都在高喊技术立业,但在实际的绩效分配体系中,掌握业务场景和客户资源的部门往往拥有更大的话语权。研发团队常常被视为成本中心或支持部门,他们的价值需要通过业务部门的成功来间接证明。这种依附关系,使得研发负责人在资源争夺和考核谈判中天然处于下风。一旦业务遇到挫折,研发往往首当其冲成为被优化和被指责的对象。
三、考核工具为何频频失灵
很多企业试图用OKR来替代KPI,以期解决研发考核的僵化问题,但现实往往是OKR变成了另一种形式的KPI,甚至比KPI更糟糕。
OKR的初衷是对齐目标和激发自驱,但在强绩效文化的组织里,没有不与升职加薪挂钩的OKR。一旦OKR跟考核强绑定,员工在制定O(目标)和KR(关键结果)时,就会本能地趋利避害:把目标定得极低,把关键结果定得极易量化。大模型研发中的很多核心突破,比如模型泛化能力的提升、长文本理解机制的优化,极难用几个简单的数字来框定。强行量化,就会催生出大量“为了度量而度量”的无效工作。
再看具体的考核指标,更是乱象丛生。有的团队拿代码行数考核,结果就出现了大量冗余的无用代码;有的拿模型参数量考核,结果就是盲目堆参数,忽视数据质量;有的拿评测榜单排名考核,结果就是针对特定题库进行定向优化,俗称“刷榜”,榜单成绩斐然,实际应用一塌糊涂。这些畸形的考核指标,不仅无法衡量研发的真实价值,反而成了劣币驱逐良币的筛选器。那些踏实做底层创新的工程师,因为短期指标不好看,在考核中反而不如擅长做表面文章的人得分高。
更深层的失灵在于,考核往往只看结果,不看约束条件。大模型训练中,算力不足、数据清洗遇阻、机器故障等非人力可控因素,随时可能导致项目延期。如果考核体系对这些约束条件视而不见,只拿最终交付说事,对研发团队而言显然有失公允。
四、重塑研发评价标尺
破解研发考核的困局,不能指望在旧有框架下修修补补,必须从认知到工具体系进行系统重塑。
承认不确定性,是重塑的第一步。前沿技术的研发本身就是一场概率游戏,失败和走弯路是常态。企业必须在考核体系中内置容错机制。对于探索性极强的预研项目,考核的重点不应是按时交付,而是验证的效率和知识的沉淀。一个证明了某条技术路线走不通的团队,同样为组织创造了巨大价值,因为他们避免了后续更大规模的算力浪费。在具体的操作上,可以设立独立的创新项目奖金池,与常规业务的绩效池分开,采用更长周期的年度或跨年度评估,给研发人员足够的安全感去挑战高难度课题。
区分工程与科研,是重塑的第二步。大模型团队内部并非铁板一块,有人负责底层算力集群的维护,有人负责模型架构的搜索,有人负责应用层的对接。工程岗位的考核可以偏向交付效率、系统稳定性和资源利用率,继续沿用相对量化的指标;而研究岗位的考核则必须引入同行评议机制。让懂技术的人来评判技术,看其在开源社区的贡献度、在顶会发表的研究成果,以及在解决特定技术难题上的思路突破,而不是让不懂技术的业务主管拿着一张Excel表格来打分。
管理预期,是重塑的第三步。从林俊旸的案例可以看出,技术Leader与组织之间的信任裂痕,往往源于预期管理的失败。管理层期待一年内做出GPT-4级别的产品,而技术团队知道这需要三年。这种预期差如果不消除,再完美的考核工具都会失灵。HR与业务一号位需要深度介入,在立项之初就拉齐认知,明确资源边界和可能的产出区间。考核不是秋后算账,而是过程中的对齐与纠偏。通过高频的复盘与沟通,动态调整目标,而不是死守年初设定的刻板数字。
结语
林俊旸的离职,撕开了大厂研发考核体系的一角隐痛。当大模型成为兵家必争之地,算力和数据固然是壁垒,但能把顶尖人才留住并激发其创造力的机制,才是最深的护城河。用管理流水线工人的方式去管理科学家和顶级工程师,注定留不住真正的人才。考核的初衷是激发,而非束缚,如果一套考核体系让最优秀的人感到窒息并选择逃离,那么该反思和改变的,绝不是离开的人。




























































