高智商却自暴自弃--从“拒绝内卷的AI狼”联想到创业团队的考核与激励（一）

今年初，互联网上一则“拒绝内卷的AI狼”的新闻火爆出圈，引起了广大网友的诸多讨论，很多人表达说 “狼就是打工人……每秒扣的是青春和时间；和现实生活一样，下限太低，激励太少，还伴随时间惩罚，所以躺平是多数人的最优解“。

其实，这则话题来自于一个微博用户的发文，讲述的是他的一位老师在进行游戏AI训练研究的过程中发现的一个有趣的现象。

在这个项目中，研究人员设定了狼吃羊游戏的基本规则：狼在20秒内得分越高越好，而羊在20秒内存活时间越长得分越高；同时，狼抓到羊奖励10分，遇到障碍物扣1分，同时为了提升狼抓羊的效率，会每秒扣分0.1分；而对应的羊则没有扣分项，在游戏中存活时间的长短决定了羊的最终得分。在整个AI游戏的训练过程中，由于每次开局时狼与羊的位置是随机出现的，大部分情况下狼是抓不到羊的，因此研发人员发现在训练到20万次以后，狼抓羊的效率明显下降，狼主动表现出“人间不值得”的心理状态，在游戏一开始就选择撞石头而死的典型“躺平”社死现象。

关于这个研究项目本身，我们权当看看笑话，乐一乐也就过了，但其中的一些逻辑和思考，做为研发团队管理者，尤其是一个创业团队的管理者来说，还是需要反思一下的，我们从“考核机制的公平性、考核内容的有效性、考核结果的激励性”三个内容一起来思考，我们今天先聊一聊考核机制的公平性。

从上面的案例来看，狼的单步惩罚代价太大，激励不足，确实存在机制设计不公的情况。那么针对创业团队来说，最常见的考核机制设计不公的现象就是考核内容中的“单调区间”问题。就像我们高中课堂上学习的函数图形内容一样，管理人员在初创团队的考核内容设定上，往往只考虑了一种场景情况：要么是不断升级的惩罚条件，要么就是不断放大的奖励措施，这两种方法都不会对团队的考核工作有任何实际的作用。

比如在质量这个考核项上，有的团队会把线上故障修复时长做为一个考核内容，同时约定故障修复时间在某个范围段内，质量考核结果为某个分值，并依据故障修复时间的阶梯分布，获得对应阶梯较低的分值。这个考核内容设计本身没啥问题，但问题就在只约定了减分的情况，只是告诉大家不要出现这种问题，出问题就处罚，没有告诉大家质量方面应该鼓励、支持的行为和结果是什么。

具体怎么做？我们可以在质量这个考核项上，再增加约定：有提前预防线上故障的发生的事例，则可以在该项上增加一定分值的分数，并综合计算考核期内加分和减分的情况做最终得分。比如发现了以前代码或设计中的严重缺陷，通过日志和告警信息提前做了风险防控的系统优化等等。所以，考核机制中，增加了一正、一反两个方向对应的行为结果情况，来强化团队对质量考核的正确认知，以达到机制设计的公平性以及引导团队向正确方向改进的作用。

下一篇，我们将和大家聊一聊”考核内容的有效性、考核结果的激励性“。

研发团队数字化管理系统

社区活动

推荐排行