今年初,互联网上一则“拒绝内卷的AI狼”的新闻火爆出圈,引起了广大网友的诸多讨论,很多人表达说 “狼就是打工人……每秒扣的是青春和时间;和现实生活一样,下限太低,激励太少,还伴随时间惩罚,所以躺平是多数人的最优解“。

其实,这则话题来自于一个微博用户的发文,讲述的是他的一位老师在进行游戏AI训练研究的过程中发现的一个有趣的现象。

在这个项目中,研究人员设定了狼吃羊游戏的基本规则:狼在20秒内得分越高越好,而羊在20秒内存活时间越长得分越高;同时,狼抓到羊奖励10分,遇到障碍物扣1分,同时为了提升狼抓羊的效率,会每秒扣分0.1分;而对应的羊则没有扣分项,在游戏中存活时间的长短决定了羊的最终得分。在整个AI游戏的训练过程中,由于每次开局时狼与羊的位置是随机出现的,大部分情况下狼是抓不到羊的,因此研发人员发现在训练到20万次以后,狼抓羊的效率明显下降,狼主动表现出“人间不值得”的心理状态,在游戏一开始就选择撞石头而死的典型“躺平”社死现象。

关于这个研究项目本身,我们权当看看笑话,乐一乐也就过了,但其中的一些逻辑和思考,做为研发团队管理者,尤其是一个创业团队的管理者来说,还是需要反思一下的,我们从“考核机制的公平性、考核内容的有效性、考核结果的激励性”三个内容一起来思考,我们今天先聊一聊考核机制的公平性

从上面的案例来看,狼的单步惩罚代价太大,激励不足,确实存在机制设计不公的情况。那么针对创业团队来说,最常见的考核机制设计不公的现象就是考核内容中的“单调区间”问题。就像我们高中课堂上学习的函数图形内容一样,管理人员在初创团队的考核内容设定上,往往只考虑了一种场景情况:要么是不断升级的惩罚条件,要么就是不断放大的奖励措施,这两种方法都不会对团队的考核工作有任何实际的作用。

比如在质量这个考核项上,有的团队会把线上故障修复时长做为一个考核内容,同时约定故障修复时间在某个范围段内,质量考核结果为某个分值,并依据故障修复时间的阶梯分布,获得对应阶梯较低的分值。这个考核内容设计本身没啥问题,但问题就在只约定了减分的情况,只是告诉大家不要出现这种问题,出问题就处罚,没有告诉大家质量方面应该鼓励、支持的行为和结果是什么。

具体怎么做?我们可以在质量这个考核项上,再增加约定:有提前预防线上故障的发生的事例,则可以在该项上增加一定分值的分数,并综合计算考核期内加分和减分的情况做最终得分。比如发现了以前代码或设计中的严重缺陷,通过日志和告警信息提前做了风险防控的系统优化等等。所以,考核机制中,增加了一正、一反两个方向对应的行为结果情况,来强化团队对质量考核的正确认知,以达到机制设计的公平性以及引导团队向正确方向改进的作用。

下一篇,我们将和大家聊一聊”考核内容的有效性、考核结果的激励性“