6.3.1 对内指标和对外指标的“道”和“术”

6.3 主观评估之职级评定问题

6.3.1 对内指标和对外指标的“道”和“术”

并非所有的产品都需要构造一个指标来鼓励用户做出平台预期的行为,简单社交资本的数值在大多数非专业场景都能满足要求。本节将介绍一类更为普遍的评估问题——对内指标的主观评估。

与外显数值相比,大多数场景下平台更需要一个仅供内部使用的数值指标,比如:

●滴滴快车的派单策略中如何度量司机端的信用等级?

●高考语文作文的判卷过程,如何科学主观地评估考生的作文得分?

●作为人力资源总监,如何科学主观地评估本公司员工的职级?

这里所说的滴滴派单策略中的司机信用等级和外显给用户的信用等级可能是不同的,比如外显等级可能是为了提升用户的使用动力而进行的数值设计,而内部模型策略中使用的信用等级则无须考虑用户使用动力的问题,在模型策略中的信用等级追求的是数值的准确性。

人力总监的例子更清楚些,对于大多数公司而言,员工的薪酬和职级是不公开的,只有直属领导拥有查看的权限。作为一家公司的管理者,如何确保企业的人力成本是相对合理的?换句话说,如何确保给每个员工都标注了对等的能力职级,并按照其职级分配薪酬?

关于高考语文作文判卷的例子,则是不同于前两者的另一类问题,那么如何科学主观地评估作文得分?

观察这三个例子,可以发现其共同的特点是:对内指标,评估是主观性的,没有标准答案。

那么,对内指标和对外指标之间有哪些区别呢?表6-2列举了笔者关于这两类指标的思考。

表6-2 对外指标和对内指标的“道”和“术”

正如6.2节阐述的,对外指标追求用户能够理解指标的含义,并在达到相关的条件时能提升指标数值(如滴滴司机的外显等级,满足一定条件可以晋升下一级,获得更高的分佣比例),同时追求数值反作弊,尽量不被用户“摸透规律”,将对外指标做到公正。对外指标的涨跌需要明确告知用户,至少有渠道给用户提示改进的途径。

但对内指标是不同的,虽然高考作文有明确的判分标准(仅为事实举例,假设高考作文分数无法被考生单独查询),比如现在有高考作文的标准为“文辞优美,语意通畅,意境深远的作文应得48分至55分”,但在具体执行层面则存在着较大的自由度,什么样的文字模式是“意境深远”?判卷教师在对每一篇作文给出相应的分数后,一般不需要全部给出批改分数的理由(但不排除对个别争议分数要做出解释)。所以,对内指标相对于前者而言,不追求可解释性。

第二点,对内指标追求的是相对公平,在一定的程序流程下,能力相近的员工得到相近的职级,相对公平的度量方式是内部价值观统一下的双人盲审一致率。所以,对于员工职级、高考作文分数、滴滴司机信用等级等对内主观指标,应该保证准确率。

上一章 封面 书架 下一章