过去我们提到竞争壁垒时,讨论的常常是体验方面的效用壁垒,例如对供应链的垄断,让己方产品和竞品的覆盖度有所差异;社交产品中的网络效应,让用户在不同产品之间可连接的朋友数量有所差异。当这些用户可以明显感知到的效用差难以被后来者缩小时,就形成了商业竞争中的效用壁垒。这种壁垒的形成与业务的发展有时候很难说谁是因谁是果,但是资源往往是有限的,所以壁垒一旦形成,后来者想要追赶就要付出更多成本。
新时代的到来,让我们开始更加关注商业竞争中的另一壁垒——效率壁垒(见图11-8)。效率壁垒往往是单个用户无法明显感知到的、需要在统计上体现的效率差距,而这些差距最终会在商业指标中得到体现,例如配送业务的超时率、金融风控的逾期率、医疗AI的误诊率等。正如前面我们分析的那样,这种效率壁垒往往来自样本优势。
图11-8 样本优势带来效率壁垒
一个行业内的样本资源是有限的,所以与效用壁垒类似,后来的竞争者往往需要付出额外的成本,这些成本一般受下面几个因素影响。
·样本完整性:一个完整的样本既包括样本特征,又包括样本标签,拥有完整样本的竞争者的优势要大于拥有不完整样本的竞争者。
·样本的边际成本:在样本闭环中获取单个增量样本所需的成本。样本边际成本越高的行业(如二手车等大宗交易),有存量样本的现有竞争者优势越大。
·样本的反馈周期:也可以理解为获取单个增量样本所需的时间成本,例如金融风控业务中,样本的获取一般需要走完整个信贷周期,所以长期信贷的样本获取时间就要长于短期信贷,同时模型迭代周期也会拉长,后来者要付出更多时间成本。
·样本的隐私与伦理问题:例如医疗AI产品中,由于隐私问题的存在,基本上很难获取到公开的样本,同时从伦理出发也无法主动增加样本,因此这一领域的样本大都由医院垄断,能否与院方达成合作就成为竞争的关键。
了解效率壁垒与样本逻辑,能够帮助我们判断产品的竞争格局。举个例子来说,如果简单地把自动驾驶看作一个端到端的机器学习问题,那么首先从样本完整性出发,我们不仅需要来自雷达、摄像头等的传感器数据(特征),也需要驾驶员的操作数据(标签),因此能够建立起这样的样本闭环的车企(如特斯拉、通用等)一定是不可或缺的玩家;其次从样本隐私问题出发,从用户私人汽车中收集样本一定是一个敏感的问题,因此能够将样本闭环部署到物流等商用场景中的公司,或者部署到公共出行场景中的公司(如滴滴、Uber等)也会是自动驾驶的参与者,并且这些参与者能够收集到由有专家水平的人类驾驶员(专车司机)提供的操作数据;最后,对于单纯研发自动驾驶技术的公司来说,实验车路测的样本来源就稍微显得单薄一些了,所以与车企合作或者将技术开源,用技术换样本就成为它们最好的选择。