11.3.2 样本优势与效率壁垒

11.3.2　样本优势与效率壁垒

过去我们提到竞争壁垒时，讨论的常常是体验方面的效用壁垒，例如对供应链的垄断，让己方产品和竞品的覆盖度有所差异；社交产品中的网络效应，让用户在不同产品之间可连接的朋友数量有所差异。当这些用户可以明显感知到的效用差难以被后来者缩小时，就形成了商业竞争中的效用壁垒。这种壁垒的形成与业务的发展有时候很难说谁是因谁是果，但是资源往往是有限的，所以壁垒一旦形成，后来者想要追赶就要付出更多成本。

新时代的到来，让我们开始更加关注商业竞争中的另一壁垒——效率壁垒（见图11-8）。效率壁垒往往是单个用户无法明显感知到的、需要在统计上体现的效率差距，而这些差距最终会在商业指标中得到体现，例如配送业务的超时率、金融风控的逾期率、医疗AI的误诊率等。正如前面我们分析的那样，这种效率壁垒往往来自样本优势。

图11-8　样本优势带来效率壁垒

一个行业内的样本资源是有限的，所以与效用壁垒类似，后来的竞争者往往需要付出额外的成本，这些成本一般受下面几个因素影响。

·样本完整性：一个完整的样本既包括样本特征，又包括样本标签，拥有完整样本的竞争者的优势要大于拥有不完整样本的竞争者。

·样本的边际成本：在样本闭环中获取单个增量样本所需的成本。样本边际成本越高的行业（如二手车等大宗交易），有存量样本的现有竞争者优势越大。

·样本的反馈周期：也可以理解为获取单个增量样本所需的时间成本，例如金融风控业务中，样本的获取一般需要走完整个信贷周期，所以长期信贷的样本获取时间就要长于短期信贷，同时模型迭代周期也会拉长，后来者要付出更多时间成本。

·样本的隐私与伦理问题：例如医疗AI产品中，由于隐私问题的存在，基本上很难获取到公开的样本，同时从伦理出发也无法主动增加样本，因此这一领域的样本大都由医院垄断，能否与院方达成合作就成为竞争的关键。

了解效率壁垒与样本逻辑，能够帮助我们判断产品的竞争格局。举个例子来说，如果简单地把自动驾驶看作一个端到端的机器学习问题，那么首先从样本完整性出发，我们不仅需要来自雷达、摄像头等的传感器数据（特征），也需要驾驶员的操作数据（标签），因此能够建立起这样的样本闭环的车企（如特斯拉、通用等）一定是不可或缺的玩家；其次从样本隐私问题出发，从用户私人汽车中收集样本一定是一个敏感的问题，因此能够将样本闭环部署到物流等商用场景中的公司，或者部署到公共出行场景中的公司（如滴滴、Uber等）也会是自动驾驶的参与者，并且这些参与者能够收集到由有专家水平的人类驾驶员（专车司机）提供的操作数据；最后，对于单纯研发自动驾驶技术的公司来说，实验车路测的样本来源就稍微显得单薄一些了，所以与车企合作或者将技术开源，用技术换样本就成为它们最好的选择。