这样做需要审查大量事故、车辆部件、示意图等,创建一个独特的数据集来训练底层计算机视觉模型。这样做的机器学习供应商将拥有数据护城河,因为没有其他人拥有这些数据,这使得它能够为这个利基市场构建无与伦比的图像识别模型。风险投资家投资这些公司是因为他们可以垄断市场。
机器学习供应商可以通过尽可能多地销售基于这些数据训练的模型来利用其数据护城河。这还包括将这些模型出售给为机器学习公司提供数据护城河的组织的竞争对手。例如,汤森路透向尽可能多的客户出售其新闻。说服它只向一个客户出售新闻需要巨额资金。数据护城河也是一样:供应商通过将这些专有企业数据出售给尽可能多的各方来将其货币化。
当组织标记其数据并将其提供给 ML 公司时,后者会 埃及电话号码数据 获得其人力专业知识并将其在市场上出售。例如,像 Grammarly 这样的应用程序通过向用户展示语法更正来提供标记数据的机会。每次人们接受或拒绝这些更改时,Grammarly 的算法都会变得更智能。这些标记数据成为基于最终用户知识的数据护城河,类似于下面的金融分析师用例,其中一家投资银行公司正在使用 ML 工具并向其研究人员支付高额费用进行情绪分析。
如果他们推翻系统建议,称某条新闻是负面的,而实际上它是正面的,那么这可能会成为供应商的专有标记数据,除非公司有特定的合同语言保护其利益。如果没有它,供应商就会从人类专家那里提取数十年的金融知识来改进供应商的算法,从而获得报酬。诚然,专家组织从这种改进中受益,但供应商销售的整个市场(包括竞争对手)也是如此。