#数据要素#
虽然这个比喻有其长处,但归根结底,数据作为一种资源与石油是非常不同的,这种比较严重地过分简化了数据的本质。为了在解决业务问题时利用数据,我们需要了解数据到底是什么样的资源。
石油是有限的资源,而数据实际上是无限的
虽然世界上可能有许多未探明的石油储量,但我们星球上剩下的石油数量是有限的。在某一时刻,我们将耗尽石油,被迫过渡到其他形式的能源。年,仅美国平均每天消耗石油万桶。然而,早在年就有消息称,全球每天产生的数据为2.5Q(1Q=10的18次方)字节。
随着互联网用户的数量呈指数级增长,我们可以有把握地说,数据实际上是无限的。我们永远不会真正用完数据。实际上,我们会无限地不断创造越来越多。这个概念引出了下一点。
石油会被消耗,而数据会被创造
当石油被用作燃料时,它只能消耗一次就被永久销毁。另一方面,数据是被创建的,即使在我们用于分析之后也不必将其销毁。在信息时代,人类的日常行动每天都在产生数据。这里有几个例子:
当有人创建Facebook个人资料时,他们就是在创建数据。
当某人接受Facebook上的好友请求时,他们已经创建了Facebook可以用于建议好友的数据。
当你在Netflix上观看电影时,你就是在为电影推荐算法创建数据。
当你在亚马逊上买东西的时候,你就是在为亚马逊的推荐系统创建数据。
当你在谷歌上搜索某样东西时,你是在以你的搜索历史的形式创建数据。
这意味着数据是一种资产,它不一定会消失,而且可以在很长一段时间内保持有用。科技公司可以多年不间断地收集有关客户行为的数据,以便建立更稳健的模型,为客户提供更好的体验。试想再过十年的网购模式学习之后,亚马逊的产品推荐系统会变得多么精密。通过随着新数据的到来更新和改进算法,公司可以将数据变成一种不断增值的资产。
在收集数据时,隐私和道德会起作用
到目前为止,数据听起来像是任何公司的终极资源。数据实际上是无限的,而且每天都在继续被创造,这一事实似乎太好了,不像是是真的。其实,这个想法有一些需要注意的地方。并非世界上所有的数据都能直接供企业使用。事实上,大量潜在有用的数据可能受到隐私准则和法律的保护。自然,在使用从客户收集的数据时也可能出现伦理方面的担忧。生产数字产品和收集客户数据的公司可能必须牢记以下问题:
他们可以合法收集哪些类型的客户数据?如果数据被收集,哪些数据必须保持私有?公司如何保护私人客户数据免遭数据泄露?使用从真实客户收集的数据进行分析是否合乎道德?这些都是非常现实的问题,如果不考虑这些问题,可能会给公司带来严重后果。以年著名的Facebook-剑桥分析丑闻为例。在这起数据丑闻中,英国政治咨询公司剑桥分析公司未经同意,以政治广告为目的,收集了数百万Facebook用户的个人信息。这一丑闻严重到导致剑桥分析公司垮台,并使Facebook的市值在短短几天内下跌超过亿美元。
尽管石油钻探也涉及道德问题,但适用于数据的隐私问题不适用于石油。数据之所以强大,是因为它丰富,并促进了分析和人工智能,但强大的力量带来了巨大的责任。
数据基础设施投资
与石油一样,数据是一种既需要收集又需要存储基础设施来维护的资源。如果您在一家计划利用数据分析或数据挖掘的公司,则需要确保您有适当的数据基础设施来管理您的数据。无论您的数据管理解决方案存在于云上,还是存在于您公司拥有的物理服务器上,您都需要确保它是可用的、容错的、并且经济的。
收集实际有用的高质量数据
任何实际分析或AI解决方案的质量都取决于构建它所使用的数据。高质量的数据带来高质量的分析。低质量的数据导致低质量的分析。如果您的原始数据包含缺失或不准确的信息,您可能必须对其进行精炼,直到它达到分析所需的质量水平。
数据可以是一种不断增值的资产
更多的机油不一定会使内燃机性能更好,但更多的数据有可能产生更稳健的预测模型。拥有一个可以让你收集和存储越来越多的数据用于训练和调优模型的系统,可以让你把数据变成一种不断为业务增值的资产。
了解数据分析中涉及的伦理问题
数据分析是强大的,但强大的力量带来了巨大的责任。数据,尤其是客户数据是一种必须以道德和负责任的方式处理的资源。如果您计划使用客户数据或其他私人数据进行分析,请始终考虑您的工作所涉及的道德和法律问题。
数据类似于石油,因为它是分析和人工智能的燃料。
像石油一样,数据需要基础设施来收集、存储和维护。
虽然数据类似于石油,但作为一种资源,它比石油复杂得多,因为它是被创造的,而不是被破坏的,而且随着更多的数据变得可用,它可以不断增加更多的价值。
与石油不同,收集数据伴随着隐私和道德问题,必须仔细考虑。
虽然数据像石油一样有价值,但我们在理解数据作为推动业务发展资源的潜力时,需要用不同的眼光来看待它。
参考:
R.K.Ragan和T.Strasser,《大数据:新油田》,(年),《信用联盟时报》。
L.亚当森,《数据是新的石油吗?》,(年),LinkedInPulse
维基百科,Facebook-剑桥分析数据丑闻(年更新),维基百科,免费百科全书