大数据的关联性,预测的重点
发布时间:2022-01-03 12:26:38 所属栏目:大数据 来源:互联网
导读:在小数据世界中,相关关系也是有用的,但在大数据的背景下,相关关系大放异彩。 通过应用相关关系,我们可以比以前更容易、更快捷、更清楚地分析事物。 相关关系的核心是量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,另一个数据值很
在小数据世界中,相关关系也是有用的,但在大数据的背景下,相关关系大放异彩。 通过应用相关关系,我们可以比以前更容易、更快捷、更清楚地分析事物。 相关关系的核心是量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加。 我们已经看到过这种很强的相关关系,比如谷歌流感趋势: 在一个特定的地理位置,越多的人通过谷歌搜索特定的词条,该地区就有更多的人患了流感。 相反,相关关系弱就意味着当一个数据值增加时,另一个数据值几乎不会发生任何变化。 例如,我们可以寻找关于个人的鞋码和幸福的相关关系,但会发现它们几乎完全没有任何联系。 相关关系通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示其内部的运作机制。 当然,即使是很强的相关关系也不一定能解释每一种情况,比如两个事物看上去行为相似,但很有可能只是巧合。 我们可能只是被随机性所愚弄而已。 相关关系没有绝对,只有可能性。 也就是说,不是亚马逊推荐的每本书都是顾客想买的书。 但是,如果相关关系强,一个相关链接成功的概率是很高的。 这一点很多人都可以证明,他们的购物车里很多东西都是因为推荐而购买的。 通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。 如果A和B经常一起发生,我们只需要注意到B发生了,就可以预测A也发生了。 这有助于我们捕捉可能和A一起发生的事情,即使我们不能直接测量或观察到A。 更重要的是,它还可以帮助我们预测未来可能会发生什么。 当然,相关关系是无法预知未来的,他们只能预测可能发生的事情。 但是光是这点,就已经弥足珍贵了。 (编辑:衡阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |