数据挖掘具有以下几个特点:! P" T. I" ]- @
1,基于大量数据:并非说小数据量上就不可以进行挖掘,实际上大多数数据挖掘的算法都可以在小数据量上运行并得到结果。但是,一方面过小的数据量完全可以通过人工分析来总结规律,另一方面来说,小数据量常常无法反映出真实世界中的普遍特性。% w% s, B Q$ @5 K9 X$ K0 v j# i/ y. g
2 i1 l/ L5 w- r1 |" p5 {1 W! ^
2,非平凡性:所谓非平凡,指的是挖掘出来的知识应该是不简单的,绝不能是类似某著名体育评论员所说的“经过我的计算,我发现了一个有趣的现象,到本场比赛结束为止,这届世界杯的进球数和失球数是一样的。非常的巧合!”那种知识。这点看起来勿庸赘言,但是很多不懂业务知识的数据挖掘新手却常常犯这种错误。% \8 M) d$ C4 P, m; U6 Z
) {% w) ?' J! H3,隐含性:数据挖掘是要发现深藏在数据内部的知识,而不是那些直接浮现在数据表面的信息。常用的BI工具,例如报表和OLAP,完全可以让用户找出这些信息。 & M4 l! o! N: u& S/ Z & K$ U. M( g) |& M. z/ h/ J4,新奇性:挖掘出来的知识应该是以前未知的,否则只不过是验证了业务专家的经验而已。只有全新的知识,才可以帮助企业获得进一步的洞察力。7 [+ I: N0 y1 i