数据挖掘十大经典算法5 H3 s( o5 h7 R- [6 ^9 n
1。C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。 & U& J: p( O) @; [" V' Q, [2. K-means算法:是一种聚类算法。 8 R: `6 _9 i. i4 W, E
3.SVM:一种监督式学习方法,广泛运用于统计分类以及回归分析中 7 a. A- i- ^1 g8 I( ]
4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 . [; v* w, X ]; ?' z2 m$ N5.EM:最大期望值法。 . t r7 B, N7 W6 I( D6.pagerank:是google算法的重要内容。 ( A) W M) A4 {- c2 Y; B/ e
7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器**起来,构成一个更强的最终分类器。 F, | m i7 o5 @0 F
8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 0 Q9 O8 G- b" I+ [- ?1 X9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) ; g A. ^- ~: l, ]10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。 * @$ ]' ]* Y& W基本参考书 简单推荐 " i( k: [7 k; w1 a# @8 G0 f % \; |/ S! ]& R' s" s1 |《数据挖掘:概念与技术》,Jiawei Han、Micheline Kamber等著,机械工业出版社,2001年。 ISBN 1-55860-489-8。 8 t6 o* R( z7 v% V. L
4 S0 T# J; I2 ?; ?最负盛名的数据挖掘著作,但版本较老,对读者的计算机尤其是数据库背景要求较高。 + r3 D* K8 {# q! C* c( ?! d" J# f S+ o: T% X; [
《数据挖掘导论》, Pang-Ning Tan, Michael Steinbach等著,范明、范宏建等译,人民邮电出版社,2006年。 ISBN 7-115-14698-5 。图灵教育 2 Q k3 s; O* @% g0 g / O) W0 x+ D8 u! w0 j最新出版的数据挖掘著作,其写作目的是“尽可能直接地学习数据挖掘,以便尽快地将其应用到各自的领域”。覆盖了多学科应用实例,对读者数学和计算机背景要求较低。 ( s1 X9 c1 z: ~. o- i% x5 K. R+ Q, E - D+ n4 L3 E' o' m0 S# x《数据挖掘》,丁一贤、陈牧言合著,沧海出版社,2005年。 ISBN 986-7777-98-0 。沧海书局 7 T( G" O& |3 \' j) I9 n
& c2 ? I# l% r" w( r
Yuchun Lee et al. (1998), "Solving Data Mining Problems Through Pattern Recognition" , ISBN 0-13-095083-1 / c3 y# K/ R3 K+ N0 u/ Y
7 a E. R+ ^* a# W- }
Oded Maimon and Mark Last (2000), "Knowledge Discovery and Data Mining - The Info-Fuzzy Network (IFN) Methodology", Kluwer Academic Publishers. ISBN 0-7923-6647-6 9 z m- b. V& S5 m7 i1 ^9 f% e* o8 \! I6 M. n, r
Sholom Weiss and Nitin Indurkhya(1998). "Predictive Data Mining". Morgan Kaufman. ISBN 1-55860-403-0 " M9 P4 C6 ^( S7 z
) b0 m: C( x# yIan Witten and Eibe Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations" (2000), ISBN 1-55860-552-5, (see also Free Weka software) 9 ?) g- C: X0 D* z! u6 c # l2 }# L+ `9 J/ x《数据挖掘(原书第2版)》,~ Jiawei Han (作者), Micheline Kamber (作者), 范明 (译者), 孟小峰 (译者) ,机械工业出版社,2007年3月1日.ISBN 97871112053882 Y' U# ~8 v8 {: J( C* B2 h
" S8 J3 u+ Y, R- Y# u p