数据挖掘十大经典算法1 ^: S- c0 U8 H1 W8 L
1。C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。 $ k( a' L( T/ _/ I/ G
2. K-means算法:是一种聚类算法。 % m1 M0 k9 Q4 j: N2 x
3.SVM:一种监督式学习方法,广泛运用于统计分类以及回归分析中 % s& N, Y) E; N/ ]5 M# m4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 # a# I" B" B9 |) W2 O
5.EM:最大期望值法。 - R9 E, w- F& l' q6.pagerank:是google算法的重要内容。 # v# n4 i- Q& j
7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器**起来,构成一个更强的最终分类器。 5 `* R; a6 Q, k) Z8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 ( W t: \, ~- X& G' Z5 F
9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) 9 t. e# D/ @0 U10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。 6 J' ^6 y2 `# T; w6 G* S( |基本参考书 简单推荐 3 L0 L* ]7 J* ~1 ]& {3 P & a2 \. ]/ C/ a0 |0 X0 [6 y《数据挖掘:概念与技术》,Jiawei Han、Micheline Kamber等著,机械工业出版社,2001年。 ISBN 1-55860-489-8。 0 y- a: Z5 X6 Q0 \. ] G' Z3 O) J( x4 l
最负盛名的数据挖掘著作,但版本较老,对读者的计算机尤其是数据库背景要求较高。 ) G8 S( i% z1 ~! e
+ @2 t! ~2 a5 P7 g" [" }
《数据挖掘导论》, Pang-Ning Tan, Michael Steinbach等著,范明、范宏建等译,人民邮电出版社,2006年。 ISBN 7-115-14698-5 。图灵教育 , J2 L8 U% a8 Q. f8 I) b% T # V& X# B+ l, l& y. |% Y1 ^7 l最新出版的数据挖掘著作,其写作目的是“尽可能直接地学习数据挖掘,以便尽快地将其应用到各自的领域”。覆盖了多学科应用实例,对读者数学和计算机背景要求较低。 5 J; h5 y, N# S4 b3 g ) K3 h& q1 G$ U' V/ I( a4 O, d4 o《数据挖掘》,丁一贤、陈牧言合著,沧海出版社,2005年。 ISBN 986-7777-98-0 。沧海书局 6 Z& Y1 H* D. G3 D1 S" w, P" t
3 \% A' A! |. CYuchun Lee et al. (1998), "Solving Data Mining Problems Through Pattern Recognition" , ISBN 0-13-095083-1 * L6 T* A2 E5 S8 U& u/ }
) D' Y# B8 n. d" W/ oOded Maimon and Mark Last (2000), "Knowledge Discovery and Data Mining - The Info-Fuzzy Network (IFN) Methodology", Kluwer Academic Publishers. ISBN 0-7923-6647-6 1 g7 t6 @$ l9 I
; \& a1 q9 [* D$ O6 R" u; ]$ m
Sholom Weiss and Nitin Indurkhya(1998). "Predictive Data Mining". Morgan Kaufman. ISBN 1-55860-403-0 . n1 r7 [% Q8 y
! {+ z+ Z+ s* B9 X# e8 w' `Ian Witten and Eibe Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations" (2000), ISBN 1-55860-552-5, (see also Free Weka software) % Z1 a( t' k- |
2 e! j1 k6 j6 Q/ i* L2 T. E: E
《数据挖掘(原书第2版)》,~ Jiawei Han (作者), Micheline Kamber (作者), 范明 (译者), 孟小峰 (译者) ,机械工业出版社,2007年3月1日.ISBN 9787111205388 - I- M! j) r& r1 z/ T j; O1 A/ F2 ?# L) w% W2 q) X