数据挖掘十大经典算法 + p. z( n6 Q. {7 e0 u3 d+ }' w1。C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。 + l7 C3 L/ c+ f! [# @# H
2. K-means算法:是一种聚类算法。 ' q2 d$ J* R/ v. k% f2 I7 b B
3.SVM:一种监督式学习方法,广泛运用于统计分类以及回归分析中 ! n' \' I3 c; G4 t/ _+ h+ U
4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 * k( |' i2 j8 ~$ H+ ^ o
5.EM:最大期望值法。 3 x) ~0 [3 S# o/ _9 O) q6.pagerank:是google算法的重要内容。 ' F8 @. G- d' [$ a0 s/ p1 F7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器**起来,构成一个更强的最终分类器。 - Z5 W6 ~3 S( _% a
8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 / ]; Q5 X& ?$ {0 Y
9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) / o4 \) ~" \1 g
10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。6 K( k6 {: A4 D5 C4 \% ^+ @' [
基本参考书 简单推荐3 l( p: S1 a& h8 G Y* ?) P
' ^8 x3 ~1 Z4 v4 ^. @
《数据挖掘:概念与技术》,Jiawei Han、Micheline Kamber等著,机械工业出版社,2001年。 ISBN 1-55860-489-8。 . Q6 P \! P6 u4 n6 _. Q: }6 Q ; ^: H: j5 H: k4 }9 m最负盛名的数据挖掘著作,但版本较老,对读者的计算机尤其是数据库背景要求较高。 # s; f% B8 K( b" B' h8 i5 P) |; l/ f* \& l; x5 K
《数据挖掘导论》, Pang-Ning Tan, Michael Steinbach等著,范明、范宏建等译,人民邮电出版社,2006年。 ISBN 7-115-14698-5 。图灵教育 : l# A0 K& [7 x( e) Q" n! a5 A. g5 Y4 q2 r
最新出版的数据挖掘著作,其写作目的是“尽可能直接地学习数据挖掘,以便尽快地将其应用到各自的领域”。覆盖了多学科应用实例,对读者数学和计算机背景要求较低。 5 Z F% ~1 J1 G
" W3 K' o5 B: p7 C% ]* z《数据挖掘》,丁一贤、陈牧言合著,沧海出版社,2005年。 ISBN 986-7777-98-0 。沧海书局 - M1 `- C) i* I2 |0 x% H" ^$ E. @4 h
6 l: \' ?7 C1 }Yuchun Lee et al. (1998), "Solving Data Mining Problems Through Pattern Recognition" , ISBN 0-13-095083-1 7 x% W2 |0 e. ^) e5 g
0 q( ]1 q5 V0 N7 E' K4 M$ t) r$ T
Oded Maimon and Mark Last (2000), "Knowledge Discovery and Data Mining - The Info-Fuzzy Network (IFN) Methodology", Kluwer Academic Publishers. ISBN 0-7923-6647-6 6 Z m( e# F7 \+ f2 z# G ; w! b1 H3 p# H! N8 j& g/ L% ~' aSholom Weiss and Nitin Indurkhya(1998). "Predictive Data Mining". Morgan Kaufman. ISBN 1-55860-403-0 7 r0 D Q+ \2 u! _3 A
8 E% E0 w* |1 u' aIan Witten and Eibe Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations" (2000), ISBN 1-55860-552-5, (see also Free Weka software) $ g" G& Z- B: q4 l7 ` U6 `
/ l* `/ M) X& E' [4 p
《数据挖掘(原书第2版)》,~ Jiawei Han (作者), Micheline Kamber (作者), 范明 (译者), 孟小峰 (译者) ,机械工业出版社,2007年3月1日.ISBN 9787111205388; {/ I- K5 i1 Q" @' _$ ^( o
9 j3 }' d. Y5 T0 G' v