数据挖掘十大经典算法' Y. E/ p; C, ~4 |
1。C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。 + v; A) C% m+ {( b" H2. K-means算法:是一种聚类算法。 $ b M& R, I/ l8 O7 E6 p5 I$ [8 J3.SVM:一种监督式学习方法,广泛运用于统计分类以及回归分析中 5 K: F% y: b+ m9 s; W4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 # B4 ]. ^( ^3 d4 N5.EM:最大期望值法。 ( r9 w# S( Z, T( h# j4 O
6.pagerank:是google算法的重要内容。 + q+ F$ _8 z: q% V7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器**起来,构成一个更强的最终分类器。 ! z4 x2 G& J; ~5 r3 Y' K' x$ q i8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 ( n0 l% c$ [6 H- c
9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) ' p' X. N! H1 p l$ q7 Y$ G
10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。/ ~! ]$ a: U& j7 E& X }& s
基本参考书 简单推荐 & Y1 R8 x# B* W/ x: {# L ( v/ }1 i* O9 D/ M( u) q4 L" B《数据挖掘:概念与技术》,Jiawei Han、Micheline Kamber等著,机械工业出版社,2001年。 ISBN 1-55860-489-8。 ) n4 |! \* u( Y. q; {9 W" Y* d- S, v0 q2 f / ]" `7 H. j, Q9 E. a) X3 y最负盛名的数据挖掘著作,但版本较老,对读者的计算机尤其是数据库背景要求较高。 * ]4 T) x5 G% A$ E+ N. W. @
0 S, J0 _1 J1 Y/ X5 _4 [5 J《数据挖掘导论》, Pang-Ning Tan, Michael Steinbach等著,范明、范宏建等译,人民邮电出版社,2006年。 ISBN 7-115-14698-5 。图灵教育 * q+ \/ A4 ?: u
2 @% @3 D9 V: b0 t. {
最新出版的数据挖掘著作,其写作目的是“尽可能直接地学习数据挖掘,以便尽快地将其应用到各自的领域”。覆盖了多学科应用实例,对读者数学和计算机背景要求较低。 8 m* M s8 h6 f; }. N8 G! E+ w) ?" t k8 a3 t9 u% w' K/ p
《数据挖掘》,丁一贤、陈牧言合著,沧海出版社,2005年。 ISBN 986-7777-98-0 。沧海书局 3 ~6 [# F, x# ?2 R8 m, u6 p; l% t7 O3 n' j5 L4 M* Y
Yuchun Lee et al. (1998), "Solving Data Mining Problems Through Pattern Recognition" , ISBN 0-13-095083-1 " j% G+ A4 r6 U8 K0 q3 d# W ) v N$ f: n: U; gOded Maimon and Mark Last (2000), "Knowledge Discovery and Data Mining - The Info-Fuzzy Network (IFN) Methodology", Kluwer Academic Publishers. ISBN 0-7923-6647-6 ( a/ }! r! Y: ?2 O z 8 u& f1 i2 n/ t$ c4 rSholom Weiss and Nitin Indurkhya(1998). "Predictive Data Mining". Morgan Kaufman. ISBN 1-55860-403-0 6 R/ j: `4 w. V. y' g ! G6 h3 d9 [+ SIan Witten and Eibe Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations" (2000), ISBN 1-55860-552-5, (see also Free Weka software) 6 z# M5 \4 B \: q" X0 a9 \0 Z0 r1 S P4 P
《数据挖掘(原书第2版)》,~ Jiawei Han (作者), Micheline Kamber (作者), 范明 (译者), 孟小峰 (译者) ,机械工业出版社,2007年3月1日.ISBN 9787111205388 ! Y4 B) P7 M* C - A, M. E8 X3 ]1 p5 s1 I