数据挖掘十大经典算法) x V. i4 r5 G
1。C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。 ) Y; D( ^; U' K% d6 Z1 l
2. K-means算法:是一种聚类算法。 0 v) E; y0 h: u+ K% |
3.SVM:一种监督式学习方法,广泛运用于统计分类以及回归分析中 . h2 `0 H% g. g& o2 N( i3 b2 R$ i
4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 7 F* ^, R7 V; \4 R5 `( v( r; o0 Y
5.EM:最大期望值法。 / T. @2 B. H7 S2 O6.pagerank:是google算法的重要内容。 $ H [0 o: O8 u0 J/ v
7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器**起来,构成一个更强的最终分类器。 K9 `* H1 k$ M+ M# A- c' l/ u8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 4 ]3 l( X, G" U# ?9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) 2 N. d# j6 K4 S+ G3 w8 P) i! b
10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。 % t! E0 B' L8 L7 y7 M% Y基本参考书 简单推荐 / @# z& q' e$ T* p0 [5 `/ O/ @ $ I1 ]; L* A& X; X3 b( W: e, u《数据挖掘:概念与技术》,Jiawei Han、Micheline Kamber等著,机械工业出版社,2001年。 ISBN 1-55860-489-8。 % ?/ H- r9 V7 h* X
" ^) i: ?7 s# H' q) s8 _' v( M
最负盛名的数据挖掘著作,但版本较老,对读者的计算机尤其是数据库背景要求较高。 6 T$ y' A# v* d* P" F0 z: N; [1 J) C# c
《数据挖掘导论》, Pang-Ning Tan, Michael Steinbach等著,范明、范宏建等译,人民邮电出版社,2006年。 ISBN 7-115-14698-5 。图灵教育 7 @; E1 [- y. K/ @3 N% p, e5 \% o0 j. I# w6 h! C
最新出版的数据挖掘著作,其写作目的是“尽可能直接地学习数据挖掘,以便尽快地将其应用到各自的领域”。覆盖了多学科应用实例,对读者数学和计算机背景要求较低。 7 M, }- {$ e8 G! s) P* W
6 ^$ o( f6 S8 h. v1 f1 Y) X2 P3 ^《数据挖掘》,丁一贤、陈牧言合著,沧海出版社,2005年。 ISBN 986-7777-98-0 。沧海书局 ) z$ f. s1 w2 ~' I" d8 @# b
% l% D* K, E9 e5 Q
Yuchun Lee et al. (1998), "Solving Data Mining Problems Through Pattern Recognition" , ISBN 0-13-095083-1 9 s. N& D( a: X0 V
' R$ K2 c- s/ V4 q2 sOded Maimon and Mark Last (2000), "Knowledge Discovery and Data Mining - The Info-Fuzzy Network (IFN) Methodology", Kluwer Academic Publishers. ISBN 0-7923-6647-6 $ [) d" L- e* r- h5 [" h
$ n) V4 H1 E+ Z2 k
Sholom Weiss and Nitin Indurkhya(1998). "Predictive Data Mining". Morgan Kaufman. ISBN 1-55860-403-0 4 G( k9 n+ Q& S) |5 X9 Y ! k9 [7 |$ ~3 p% r" F |+ J. r8 FIan Witten and Eibe Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations" (2000), ISBN 1-55860-552-5, (see also Free Weka software) " V" _ f7 |/ V+ y + I% l3 f- A% r9 x+ R7 v$ s《数据挖掘(原书第2版)》,~ Jiawei Han (作者), Micheline Kamber (作者), 范明 (译者), 孟小峰 (译者) ,机械工业出版社,2007年3月1日.ISBN 9787111205388 ( |, l7 D- p% U9 z& e- Q' Y- d) ?& F. B9 z4 \" M5 U2 _