数据挖掘十大经典算法0 y9 Y- _" U& s. E( _* @+ v
1。C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。 ; A. \5 g7 ^5 [. n# E' b
2. K-means算法:是一种聚类算法。 1 O2 T- W3 ]2 _3 Y' |4 `
3.SVM:一种监督式学习方法,广泛运用于统计分类以及回归分析中 3 d5 L# m! y5 a& J1 Y
4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 * H" r$ ?7 G( a5 b8 a3 P0 ^
5.EM:最大期望值法。 & [$ C& o. d+ ^# \7 f0 e& y
6.pagerank:是google算法的重要内容。 0 U( W! ~9 k- ]' H& Y8 E7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器**起来,构成一个更强的最终分类器。 3 e$ V, I, ?0 t
8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 ; G$ G% v/ W! K* I, H
9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) % R, j/ _* N8 f10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。 # C# t6 b% e' Y9 A基本参考书 简单推荐 6 a {* Z% ~9 B" U7 A7 y0 T& v 1 `( j9 Y1 I) G% X. v ~6 K, z《数据挖掘:概念与技术》,Jiawei Han、Micheline Kamber等著,机械工业出版社,2001年。 ISBN 1-55860-489-8。 , n' P8 y& n% r, I
7 B7 y2 Z1 j" o' p/ X; D2 o9 Q最负盛名的数据挖掘著作,但版本较老,对读者的计算机尤其是数据库背景要求较高。 0 l$ `- }! b+ Z
' x. c1 I) e6 l4 s2 \3 w
《数据挖掘导论》, Pang-Ning Tan, Michael Steinbach等著,范明、范宏建等译,人民邮电出版社,2006年。 ISBN 7-115-14698-5 。图灵教育 ! S* ^' n* |: k2 T1 K8 Q0 L: ?3 [4 t$ U, C
最新出版的数据挖掘著作,其写作目的是“尽可能直接地学习数据挖掘,以便尽快地将其应用到各自的领域”。覆盖了多学科应用实例,对读者数学和计算机背景要求较低。 " h( B( C- Z8 q + c* Q" Y! [% c& q9 C《数据挖掘》,丁一贤、陈牧言合著,沧海出版社,2005年。 ISBN 986-7777-98-0 。沧海书局 : X# P9 `# I8 P6 {2 v' t 7 T( `. ]5 o4 |1 Z" J. XYuchun Lee et al. (1998), "Solving Data Mining Problems Through Pattern Recognition" , ISBN 0-13-095083-1 6 r$ [ O& V/ S
, W1 l1 n( M K$ @- B2 Y, N# p) F6 k
Oded Maimon and Mark Last (2000), "Knowledge Discovery and Data Mining - The Info-Fuzzy Network (IFN) Methodology", Kluwer Academic Publishers. ISBN 0-7923-6647-6 * x# U( e* o. z: Z) {# K3 D 1 M4 M; R V4 g6 `+ xSholom Weiss and Nitin Indurkhya(1998). "Predictive Data Mining". Morgan Kaufman. ISBN 1-55860-403-0 / N3 l4 p }2 p, P6 I! u
% u% ]8 c+ k6 e" u- n; i2 SIan Witten and Eibe Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations" (2000), ISBN 1-55860-552-5, (see also Free Weka software) ) j$ W' }# G* k: A% A ) w$ H) U3 v3 W* ^《数据挖掘(原书第2版)》,~ Jiawei Han (作者), Micheline Kamber (作者), 范明 (译者), 孟小峰 (译者) ,机械工业出版社,2007年3月1日.ISBN 9787111205388: G3 P0 {6 E2 O: M- O) v4 G