数据挖掘十大经典算法 - l5 N. g: L% v1。C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。 ) g6 ~% t1 H# V5 F; T- p
2. K-means算法:是一种聚类算法。 4 C6 |1 q+ d1 J8 ]0 B
3.SVM:一种监督式学习方法,广泛运用于统计分类以及回归分析中 ; g/ |( U/ ]& {% h5 Q
4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 ! K! U- ?; r F2 m8 ^+ p1 L5.EM:最大期望值法。 ) C5 f3 P. h% O. W$ b4 A& f! C
6.pagerank:是google算法的重要内容。 " [; N" \2 h. |& G& M5 @7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器**起来,构成一个更强的最终分类器。 1 l; o) R+ D6 x3 G" `# K8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 ) }. b4 J" H% n) s
9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) / P+ ?. }/ g Y, |7 Y( q: w10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。* P# p* b% X. u; ?
基本参考书 简单推荐; u& ]" x6 x/ j& l/ h
) ?: H3 F1 @9 G+ t2 ~) K
《数据挖掘:概念与技术》,Jiawei Han、Micheline Kamber等著,机械工业出版社,2001年。 ISBN 1-55860-489-8。 ; y: C# o1 R& ~+ h) c/ z9 q4 Y4 J4 `
最负盛名的数据挖掘著作,但版本较老,对读者的计算机尤其是数据库背景要求较高。 7 L; j% x. o, X$ U f0 h% C/ R
% @$ z* v: O7 x8 x- X# ^8 j0 N《数据挖掘导论》, Pang-Ning Tan, Michael Steinbach等著,范明、范宏建等译,人民邮电出版社,2006年。 ISBN 7-115-14698-5 。图灵教育 0 t! J0 y; _: e, @" J6 O& ~; g
1 t0 M, I" D$ z; ]9 V+ i! C最新出版的数据挖掘著作,其写作目的是“尽可能直接地学习数据挖掘,以便尽快地将其应用到各自的领域”。覆盖了多学科应用实例,对读者数学和计算机背景要求较低。 ) A% j+ z& G4 O8 R" Z. ^! z; q" |2 i2 l
《数据挖掘》,丁一贤、陈牧言合著,沧海出版社,2005年。 ISBN 986-7777-98-0 。沧海书局 3 u; z& j" S6 v5 Y+ P8 C1 e
$ X5 ?) A, K# ^0 ?" Z" sYuchun Lee et al. (1998), "Solving Data Mining Problems Through Pattern Recognition" , ISBN 0-13-095083-1 - b, O, ` Q6 a7 o( `5 V
5 N/ G1 h ?; I3 `: {6 x
Oded Maimon and Mark Last (2000), "Knowledge Discovery and Data Mining - The Info-Fuzzy Network (IFN) Methodology", Kluwer Academic Publishers. ISBN 0-7923-6647-6 , n+ Q. S9 V9 e) ]. N' e
' ^+ i* H1 Y7 M0 n
Sholom Weiss and Nitin Indurkhya(1998). "Predictive Data Mining". Morgan Kaufman. ISBN 1-55860-403-0 / v: L. |- ]2 @! {
: W" t8 [7 e2 H, Z- {/ t# mIan Witten and Eibe Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations" (2000), ISBN 1-55860-552-5, (see also Free Weka software) 3 Z4 _* ?! p/ [5 \& w6 J4 Q( C
《数据挖掘(原书第2版)》,~ Jiawei Han (作者), Micheline Kamber (作者), 范明 (译者), 孟小峰 (译者) ,机械工业出版社,2007年3月1日.ISBN 9787111205388" {$ E, B( H* b2 x0 }) |
2 u3 e0 k2 b- A( {/ v5 C