数据挖掘十大经典算法 + t5 E3 _) j9 C* w' S( y1 W1。C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。 ! C4 I7 f: f3 Z/ X
2. K-means算法:是一种聚类算法。 ?' D$ v9 F a* r9 d+ e6 c$ ]
3.SVM:一种监督式学习方法,广泛运用于统计分类以及回归分析中 " C/ i8 C) q" G5 y4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 # P$ |7 C" P; |3 L# `1 W- f9 S& z5.EM:最大期望值法。 2 m$ S' i& r7 ]# B% @8 U0 V* r; O
6.pagerank:是google算法的重要内容。 & v) S% d6 b% \8 X& F$ V7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器**起来,构成一个更强的最终分类器。 ; u( `* }; e: X
8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 : l* q# e; L9 h8 @
9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) 5 L" {& `: ~( ^# H7 K10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。 9 O! n9 F O4 \! `基本参考书 简单推荐4 p0 Y; Q3 B7 G8 K) l: ]
; T+ S; Q. D7 Q& x; F0 R( L, L d
《数据挖掘:概念与技术》,Jiawei Han、Micheline Kamber等著,机械工业出版社,2001年。 ISBN 1-55860-489-8。 ( T4 [6 N" d# V* z1 C! t3 A
0 V y; E- D% ~) `1 h8 F
最负盛名的数据挖掘著作,但版本较老,对读者的计算机尤其是数据库背景要求较高。 6 Z. A! x, g; X+ n' f! s! t' |9 k9 d
1 B! f6 g7 P8 M ?0 \& Q
《数据挖掘导论》, Pang-Ning Tan, Michael Steinbach等著,范明、范宏建等译,人民邮电出版社,2006年。 ISBN 7-115-14698-5 。图灵教育 - K+ W# {6 s2 v8 A1 p' R, t% D k" A, [* H: L/ B* {1 j
最新出版的数据挖掘著作,其写作目的是“尽可能直接地学习数据挖掘,以便尽快地将其应用到各自的领域”。覆盖了多学科应用实例,对读者数学和计算机背景要求较低。 % P6 h/ J! Z J( S3 ~8 q
- N% c6 @& [) G《数据挖掘》,丁一贤、陈牧言合著,沧海出版社,2005年。 ISBN 986-7777-98-0 。沧海书局 " s3 K2 J" a& v+ f3 i) J, y, V) C8 z6 M# R* }6 l: v+ m
Yuchun Lee et al. (1998), "Solving Data Mining Problems Through Pattern Recognition" , ISBN 0-13-095083-1 $ j H% z$ J- ^2 v3 j; \2 M2 ^
1 @+ u3 D' O9 m9 `* o8 MOded Maimon and Mark Last (2000), "Knowledge Discovery and Data Mining - The Info-Fuzzy Network (IFN) Methodology", Kluwer Academic Publishers. ISBN 0-7923-6647-6 0 u: A5 T' r# X
' B. [; j. r7 f7 K- ~Sholom Weiss and Nitin Indurkhya(1998). "Predictive Data Mining". Morgan Kaufman. ISBN 1-55860-403-0 2 e3 U( t" Z5 z# b; Q; Y
5 o3 n9 O+ I" g8 y8 U1 l7 NIan Witten and Eibe Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations" (2000), ISBN 1-55860-552-5, (see also Free Weka software) 4 v8 W' C* S, u" h x! s7 r/ G 6 O4 Y1 v1 X1 m( G' @《数据挖掘(原书第2版)》,~ Jiawei Han (作者), Micheline Kamber (作者), 范明 (译者), 孟小峰 (译者) ,机械工业出版社,2007年3月1日.ISBN 9787111205388 4 y- }7 ?6 t6 M. E! ? / M( e& |# U/ w9 n' F) |; h+ ^