数学建模社区-数学中国

标题: 数据分析、挖掘的好书推荐——干货分享 [打印本页]

作者: chengshiyu    时间: 2014-5-6 22:06
标题: 数据分析、挖掘的好书推荐——干货分享
我找了好久才找到的资料,分享出来给咱们数模人!共同提高,共同进步!) Q' q% o5 O% b$ c
1. 深入浅出数据分析 (http://book.douban.com/subject/5257905/) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。
! i( V4 @* ~  m- s+ V
, u: n( [; K' d# x7 h$ t3 q难易程度:非常易。& _1 ^4 Z0 B- W! |0 a, T

% P( C( Y6 E" p: J9 I  b2.       啤酒与尿布 (http://book.douban.com/subject/3283973/) 通过案例来说事情,而且是最经典的例子。
" i* C' U" j8 y" N7 E& S
# P: S2 ?  A( |5 V! f9 L难易程度:非常易。3 j; p& C& j1 Z1 P

0 Z. q# B* c9 P- j4 O3.       数据之美 (http://book.douban.com/subject/5269219/) 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。
% F7 H7 c5 @3 q+ f. s( a; T/ y
难易程度:易。
2 \/ N0 u& q  F# I/ s0 v! E" I# N2 p4 [; E# S- ]
4.       集体智慧编程 (http://book.douban.com/subject/3288908/) 学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。
, I1 t+ g0 D$ ~% z- m0 h
5 o  x. V$ N5 C7 c% k. |难易程度:中。
" `% j- c! R6 _# E
! {4 N1 h+ E, o3 _5.       Machine Learning in Action (http://book.douban.com/subject/6962285/) 用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博: @王斌_ICTIR)已经翻译这本书了 机器学习实战 (http://book.douban.com/subject/24703171/)。这本书本身质量就很高,王老师的翻译质量也很高。
' d& m: Q! z: ]0 e. S: Y7 ?& a) p. p8 q( {7 Y: N, E
难易程度:中。
  m0 D' [/ _# ]) e& ?9 B; e* I% n
/ c3 K1 k3 ^! m6.       推荐系统实践 (http://book.douban.com/subject/10769749/) 这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。
% }" V5 J# R) E$ l7 l! N$ v2 ]/ m
0 ~4 f$ ]& _) U' a4 _- [& s9 Y难易程度:中上。* i$ O$ n& ^! B+ T$ w4 n7 B
7 K* r2 A( o; U/ n5 B  @
7.       数据挖掘导论 (http://book.douban.com/subject/5377669/) 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。# T+ `" \. @1 I; Y: e. n
. b- s: ]6 a4 t% T) S# G! Q
难易程度:中上。/ r( B" i4 P$ h$ @3 H; b

! ~6 h% {6 z+ M1 x- p7 {8.       The Elements of Statistical Learning (http://book.douban.com/subject/3294335/) 这本书有对应的中文版:统计学习基础 (http://book.douban.com/subject/1152126/)。书中配有R包,非常赞!可以参照着代码学习算法。
3 d5 L9 @; i" @" n% A
8 ^6 h7 Y3 ~8 p难易程度:难。' c) L/ @9 _5 M% E4 k  ~1 Q$ o
- |' |/ ]8 O5 R. K6 H1 ~, F
9.       统计学习方法 (http://book.douban.com/subject/10590856/) 李航老师的扛鼎之作,强烈推荐。
" [4 G/ F: R" K$ i! @. z3 g8 R3 t" H/ y$ D, n: S
难易程度:难。
  U8 [4 p- |$ x
3 B* T3 L. j" {2 E10.    Pattern Recognition And Machine Learning (http://book.douban.com/subject/2061116/) 经典中的经典。
3 D4 Z& `4 l" I+ P9 E  c& L9 k
9 c0 J# H% C& X9 `* T+ m7 E% i11.    Machine Learning (http://book.douban.com/subject/10758624/) 去年出版的新书,作者Kevin Murrphy教授是机器学习领域中年少有为的代表。这书是他的集大成之作,写完之后,就去Google了,产学研结合,没有比这个更好的了。
# D% m4 v# w% M; J( o3 a( q7 n" N% W8 q2 \- o1 f0 ], u
12.    Bayesian Reasoning and Machine Learning (http://book.douban.com/subject/5397287/) 看名字就知道了,彻彻底底的Bayesian学派的书,里面的内容非常多,有一张图将机器学习中设计算法的关系总结了一下,很棒。' Z% }! h$ S' v: B

# v) e) L! _/ [9 Q0 A13.    Machine Learning for Hackers (http://book.douban.com/subject/7906768/) 也是通过实例讲解机器学习算法,用R实现的,可以一边学习机器学习一边学习R。" D' v# L9 \* G& B9 T( ]& d# l9 _! F0 O

/ \( q8 y+ z. P; V: A14.    Probabilistic Graphical Models (http://book.douban.com/subject/4007200/) 鸿篇巨制,这书谁要是读完了告诉我一声。8 P! e+ M- v6 v# B2 z7 z2 ~
- s. c  K$ W5 I) z9 l  N# v0 @. U
15.    Convex Optimization (http://book.douban.com/subject/1888111/) 凸优化中最好的教材,没有之一了。课程也非常棒,Stephen老师拿着纸一步一步推到,图一点一点画,太棒了。
9 X( I1 L9 D" l+ R& z  f2 R
+ w8 O5 `& c+ M2 x( a+ A16.    Graphical Models, Exponential Families, and Variational Inference (http://book.douban.com/subject/3722993/) 这个是Jordan老爷子和他的得意门徒 Martin J Wainwright 在 Foundation of Machine Learning Research上的创刊号,可以免费下载,比较难懂,但是一旦读通了,graphical model的相关内容就可以踏平了。& N6 p- K2 F4 R- V/ p
! y2 p9 P, D# n/ v. n
17.    Introduction to Semi-Supervised Learning (http://book.douban.com/subject/3916225/) 半监督学习必读必看的书。) g! r/ M( }- V0 j$ }$ c& Q* \

( Y  t6 D# `6 [; g18.    Learning to Rank for Information Retrieval (http://book.douban.com/subject/4063191/) 微软亚院刘铁岩老师关于LTR的著作,啥都不说了,推荐!4 V2 ~5 T( N+ D* B- o

, g. _. F8 H# |( r0 ~/ ?5 i/ q19.    Learning to Rank for Information Retrieval and Natural Language Processing (http://book.douban.com/subject/6440223/) 李航老师关于LTR的书,也是当时他在微软亚院时候的书,可见微软亚院对LTR的研究之深,贡献之大。
% C: U& U" C+ [0 y* T% ]! n2 X
' x3 k9 c3 x4 |5 y20.    SciPy and NumPy (http://book.douban.com/subject/10561724/) 这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。
5 x) H% F* b/ y& i$ F9 p' C
0 S+ U( W) p* h, W& V4 j21.    Python for Data Analysis (http://book.douban.com/subject/10760444/) 作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强,用pandas做数据分析!
6 V7 p9 v9 M6 @: k. e- H
; Z; r3 [( ~6 K9 b22.    Bad Data Handbook (http://book.douban.com/subject/11549309/) 很好玩的书,作者的角度很不同。8 \1 B) O) |) H( E

作者: chb2012    时间: 2014-5-7 23:06

作者: chengshiyu    时间: 2014-5-14 12:59
chb2012 发表于 2014-5-7 23:06 0 _4 E3 a% r+ Q# m2 P5 }- a! t
3 j* w) p4 D# q7 \& u  w: U

作者: gancm    时间: 2014-5-15 15:32
这个很赞!!!!
作者: 一米阳光的ta    时间: 2014-5-17 12:16
必须赞啊。。。
作者: 一米阳光的ta    时间: 2014-5-17 12:16
谢谢分享啦。。。
作者: chengshiyu    时间: 2014-5-30 19:15
gancm 发表于 2014-5-15 15:32 6 _5 E& a+ M, s5 C. \. O  J
这个很赞!!!!
/ ~' i" J9 V  O" l

作者: chengshiyu    时间: 2014-5-30 19:15
一米阳光的ta 发表于 2014-5-17 12:16
2 ~) l7 J, |( w6 ^* E必须赞啊。。。

- E; A& k4 ?/ J0 K4 {" Q
作者: 秋枫舞    时间: 2014-6-6 14:34
mark一下,漫漫看




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5