数学建模社区-数学中国

标题: 数据分析、挖掘的好书推荐——干货分享 [打印本页]

作者: chengshiyu    时间: 2014-5-6 22:06
标题: 数据分析、挖掘的好书推荐——干货分享
我找了好久才找到的资料,分享出来给咱们数模人!共同提高,共同进步!$ Z; Z) ]" X- c" p
1. 深入浅出数据分析 (http://book.douban.com/subject/5257905/) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。
2 ^* V& I( v- `9 K- k7 L7 ^
/ h" D) j. Y3 {- u* D  V4 Q难易程度:非常易。
4 m/ z4 M$ g) v' @3 T+ L7 w6 q% z/ m+ n# G" v3 W4 b. Y: C
2.       啤酒与尿布 (http://book.douban.com/subject/3283973/) 通过案例来说事情,而且是最经典的例子。
* v- A( n1 I* E% G$ q' h' n6 W. q) P+ V* [+ w
难易程度:非常易。
9 \) M$ T" Y4 i
: c: B" }; s1 u4 I! b3.       数据之美 (http://book.douban.com/subject/5269219/) 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。9 b* U: G0 |0 W4 m& `

3 m( k0 E' N  H8 b& {  c难易程度:易。
+ k1 i1 b+ |& Y& m" P* U
! b1 l& |# }4 c+ ]" Z4.       集体智慧编程 (http://book.douban.com/subject/3288908/) 学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。
) q3 f) r. u1 i# H/ X, Y3 z6 @; w  l, b1 H! f. n1 J4 i, c1 N
难易程度:中。  k0 b# K% w0 _

& ?0 q# A5 D7 j& l: E5.       Machine Learning in Action (http://book.douban.com/subject/6962285/) 用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博: @王斌_ICTIR)已经翻译这本书了 机器学习实战 (http://book.douban.com/subject/24703171/)。这本书本身质量就很高,王老师的翻译质量也很高。1 p: W9 q+ u+ O$ H2 Y' R

  j, \7 ]7 o4 C8 C2 r- P难易程度:中。
1 H& {, d0 t7 i2 H4 H: ^  A; o" ~4 Z( P9 C. ?( k! x. _
6.       推荐系统实践 (http://book.douban.com/subject/10769749/) 这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。
$ a" U5 T: q$ |2 E$ |/ n
7 l; {2 u+ X6 Y4 g8 M. K, V难易程度:中上。
6 w8 e1 E1 _. i# V& J0 q
& q2 E9 r1 [9 |! J' ~7.       数据挖掘导论 (http://book.douban.com/subject/5377669/) 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。
( R8 p1 w3 K- G' x* e$ }9 h9 N
  `! ^( O, `  `: G/ M( l$ Z9 {! ?( I难易程度:中上。
& a9 R# }% I; Z. U1 V9 T+ q
* f' u  z" Q* {  q8.       The Elements of Statistical Learning (http://book.douban.com/subject/3294335/) 这本书有对应的中文版:统计学习基础 (http://book.douban.com/subject/1152126/)。书中配有R包,非常赞!可以参照着代码学习算法。( p  m) N( A- k$ a9 h
" Z# F! p4 u" Y8 I
难易程度:难。+ a5 l: q6 d& l1 i1 K. c

  B0 d& j6 k! S1 {9 o9.       统计学习方法 (http://book.douban.com/subject/10590856/) 李航老师的扛鼎之作,强烈推荐。
! Y! t9 z$ U0 i$ m6 ^# ~5 t" B' a* T0 S. b0 D. p6 E9 ?4 p* J
难易程度:难。 & y! u% c: P& c) m  e0 {4 ]
6 w7 [" p+ i, I. J
10.    Pattern Recognition And Machine Learning (http://book.douban.com/subject/2061116/) 经典中的经典。
& D: J( @/ v5 `- I# H( [8 t* i  d" K& i
11.    Machine Learning (http://book.douban.com/subject/10758624/) 去年出版的新书,作者Kevin Murrphy教授是机器学习领域中年少有为的代表。这书是他的集大成之作,写完之后,就去Google了,产学研结合,没有比这个更好的了。" |! c0 R- X9 G! T9 U

: w5 m1 `. D1 X& m9 X/ W12.    Bayesian Reasoning and Machine Learning (http://book.douban.com/subject/5397287/) 看名字就知道了,彻彻底底的Bayesian学派的书,里面的内容非常多,有一张图将机器学习中设计算法的关系总结了一下,很棒。6 l$ x% O% V. B
! u9 v% \! S$ N2 x& [
13.    Machine Learning for Hackers (http://book.douban.com/subject/7906768/) 也是通过实例讲解机器学习算法,用R实现的,可以一边学习机器学习一边学习R。
+ m0 M) v9 _0 l  R5 V, S7 c; f& X9 e1 l# Z0 b
14.    Probabilistic Graphical Models (http://book.douban.com/subject/4007200/) 鸿篇巨制,这书谁要是读完了告诉我一声。
7 R/ T; ]# t" E1 A1 e) R2 A
: I8 t& o. M6 x* R3 A15.    Convex Optimization (http://book.douban.com/subject/1888111/) 凸优化中最好的教材,没有之一了。课程也非常棒,Stephen老师拿着纸一步一步推到,图一点一点画,太棒了。
9 ~$ E) S6 f9 X5 X. V' F9 d. Q- q
16.    Graphical Models, Exponential Families, and Variational Inference (http://book.douban.com/subject/3722993/) 这个是Jordan老爷子和他的得意门徒 Martin J Wainwright 在 Foundation of Machine Learning Research上的创刊号,可以免费下载,比较难懂,但是一旦读通了,graphical model的相关内容就可以踏平了。
3 F# }, Z+ e: E4 I8 X5 k) Y# B
1 }5 p' y% g* K0 F17.    Introduction to Semi-Supervised Learning (http://book.douban.com/subject/3916225/) 半监督学习必读必看的书。0 b. X0 |+ C2 O3 v6 j& @0 ?
, X/ G+ [% M  s" {$ W! L6 t+ _7 B
18.    Learning to Rank for Information Retrieval (http://book.douban.com/subject/4063191/) 微软亚院刘铁岩老师关于LTR的著作,啥都不说了,推荐!
; n' x( Z4 M0 u9 a4 @% G- q) u) s* K) v$ M. h3 D6 T( C
19.    Learning to Rank for Information Retrieval and Natural Language Processing (http://book.douban.com/subject/6440223/) 李航老师关于LTR的书,也是当时他在微软亚院时候的书,可见微软亚院对LTR的研究之深,贡献之大。
4 k8 f1 Y% W1 q* x
% T! q7 o+ {! X20.    SciPy and NumPy (http://book.douban.com/subject/10561724/) 这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。
+ F7 k" E3 |" V" }4 z2 a$ \. B! Q; \/ G
21.    Python for Data Analysis (http://book.douban.com/subject/10760444/) 作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强,用pandas做数据分析!5 W: l) B8 ^6 M6 k3 v
8 D3 |8 I7 p1 s, s( ~& C! G& t
22.    Bad Data Handbook (http://book.douban.com/subject/11549309/) 很好玩的书,作者的角度很不同。( c% [0 P" Q# l, W( S6 T

作者: chb2012    时间: 2014-5-7 23:06

作者: chengshiyu    时间: 2014-5-14 12:59
chb2012 发表于 2014-5-7 23:06 8 Y4 F* H/ X0 n8 y. W

& D# [2 B; ?. y7 H& L. n3 K
作者: gancm    时间: 2014-5-15 15:32
这个很赞!!!!
作者: 一米阳光的ta    时间: 2014-5-17 12:16
必须赞啊。。。
作者: 一米阳光的ta    时间: 2014-5-17 12:16
谢谢分享啦。。。
作者: chengshiyu    时间: 2014-5-30 19:15
gancm 发表于 2014-5-15 15:32
- V+ I8 t- x8 R# w这个很赞!!!!

% ~. i: |7 T  K. |8 q* K! i" L
作者: chengshiyu    时间: 2014-5-30 19:15
一米阳光的ta 发表于 2014-5-17 12:16 + g0 s6 }3 Z% b* K$ H
必须赞啊。。。
. E. x: M  x) Z

作者: 秋枫舞    时间: 2014-6-6 14:34
mark一下,漫漫看




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5