数学建模社区-数学中国

标题: 数据分析、挖掘的好书推荐——干货分享 [打印本页]

作者: chengshiyu    时间: 2014-5-6 22:06
标题: 数据分析、挖掘的好书推荐——干货分享
我找了好久才找到的资料,分享出来给咱们数模人!共同提高,共同进步!
  j0 P# h2 F1 x1. 深入浅出数据分析 (http://book.douban.com/subject/5257905/) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。
7 \% [5 X6 L7 v* n
6 h1 p" J3 l. O! E" E难易程度:非常易。
( g  ]- t+ @# ]- y' q' F7 u7 ?% w
2.       啤酒与尿布 (http://book.douban.com/subject/3283973/) 通过案例来说事情,而且是最经典的例子。7 ~! B8 a6 E7 a( G4 U$ D
6 Z* U( `7 K! q8 k
难易程度:非常易。
" I+ b: p% I& I' y. b
4 ?" D, Q8 V' a  X7 }2 k3.       数据之美 (http://book.douban.com/subject/5269219/) 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。
- y; m2 y, r( V0 m& d& n6 m4 k# Q- v+ e3 M: s9 i( M
难易程度:易。' g( p. Y+ k8 q+ s

$ t( ?9 f' P+ [$ ]$ Y' ]- e4.       集体智慧编程 (http://book.douban.com/subject/3288908/) 学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。! v7 `; s: A5 n" t0 V7 a$ P
$ ~' o5 b2 E' Q3 p8 T+ b: V
难易程度:中。
$ }. n$ F# U) _# \9 P1 d/ [, U
5.       Machine Learning in Action (http://book.douban.com/subject/6962285/) 用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博: @王斌_ICTIR)已经翻译这本书了 机器学习实战 (http://book.douban.com/subject/24703171/)。这本书本身质量就很高,王老师的翻译质量也很高。, E5 I# F. v$ G' b% N7 J  H

8 z3 i. R& e! p! E难易程度:中。
6 M- P' n4 b0 `4 R. N+ U  ]3 p% W5 d7 u. d$ |5 `
6.       推荐系统实践 (http://book.douban.com/subject/10769749/) 这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。, V# D1 i2 n% Q! {1 k( B$ a

6 `( w# z; c7 L* ?- k难易程度:中上。
; t' ^9 X, e* B# B! B& ?  ~5 l8 p" G1 d- {, g# _
7.       数据挖掘导论 (http://book.douban.com/subject/5377669/) 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。/ R# Z* @; r/ O/ n' \' Q

) D, A' ^# I) h* u% V5 ^: @难易程度:中上。
# d0 U/ @# W* B
6 g# k1 t  ~+ E: Y8.       The Elements of Statistical Learning (http://book.douban.com/subject/3294335/) 这本书有对应的中文版:统计学习基础 (http://book.douban.com/subject/1152126/)。书中配有R包,非常赞!可以参照着代码学习算法。
. j! q8 s5 |5 Z/ }9 N$ E
2 S3 T# D3 r, S( ]难易程度:难。  n" x; H3 ~! `
6 M! [( O$ {4 Q' C" K9 E+ t
9.       统计学习方法 (http://book.douban.com/subject/10590856/) 李航老师的扛鼎之作,强烈推荐。
% F% y2 p, e3 [3 s3 s$ A: Q2 J% F% [- v( s5 L  A2 R0 ?/ G* ]
难易程度:难。
& X4 v4 J; E) N5 l" A! X3 ], a- I7 p
10.    Pattern Recognition And Machine Learning (http://book.douban.com/subject/2061116/) 经典中的经典。# |+ @8 e8 Y+ s5 V* d2 A
6 S8 R9 R6 M: ?6 g
11.    Machine Learning (http://book.douban.com/subject/10758624/) 去年出版的新书,作者Kevin Murrphy教授是机器学习领域中年少有为的代表。这书是他的集大成之作,写完之后,就去Google了,产学研结合,没有比这个更好的了。) k' I. B; I, Y9 k- r0 ^3 U, k

6 c. b  `* }4 w; l$ [' o$ @3 n12.    Bayesian Reasoning and Machine Learning (http://book.douban.com/subject/5397287/) 看名字就知道了,彻彻底底的Bayesian学派的书,里面的内容非常多,有一张图将机器学习中设计算法的关系总结了一下,很棒。
  g3 I; e/ c; g8 M- f1 n9 D( o3 k, U6 V- U
13.    Machine Learning for Hackers (http://book.douban.com/subject/7906768/) 也是通过实例讲解机器学习算法,用R实现的,可以一边学习机器学习一边学习R。
' {3 h4 x: A! d# d
' W% |# b$ X! J14.    Probabilistic Graphical Models (http://book.douban.com/subject/4007200/) 鸿篇巨制,这书谁要是读完了告诉我一声。
& Z/ n) d$ e2 ?+ ]/ {0 y$ Z; y% j9 j* s: r# W* z, L$ ~# m7 U
15.    Convex Optimization (http://book.douban.com/subject/1888111/) 凸优化中最好的教材,没有之一了。课程也非常棒,Stephen老师拿着纸一步一步推到,图一点一点画,太棒了。
3 k: w% n9 }! @3 @0 l
7 J4 g3 A  \, C+ a16.    Graphical Models, Exponential Families, and Variational Inference (http://book.douban.com/subject/3722993/) 这个是Jordan老爷子和他的得意门徒 Martin J Wainwright 在 Foundation of Machine Learning Research上的创刊号,可以免费下载,比较难懂,但是一旦读通了,graphical model的相关内容就可以踏平了。6 q% w0 o0 V8 ^; A* \
5 I* T7 r0 Z' _
17.    Introduction to Semi-Supervised Learning (http://book.douban.com/subject/3916225/) 半监督学习必读必看的书。2 E: Q% M7 J$ X
3 I, B) h2 Y  l% D" o( q
18.    Learning to Rank for Information Retrieval (http://book.douban.com/subject/4063191/) 微软亚院刘铁岩老师关于LTR的著作,啥都不说了,推荐!
. `0 X; A6 r# a' |5 j9 i: O, `0 L; b# q
19.    Learning to Rank for Information Retrieval and Natural Language Processing (http://book.douban.com/subject/6440223/) 李航老师关于LTR的书,也是当时他在微软亚院时候的书,可见微软亚院对LTR的研究之深,贡献之大。1 w( Z, y; u5 R
5 J( Z; H0 ^' _
20.    SciPy and NumPy (http://book.douban.com/subject/10561724/) 这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。; v/ k9 {4 h, s3 ]- \/ L) I

6 Q# W2 _' u. y! e21.    Python for Data Analysis (http://book.douban.com/subject/10760444/) 作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强,用pandas做数据分析!
0 {$ z% r' p( I+ L* `0 M  D8 K  {  W; ^; g- p; D5 T4 o, l
22.    Bad Data Handbook (http://book.douban.com/subject/11549309/) 很好玩的书,作者的角度很不同。
* C6 ^8 {8 p. X) W' ~
作者: chb2012    时间: 2014-5-7 23:06

作者: chengshiyu    时间: 2014-5-14 12:59
chb2012 发表于 2014-5-7 23:06
2 _6 s5 x9 f4 z4 A, j

; R0 v) A+ X, l6 b! a4 |
作者: gancm    时间: 2014-5-15 15:32
这个很赞!!!!
作者: 一米阳光的ta    时间: 2014-5-17 12:16
必须赞啊。。。
作者: 一米阳光的ta    时间: 2014-5-17 12:16
谢谢分享啦。。。
作者: chengshiyu    时间: 2014-5-30 19:15
gancm 发表于 2014-5-15 15:32
: f% x6 P6 Z' C+ `: H这个很赞!!!!
$ L, }4 F6 P' x; D, S& ]

作者: chengshiyu    时间: 2014-5-30 19:15
一米阳光的ta 发表于 2014-5-17 12:16
2 G- M) X4 _, T1 Z必须赞啊。。。

3 t7 Y6 @- [" ]0 d" P) ~
作者: 秋枫舞    时间: 2014-6-6 14:34
mark一下,漫漫看




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5