数据科学免费电子书25强合集:从数学基础到机器学习,吴恩达、Bengio等专家出品-量子位
- 时间:
- 浏览:0
要学习数据科学,到底应该读什么样的书呢
网上的免费内容、评论让人眼花缭乱,千方百计地动手的话,就会有从开始到停止的心情。
Medium博主布伦达哈里总结了数据科学最好的免费电子书集
前25名的选手从数学中选择Python、数据挖掘、机器学习等所有东西
数学类
学习人工智能首先需要巩固数学基础。数学的前六名如下。
统计学习序言:基于R应用
书名:An Introduction to Statistical Learning
该书由南加州大学马歇尔商学院校长Gareth James等人出版,主要针对非数学专业的本科生、硕士博士生。
这本书的内容主要用R语言实现,详细说明了统计学习方法在实际生活中的应用实例。
然后,人大统计学院王星王副教授把这本书翻译成了中文。
地址:http://faculty.marshall.usc.edu/gareth-james/isl/
统计思维程序员数学的概率统计
书名:Think Stats
这本书的作者是美国计算机科学家艾伦B唐尼。在《统计思考》中,介绍了可以使用真实的数据集进行探索的简单技术。
这本书使用美国国立卫生研究所的数据进行了案例研究。还有GitHub存储库,提供了代码示例。
地址:https://bit.ly/2Morui2来修改标记元素的显示属性。
github:https://github.com/allendowney/thinkstats2
它是统计学习的基础
书名:Statistical Learning:Data Mining,Inference,and Prediction
斯坦福大学教授Trevor Hastie说,这本书强调的是概念而不是数学本身,内文采用大量的图表来展示范例。
本书从有教师学习到无教师学习,涉及面很广。
地址:https://web.stanford.edu/~hastie/elemstatlearn/
简明贝叶斯统计
书名:Think Bayes:Bayesian Statistics Made Simple
大多数关于贝叶斯统计的书都用数学符号来表达想法。这本书用Python码代替数学符号,并用离散近似代替连续。
这本书也附带了代码,但也有提供IPython notebooks版的人,可以在线修改代码并运行。
地址:。
ipython notebook:https://mybinder.org/repo/rlabbe/thinkbayes
贝叶斯方法,概率编程和贝叶斯推理
书名:Probabilistic Programming amp;Bayesian Methods for Hackers
这本书的目标从计算/理解第一,数学的第二个角度介绍贝叶斯的估计。作为一本入门书,这门不是数学专业,适合对数学不那么感兴趣的贝叶斯方法实践者。
地址:http://camdavidsonpilon.github.io/probabilistic-programming-and-bayesian-methods-for-hackers/
计算机时代的统计推论
书名:计算机Age Statistical Inference
由斯坦福大学的Bradley Efron和Trevor Hastie制作的经典推论理论开始,以统计和数据科学应该前进的方向的推测结尾的这本书,回顾1950年以后的数据分析革命的始末。
生存分析,逻辑回归,经典贝叶斯,随机森林,神经网络,马尔可夫链蒙特卡罗方法…这本书里都有
地址:http://web.stanford.edu/~hastie/CASI/。
数据科学
数学的说明结束后,终于要转到数据科学了。推荐的书一共有6本。
数据分析样式
这本书侧重于传统统计学课程和教科书中容易被忽略的细节,也可以作为数据科学和数据分析的入门课程教材。
地址:https://leanpub.com/datastyle
它是为程序员编写的数据挖掘手册
书名:The Ancient Art of The Numerati
这是学习基本数据挖掘的入门书。
很多数据挖掘的书都是以理论知识为重点写的,理论知识非常重要,但无论如何都要脚踏实地。如果你想在程序员中了解数据挖掘的初步情况,我推荐这本书。
因为本书是用“边学习边写”写的,所以强烈推荐实践一下各章结束时提供的练习题。
地址:http://guidetodatamining.com/
中文原版:https://github.com/yourtion/dataminingguidebook
它是社交媒体挖掘
书的标题是Social Media Mining:An Introduction
本书整合了社交媒体、社交网络分析和数据挖掘,为了解社交媒体挖掘的基础和可能性提供了一个便捷的平台。
本书适合作为高年级本科生、研究生课程和专业短期课程的教材。难度包括各种练习,可以加深读者的理解。
地址:http://dmml.asu.edu/smm/book/
它是数据科学的艺术
书名:数据科学
本书介绍了数据分析的过程。作者是约翰斯霍普金斯大学的Roger D.Peng教授(生物统计学)和UT奥斯汀教授Elizabeth Matsui(熟悉数据分析)
地址:http://bedford-computing.co.uk/learning/wp-content/uploads/2016/09/artofdatascience.pdf
数据科学手册
书的标题是The Data Science Handbook
这本书总结了25位优秀的数据科学家的深度采访,其中有来自该领域专家的见解、故事和建议。
地址:https://www.thedatasciencehandbook.com/
数据科学对话
书名:Conversations On Data Science
约翰斯霍普金斯大学的Roger D.Peng教授(生物统计学)和Stitch Fix的Hilary Parker的对话,以数据科学在现实世界中如何运作为主题。
地址:https://leanpub.com/conversationsondatascience
我是Python
因为人生很短,所以使用Python学习人工智能,无论如何Python都是不可缺少的。
Python面向对象编程
书名:object-oriented Programming with Python
这本书是Python3面向对象编程的简明而权威的手册。语言简单,概念清晰。面向已经理解Python的中级者。
地址:https://leanpub.com/pythonoop
快速完成Python编程:自动化繁琐的工作。
书的标题是Automate the Boring Stuff with Python
本书是用于实践Python编程的手册。我不仅想介绍Python语言的基础知识,还想通过项目实践,教大家如何应用该知识和技能。每一章的结尾都有一道习题和实践项目,附录中都写着可供参考的答案。
面向编程初学者。
地址:https://automatetheboringstuff.com/
日文版:https://bit.ly/2PUo0Wx
Python数据科学手册
书名:Python Data Science Handbook
Python科学计算所需的资料。
这本书最适合作为解决日常问题的参考书,如数据处理、转换、擦除等,使用可视化的数据来创建统计或机器学习模型。
地址:http://shop.oreilly.com/product/0636920034919.do
Learn Python,Break Python
这本书从肤浅的地方开始,从编程的简单介绍开始,一步一步地引入更复杂的程序元素。面向初学者。
地址:https://learnpythonbreakpython.com/
Python自然语言处理
书名:naturallanguageprocessingwithpython
本书简单易懂地介绍了自然语言处理。你可以从中学习如何编写适合大量非结构化文本的Python程序。
地址:https://www.nltk.org/book/
产品中的数据科学
书名:Data Science in Production
从初创企业到数万亿美元的大公司,数据科学在最大化数据价值方面发挥着重要作用。本书以想在多个云环境构筑数据产品,开发应用数据科学技能的分析人员为对象。
地址:https://leanpub.com/productiondatascience
数据驱动
书名:数据驱动
介绍了Google、Linkedln、Facebook如何活用本公司的数据,以及沃尔玛、UPS、其他企业如何在大数据时代到来之前活用数据资源。
地址:https://www.oreilly.com/library/view/data-driven/9781491925454/
机器学习
接下来,进入机器学习书的推荐角。
ScikitLearn和TensorFlow机器学习实用指南
书名:Hands-onmachinelearningwithscikit-learnandtensorflow
在一个具体的例子中,通过最小的理论和scikit-learn,TensorFlow这两个大的工具,作者直观地展示了构建人工智能系统的概念和工具。同样,从浅到深依次进行,从简单的线性回归开始,深入神经网络。
地址:https://github.com/Ageron/Handson-ml
深入了解机器学习:从原理到算法
书名:understandingmachinelearning:fromtheorytoalgorithms
本文探讨了学习的计算复杂度、凸性和稳定性、PAC-贝叶斯方法、压缩界等概念,介绍了随机梯度下降、神经网络、结构化输出等重要算法范式。
适合有基础的高年级本科生和研究生学习,也适合作为从事IT行业数据分析和挖掘的专家和研究人员参考阅读。
地址:https//www.CSE.Huji.AC.il/~shais/understandingmachinelearning/TOC.html
强化学习概述
书名:reinforcementlearning:anintroduction
本书简明扼要地介绍了强化学习领域的重要思想和算法。
礼服:http://incompleteideas.net/book/the-book.html
深度学习
书名:Deep Learning
Ian Goodfellow,Yoshua Bengio和Aaron Courville共同撰写。旨在帮助学生和员工全面了解机器学习,特别是深度学习。
地址:http://www.deeplearningbook.org/
Machine Learning Yearning
吴恩达制。本书的重点不是机器学习算法本身,而是如何使机器学习算法工作。
地址:
htps://github.com/amusi/machine-learning-yearning-cn
数据可视化D3Tips and Tricks
最后推荐一本关于数据可视化的书。
D3Tips and Tricks介绍了一种利用d3.js工具可视化数据的方法。它包括50多个可下载的代码示例。
地址:https://leanpub.com/D3-tips-and-tricks
那么,拿着书信,早点学习吧~
博客:https//towardsdatascience.com/the-best-free-data-science-ebooks-b671691e5231
-结束了