三三文章网 - 科技知识大全是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域

数据科学免费电子书25强合集:从数学基础到机器学习,吴恩达、Bengio等专家出品-量子位

  • 时间:
  • 浏览:0

要学习数据科学,到底应该读什么样的书呢

网上的免费内容、评论让人眼花缭乱,千方百计地动手的话,就会有从开始到停止的心情。

Medium博主布伦达哈里总结了数据科学最好的免费电子书集

前25名的选手从数学中选择Python、数据挖掘、机器学习等所有东西

数学类

学习人工智能首先需要巩固数学基础。数学的前六名如下。

统计学习序言:基于R应用

书名:An Introduction to Statistical Learning

该书由南加州大学马歇尔商学院校长Gareth James等人出版,主要针对非数学专业的本科生、硕士博士生。

这本书的内容主要用R语言实现,详细说明了统计学习方法在实际生活中的应用实例。

然后,人大统计学院王星王副教授把这本书翻译成了中文。

地址:http://faculty.marshall.usc.edu/gareth-james/isl/

统计思维程序员数学的概率统计

书名:Think Stats

这本书的作者是美国计算机科学家艾伦B唐尼。在《统计思考》中,介绍了可以使用真实的数据集进行探索的简单技术。

这本书使用美国国立卫生研究所的数据进行了案例研究。还有GitHub存储库,提供了代码示例。

地址:https://bit.ly/2Morui2来修改标记元素的显示属性。

github:https://github.com/allendowney/thinkstats2

它是统计学习的基础

书名:Statistical Learning:Data Mining,Inference,and Prediction

斯坦福大学教授Trevor Hastie说,这本书强调的是概念而不是数学本身,内文采用大量的图表来展示范例。

本书从有教师学习到无教师学习,涉及面很广。

地址:https://web.stanford.edu/~hastie/elemstatlearn/

简明贝叶斯统计

书名:Think Bayes:Bayesian Statistics Made Simple

大多数关于贝叶斯统计的书都用数学符号来表达想法。这本书用Python码代替数学符号,并用离散近似代替连续。

这本书也附带了代码,但也有提供IPython notebooks版的人,可以在线修改代码并运行。

地址:。

ipython notebook:https://mybinder.org/repo/rlabbe/thinkbayes

贝叶斯方法,概率编程和贝叶斯推理

书名:Probabilistic Programming amp;Bayesian Methods for Hackers

这本书的目标从计算/理解第一,数学的第二个角度介绍贝叶斯的估计。作为一本入门书,这门不是数学专业,适合对数学不那么感兴趣的贝叶斯方法实践者。

地址:http://camdavidsonpilon.github.io/probabilistic-programming-and-bayesian-methods-for-hackers/

计算机时代的统计推论

书名:计算机Age Statistical Inference

由斯坦福大学的Bradley Efron和Trevor Hastie制作的经典推论理论开始,以统计和数据科学应该前进的方向的推测结尾的这本书,回顾1950年以后的数据分析革命的始末。

生存分析,逻辑回归,经典贝叶斯,随机森林,神经网络,马尔可夫链蒙特卡罗方法…这本书里都有

地址:http://web.stanford.edu/~hastie/CASI/。

数据科学

数学的说明结束后,终于要转到数据科学了。推荐的书一共有6本。

数据分析样式

这本书侧重于传统统计学课程和教科书中容易被忽略的细节,也可以作为数据科学和数据分析的入门课程教材。

地址:https://leanpub.com/datastyle

它是为程序员编写的数据挖掘手册

书名:The Ancient Art of The Numerati

这是学习基本数据挖掘的入门书。

很多数据挖掘的书都是以理论知识为重点写的,理论知识非常重要,但无论如何都要脚踏实地。如果你想在程序员中了解数据挖掘的初步情况,我推荐这本书。

因为本书是用“边学习边写”写的,所以强烈推荐实践一下各章结束时提供的练习题。

地址:http://guidetodatamining.com/

中文原版:https://github.com/yourtion/dataminingguidebook

它是社交媒体挖掘

书的标题是Social Media Mining:An Introduction

本书整合了社交媒体、社交网络分析和数据挖掘,为了解社交媒体挖掘的基础和可能性提供了一个便捷的平台。

本书适合作为高年级本科生、研究生课程和专业短期课程的教材。难度包括各种练习,可以加深读者的理解。

地址:http://dmml.asu.edu/smm/book/

它是数据科学的艺术

书名:数据科学

本书介绍了数据分析的过程。作者是约翰斯霍普金斯大学的Roger D.Peng教授(生物统计学)和UT奥斯汀教授Elizabeth Matsui(熟悉数据分析)

地址:http://bedford-computing.co.uk/learning/wp-content/uploads/2016/09/artofdatascience.pdf

数据科学手册

书的标题是The Data Science Handbook

这本书总结了25位优秀的数据科学家的深度采访,其中有来自该领域专家的见解、故事和建议。

地址:https://www.thedatasciencehandbook.com/

数据科学对话

书名:Conversations On Data Science

约翰斯霍普金斯大学的Roger D.Peng教授(生物统计学)和Stitch Fix的Hilary Parker的对话,以数据科学在现实世界中如何运作为主题。

地址:https://leanpub.com/conversationsondatascience

我是Python

因为人生很短,所以使用Python学习人工智能,无论如何Python都是不可缺少的。

Python面向对象编程

书名:object-oriented Programming with Python

这本书是Python3面向对象编程的简明而权威的手册。语言简单,概念清晰。面向已经理解Python的中级者。

地址:https://leanpub.com/pythonoop

快速完成Python编程:自动化繁琐的工作。

书的标题是Automate the Boring Stuff with Python

本书是用于实践Python编程的手册。我不仅想介绍Python语言的基础知识,还想通过项目实践,教大家如何应用该知识和技能。每一章的结尾都有一道习题和实践项目,附录中都写着可供参考的答案。

面向编程初学者。

地址:https://automatetheboringstuff.com/

日文版:https://bit.ly/2PUo0Wx

Python数据科学手册

书名:Python Data Science Handbook

Python科学计算所需的资料。

这本书最适合作为解决日常问题的参考书,如数据处理、转换、擦除等,使用可视化的数据来创建统计或机器学习模型。

地址:http://shop.oreilly.com/product/0636920034919.do

Learn Python,Break Python

这本书从肤浅的地方开始,从编程的简单介绍开始,一步一步地引入更复杂的程序元素。面向初学者。

地址:https://learnpythonbreakpython.com/

Python自然语言处理

书名:naturallanguageprocessingwithpython

本书简单易懂地介绍了自然语言处理。你可以从中学习如何编写适合大量非结构化文本的Python程序。

地址:https://www.nltk.org/book/

产品中的数据科学

书名:Data Science in Production

从初创企业到数万亿美元的大公司,数据科学在最大化数据价值方面发挥着重要作用。本书以想在多个云环境构筑数据产品,开发应用数据科学技能的分析人员为对象。

地址:https://leanpub.com/productiondatascience

数据驱动

书名:数据驱动

介绍了Google、Linkedln、Facebook如何活用本公司的数据,以及沃尔玛、UPS、其他企业如何在大数据时代到来之前活用数据资源

地址:https://www.oreilly.com/library/view/data-driven/9781491925454/

机器学习

接下来,进入机器学习书的推荐角。

ScikitLearn和TensorFlow机器学习实用指南

书名:Hands-onmachinelearningwithscikit-learnandtensorflow

在一个具体的例子中,通过最小的理论和scikit-learn,TensorFlow这两个大的工具,作者直观地展示了构建人工智能系统的概念和工具。同样,从浅到深依次进行,从简单的线性回归开始,深入神经网络。

地址:https://github.com/Ageron/Handson-ml

深入了解机器学习:从原理到算法

书名:understandingmachinelearning:fromtheorytoalgorithms

本文探讨了学习的计算复杂度、凸性和稳定性、PAC-贝叶斯方法、压缩界等概念,介绍了随机梯度下降、神经网络、结构化输出等重要算法范式。

适合有基础的高年级本科生和研究生学习,也适合作为从事IT行业数据分析和挖掘的专家和研究人员参考阅读。

地址:https//www.CSE.Huji.AC.il/~shais/understandingmachinelearning/TOC.html

强化学习概述

书名:reinforcementlearning:anintroduction

本书简明扼要地介绍了强化学习领域的重要思想和算法。

礼服:http://incompleteideas.net/book/the-book.html

深度学习

书名:Deep Learning

Ian Goodfellow,Yoshua Bengio和Aaron Courville共同撰写。旨在帮助学生和员工全面了解机器学习,特别是深度学习。

地址:http://www.deeplearningbook.org/

Machine Learning Yearning

吴恩达制。本书的重点不是机器学习算法本身,而是如何使机器学习算法工作。

地址:

htps://github.com/amusi/machine-learning-yearning-cn

数据可视化D3Tips and Tricks

最后推荐一本关于数据可视化的书。

D3Tips and Tricks介绍了一种利用d3.js工具可视化数据的方法。它包括50多个可下载的代码示例。

地址:https://leanpub.com/D3-tips-and-tricks

那么,拿着书信,早点学习吧~

博客:https//towardsdatascience.com/the-best-free-data-science-ebooks-b671691e5231

-结束了