机器学习:掌握一个领域的知识需要系统的去学习,只通过一本书所学到的知识是远远不够的。此外,除了与该领域相关的技术,对应的产业发展也是格外重要。本文便以机器学习为例,由浅入深,并结合相关领域其它技术、产业等方面,为读者推荐了丰富的书目资源。
一张“迷你地图”,教你如何进击机器学习!
由图可见,想要进击机器学习,成为机器学习方面的专家,那么你需要从入门、深度学习、数据科学、R语言、Python、金融、专家级等多方面的书目,循序渐进的进行修炼。
话不多说,来看与机器学习相关,最受欢迎的书目榜单Top10吧!
1、《Scikit-Learn 与 TensorFlow 机器学习实用指南》
英文书名:Hands-On Machine Learning with Scikit-Learn and TensorFlow
作者:Aurélien Géron
出版社:O'Reilly Media
这本书通过具体的例子、很少的理论以及两款成熟的Python框架:Scikit—Learn和TensorFlow,帮助你掌握构建智能系统所需要的概念和工具。你将会学习到各种技术,从简单的线性回归到深度神经网络。每章的练习有助于你运用所学到的知识,你只需要有一些编程经验就行了。
从这本书你将学习:
探索机器学习环境,特别是神经网络
使用scikit-learn跟踪端到端的示例机器学习项目
探索几种训练模型,包括支持向量机、决策树、随机森林和集合方法
使用TensorFlow库构建和训练神经网络
深入研究神经网络架构,包括卷积网络,循环网络和深度强化学习
学习训练和scaling深度神经网络的技巧
应用实际代码示例,而无需学习过多的机器学习理论或算法细节
2、《面向数据科学家的实用统计学》
英文书名:Practical Statistics for Data Scientists: 50 Essential Concepts
作者:Peter Bruce & Andrew Bruce
出版社:O'Reilly Media
很多数据科学资源包括了统计方法,但是欠缺具有深度的统计学视角。如果你熟悉R语言编程,也对统计学有所了解,这份快速参考将帮助你搭建易学可达的知识桥梁。
从这本书你将学到:
为什么探索性数据分析是数据科学的关键步骤
随机抽样如何减少偏差,并产生更高质量的数据集,即使对于大数据也能如此
实验设计原则如何有助于得到问题的最终答案
如何使用回归来估计结果并检测异常
用于预测一个record属于哪个类别的关键分类技术
从数据中“学习”的统计机器学习方法
用于从未标记数据中提取含义的无监督学习方法
3、Python深度学习
英文书名:Deep Learning with Python
作者:Francois Chollet
出版社:Manning Publications
本书介绍使用Python语言和强大的Keras库深入深度学习领域。本书由Keras作者、Google AI研究员François Chollet撰写,通过直观的解释和实际例子帮助读者理解。你将在计算机视觉、自然语言处理和生成模型中应用具有挑战性的概念和实践。当学完本书时,你将拥有在自己的项目中应用深度学习的知识和实践技能。
从本书你将学习:
深度学习的基本原则
建立自己的深度学习环境
图像分类模型
文本和序列的深度学习
神经风格迁移、文本生成和图像生成
4、《深度学习》
英文书名:Deep Learning
作者:Ian Goodfellow, Yoshua Bengio & Aaron Courville
出版社:The MIT Press
这本“花书”被认为是名副其实的AI圣经。《深度学习》由深度学习领域三位前沿、权威的专家 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 合著,长期位居美国亚马逊人工智能类图书榜首,中文版在去年出版后更是卖到断货。
该书从浅入深介绍了基础数学知识、机器学习经验以及现阶段深度学习的理论和发展,它能帮助人工智能技术爱好者和从业人员在三位专家学者的思维带领下全方位了解深度学习。
这是一本教科书,又不只是一本教科书,任何对深度学习感兴趣的读者,阅读本书都会受益。
5、《用于数据分析的Python:Pandas,NumPy和IPython》
英文书名:Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython
作者:Wes McKinney
出版社:O'Reilly Media
本书由Python pandas项目的创建者Wes McKinney撰写,是对Python中数据科学工具的实用介绍。对于刚接触Python的分析师以及对数据科学和科学计算不熟悉的Python程序员来说,本书是理想的选择。GitHub上提供了数据文件和相关资料。
阅读本书你将学习:
使用IPython shell和Jupyter notebook进行探索性计算
学习NumPy中的基本功能和高级功能
学习使用pandas库中的数据分析工具
使用灵活的工具加载、清理、转换、合并和重塑数据
使用matplotlib创建信息可视化
将pandas groupby工具应用于slice,dice块和汇总数据集
分析和处理规则和不规则的时间序列数据
通过详细示例了解如何解决实际的数据分析问题
6、《R 数据科学》
英文名称:R for Data Science: Import, Tidy, Transform, Visualize, and Model Data
作者:Hadley Wickham、Garrett Grolemund
出版社:O'Reilly Media
本书的目标是教会读者使用重要的数据科学工具,从而为实施数据科学奠定坚实的基础。 读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。
本书适合R数据科学家阅读。
7、《Python 数据科学手册》
英文名称:Python Data Science Handbook: Essential Tools for Working with Data
作者:Jake VanderPlas
出版社:O'Reilly Media
本书是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第 2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为重要的机器学习算法提供了高效整洁的Python版实现。
本书适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。
8、《Python 机器学习》
英文名称:Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow
作者:Sebastian Raschka、Vahid Mirjalili
出版社:Packt Publishing - ebooks Account
机器学习正在吞噬软件世界,而深度学习正在扩展机器学习。 通过第二版Sebastian Raschka的畅销书《Python机器学习》,可以了解并实现机器学习、神经网络和深度学习的最前沿的知识。 本书使用最新的Python开源库进行了彻底的更新,提供了创建机器学习,深度学习和现代数据分析所需的实用知识和技术。
从本书中,你将学到:
了解数据科学、机器学习和深度学习的关键框架
使用在机器学习中Python最新的开源库
使用具有挑战性的真实数据探索机器学习技术
使用TensorFlow库掌握深度神经网络
了解分类算法的机制,以实现最佳工作
使用回归分析预测连续目标结果
通过聚类发现数据中的隐藏模式和结构
使用情绪分析深入挖掘文本和社交媒体数据
9、《Python袖珍指南》
英文名称:Python Pocket Reference: Python In Your Pocket (Pocket Reference (O'Reilly))
作者:Mark Lutz
出版社:O'Reilly Media
对于的Python 3.4和2.7而言,本指南是完美的实战快速参考。你从中将会学习有关Python类型和语句、特殊方法名、内建函数与异常、常用的标准库模块及其他的Python工具。
由Mark Lutz这位公认为的Python领导者编写的《Python袖珍指南(第五版)》,是仍由Mark编写的经典Python教程(《Learning Python》和《Programming Python》,O’Reilly出版)的理想助手。
本书涵盖内容:
内建对象类型,包括数字、列表、字典等更多内容
创建和处理对象的语句和语法
结构化和重用代码所用的函数与模块
Python面向对象的编程工具
内建函数、异常和属性
专有运算符重载方法
广泛应用的标准库模块和扩展
命令行选项与开发工具
Python的习语与提示
Python的SQL数据库API
10、《统计学习基础》
英文名称:The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition (Springer Series in Statistics)
作者:Trevor Hastie、 Robert Tibshirani
出版社:Springer
计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语来表达。《统计学习基础(第2版)(英文)》介绍了这些领域的一些重要概念。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。《统计学习基础(第2版)(英文)》内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得*全面的。
《统计学习基础(第2版)(英文)》可作为高等院校相关专业本科生和研究生的教材,对于统计学相关人员、科学界和业界关注数据挖掘的人,《统计学习基础(第2版)(英文)》值得一读。