《图解机器学习算法(全彩印刷)》([日]秋庭伸也 [日]杉山阿圣 [日]寺田学|译者:郑明智)-图书推荐
编辑推荐语
152张图表,轻松掌握17种常用算法!没有复杂公式,零基础也可轻松读懂!1.全面 网罗有监督学习和无监督学习的17种算法,涉及回归、分类、降维、聚类等问题。2.直观 全彩图解,让原本抽象复杂的算法变得一目了然,方便读者快速了解各算法的特征,学会如何选择恰当的算法。3.易懂 几乎没有数学公式和统计术语,零基础也可轻松读懂。4.实现 各算法均用Python代码实现,基于Python 3.7版本,读者可下载配套代码资源,边试边学。
内容提要
本书基于丰富的图示,详细介绍了有监督学习和无监督学习的17种算法,包括线性回归、正则化、逻辑回归、支持向量机、核方法、朴素贝叶斯、随机森林、神经网络、KNN、PCA、LSA、NMF、LDA、k-means算法、混合高斯分布、LLE和t-SNE。书中针对各算法均用Python代码进行了实现,读者可一边运行代码一边阅读,从而加深对算法的理解。
作者简介
秋庭伸也(作者)日本早稻田大学硕士毕业,目前在Recruit Communications公司担任技术负责人。 杉山阿圣(作者)具有多年研发经验,目前在AI创业公司SENSY担任机器学习研究员。 寺田学(作者) CMS Communications公司董事长、日本PyCon会议组织者、Plone基金会大使、Python工程师发展协会顾问理事、PSF(Python软件基金会)贡献成员。郑明智(译者)智慧医疗工程师,翻译经验丰富,有《白话机器学习的数学》《用Python动手学机器学习》等多部译著。
目录
第1章
机器学习基础1
1.1机器学习概要2
什么是机器学习2
机器学习的种类3
机器学习的应用8
1.2机器学习的步骤9
数据的重要性9
有监督学习(分类)的例子11
无监督学习(聚类)的例子16
可视化18
图形的种类和画法:使用Matplotlib显示图形的方法22
使用pandas理解和处理数据30
本章小结36
第2章
有监督学习37
2.1算法1:线性回归38
概述38
算法说明39
详细说明41
2.2算法2:正则化45
概述45
算法说明48
详细说明50
2.3算法3:逻辑回归52
概述52
算法说明53
详细说明55
2.4算法4:支持向量机58
概述58
算法说明59
详细说明60
2.5算法5:支持向量机(核方法)63
概述63
算法说明64
详细说明65
2.6算法6:朴素贝叶斯68
概述68
算法说明70
详细说明74
2.7算法7:随机森林76
概述76
算法说明77
详细说明80
2.8算法8:神经网络81
概述81
算法说明83
详细说明86
2.9算法9:KNN88
概述88
算法说明89
详细说明90
第3章
无监督学习93
3.1算法10:PCA94
概述94
算法说明95
详细说明98
3.2算法11:LSA99
概述99
算法说明100
详细说明104
3.3算法12:NMF105
概述105
算法说明106
详细说明108
3.4算法13:LDA111
概述111
算法说明112
详细说明114
3.5算法14:k-means算法117
概述117
算法说明117
详细说明119
3.6算法15:混合高斯分布122
概述122
算法说明123
详细说明126
3.7算法16:LLE127
概述127
算法说明128
详细说明131
3.8算法17:t-SNE133
概述133
算法说明134
详细说明136
第4章
评估方法和各种数据的处理139
4.1评估方法140
有监督学习的评估140
分类问题的评估方法140
回归问题的评估方法148
均方误差和决定系数指标的不同152
与其他算法进行比较152
超参数的设置154
模型的过拟合155
防止过拟合的方法155
将数据分为训练数据和验证数据156
交叉验证158
搜索超参数160
4.2文本数据的转换处理163
基于单词出现次数的转换163
基于tf-idf的转换164
应用于机器学习模型165
4.3图像数据的转换处理167
直接将像素信息作为数值使用167
将转换后的向量数据作为输入来应用机器学习模型168
第5章
环境搭建171
5.1Python 3的安装172
Windows172
macOS172
Linux173
使用Anaconda在Windows上安装174
5.2虚拟环境175
通过官方安装程序安装Python的情况175
通过Anaconda安装Python的情况177
5.3第三方包的安装178
什么是第三方包178
安装第三方包的方法178
参考文献180