机器学习和数据挖掘推荐书单

有了这些书，再也不愁下了班没妹纸该咋办了。慢慢来，认真学，揭开机器学习和数据挖掘这一神秘的面纱吧！

《机器学习实战》：本书第一部分主要介绍机器学习基础，以及如何利用算法进行分类，并逐步介绍了多种经典的监督学习算法，如 k 近邻算法、朴素贝叶斯算法、 Logistic 回归算法、支持向量机、 AdaBoost 集成方法、基于树的回归算法和分类回归树（ CART ）算法等。第三部分则重点介绍无监督学习及其一些主要算法： k 均值聚类算法、 Apriori 算法、 FP-Growth 算法。第四部分介绍了机器学习算法的一些附属工具。

全书通过精心编排的实例，切入日常工作任务，摒弃学术化语言，利用高效的可复用 Python 代码来阐释如何处理统计数据，进行数据分析及可视化。通过各种实例，读者可从中学会机器学习的核心算法，并能将其运用于一些策略性任务中，如分类、预测、推荐。另外，还可用它们来实现一些更高级的功能，如汇总和简化等。

之前看过一部分这本书，但是实习工作涉及到用Java代码处理数据，所以暂时先搁一下，目前正在李航的那本书。

《数据挖掘- 实用机器学习技术》：本书介绍数据挖掘的基本理论与实践方法。主要内容包括：各种模型 ( 决策树，关联规则、线性模型、聚类、贝叶斯网以及神经网络 ) 以及在实践中的运用，所存任缺陷的分析。安全地清理数据集、建立以及评估模型的预测质量的方法，并且提供了一个公开的数据挖掘工作平台 Weka 。 Weka 系统拥有进行数据挖掘仟务的图形用户界面，有助于理解模型，是一个实用并且深受欢迎的工具。

《数据挖掘：概念与技术》：本书全面地讲述数据挖掘领域的重要知识和技术创新。在第 1 版内容相当全面的基础上，第 2 版展示了该领域的最新研究成果，例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和 Web 数据。本书可作为数据挖掘和知识发现领域的教师、研究人员和开发人员的一本必读书。

《统计学习基础数据挖掘、推理与预测》：尽管应用的是统计学方法，但强调的是概念，而不是数学。许多例子附以彩图。《统计学习基础 : 数据挖掘、推理与预测》内容广泛，从有指导的学习（预测）到无指导的学习，应有尽有。包括神经网络、支持向量机、分类树和提升等主题，是同类书籍中介绍得最全面的。计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战，这导致了统计学领域新工具的发展，并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。

《机器学习》（Mitchell）：展示了机器学习中核心的算法和理论，并阐明了算法的运行过程。《机器学习》综合了许多的研究成果，例如统计学、人工智能、哲学、信息论、生物学、认知科学、计算复杂性和控制论等，并以此来理解问题的背景、算法和其中的隐含假定。《机器学习》可作为计算机专业本科生、研究生教材，也可作为相关领域研究人员、教师的参考书。

《统计学习方法》：本书全面系统地介绍了统计学习的主要方法，特别是监督学习方法，包括感知机、 k 近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、 em 算法、隐马尔可夫模型和条件随机场等。除第 1 章概论和最后一章总结外，每章介绍一种方法。叙述从具体问题或实例入手，由浅入深，阐明思路，给出必要的数学推导，便于读者掌握统计学习方法的实质，学会运用。为满足读者进一步学习的需要，书中还介绍了一些相关研究，给出了少量习题，列出了主要参考文献。

《机器学习导论》：对机器学习的定义和应用实例进行了介绍，涵盖了监督学习。贝叶斯决策理论。参数方法、多元方法、维度归约、聚类、非参数方法、决策树。线性判别式、多层感知器，局部模型、隐马尔可夫模型。分类算法评估和比较，组合多学习器以及增强学习等。

《机器学习及其应用》：全书共分 14 章，内容分别涉及因果推断、流形学习与降维、迁移学习、类别不平衡学习、演化聚类、多标记学习、排序学习、半监督学习等技术和协同过滤、社区推荐、机器翻译等应用，以及互联网应用对机器学习技术需求的探讨。

《模式分类》第二版：除了保留了第 1 版的关于统计模式识别和结构模式识别的主要内容以外，读者将会发现新增了许多近 25 年来的新理论和新方法，其中包括神经网络、机器学习、数据挖掘、进化计算、不变量理论、隐马尔可夫模型、统计学习理论和支持向量机等。

《推荐系统实践》：过大量代码和图表全面系统地阐述了和推荐系统有关的理论基础，介绍了评价推荐系统优劣的各种标准 ( 比如覆盖率、满意度 ) 和方法 ( 比如 AB 测试 ) ，总结了当今互联网领域中各种和推荐有关的产品和服务。

《深入搜索引擎-- 海量信息的压缩、索引和查询》：理论和实践并重，深入浅出地给出了海量信息数据处理的整套解决方案，包括压缩、索引和查询的方方面面。其最大的特色在于不仅仅满足信息检索理论学习的需要，更重要的是给出了实践中可能面对的各种问题及其解决方法。

《概率论与数理统计》：这本书不用过多介绍了吧，普遍大学里大一时期的教科书，只恨当年没听课啊，现在正在慢慢啃。。。

《大数据：互联网大规模数据挖掘与分布式处理》：主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。

《Web 数据挖掘》：信息检索领域的书籍，该书深入讲解了从大量非结构化 Web 数据中提取和产生知识的技术。书中首先论述了 Web 的基础（包括 Web 信息采集机制、 Web 标引机制以及基于关键字或基于相似性搜索机制），然后系统地描述了 Web 挖掘的基础知识，着重介绍基于超文本的机器学习和数据挖掘方法，如聚类、协同过滤、监督学习、半监督学习，最后讲述了这些基本原理在 Web 挖掘中的应用。《 Web 数据挖掘》为读者提供了坚实的技术背景和最新的知识。

《数据之巅》：对大数据追根溯源，提出当前信息技术的发展，已经让中国获得了后发优势，中国要在大数据时代的全球竞争中胜出，必须把大数据从科技符号提升成为文化符号，在全社会倡导数据文化。

《深入浅出统计学》：本书涵盖的知识点包括：信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区间的构建、假设检验、卡方分布、相关与回归等等，完整涵盖 AP 考试范围。

《矩阵分析》：本书从数学分析的角度论述矩阵分析的经典方法和现代方法，取材新，有一定的深度，并给出在多元微积分、复分析、微分方程、量优化、逼近理论中的许多重要应用。主要内容包括：特征值、特征向量和相似性，酉等价和正规矩阵，标准形， Hermite 矩阵和对称矩阵，向量范数和矩阵范数，特征值和估计和扰动，正定矩阵，非负矩阵。

本文由用户 jopen 自行上传分享，仅供网友学习交流。所有权归原作者，若您的权利被侵害，请联系管理员。

转载本站原创文章，请注明出处，并保留原始链接、图片水印。

本站是一个以用户分享为主的开源技术平台，欢迎各类分享！

本文地址：https://www.open-open.com/lib/view/open1445688876195.html

机器学习算法

热门搜索

机器学习和数据挖掘推荐书单