
精通数据清洗与预测建模——基于 Scikit-Learn 的机器学习实战
内容简介
《Ultimate Machine Learning with Scikit-Learn》是一本权威资源,深入讲解了数据准备、建模技术以及强大机器学习算法背后的理论基础,并结合 Python 与 Scikit-Learn 进行实践。
本书从基础技术入手,首先讲解高效数据预处理的核心技能,为后续的稳健分析奠定基础。接着,你将学习逻辑回归和决策树,掌握预测建模的核心工具,确保对关键方法论有扎实的理解。随后,你将深入时间序列数据分析,并通过朴素贝叶斯学习处理非结构化数据的有效策略。
在过渡到实时数据流分析时,本书将介绍 K 近邻算法(KNN)的动态方法,并结合支持向量机(SVM)处理高维数据。同时,你将学习如何使用孤立森林进行异常检测,并在股票市场数据分析中利用集成方法提升预测性能。
读完本书后,你将精通数据工程与机器学习流水线(ML Pipelines),具备应对最复杂分析任务的信心与能力。
目录
- 使用线性回归进行数据预处理
- 结构化数据与逻辑回归
- 时间序列数据与决策树
- 非结构化数据处理与朴素贝叶斯
- 实时数据流与 K 近邻算法
- 稀疏分布数据与支持向量机
- 异常检测与孤立森林
- 股票市场数据与集成方法
- 高级分析中的数据工程与机器学习流水线 附录:索引