机器学习基础~01.概述
目录
第 1 节 概述
摘要
本文讲述数据挖掘和机器学习的概念,以及其基本工作流程。
数据挖掘 (Data Mining) :是一种知识发现,是从海量数据中提取隐含的、先前未知的、具有潜在价值的信息。
机器学习(Machine Learning) :是通过算法使计算机从数据中学习规律,建立模型,使计算机能够自动做出决策和预测。
信息
「数据挖掘」和「机器学习」有着很强的相关性,知识体系有许多交叉,本文不对两者进行区分,统一讲述其工作流程。
工作流程:
- 商业理解:确定业务对象、确定数据挖掘目标、制订工程计划
- 数据理解:收集初始数据、描述数据 、探索数据、验证数据质量
- 数据准备:特征提取与选择、数据清洗 、数据转换 、数据集成
- 建立模型:选择建模技术、生成测试设计、构建和评估模型
- 模型评估:评估结果、查看数据挖掘过程、确定后续步骤
- 模型部署:计划部署、监视和维护 、生成最终报告、复查
在接下来的篇章中,我们将逐个讲述这些过程。