# 机器学习基础~01.概述

## 概述

>[!summary]  摘要
>本文讲述数据挖掘和机器学习的概念，以及其基本工作流程。

**数据挖掘 (Data Mining)** ：是一种知识发现，是从海量数据中提取隐含的、先前未知的、具有潜在价值的信息。

**机器学习（Machine Learning）** ：是通过算法使计算机从数据中学习规律，建立模型，使计算机能够自动做出决策和预测。

>[!info]  信息
>「数据挖掘」和「机器学习」有着很强的相关性，知识体系有许多交叉，本文不对两者进行区分，统一讲述其工作流程。

工作流程：

- **商业理解**：确定业务对象、确定数据挖掘目标、制订工程计划
- **数据理解**：收集初始数据、描述数据 、探索数据、验证数据质量
- **数据准备**：特征提取与选择、数据清洗 、数据转换 、数据集成
- **建立模型**：选择建模技术、生成测试设计、构建和评估模型
- **模型评估**：评估结果、查看数据挖掘过程、确定后续步骤
- **模型部署**：计划部署、监视和维护 、生成最终报告、复查

在接下来的篇章中，我们将逐个讲述这些过程。


---

> 作者: Aphros  
> URL: https://blog.papergate.top/posts/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80~01.%E6%A6%82%E8%BF%B0/  

