机器学习基础~01.概述

目录

第 1 节 概述

摘要

本文讲述数据挖掘和机器学习的概念,以及其基本工作流程。

数据挖掘 (Data Mining) :是一种知识发现,是从海量数据中提取隐含的、先前未知的、具有潜在价值的信息。

机器学习(Machine Learning) :是通过算法使计算机从数据中学习规律,建立模型,使计算机能够自动做出决策和预测。

信息

「数据挖掘」和「机器学习」有着很强的相关性,知识体系有许多交叉,本文不对两者进行区分,统一讲述其工作流程。

工作流程:

  • 商业理解:确定业务对象、确定数据挖掘目标、制订工程计划
  • 数据理解:收集初始数据、描述数据 、探索数据、验证数据质量
  • 数据准备:特征提取与选择、数据清洗 、数据转换 、数据集成
  • 建立模型:选择建模技术、生成测试设计、构建和评估模型
  • 模型评估:评估结果、查看数据挖掘过程、确定后续步骤
  • 模型部署:计划部署、监视和维护 、生成最终报告、复查

在接下来的篇章中,我们将逐个讲述这些过程。

目录