聚类 概述 聚类是一种无监督学习方法,它将相似的数据样本分组为一个集合,被称为簇(cluster),使得簇内的样本相似度高,而簇间的样本相似度低
关联规则 Apriori 算法 FP-growth 算法 FP树时一种输入数据的压缩表示,它通过逐个读入事务,并把事务映射到FP树中的一条路径来构造。 由于不同的事务可能会有若干个
时间序列 概述 分类 研究对象: 一元时间序列 多元时间序列 时间连续性 离散时间序列 连续时间序列 序列的特性 平稳时间序列 非平稳时间序列 分析方法 效应分解法 将
第 1 章 准备工作 1.1 本书的内容 本书讲的是利用 Python 进行数据控制、处理、整理、分析等方面的具体细节和基本要点。我的目标是介绍 Python 编程和用于数据处理的库和
第 10 章 数据聚合与分组运算 对数据集进行分组并对各组应用一个函数(无论是聚合还是转换),通常是数据分析工作中的重要环节。在将数据集加载、融合、准
第 11 章 时间序列 时间序列(time series)数据是一种重要的结构化数据形式,应用于多个领域,包括金融学、经济学、生态学、神经科学、物理学等