ML知识库 - ML Share

机器学习基础

机器学习是一种让计算机从数据中学习规律、模式，并做出预测的技术。

使用带标签的数据训练模型，学习输入到输出的映射关系。

分类回归

将原始数据转换为机器学习算法可以理解的格式的过程。

关键步骤

随机森林是一种集成学习方法，通过构建多个决策树并进行投票来做出最终预测。适用于分类和回归问题，具有良好的抗过拟合能力。

本项目参数: n_estimators=100, max_depth=10

梯度提升树是一种强大的集成学习算法，通过迭代优化损失函数逐步提升模型性能。在处理复杂数据模式时表现优异。

本项目参数: n_estimators=100, max_depth=5

多层感知器(MLP)是一种前馈神经网络，能够学习数据中的复杂非线性关系。本项目使用三层结构(128, 64, 32)处理红球和蓝球预测。

本项目参数: hidden_layer_sizes=(128, 64, 32)

从MySQL数据库加载历史数据，进行预处理、特征工程，最后输入模型进行预测。

数据加载预处理

使用历史数据训练三种模型，保存为pkl文件供后续使用。

训练持久化