基于BP神经网络的数据分类预测：Matlab代码实战

8172_cdabigdata

收藏 2025-12-08

在数据科学与机器学习领域，BP神经网络被广泛应用于分类预测任务。本文将深入解析一段基于BP神经网络实现数据分类的Matlab代码，并对其实现流程进行系统性分析。

程序运行环境初始化

为确保程序运行不受先前变量或图形窗口干扰，代码首先执行环境清理操作，包括清空工作区变量、关闭所有图窗、清除命令行显示内容以及屏蔽警告信息。这一系列操作旨在构建一个干净、独立的运行环境，避免外部因素影响模型训练过程。

clear all; % 清空环境变量
warning off; % 关闭报警信息
close all; % 关闭图窗
clc; % 清空命令行

数据加载与读取

程序通过特定函数从名为“数据集.xlsx”的Excel文件中读取原始数据，并将其存储至变量res中。该步骤相当于将研究所需的全部资料集中获取，为后续的数据处理和建模提供基础支持。

res = xlsread('数据集.xlsx');

xlsread

res

训练集与测试集划分

在完成数据读取后，程序统计样本总数及类别数量，并按照预设比例（默认70%）将数据划分为训练集和测试集。此划分方式采用按类别分层抽样策略，确保每一类样本在两个子集中均保持合理的分布比例，防止因数据倾斜导致模型偏差。

classes = unique(res(:, end)); % 统计类别数
num_classes = length(classes); % 类别数量
num_samples = size(res, 1); % 样本数量
train_ratio = 0.7; % 训练集比例
train_size = floor(train_ratio * num_samples); % 训练集大小
test_size = num_samples - train_size; % 测试集大小

train_data = [];
test_data = [];
for i = 1:num_classes
    class_data = res(res(:, end) == classes(i), :);
    class_train_size = floor(train_ratio * size(class_data, 1));
    train_data = [train_data; class_data(1:class_train_size, :)];
    test_data = [test_data; class_data(class_train_size + 1:end, :)];
end

数据预处理：转置与归一化

为了适配神经网络输入格式，程序对训练集和测试集的数据矩阵进行转置处理。随后使用mapminmax函数对输入特征进行归一化，将其映射至[0,1]区间内。该操作有助于消除不同特征间的量纲差异，提升模型收敛速度与训练稳定性。

train_data = train_data';
test_data = test_data';

[train_input, ps] = mapminmax(train_data(1:end - 1, :));
test_input = mapminmax('apply', test_data(1:end - 1, :), ps);
train_target = train_data(end, :);
test_target = test_data(end, :);

mapminmax

超参数设置

程序设定若干关键超参数以控制模型结构与训练行为，主要包括最大迭代次数、学习率以及隐藏层神经元节点数。这些参数直接影响模型的学习效率、拟合能力及泛化性能，是调节模型表现的重要手段。

max_epoch = 100; % 最大训练次数
learning_rate = 0.1; % 学习率
hidden_nodes = 10; % 隐藏层节点数

神经网络模型训练

调用net_train函数启动训练流程，传入训练数据、标签、隐藏层节点数、学习率和最大训练轮数等参数。该函数内部实现BP算法的前向传播与反向传播过程，最终输出训练完成的神经网络模型及对应的损失函数记录。

[net, loss] = net_train(train_input, train_target, hidden_nodes, learning_rate, max_epoch);

net_train

模型预测执行

利用训练所得模型，分别对训练集和测试集进行预测。通过调用net_sim函数，依据输入数据与已学得权重关系生成预测输出，从而评估模型在已见与未见数据上的表现能力。

train_pred = net_sim(train_input, net);
test_pred = net_sim(test_input, net);

net_sim

结果还原与性能评估

对模型输出的归一化预测值执行反变换操作，恢复为原始类别标签形式。接着计算训练集与测试集上的分类准确率，量化模型的预测效果，为性能分析提供数值依据。

train_pred = round(train_pred);
test_pred = round(test_pred);

train_accuracy = sum(train_pred == train_target) / length(train_target);
test_accuracy = sum(test_pred == test_target) / length(test_target);

可视化分析

程序绘制预测结果对比图，直观展示真实标签与预测结果之间的匹配程度，并标注准确率指标。若标志位flag设为1，则进一步生成训练集与测试集的混淆矩阵，用于细致分析各类别的识别情况。此外，还绘制训练过程中损失函数的变化曲线，反映模型收敛趋势与训练稳定性。

figure;
subplot(2, 1, 1);
plot(train_target, 'b', 'LineWidth', 1.5);
hold on;
plot(train_pred, 'r--', 'LineWidth', 1.5);
title(['训练集预测结果对比，准确率: ', num2str(train_accuracy * 100), '%']);
legend('真实值', '预测值');

subplot(2, 1, 2);
plot(test_target, 'b', 'LineWidth', 1.5);
hold on;
plot(test_pred, 'r--', 'LineWidth', 1.5);
title(['测试集预测结果对比，准确率: ', num2str(test_accuracy * 100), '%']);
legend('真实值', '预测值');

if flag == 1
    figure;
    subplot(2, 1, 1);
    confusionchart(train_target', train_pred');
    title('训练集混淆矩阵');
    
    subplot(2, 1, 2);
    confusionchart(test_target', test_pred');
    title('测试集混淆矩阵');
end

figure;
plot(loss);
title('损失函数曲线');