1.5 如何划分训练集与验证集

前面介绍了如何加载数据集,在加载数据集之后,需要将数据集划分为训练集和验证集。在MATLAB深度学习工具箱中,提供了splitEachLabel函数将数据存储区中的数据集划分为训练集和验证集,具体使用方法如下。

函数:splitEachLabel。

功能:将数据存储区中的数据集划分为训练集和验证集。

用法:[ds1,ds2 ] = splitEachLabel(imds,p)。

输入:imds表示图像样本数据,p表示数据集中用于训练深度网络的样本比例或数量。

输出:ds1用于训练的样本数据,ds2用于验证的样本数据。

注意

splitEachLabel函数默认是按顺序对样本数据集进行划分的,可以添加选项'random-ized'来进行随机划分。

例如,[imdsTrain,imdsValidation] = splitEachLabel(imds,750,'randomize')。

实现的功能是随机将样本数据imds中的750个样本数据划分为训练样本数据。

实现的功能是随机将样本数据imds中70%的样本数据划分为训练样本数据。