文章目录一、下载jqdfj、MNIST数据集训练集和测试集的长度输出图像数据和标签数据的形状显示手写数字图像输出数据集的第一个样本显示图像
一.个人资料
MNIST是非常有名的手写数字识别数据集(手写数字灰度图像数据集),在很多资料中被用作深度学习的入门示例。
MNIST数据集由从0到9的数字图像组成。 训练图像为6万张,测试图像为1万张。 MNIST数据集是NIST数据集的子集,包含60000张图像作为训练数据,10000张图像作为测试数据。 是250个不同的人手写的。
每个图像都有对应的标签数字,训练图像共有60000张,方便研究者训练合适的模型。 测试图像共有10000张,用于测试研究者训练的模型的性能。
这些手写图像都是2828像素、灰度图像。
但是,它们并不存储为图像文件,而是存储在2828的二维数组中。 数组中的每个元素对应于数组中的每个像素。
MNIST已经包含在keras内置模块中,可以直接使用keras的datesets进行访问。
二. MNIST数据集importtensorflowastfminist=TF.keras.datasets.Mn ist (train _ x,train_y ),) test_x,test _ test
下载完成
下载路径
c :usersDell. kerasdatasetsMn ist.npz
训练集和测试集的长度print(trainingset: (,len ) train_x ) ) (打印) testingset: ),len ) test_x )
输出图像数据和标记数据的形状print(train_x )、train_x.shape、train_x.dtype ) print )、train_y )、train_y.shape
显示手写数字图像输出数据集第一样本train[0]
是2828的两位数的排列。 因为很长,所以这里省略了中间的部分。 数组内的各要素与图像内的1个像素相对应,由于图像的背景为黑色,数组内大量存在0数值为非0的要素是手写数字的笔画,主要集中在图像的中央。
显示图像可以显示为图像
importmatplotlib.pyplotasplt.axis (off ) plt.show ) train_x[0],cmap='gray ' ) plt.show )的运行结果
输出下一个图像的标签
train_y[0]# 5例:随机显示4张手写数字图像
forIinrange(4) :num=NP.random.randint ) 1,60000 ) PLT.subplot ) 1,4,i 1) PLT.axis ) ' off ' ) PLT ) imssimsted