这篇文章主要为大家详细介绍了python之解决Keras载入mnist数据集出错的问题,具有一定的参考价值,可以用来参考一下。
感兴趣的小伙伴,下面一起跟随四海网的雯雯来看看吧!
F:\python_enter_anaconda510\Lib\site-packages\tensorflow\python\keras\datasets
代码如下:
https://s3.amazonaws.com/img-datasets/mnist.npz
如何解决Keras载入mnist数据集出错的问题
代码如下:
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
from ..utils.data_utils import get_file
import numpy as np
def load_data(path='mnist.npz'):
"""Loads the MNIST dataset.
# Arguments
path: path where to cache the dataset locally
(relative to ~/.keras/datasets).
# Returns
Tuple of Numpy arrays: `(x_train, y_train), (x_test, y_test)`.
"""
path = 'E:/Data/Mnist/mnist.npz' #此处的path为你刚刚防止mnist.py的目录。注意斜杠
f = np.load(path)
x_train, y_train = f['x_train'], f['y_train']
x_test, y_test = f['x_test'], f['y_test']
f.close()
return (x_train, y_train), (x_test, y_test)
如何解决Keras载入mnist数据集出错的问题
代码如下:
import keras
import numpy as np
from keras.utils import np_utils
import os
from keras.datasets import mnist
如何解决Keras载入mnist数据集出错的问题
代码如下:
(X_train_image ,y_train_image),(X_test_image,y_test_image) = mnist.load_data()
如何解决Keras载入mnist数据集出错的问题
第一次执行 mnist.load_data() 方法 ,程序会检查用户目录下是否已经存在 MNIST 数据集文件 ,如果没有,就会自动下载 . (所以第一次运行比较慢) .
代码如下:
print('train data = ' ,len(X_train_image)) #
print('test data = ',len(X_test_image))
如何解决Keras载入mnist数据集出错的问题
1 训练集是由 images 和 label 组成的 , images 是数字的单色数字图像 28 x 28 的 , label 是images 对应的数字的十进制表示 .
2 显示数字的图像
代码如下:
import matplotlib.pyplot as plt
def plot_image(image):
fig = plt.gcf()
fig.set_size_inches(2,2) # 设置图形的大小
plt.imshow(image,cmap='binary') # 传入图像image ,cmap 参数设置为 binary ,以黑白灰度显示
plt.show()
如何解决Keras载入mnist数据集出错的问题
3 查看训练数据中的第一个数据
代码如下:
plot_image(x_train_image[0])
如何解决Keras载入mnist数据集出错的问题
查看对应的标记(真实值)
代码如下:
print(y_train_image[0])
如何解决Keras载入mnist数据集出错的问题
运行结果 : 5
上面我们只显示了一组数据的图像 , 下面将显示多组手写数字的图像展示 ,以便我们查看数据 .
代码如下:
def plot_images_labels_prediction(images, labels,
prediction, idx, num=10):
fig = plt.gcf()
fig.set_size_inches(12, 14) # 设置大小
if num > 25: num = 25
for i in range(0, num):
ax = plt.subplot(5, 5, 1 + i)# 分成 5 X 5 个子图显示, 第三个参数表示第几个子图
ax.imshow(images[idx], cmap='binary')
title = "label=" + str(labels[idx])
if len(prediction) > 0: # 如果有预测值
title += ",predict=" + str(prediction[idx])
ax.set_title(title, fontsize=10)
ax.set_xticks([])
ax.set_yticks([])
idx += 1
plt.show()
plot_images_labels_prediction(x_train_image,y_train_image,[],0,10)
如何解决Keras载入mnist数据集出错的问题
查看测试集 的手写数字前十个
代码如下:
plot_images_labels_prediction(x_test_image,y_test_image,[],0,10)
如何解决Keras载入mnist数据集出错的问题
feature (数字图像的特征值) 数据预处理可分为两个步骤:
(1) 将原本的 288 X28 的数字图像以 reshape 转换为 一维的向量 ,其长度为 784 ,并且转换为 float
(2) 数字图像 image 的数字标准化
1 查看image 的shape
代码如下:
print("x_train_image : " ,len(x_train_image) , x_train_image.shape )
print("y_train_label : ", len(y_train_label) , y_train_label.shape)
#output :
x_train_image : 60000 (60000, 28, 28)
y_train_label : 60000 (60000,)
如何解决Keras载入mnist数据集出错的问题
2 将 lmage 以 reshape 转换
代码如下:
# 将 image 以 reshape 转化
x_Train = x_train_image.reshape(60000,784).astype('float32')
x_Test = x_test_image.reshape(10000,784).astype('float32')
print('x_Train : ' ,x_Train.shape)
print('x_Test' ,x_Test.shape)
如何解决Keras载入mnist数据集出错的问题
3 标准化
images 的数字标准化可以提高后续训练模型的准确率 ,因为 images 的数字 是从 0 到255 的值 ,代表图形每一个点灰度的深浅 .
代码如下:
# 标准化
x_Test_normalize = x_Test/255
x_Train_normalize = x_Train/255
如何解决Keras载入mnist数据集出错的问题
4 查看标准化后的测试集和训练集 image
代码如下:
print(x_Train_normalize[0]) # 训练集中的第一个数字的标准化
如何解决Keras载入mnist数据集出错的问题
代码如下:
x_train_image : 60000 (60000, 28, 28)
y_train_label : 60000 (60000,)
[0. 0. 0. 0. 0. 0.
........................................................
0. 0. 0. 0. 0. 0.
0.
0.21568628 0.6745098 0.8862745 0.99215686 0.99215686 0.99215686
0.99215686 0.95686275 0.52156866 0.04313726 0. 0.
0. 0. 0. 0. 0. 0.
0. 0. 0. 0. 0. 0.
0. 0. 0. 0. 0.53333336 0.99215686
0.99215686 0.99215686 0.83137256 0.5294118 0.5176471 0.0627451
0. 0. 0. 0. ]
如何解决Keras载入mnist数据集出错的问题
label 标签字段原本是 0 ~ 9 的数字 ,必须以 One -hot Encoding 独热编码 转换为 10个 0,1 组合 ,比如 7 经过 One -hot encoding
转换为 0000000100 ,正好就对应了输出层的 10 个 神经元 .
代码如下:
# 将训练集和测试集标签都进行独热码转化
y_TrainOneHot = np_utils.to_categorical(y_train_label)
y_TestOneHot = np_utils.to_categorical(y_test_label)
如何解决Keras载入mnist数据集出错的问题
代码如下:
print(y_TrainOneHot[:5]) # 查看前5项的标签
如何解决Keras载入mnist数据集出错的问题
代码如下:
[[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.] 5
[1. 0. 0. 0. 0. 0. 0. 0. 0. 0.] 0
[0. 0. 0. 0. 1. 0. 0. 0. 0. 0.] 4
[0. 1. 0. 0. 0. 0. 0. 0. 0. 0.] 1
[0. 0. 0. 0. 0. 0. 0. 0. 0. 1.]] 9
如何解决Keras载入mnist数据集出错的问题
1 我们将将建立如图所示的多层感知器模型
数据的预处理我们已经处理完了. 包含 数据集 输入(数字图像)的标准化 , label的one-hot encoding
我们将建立多层感知器模型 ,输入层 共有784 个神经元 ,hodden layer 有 256 个neure ,输出层用 10 个神经元 .
代码如下:
from keras.models import Sequential
from keras.layers import Dense
如何解决Keras载入mnist数据集出错的问题
代码如下:
# 建立Sequential 模型
model = Sequential()
如何解决Keras载入mnist数据集出错的问题
3 建立 "输入层" 和 "隐藏层"
使用 model,add() 方法加入 Dense 神经网络层 .
代码如下:
model.add(Dense(units=256,
input_dim =784,
keras_initializer='normal',
activation='relu')
)
如何解决Keras载入mnist数据集出错的问题
参数 | 说明 |
units =256 | 定义"隐藏层"神经元的个数为256 |
input_dim | 设置输入层神经元个数为 784 |
kernel_initialize='normal' | 使用正态分布的随机数初始化weight和bias |
activation | 激励函数为 relu |
4 建立输出层
代码如下:
model.add(Dense(
units=10,
kernel_initializer='normal',
activation='softmax'
))
如何解决Keras载入mnist数据集出错的问题
参数 | 说明 |
units | 定义"输出层"神经元个数为10 |
kernel_initializer='normal' | 同上 |
activation='softmax | 激活函数 softmax |
5 查看模型的摘要
代码如下:
print(model.summary())
如何解决Keras载入mnist数据集出错的问题
param 的计算是 上一次的神经元个数 * 本层神经元个数 + 本层神经元个数 .
1 定义训练方式
代码如下:
model.compile(loss='categorical_crossentropy' ,optimizer='adam',metrics=['accuracy'])
如何解决Keras载入mnist数据集出错的问题
开始训练 2
代码如下:
train_history = model.fit(x=x_Train_normalize,y=y_TrainOneHot,validation_split=0.2 ,
epoch=10,batch_size=200,verbose=2)
如何解决Keras载入mnist数据集出错的问题
使用 model.fit() 进行训练 , 训练过程会存储在 train_history 变量中 .
x = x_Train_normalize
y = y_TrainOneHot
validation_split=0.2 8 :2 = 训练集 : 验证集
epoch=10,batch_size=200
verbose = 2
3 建立show_train_history 显示训练过程
代码如下:
def show_train_history(train_history,train,validation) :
plt.plot(train_history.history[train])
plt.plot(train_history.history[validation])
plt.title("Train_history")
plt.ylabel(train)
plt.xlabel('Epoch')
plt.legend(['train','validation'],loc='upper left')
plt.show()
如何解决Keras载入mnist数据集出错的问题
测试数据评估模型准确率
代码如下:
scores = model.evaluate(x_Test_normalize,y_TestOneHot)
print()
print('accuracy=',scores[1] )
如何解决Keras载入mnist数据集出错的问题
accuracy= 0.9769
通过之前的步骤, 我们建立了模型, 并且完成了模型训练 ,准确率达到可以接受的 0.97 . 接下来我们将使用此模型进行预测.
1 执行预测
代码如下:
prediction = model.predict_classes(x_Test)
print(prediction)
如何解决Keras载入mnist数据集出错的问题
result : [7 2 1 ... 4 5 6]
2 显示 10 项预测结果
代码如下:
plot_images_labels_prediction(x_test_image,y_test_label,prediction,idx=340)
如何解决Keras载入mnist数据集出错的问题
我们可以看到 第一个数字 label 是 5 结果预测成 3 了.
上面我们在预测到第340 个测试集中的数字5 时 ,却被错误的预测成了 3 .如果想要更进一步的知道我们所建立的模型中哪些 数字的预测准确率更高 , 哪些数字会容忍混淆 .
混淆矩阵 也称为 误差矩阵.
1 使用Pandas 建立混淆矩阵 .
代码如下:
showMetrix = pd.crosstab(y_test_label,prediction,colnames=['label',],rownames=['predict'])
print(showMetrix)
如何解决Keras载入mnist数据集出错的问题
代码如下:
label 0 1 2 3 4 5 6 7 8 9
predict
0 971 0 1 1 1 0 2 1 3 0
1 0 1124 4 0 0 1 2 0 4 0
2 5 0 1009 2 1 0 3 4 8 0
3 0 0 5 993 0 1 0 3 4 4
4 1 0 5 1 961 0 3 0 3 8
5 3 0 0 16 1 852 7 2 8 3
6 5 3 3 1 3 3 939 0 1 0
7 0 5 13 7 1 0 0 988 5 9
8 4 0 3 7 1 1 1 2 954 1
9 3 6 0 11 7 2 1 4 4 971
如何解决Keras载入mnist数据集出错的问题
2 使用DataFrame
代码如下:
df = pd.DataFrame({'label ':y_test_label, 'predict':prediction})
print(df)
如何解决Keras载入mnist数据集出错的问题
代码如下:
label predict
0 7 7
1 2 2
2 1 1
3 0 0
4 4 4
5 1 1
6 4 4
7 9 9
8 5 5
9 9 9
10 0 0
11 6 6
12 9 9
13 0 0
14 1 1
15 5 5
16 9 9
17 7 7
18 3 3
19 4 4
20 9 9
21 6 6
22 6 6
23 5 5
24 4 4
25 0 0
26 7 7
27 4 4
28 0 0
29 1 1
... ... ...
9970 5 5
9971 2 2
9972 4 4
9973 9 9
9974 4 4
9975 3 3
9976 6 6
9977 4 4
9978 1 1
9979 7 7
9980 2 2
9981 6 6
9982 5 6
9983 0 0
9984 1 1
9985 2 2
9986 3 3
9987 4 4
9988 5 5
9989 6 6
9990 7 7
9991 8 8
9992 9 9
9993 0 0
9994 1 1
9995 2 2
9996 3 3
9997 4 4
9998 5 5
9999 6 6
如何解决Keras载入mnist数据集出错的问题
代码如下:
model.add(Dense(units=1000,
input_dim=784,
kernel_initializer='normal',
activation='relu'))
如何解决Keras载入mnist数据集出错的问题
hidden layer 神经元的增大,参数也增多了, 所以训练model的时间也变慢了.
加入 Dropout 功能避免过度拟合
代码如下:
# 建立Sequential 模型
model = Sequential()
model.add(Dense(units=1000,
input_dim=784,
kernel_initializer='normal',
activation='relu'))
model.add(Dropout(0.5)) # 加入Dropout
model.add(Dense(units=10,
kernel_initializer='normal',
activation='softmax'))
如何解决Keras载入mnist数据集出错的问题
训练的准确率 和 验证的准确率 差距变小了 .
建立多层感知器模型包含两层隐藏层
代码如下:
# 建立Sequential 模型
model = Sequential()
# 输入层 +" 隐藏层"1
model.add(Dense(units=1000,
input_dim=784,
kernel_initializer='normal',
activation='relu'))
model.add(Dropout(0.5)) # 加入Dropout
# " 隐藏层"2
model.add(Dense(units=1000,
kernel_initializer='normal',
activation='relu'))
model.add(Dropout(0.5)) # 加入Dropout
# " 输出层"
model.add(Dense(units=10,
kernel_initializer='normal',
activation='softmax'))
print(model.summary())
如何解决Keras载入mnist数据集出错的问题
代码:
代码如下:
import tensorflow as tf
import keras
import matplotlib.pyplot as plt
import numpy as np
from keras.utils import np_utils
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
import pandas as pd
import os
np.random.seed(10)
os.environ["CUDA_VISIBLE_DEVICES"] = "2"
(x_train_image ,y_train_label),(x_test_image,y_test_label) = mnist.load_data()
#
# print('train data = ' ,len(X_train_image)) #
# print('test data = ',len(X_test_image))
def plot_image(image):
fig = plt.gcf()
fig.set_size_inches(2,2) # 设置图形的大小
plt.imshow(image,cmap='binary') # 传入图像image ,cmap 参数设置为 binary ,以黑白灰度显示
plt.show()
def plot_images_labels_prediction(images, labels,
prediction, idx, num=10):
fig = plt.gcf()
fig.set_size_inches(12, 14)
if num > 25: num = 25
for i in range(0, num):
ax = plt.subplot(5, 5, 1 + i)# 分成 5 X 5 个子图显示, 第三个参数表示第几个子图
ax.imshow(images[idx], cmap='binary')
title = "label=" + str(labels[idx])
if len(prediction) > 0:
title += ",predict=" + str(prediction[idx])
ax.set_title(title, fontsize=10)
ax.set_xticks([])
ax.set_yticks([])
idx += 1
plt.show()
def show_train_history(train_history,train,validation) :
plt.plot(train_history.history[train])
plt.plot(train_history.history[validation])
plt.title("Train_history")
plt.ylabel(train)
plt.xlabel('Epoch')
plt.legend(['train','validation'],loc='upper left')
plt.show()
# plot_images_labels_prediction(x_train_image,y_train_image,[],0,10)
#
# plot_images_labels_prediction(x_test_image,y_test_image,[],0,10)
print("x_train_image : " ,len(x_train_image) , x_train_image.shape )
print("y_train_label : ", len(y_train_label) , y_train_label.shape)
# 将 image 以 reshape 转化
x_Train = x_train_image.reshape(60000,784).astype('float32')
x_Test = x_test_image.reshape(10000,784).astype('float32')
# print('x_Train : ' ,x_Train.shape)
# print('x_Test' ,x_Test.shape)
# 标准化
x_Test_normalize = x_Test/255
x_Train_normalize = x_Train/255
# print(x_Train_normalize[0]) # 训练集中的第一个数字的标准化
# 将训练集和测试集标签都进行独热码转化
y_TrainOneHot = np_utils.to_categorical(y_train_label)
y_TestOneHot = np_utils.to_categorical(y_test_label)
print(y_TrainOneHot[:5]) # 查看前5项的标签
# 建立Sequential 模型
model = Sequential()
model.add(Dense(units=1000,
input_dim=784,
kernel_initializer='normal',
activation='relu'))
model.add(Dropout(0.5)) # 加入Dropout
# " 隐藏层"2
model.add(Dense(units=1000,
kernel_initializer='normal',
activation='relu'))
model.add(Dropout(0.5)) # 加入Dropout
model.add(Dense(units=10,
kernel_initializer='normal',
activation='softmax'))
print(model.summary())
# 训练方式
model.compile(loss='categorical_crossentropy' ,optimizer='adam',metrics=['accuracy'])
# 开始训练
train_history =model.fit(x=x_Train_normalize,
y=y_TrainOneHot,validation_split=0.2,
epochs=10, batch_size=200,verbose=2)
show_train_history(train_history,'acc','val_acc')
scores = model.evaluate(x_Test_normalize,y_TestOneHot)
print()
print('accuracy=',scores[1] )
prediction = model.predict_classes(x_Test)
print(prediction)
plot_images_labels_prediction(x_test_image,y_test_label,prediction,idx=340)
showMetrix = pd.crosstab(y_test_label,prediction,colnames=['label',],rownames=['predict'])
print(showMetrix)
df = pd.DataFrame({'label ':y_test_label, 'predict':prediction})
print(df)
#
#
# plot_image(x_train_image[0])
#
# print(y_train_image[0])
如何解决Keras载入mnist数据集出错的问题
代码2:
代码如下:
import numpy as np
from keras.models import Sequential
from keras.layers import Dense , Dropout ,Deconv2D
from keras.utils import np_utils
from keras.datasets import mnist
from keras.optimizers import SGD
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "2"
def load_data():
(x_train,y_train),(x_test,y_test) = mnist.load_data()
number = 10000
x_train = x_train[0:number]
y_train = y_train[0:number]
x_train =x_train.reshape(number,28*28)
x_test = x_test.reshape(x_test.shape[0],28*28)
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
y_train = np_utils.to_categorical(y_train,10)
y_test = np_utils.to_categorical(y_test,10)
x_train = x_train/255
x_test = x_test /255
return (x_train,y_train),(x_test,y_test)
(x_train,y_train),(x_test,y_test) = load_data()
model = Sequential()
model.add(Dense(input_dim=28*28,units=689,activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(units=689,activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(units=689,activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(output_dim=10,activation='softmax'))
model.compile(loss='categorical_crossentropy',optimizer='adam',metrics=['accuracy'])
model.fit(x_train,y_train,batch_size=10000,epochs=20)
res1 = model.evaluate(x_train,y_train,batch_size=10000)
print("\n Train Acc :",res1[1])
res2 = model.evaluate(x_test,y_test,batch_size=10000)
print("\n Test Acc :",res2[1])
以上为个人经验,希望能给大家一个参考,也希望大家多多支持四海网。
本文来自:http://www.q1010.com/181/18588-0.html
注:关于python之解决Keras载入mnist数据集出错的问题的内容就先介绍到这里,更多相关文章的可以留意四海网的其他信息。
关键词:python
四海网收集整理一些常用的php代码,JS代码,数据库mysql等技术文章。