Deep Learning手写数字识别 (LeNet)

代码实现如下

1
2
3
4
5
6
7
8
9
10
import paddle

from PIL import Image #用于图像载入

import matplotlib.pyplot as plt #用于图像显示

import numpy as np

import paddle.vision.transforms as T #用于图像预处理

1
2
3
4
5
6
7
8
#导入框架自带Mnist数据集

transforms=T.Compose([T.Resize(32),T.ToTensor()]) #图像预处理组合,把图像转为向量

Train_Dataset=paddle.vision.datasets.MNIST(mode="train",transform=transforms) #加载训练集

Test_Dataset=paddle.vision.datasets.MNIST(mode="test",transform=transforms) #加载测试集

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
#模型建立(LeNet)

class Mnist_Net(paddle.nn.Layer):

def __init__(self):

super().__init__()

self.conv1=paddle.nn.Conv2D(in_channels=1,out_channels=6,kernel_size=[5,5])

self.maxpool1=paddle.nn.MaxPool2D(kernel_size=[2,2],stride=2)

self.conv2=paddle.nn.Conv2D(in_channels=6,out_channels=16,kernel_size=[5,5])

self.maxpool2=paddle.nn.MaxPool2D(kernel_size=[2,2],stride=2)

self.conv3=paddle.nn.Conv2D(in_channels=16,out_channels=120,kernel_size=[5,5])



self.flatten=paddle.nn.Flatten()

self.fc2=paddle.nn.Linear(120,84)

self.fc3=paddle.nn.Linear(84,10)

self.softmax=paddle.nn.Softmax()



self.relu=paddle.nn.ReLU()

self.sigmoid=paddle.nn.Sigmoid()

def forward(self,x):

x=self.conv1(x)

x=self.relu(x)

x=self.maxpool1(x)

x=self.conv2(x)

x=self.relu(x)

x=self.maxpool2(x)

x=self.conv3(x)

x=self.relu(x)

x=self.flatten(x)



x=self.fc2(x)

x=self.relu(x)

x=self.fc3(x)

y=self.softmax(x)

return y



mnist_net=Mnist_Net()

paddle.summary(mnist_net,(1,1,32,32))

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#高层API模型对象化

model=paddle.Model(mnist_net)

#配置模型

model.prepare(optimizer=paddle.optimizer.Adam(learning_rate=0.001,parameters=model.parameters()), #优化器

loss=paddle.nn.CrossEntropyLoss(),#损失函数

metrics =paddle.metric.Accuracy()) #准确度

#训练模型

callback=paddle.callbacks.VisualDL("log_dir") #定义callback对象,保存可视化数据日志

model.fit(train_data=Train_Dataset,epochs=10,batch_size=200,callbacks=callback,verbose=1)

#评估模型

eval_result=model.evaluate(Test_Dataset,verbose=1)

model.save("mymodel/mnist_net") #保存模型

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
#载入图像

def image_load(img_path):

photo=Image.open(img_path).convert("L") #以灰度图方式读入图像

photo=photo.resize([32,32]) #图像统一大小32*32

im=np.array(photo).astype("float32") #图像数字化

im=np.where(im > 150, 0, im) #把像素点大于150的置为0,去掉背景

im=im/255 #归一化

im=paddle.to_tensor(im) #张量

return im

import matplotlib



model.load("mymodel/mnist_net") #加载模型参数

im=image_load("mydata/5.JPG") #载入图像

plt.imshow(im) #显示图像

im=im.reshape([1,1,32,32]) #图像变形为1张1通道28*28大小

result=model.predict_batch(im) #使用model.predict_batch对图像进行预测

print(np.argmax(result))

尾巴