0.前言与基本知识

前言

本课程为tensorflow官方课程,本系列文档依旧只记录学习笔记。

基础知识

第一个应用程序总是应该从超级简单的东西开始,这样可以看到代码如何产生和运作的整体框架。

就创建神经网络而言,我喜欢使用的例子是一个能够学习两组数字之间函数关系的神经元。具体来说,如果你在写下面函数的代码,表明你已经知道了这个函数的"规则",即x和y的映射关系。

float hw_function(float x){
    float y = (2 * x) - 1;
    return y;
}

那么,如何训练一个神经网络来完成同等的任务呢? 用数据!用数据来训练神经网络。通过给它输入一组X,和一组Y,它应该能够找出它们之间的关系。

这显然和你习惯的范式很不一样,所以让我们一步步来了解它。

1.导入tensorflow

让我们从导入TensorFlow开始。为了方便后续使用,我们把它叫做tf。

然后我们导入一个名为numpy的库,它可以帮助我们方便快捷地将数据表示为列表。

定义神经网络的框架叫做keras,它将神经元网络模型定义为一组Sequential层。Keras库也需要导入。

import tensorflow as tf
import numpy as np
from tensorflow import keras

2.定义并编译神经元网络

接下来我们将创建一个最简单的神经网络。它只有1层,且这层只有1个神经元,它的输入只是1个数值。

model = tf.keras.Sequential([keras.layers.Dense(units=1, input_shape=[1])])

在编译神经网络时,我们必须指定2个函数:一个损失函数和一个优化器。随着经验的积累,你将了解如何选择相应的损失和优化函数,以适应不同的情况。

model.compile(optimizer='sgd', loss='mean_squared_error')

3.提供训练数据

接下来我们将提供一些数据。对于本案例,我们提供6个X和6个Y。可以看到它们之间的关系是y=2x-1,所以当X=-1,y=-3,以此类推。

xs = np.array([-1.0,  0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([-3.0, -1.0, 1.0, 3.0, 5.0, 7.0], dtype=float)

4.训练神经元网络

在调用model.fit函数时,神经网络“学习”X和Y之间的关系。在这个过程中,它将一次又一次地完成上面所说的循环,即做一个猜测,衡量它有多好或多坏(又名损失),使用Opimizer进行再一次猜测,如此往复。训练将根据指定的遍数(epochs)执行此操作。当运行此代码时,将在输出结果中看到损失(loss)。

model.fit(xs, ys, epochs=100)

到这里为止模型已经训练好了,它学习了X和Y之间的关系。现在,你可以使用model.predict方法来让它计算未知X对应的Y。例如,如果X=10,你认为Y会是什么?在运行下面代码之前,请猜一猜:

print(model.predict([10.0]))
## [[18.985321]]

你可能会想到19,对吧?但最后输出比19低了一丁点儿。这是为什么呢?因为神经网络处理的是概率,所以根据我们向神经元网络提供的数据,它计算出X和y之间的关系是y=2x-1的概率非常高。但由于只有6个数据点,无法完全确定x和y的函数关系。因此,10对应的y值非常接近19,但不一定正好是19。当使用神经网络时,会看到这种模式反复出现。你几乎总是在处理概率,而非确定的数值。并经常需要通过进一步编写程序,来找出概率所对应的结果,特别当处理分类问题时。