6. 深度学习用于序列处理
WU Xiaokun 吴晓堃
xkun.wu [at] gmail
2021/05/17
处理文本数据。 理解循环神经网络。 循环神经网络的高级用法。 用卷积神经网络处理序列。
重点:使用预训练的词嵌入、使用LSTM 层和 GRU 层、使用一维卷积神经网络;
难点:分析不同循环神经网络的适用条件、提高循环神经网络的性能和泛化能力。
将文本分解而成的单元(单词、字符或 n-gram)。
前馈网络(feedforward network)的问题:没有记忆。
output~t~ = np.tanh(np.dot(W, input~t~) + np.dot(U, state~t~) + b)
from keras import models, layers
model = models.Sequential()
model.add(layers.LSTM(32, return_sequences=True, input_shape=(num_timesteps, num_features)))
model.add(layers.LSTM(32, return_sequences=True))
model.add(layers.LSTM(32))
model.add(layers.Dense(num_classes, activation='sigmoid'))
model.compile(optimizer='rmsprop', loss='binary_crossentropy')