Appearance
词嵌入(word2vec)基本概念
跳字模型(skip-gram)
连续词袋模型(cbow)
近似训练
word2vec
子词嵌入
全局向量嵌入(GloVe)
seq2seq
评测指标BLEU
在训练过程中先清零梯度再更新梯度
# 将优化器的梯度缓存清零 optimizer.zero_grad() # 计算损失函数的梯度 loss.backward() # 使用优化器更新模型参数 optimizer.step()
p1、p2是怎么计算出来的?