Skip to content

1、课堂要点

  • 词嵌入(word2vec)基本概念

  • 跳字模型(skip-gram)

  • 连续词袋模型(cbow)

  • 近似训练

  • word2vec

  • 子词嵌入

  • 全局向量嵌入(GloVe)

  • seq2seq

  • 评测指标BLEU

  • 在训练过程中先清零梯度再更新梯度

python
# 将优化器的梯度缓存清零
optimizer.zero_grad()

# 计算损失函数的梯度
loss.backward()

# 使用优化器更新模型参数
optimizer.step()

2、课后作业

p1、p2是怎么计算出来的?