WheatField
WheatField

All Posts

  • Published on

    Step-Back Prompting

    本文介绍了Step-Back Prompting技术,通过对问题先抽象再回答的方式进行推理,并对其效果进行了实验分析。
  • Published on

    Pattern Exploiting Training

    Pattern Exploiting Training(PET)是一种少样本半监督训练方法,通过添加任务描述,将输入重构成填空风格的语句。
  • Published on

    ELMo

    本文介绍了ELMo模型,包括其网络结构、模型训练和模型使用,ELMo通过双向语言模型生成上下文感知的词嵌入。
  • Published on

    Normalization

    本文介绍了Batch Normalization和Layer Normalization的原理、优缺点以及工作机制。
  • Published on

    T5

    本文介绍了由 Google Research 提出的生成式预训练模型 T5,其理念是“万物皆可 seq2seq”,目标是统一框架,将文本分类、生成、翻译等任务都转化成 text-to-text 任务。
  • Published on

    Gradient descent

    本文介绍了神经网络训练过程中基于梯度的优化算法,包括反向传播、梯度下降法、动量优化算法等。