Published onNovember 19, 2023Pattern Exploiting TrainingpeftPattern Exploiting Training(PET)是一种少样本半监督训练方法,通过添加任务描述,将输入重构成填空风格的语句。
Published onNovember 6, 2023ELMoelmobertembedding本文介绍了ELMo模型,包括其网络结构、模型训练和模型使用,ELMo通过双向语言模型生成上下文感知的词嵌入。
Published onOctober 11, 2023Normalizationnormalization本文介绍了Batch Normalization和Layer Normalization的原理、优缺点以及工作机制。
Published onFebruary 28, 2023T5nlp本文介绍了由 Google Research 提出的生成式预训练模型 T5,其理念是“万物皆可 seq2seq”,目标是统一框架,将文本分类、生成、翻译等任务都转化成 text-to-text 任务。
Published onJanuary 2, 2023Background propagation formula derivationnlpgradientbp反向传播(Backpropagation,缩写为BP)是“误差反向传播”的简称,是一种与最优化方法结合使用的,用来训练人工神经网络的常见方法。
Published onDecember 10, 2022Active Learningactive-learning通过主动选择最有价值的样本进行标注的机器学习方法,其目的是使用尽可能少的、高质量的样本标注使模型达到尽可能好的性能。