Published onDecember 6, 2023Gemini - The second best AI model in the worldgeminillmdeepmindGoogle Gemini 模型终于发布,本文探讨其特点、版本及性能表现,并与 GPT-4 进行对比。
Published onDecember 2, 2023Step-Back Promptingpromptingllm本文介绍了Step-Back Prompting技术,通过对问题先抽象再回答的方式进行推理,并对其效果进行了实验分析。
Published onNovember 19, 2023Pattern Exploiting TrainingpeftPattern Exploiting Training(PET)是一种少样本半监督训练方法,通过添加任务描述,将输入重构成填空风格的语句。
Published onNovember 6, 2023ELMoelmobertembedding本文介绍了ELMo模型,包括其网络结构、模型训练和模型使用,ELMo通过双向语言模型生成上下文感知的词嵌入。
Published onOctober 11, 2023Normalizationnormalization本文介绍了Batch Normalization和Layer Normalization的原理、优缺点以及工作机制。
Published onFebruary 28, 2023T5nlp本文介绍了由 Google Research 提出的生成式预训练模型 T5,其理念是“万物皆可 seq2seq”,目标是统一框架,将文本分类、生成、翻译等任务都转化成 text-to-text 任务。
Published onJanuary 2, 2023Background propagation formula derivationnlpgradientbp反向传播(Backpropagation,缩写为BP)是“误差反向传播”的简称,是一种与最优化方法结合使用的,用来训练人工神经网络的常见方法。