当前位置: 首页 > news >正文

普法网站建设软文广告的案例

普法网站建设,软文广告的案例,做网站图片属性,如何删除网站的信息吗GPT-3(Language Models are Few-shot Learners) 一、GPT-2 1. 网络架构: GPT系列的网络架构是Transformer的Decoder,有关Transformer的Decoder的内容可以看我之前的文章。 简单来说,就是利用Masked multi-head attention来提取文本信息&a…

GPT-3(Language Models are Few-shot Learners)

一、GPT-2

1. 网络架构:

GPT系列的网络架构是Transformer的Decoder,有关Transformer的Decoder的内容可以看我之前的文章。

简单来说,就是利用Masked multi-head attention来提取文本信息,之后利用MLP和softmax来预测当前序列后应该接什么字符,以此来生成长的文本。注意:与传统的softmax不同,GPT会根据生成字符的概率,随机在概率高的几个字符中进行挑选,这就保证了同一个问题每次的回答都不相同。

对于不同版本的GPT的架构,无非就是在Decoder的基础上提高Masked multi-head attention layer的”多头“数与层数来增大模型的参数量以提高模型的拟合能力。

2. 核心思想:

使用无监督的预训练模型做有监督的任务。
作者认为,当一个语言模型的容量足够大时,它就足以覆盖所有的有监督任务,也就是说所有的有监督学习都是无监督语言模型的一个子集。这一点在之后的chatGPT中得到了很好的体现。

简单理解就是,在大量的训练样本中肯定存在某些样本是关于英语到法语翻译的。在训练完GPT-2后,模型本身已经凭借海量的训练数据学会了英语到法语的翻译,这时只要向模型发出”英语翻译成法语“这个任务指令,模型就可以进行翻译任务而不需要对模型进行微调。这便有了GPT-3中"In-context learning"的雏形。

3. 总结:

GPT-2最大的贡献是提出了通过海量的数据进行大规模的无监督训练,可以使模型直接完成下游任务而不需要对模型本身进行任何调整。在不少语言模型任务中仅仅通过向GPT-2”发出指令“,模型就有良好的性能。但是,很多实验表明,GPT-2的无监督学习还远没有头达到瓶颈,这就诞生了模型更大、数据集更”海量“的GPT-3。

二、GPT-3—力大砖飞

1

GPT-3的模型非常巨大,如图,GPT-1的模型大小为第一个红色矩形,GPT-2的模型大小为第二个红色矩形,而GPT-3的模型大小为175B的参数。对一般实验室来说训练是不可能的。

三、zero-shot / few-shot learning

1. 预训练—微调

1

如图,对于普通的NLP模型如BERT和GPT-1,模型的使用方法是:

  1. 对成熟的NLP模型进行有监督的预训练。
  2. 根据特定的下游任务(文本分类、问答等)对当前NLP添加MLP。
  3. 根据特性下游任务的数据集对整个模型进行微调。

2. “In-context” learning

1

GPT-3采用"In-context" learning来完成特定的下游任务。简单来说,用户通过对话向GPT-3发出任务描述,GPT-3在”理解“用户的任务后直接就可以完成任务而无需对模型进行微调。整个过程都是在与用户的对话中完成的,模型本身没有任何改变。

如图,

  1. 给GPT进行任务说明,如图为:Translate English to French.

  2. few-shot learning中,给GPT不止一个样例,在one-shot learning中,给GPT一个样例,在zero-shot learning中,不给GPT样例。样例是在对话框中由用户直接给出的。

    注意:在此过程中,GPT不进行梯度下降(无fine tune)。直观的理解就是GPT理解了你发出的任务的目的而不是对GPT本身进行模型优化。

  3. 输入一个英文单词,之后输入一个=>。该符号的意思是:符号前的内容是我输入的,符号后的内容是GPT输出的。

3. 总结:

GPT的1、2和3系列都是采用Transformer的Decoder架构,在模型结构上没有新意,但是凭借微软平台的支持,其可以对普通人无法想象的巨大模型海量的训练数据进行训练从而产生令人惊叹的效果。甚至在训练GPT-3时出现了一个bug,OpenAI自己也没有资金重新训练了。

但是,GPT-3也不是万能的,其在一些任务上也存在不少问题,这就催生了InstructGPT和最近爆火的ChatGPT。

http://www.wangmingla.cn/news/7092.html

相关文章:

  • 县总工会网站建设情况seo下载站
  • 西安做建站的公司seo搜索引擎优化排名
  • 百度做网站骗人到哪里去投诉厦门seo关键词优化代运营
  • 长沙网站建设外贸b2b网站大全免费
  • 做PPT素材图片网站 知乎b2b平台有哪些
  • 建立个人网站视频教程seo网络推广优化
  • 中央农村工作会议内容和精神体会在广州做seo找哪家公司
  • 营销软件团购跨境电商seo
  • 工厂的网站在哪里做的百度推广账号怎么注册
  • 网站建设 协议书 doc网站创建流程
  • 哪家做网站公司产品seo优化
  • 制作一个网站界面设计图片seo和sem哪个工资高
  • 昆明做网站哪家北京seo公司公司
  • 博客 系统 wordpress厦门seo怎么做
  • 如何在微信公众平台上建立微网站网页制作代码
  • 成都市建设工程施工安监站网站百度小程序对网站seo
  • 可视化课题组网站建设教程网络营销和网络推广
  • wordpress 4.9中文版seo是付费还是免费推广
  • 惠州做网站的网络推广员工作内容
  • 域名停靠网页应用大全app廊坊seo外包
  • 用asp.net做网站计数器百度seo权重
  • 做视频网站的方法信息发布平台推广有哪些
  • 免费自建手机网站怎么从网上找国外客户
  • 什么是网站建设技术做seo的公司
  • 宁夏网站建设哪个好词语搜索排行
  • 百度推广需要先做网站吗链接制作软件
  • 深圳找人做网站郑州关键词排名外包
  • 中国卫生网seo关键词优化软件
  • 时时彩网站如何做代理西安疫情最新数据
  • 网站制作1000元googleseo优化