当前位置: 首页 > news >正文

cms网站搭建好了再怎么做杭州网站设计公司

cms网站搭建好了再怎么做,杭州网站设计公司,网站底部的备案信息,二本java已经很难就业了论文下载:https://openreview.net/pdf?idr1xMH1BtvB 另一篇分析文章:ELECTRA 详解 - 知乎 一、概述 对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。 不是对选择的token直接用mask替代,而是替换为…

论文下载:https://openreview.net/pdf?id=r1xMH1BtvB

另一篇分析文章:ELECTRA 详解 - 知乎

一、概述

对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。

不是对选择的token直接用mask替代,而是替换为一个生成器网络产生的token。

然后训练模型时并不是只被破坏的token,而是训练一个辨别模型来预测这些被破坏的输入的每一个token是否是被生成模型生成的样本替代的。因为将GANs应用于文本很困难,所以生成损坏token的生成器是以最大似然进行训练的。

小generator和大discriminator共同训练,但判别器的梯度不会传给生成器

fine-tuning 时丢弃generator,只使用discriminator

二、网络结构和训练

1、模型训练两个网络G和D。

        G:给定位置t,将该位置token替换为mask,输入到G,G输出一个概率,结合softmax层,来产生mask位置的xt,从而G产生损坏的输入。输出只在mask的token中计算分数,不是所有的token。

        D:给定位置t,D预测xt是否是真的。输出只在mask的token中预测是不是真的,不是所有的。

        对于给定一个随机位置序列,原始输入对应位置替换为[MASK] token,输入G,G学习恢复原始序列。D来分辨哪些token是被生成器产生的样本替换的。

文本损坏过程描述为:

2、损失函数为:

MLM损失的计算只计算m个,即m个被masked tokens

Disc损失 t的取值到 1..n,每个token都会更新参数

        在训练过程中,discriminator的loss不会反向传播到generator(因为generator的sampling的步骤导致),在pre-training之后,只使用discriminator进行fine-tuning.

http://www.wangmingla.cn/news/135189.html

相关文章:

  • edu域名网站爱站网长尾词挖掘
  • 无上光东莞网站免费域名 网站
  • pc网站开发成app难度软件推广
  • 我爱你域名的网站建立网站步骤
  • wordpress评分中文版seo优化的基本流程
  • 网站流量对排名的影响互动营销案例100
  • 廊坊高端网站制作品牌网络推广运营公司
  • 网站导航规划重庆网站seo建设哪家好
  • wordpress bat高亮洛阳搜索引擎优化
  • wap网站开发教程西安seo培训机构
  • 视频教程网站模板杭州优化商务服务公司
  • 如何自己设计logo图标宁波seo外包服务商
  • asp企业营销型网站建设最新网站查询
  • 用html怎么做网站尾部石家庄seo全网营销
  • wordpress实现登录注册seo的中文是什么
  • php电商网站开发流程免费发布推广的平台
  • 做区块链网站的公司哪里做网站便宜
  • wordpress 视频站模板pageadmin建站系统
  • 东营网站建设哪家好网络营销中的seo与sem
  • 网站做滚动图杭州seo按天计费
  • 餐饮公司做网站好处seo推广灰色词
  • 海尔商务网站建设公司宣传网页怎么做
  • wordpress突然访问不百度seo教程网
  • flash网站系统输入关键词就能写文章的软件
  • 个人主页免费网站站外推广怎么做
  • weebly跟Wordpress如何进行搜索引擎的优化
  • axure做网站原型收录好的网站有哪些
  • 提高asp.net网站安全性seo诊断分析工具
  • 广州海珠做网站的公司网站目录
  • 网站footer模板搜索引擎优化的名词解释