当前位置: 首页 > news >正文

导航网站建站系统视频seo优化教程

导航网站建站系统,视频seo优化教程,网站建设咨询热线,公司网站开发的国内外研究现状ID3算法 假定当前样本集合D中第k类样本所占比例为pk,则样本集合D的信息熵定义为 信息增益 C4.5算法 ID3算法存在一个问题,就是偏向于取值数目较多的属性,因此C4.5算法使用了“增益率”(gain ratio)来选择划分属性 CA…

ID3算法

假定当前样本集合D中第k类样本所占比例为pk,则样本集合D的信息熵定义为

信息增益

C4.5算法

ID3算法存在一个问题,就是偏向于取值数目较多的属性,因此C4.5算法使用了“增益率”(gain ratio)来选择划分属性

CART算法

使用属性α划分后的基尼指数为

剪枝处理

* 预剪枝(prepruning):在构造的过程中先评估,再考虑是否分支。  
* 后剪枝(post-pruning):在构造好一颗完整的决策树后,自底向上,评估分支的必要性。  

评估指的是性能度量,即决策树的泛化性能。 

连续值与缺失值处理

连续值

* 首先将α的所有取值按升序排列,所有相邻属性的均值作为候选划分点(n-1个,n为α所有的取值数目)。  
* 计算每一个划分点划分集合D(即划分为两个分支)后的信息增益。  
* 选择最大信息增益的划分点作为最优划分点。

缺失值

假定为样本集中的每一个样本都赋予一个权重,根节点中的权重初始化为1,则定义:

通过在样本集D中选取在属性α上没有缺失值的样本子集,计算在该样本子集上的信息增益,最终的信息增益等于该样本子集划分后信息增益乘以样本子集占样本集的比重。即:

对于(2):若该样本子集在属性α上的值缺失,则将该样本以不同的权重(即每个分支所含样本比例)划入到所有分支节点中。该样本在分支节点中的权重变为:

多变量决策树

对于高维数据空间,决策树形成的分类边界有一个特点:轴平行,引入多变量决策树实现斜划分,分裂节点变为k1*x1+k2*x2+...

http://www.wangmingla.cn/news/85759.html

相关文章:

  • 可以在哪个网站做封面赚钱深圳最新疫情最新消息
  • wordpress汉语插件seo外链发布软件
  • 网站套餐网站平台如何推广
  • 建设摩托车官网官方网站厦门网站建设
  • 网站开发后台注意事项宁波关键词优化时间
  • 南宁网站建设-中国互联2345系统导航
  • 购物网站后台设计网店运营推广实训
  • 潜江哪里做网站深圳网站建设服务
  • 本地搭建wordpress环境windows优化软件排行
  • 做一些网站的弹出页面网页制作步骤
  • wordpress与dz镇江关键字优化公司
  • 免费做链接的网站如何搭建一个网站平台
  • 深圳做网站推广的公司网站关键词优化怎么做的
  • 中国万网怎么自己做网站网推平台有哪些比较好
  • 各大网站每日热点汇总企业建站模板
  • 网站开发必学书籍如何开展网络营销活动
  • 网上国网app搜索引擎优化教材答案
  • 福州开发网站公司互联网营销师培训教材
  • 永久免费企业网站建设网站流量分析工具
  • 方正宽带网络服务有限公司seo外链优化方法
  • 标准网站建设合同网站推广的平台
  • 做 爱 网站视频国外b站不收费免费2023
  • 东莞如何建设网站制作平台网络营销与直播电商专业学什么
  • 西安网站建设公司有哪些足球联赛排名
  • 农机网站模版今日头条新闻消息
  • wordpress featured image邯郸网站优化
  • wordpress备份百度云广州seo排名优化
  • 做网站的广告语中文网站排行榜
  • 深圳定制网站制作全网营销推广是什么
  • 什么是网站后台郑州做网站