当前位置: 首页 > news >正文

做网站和网页有什么区别如何推广自己的业务

做网站和网页有什么区别,如何推广自己的业务,经典传奇网页游戏,中国空间站和国际空间站对比文章目录 前言为什么叫倒排索引数据结构如何生成如何查询TF、IDF参考文档 前言 上一章,简单介绍了 ES 的节点类型。 本章,我们要介绍 ES 中非常重要的一个概念:倒排索引。 ES 的全文索引就是基于倒排索引实现的。 本章内容建议重点学习&…

文章目录

      • 前言
      • 为什么叫倒排索引
      • 数据结构
      • 如何生成
      • 如何查询
      • TF、IDF
      • 参考文档

前言

上一章,简单介绍了 ES 的节点类型。
本章,我们要介绍 ES 中非常重要的一个概念:倒排索引。
ES 的全文索引就是基于倒排索引实现的。
本章内容建议重点学习,因为面试也常问。

为什么叫倒排索引

倒排索引指的是将每一个关键字映射到它出现的文档中。如下图所示
在这里插入图片描述

因为结构是倒着的,因此被称为倒排索引。

数据结构

倒排索引分为 2 部分:一部分叫 term directory(term 词典),一部分叫 posting list(倒排列表)。如下图所示
在这里插入图片描述

  • term directory
    term 字典,存放着每个单词到对应倒排列表的映射关系

  • posting list
    Docs 是一个数组。其中 1:2:[2,6] 意思如下

    • 1:文档ID
    • 2:词频(term frequency)
    • [2,6]:出现在文档中的第 2,6 个 term。

如何生成

这里涉及到我们之前讲过的分词器。工作流程如下图所示
在这里插入图片描述

大体就包含2部分,根据分词器将文本分词,然后根据分词生成倒排索引。

如何查询

例如我们查询:To do right
则该文本会先被分词为:to, do, right
对应的结果如下图所示:
在这里插入图片描述

TF、IDF

默认情况下,ES 会根据文档与搜索词的相关性得分对结果降序返回。相关性得分与以下 2 个概念有关(稍做了解,后续会出文章做更深入的介绍)

  • Term Frequency(TF):term 在文档中出现的频率,得分正相关。出现频率越高,得分越高
  • Inverted Document Frequency(IDF):term 在 所有文档 中出现的频率,得分负相关。出现频率越高,得分越低。

参考文档

Indexing: Inverted Index

http://www.wangmingla.cn/news/100594.html

相关文章:

  • 手机网站建设基本流程爱站seo综合查询
  • 网站开发系统设计怎么写免费域名
  • wordpress的登录地址修改密码seo内容优化是什么
  • 网站用什么做软文模板app
  • 在网站挂广告一个月多少钱中央新闻频道直播今天
  • 网站制作文章标签网络营销的基本特征
  • 重庆市工程建设信息网官网查询关键词排名优化工具
  • 拼多多关键词推广家庭优化大师免费下载
  • asp动态网站建设东莞关键词排名优化
  • avada如何做中英文网站百度竞价价格查询
  • 在中国做外国网站怎么收钱株洲最新今日头条
  • 网站营销推广策划书优化服务内容
  • 怎么注册晋江网站做的外贸seo优化
  • 自己做交友网站爱站关键词挖掘
  • 七冶建设集团网站 江苏百度首页快速排名系统
  • 贵阳专业做网站的公司百度推广竞价开户
  • 郑州网站建设鹏之信百度官方版
  • 一流的高密做网站的关键词分类
  • 站长之家查询域名自媒体论坛交流推荐
  • 做代售机票网站程序在百度上怎么发布广告
  • 无锡做网站多少钱免费创建网站平台
  • 网站建设 上海网站建设专业营销策划团队
  • 手机端便民服务平台网站建设故事式的软文广告例子
  • 淘宝客如何新建网站哈尔滨seo整站优化
  • 没有网站可以做百度推广吗百度竞价代理商
  • 做一个网站需要多久可免费投放广告的平台
  • 北京做手机网站设计百度搜索趋势
  • 如何网上快速接网站开发订单seo排名资源
  • 建设银行的英语网站首页百度推广电话销售好做吗
  • 网页设计模板套用步骤点石关键词排名优化软件