当前位置: 首页 > news >正文

怎么往网站里做游戏百度网盘搜索引擎官方入口

怎么往网站里做游戏,百度网盘搜索引擎官方入口,手机兼职平台app排行榜前十名,杭州网站建设设计公司一、目的 作为日志采集工具Flume,它在项目中最常见的就是采集Kafka中的数据然后写入HDFS或者HBase中,这里就是用flume采集Kafka的数据导入HDFS中 二、各工具版本 (一)Kafka kafka_2.13-3.0.0.tgz (二)…

一、目的

作为日志采集工具Flume,它在项目中最常见的就是采集Kafka中的数据然后写入HDFS或者HBase中,这里就是用flume采集Kafka的数据导入HDFS中

二、各工具版本

(一)Kafka

kafka_2.13-3.0.0.tgz

(二)Hadoop(HDFS)

hadoop-3.1.3.tar.gz

(三)Flume

apache-flume-1.9.0-bin.tar.gz

三、实施步骤

(一)到flume的conf的目录下

# cd  /home/hurys/dc_env/flume190/conf

(二)创建配置文件evaluation.properties

# vi  evaluation.properties

### Name agent, source, channels and sink alias
a1.sources = s1
a1.channels = c1
a1.sinks = k1

### define kafka source
a1.sources.s1.type = org.apache.flume.source.kafka.KafkaSource

# Maximum number of messages written to Channel in one batch
a1.sources.s1.batchSize = 5000

# Maximum time (in ms) before a batch will be written to Channel The batch will be written whenever the first of size and time will be reached.
a1.sources.s1.batchDurationMillis = 2000

# set kafka broker address
a1.sources.s1.kafka.bootstrap.servers = 192.168.0.27:9092

# set kafka consumer group Id and offset consume
# 官网推荐1.9.0版本只设置了topic,但测试后不能正常消费,需要添加消费组id(自己写一个),并定义偏移量消费方式
a1.sources.s1.kafka.consumer.group.id = evaluation_group
a1.sources.s1.kafka.consumer.auto.offset.reset = earliest

# set kafka topic
a1.sources.s1.kafka.topics = topic_b_evaluation


### defind hdfs sink
a1.sinks.k1.type = hdfs
# set store hdfs path
a1.sinks.k1.hdfs.path = hdfs://hurys22:8020/rtp/evaluation/evaluation_%Y-%m-%d
# set file size to trigger roll
a1.sinks.k1.hdfs.rollSize = 0
a1.sinks.k1.hdfs.rollCount = 0
a1.sinks.k1.hdfs.rollInterval = 3600
a1.sinks.k1.hdfs.threadsPoolSize = 30
a1.sinks.k1.hdfs.fileType=DataStream
a1.sinks.k1.hdfs.writeFormat=Text


### define channel from kafka source to hdfs sink
# memoryChannel:快速,但是当设备断电,数据会丢失
# FileChannel:速度较慢,即使设备断电,数据也不会丢失
a1.channels.c1.type = file
# 这里不单独设置checkpointDir和dataDirs文件位置,参考官网不设置会有默认位置
# channel store size
a1.channels.c1.capacity = 100000
# transaction size
a1.channels.c1.transactionCapacity = 10000


### 绑定source、channel和sink
a1.sources.s1.channels = c1
a1.sinks.k1.channel = c1

(三)配置文件创建好后启动flume服务

# cd /home/hurys/dc_env/flume190/

# ./bin/flume-ng agent -n a1  -f /home/hurys/dc_env/flume190/conf/evaluation.properties

(四)到HDFS文件里验证一下

HDFS中生成evaluation_2023-09-07 文件夹,里面有很多小文件

(五)注意:小文件里的数据是JSON格式,即使我设置文件后缀名为csv也没用(可能配置文件中的文件类型设置需要优化

a1.sinks.k1.hdfs.writeFormat=Text

(六)jps查看Flume的服务

[root@hurys22 conf]# jps
16801 ResourceManager
4131 Application
18055 AlertServer
16204 DataNode
22828 Application
17999 LoggerServer
2543 launcher.jar
22224 Application
17393 QuorumPeerMain
16980 NodeManager
17942 WorkerServer
16503 SecondaryNameNode
11384 Application
32669 Application
17886 MasterServer
10590 Jps
16031 NameNode
18111 ApiApplicationServer

注意:Application就是Flume运行的任务

(七)关闭Flume服务

如果想要关闭Flume服务,直接杀死服务就好了

# kill -9 32669

(八)checkpointDir和dataDirs默认的文件位置

默认的文件位置:/root/.flume/file-channel/

总之,Flume这个工具的用法还需进一步研究优化,当然kettle也可以,所以这个项目目前还是用kettle吧!

http://www.wangmingla.cn/news/506.html

相关文章:

  • 没有独立ip如何解析网站上海网站制作推广
  • 百度哪个网站做贸易关键词你们懂的
  • 云南网站设计外包做好的网站怎么优化
  • 推荐做那个的电影网站百度竞价点击神器
  • 视频网站做短视频经典软文广告案例
  • wordpress 中英文网站模板如何推广app
  • 单位网站建设目的网络推广是什么工作内容
  • 专业类网站桂林网站设计制作
  • 做海报找素材的网站全网营销图片
  • 泉州网站seo江东seo做关键词优化
  • 建设网站项目概述汕头seo托管
  • 企业云服务平台企业seo网络营销
  • 一起生活小程序怎么注册seo优化seo外包
  • 免费b2b网站大全免费黄页网址链接查询
  • php做网站需要什么技术网络推广产品要给多少钱
  • 做网站的是哪类公司百度账号登陆入口
  • 个人免费域名注册网站做百度推广的网络公司
  • 门户类网站前台免费seo营销优化软件下载
  • 网站诊断书怎么做百度旗下13个app
  • 日照建网站电商关键词查询工具
  • 互动网站建设自媒体seo是什么意思
  • 鲜花团购网站建设太原关键词优化报价
  • 陕西网站建设公司找哪家网络营销渠道建设方案
  • j2ee博客网站开发重庆排名seo公司
  • 明星做代言的购物网站0东莞seo关键词
  • 树莓派做网站服务器性能怎么样宁波网站推广大全
  • 威海哪有网站建设视频推广一条多少钱
  • 咖啡网站设计建设wordpress自助建站
  • 网站域名费用怎么做帐网站推广seo教程
  • 网络销售是做网站推广百度搜索排名推广