当前位置: 首页 > news >正文

苏州网站维护互联网营销公司

苏州网站维护,互联网营销公司,半夜看的直播app推荐知乎,用jsp怎么做的购物网站目录 前言思路与核心代码优缺点分析 前言 dataframe是用python做数据分析最场景的数据结构了,如何将dataframe数据快速写入到clickhouse数据库呢?这里介绍几种方法,各有优劣势,可以结合自己的使用场景挑用。 思路与核心代码 假…

目录

  • 前言
  • 思路与核心代码
  • 优缺点分析

前言

dataframe是用python做数据分析最场景的数据结构了,如何将dataframe数据快速写入到clickhouse数据库呢?这里介绍几种方法,各有优劣势,可以结合自己的使用场景挑用。

思路与核心代码

假设df是一个dataframe数据结构,一共有5个列。

  • to_records一条一条插入
df = pd.Dataframe()for x in df.to_records(index = False): sql = "INSERT INTO database.table_name(col1,col2,col3,col4,col5)VALUES"+str(tuple(x))# print(sql)client.execute(sql)

这种方法将dataframe里面每一个看车一个record记录,一条记录一条记录插入clickhouse数据表,不容易出岔子,但是一旦数据量很大,就会要很长时间;

  • 整个dataframe插入
df = pd.Dataframe()insert_query = 'INSERT INTO  database.table_name(col1,col2,col3,col4,col5)VALUES'  
values_query = ','.join([tuple(df.iloc[i]) for i in range(len(df))])  
insert_query += f' ({",".join([f"({col}, {val})" for col, val in zip(df.columns, values_query)])})'  
cursor = conn.cursor()  
cursor.execute(insert_query)

这种方法先利用values_query变量将每一行的数据转换为字符串形式,然后,使用INSERT语句将通过将整个DataFrame一次性插入ClickHouse中,避免了频繁的网络通信,从而提高了性能。但是需要注意的是,这种方法只适用于小型数据集。其实,也可以仿MySQL那样用to_sql的方法一次性塞入表里面

df = pd.Dataframe()df.to_sql('database.table_name', conn, if_exists='append', index=False) 
  • parallel插入
insert_query = 'INSERT INTO my_table (name, age, salary) VALUES'  
values_query = ','.join([tuple(df.iloc[i]) for i in range(len(df))])  
insert_query += f' ({",".join([f"({col}, {val})" for col, val in zip(df.columns, values_query)])})'  
cursor = conn.cursor()  
cursor.execute(insert_query, parameters=None, execution_profile='parallel')

对于超大型数据集,建议使用ClickHouse的并行插入功能或其他分布式技术。

优缺点分析

1,如果提前构造好了dataframe,且dataframe数据量适中,那么可以考虑一次性塞入,如果dataframe数据量足够大超出了内存容量,那么就要考虑了;
2,对于哪些容易丢失的还是一条一条插入数据库为好;

http://www.wangmingla.cn/news/62469.html

相关文章:

  • 网站开发网站排名优化安徽做网站公司哪家好
  • 动漫电影做英语教学视频网站有哪些襄阳百度开户
  • 铁岭做网站自己怎么制作网站
  • 凡科网站备案备案查询平台官网
  • 北京通州区住房和城乡建设委员会网站友情链接交换平台
  • 京东云 安装wordpress小璇seo优化网站
  • 网站seo优化方案项目策划书seo百度关键词优化软件
  • wordpress 语言选择器佛山seo代理计费
  • 免费注册网站有哪些网站推广属于哪些
  • 政府网站开发报价今日头条号官网
  • 标志设计欣赏网站市场调研报告范文模板word
  • 帝国cms灵动标签做网站地图上海培训机构有哪些
  • 员工入职 在哪个网站做招工广州今日新闻最新消息
  • 丰台高端网站建设一站式网络营销
  • 邢台专业做移动网站四川省最新疫情情况
  • 做外快的网站蚁坊软件舆情监测系统
  • 做网站和做推广的区别怎么查搜索关键词排名
  • 沈阳市住房和城乡建设局网站在哪里可以做百度推广
  • wordpress登陆链接seo排名优化技术
  • ftp网站备份seo推广方案怎么做
  • phpwind与wordpress广州seo好找工作吗
  • 河南郑州网站关键词排名助手优书网首页
  • 做a动态网站企业邮箱哪个好
  • 网站权重多少4深圳seo关键词优化
  • wordpress建站落后吗收录优美图片崩了
  • 有了域名怎么制作网站在百度上打广告找谁推广产品
  • 网站建设销售发展前景seo去哪学
  • 珠宝网站开发的背景推广一个产品有哪些方式
  • 网站加入谷歌地图导航会计培训班多少钱
  • 外贸网站推广工作东莞网站优化关键词排名