当前位置: 首页 > news >正文

网络文化经营许可证变更法人soe搜索优化

网络文化经营许可证变更法人,soe搜索优化,网站建设教程网页,tornado做网站霍比特人小说爬取,使用 selenium 模块调用谷歌浏览器,无界面模式爬取小说网站信息,将数据按照每次2000字符在mysql中保存。 # https://www.shukuai9.com/b/324694/ # 导入需要的库 from selenium import webdriver # 导入Keys模块&#xff…

霍比特人小说爬取,使用 selenium 模块调用谷歌浏览器,无界面模式爬取小说网站信息,将数据按照每次2000字符在mysql中保存。
在这里插入图片描述

# https://www.shukuai9.com/b/324694/
# 导入需要的库
from selenium import webdriver
# 导入Keys模块,用于模拟键盘按键操作
from selenium.webdriver.common.keys import Keys
#数据库
import pymysql#获取文本,拆分为4000字每段
def text_sql(title,dimension,text):text = text.replace(chr(9),'').replace(chr(10),'').replace(chr(13),'')print(title,dimension,len(text),len(text)//2000)for i in range((len(text)//2000)+1):str_num = i*2000end_num = (i+1)*2000#print(str_num,end_num)#print(i,text[str_num:end_num])try:start = mysql_in(title,dimension,i,text[str_num:end_num])except Exception as e:print(e)start='异常'print(title,dimension,i,start)#数据库登录
def mysql_execute(in_sql, leixing):# 登录数据库conn = pymysql.connect(host='127.0.0.1', port=3306, user='szc_sql', password='szcNSP850219', database='szc_sql',charset='utf8')# # 登录数据库# dsn = "134.80.200.216/xxx"# try:#     conn = cx_Oracle.connect(user="zbweb", password="zibo_xxx", dsn=dsn, encoding="UTF-8")# except:#     time.sleep(10)#     conn = cx_Oracle.connect(user="zbweb", password="zibo_xxx", dsn=dsn, encoding="UTF-8")# 得到一个可以执行SQL语句的光标对象cursor = conn.cursor()# 数据库执行导入的语句if leixing == '数量':# 反馈数量count = cursor.execute(in_sql)elif leixing == '单条':# 反馈单条cursor.execute(in_sql)count = cursor.fetchone()[0]elif leixing == '多条':# 反馈多条cursor.execute(in_sql)count = cursor.fetchall()elif leixing == '编辑':count = cursor.execute(in_sql)conn.commit()# 关闭光标对象cursor.close()# 关闭数据库连接conn.close()# 反馈return countdef mysql_in(title,dimension,num,text):print(num,type(num))sql="delete from novel_text where title='%s' and dimension='%s' and num='%s' " % (title,dimension,str(num))mysql_execute(sql, '编辑')sql = "insert into novel_text (title,dimension,num,text) values('%s','%s','%s','%s') " % (title,dimension,str(num),text)print('sql',sql)mysql_execute(sql, '编辑')return '完成'# 创建Chrome浏览器对象
chrome_opt = webdriver.ChromeOptions()
# 开启无界面模式
chrome_opt.add_argument('--headless')
# 禁用gpu
chrome_opt.add_argument('--disable-gpu')
# 创建Chrome浏览器实例
driver = webdriver.Chrome(executable_path='./chromedriver.exe',options=chrome_opt)
# 打开网页
driver.get("https://www.shukuai9.com/b/324694/")
# 等待页面加载完成
driver.implicitly_wait(10)
# 获取搜索结果列表元素
search_results = driver.find_elements_by_css_selector("dd")
search_title = driver.find_elements_by_css_selector("h1")
print('search_title',search_title)for text in search_title:print('text',text.text)search_title_text = text.texthbt_key = {}
# 输出搜索结果标题和链接
for result in search_results:title = result.find_element_by_css_selector("a").textlink = result.find_element_by_css_selector("a").get_attribute("href")num = str(title).index('节')title_num = title[1:num]#print(title_num,biaoti, link)hbt_key[title_num]=[title,link]#print('hbt_key',hbt_key)#获取键值对个数
for i in range(len(hbt_key)):print(hbt_key[str(i+1)])title = hbt_key[str(i + 1)][0]link = hbt_key[str(i + 1)][1]# 打开网页driver.get(link)# 等待页面加载完成driver.implicitly_wait(10)# 获取搜索结果列表元素search_results = driver.find_element_by_xpath('//*[@id="content"]').text#print(search_results)# 输出搜索结果标题和链接search_text = ''for t in search_results:search_text += tprint(len(search_text),type(search_text))#文字留存text_sql(search_title_text,title,search_text)#break
http://www.wangmingla.cn/news/142046.html

相关文章:

  • b2b电子商务网站和平台有哪些?关键词全网搜索
  • 短链接恢复长连接重庆seo教程博客
  • 盘龙网站建设如何做企业产品推广
  • 天津做网站的b站推广网站2023
  • 什么叫做响应式网站西昌seo快速排名
  • 上海学做网站百度浏览器下载安装
  • 做微课的网站有哪些方面快速排名优化
  • 微服务网站开发新媒体口碑营销案例
  • wordpress 建站教程黄页污水
  • 公司网站选择什么空间产品推广建议
  • 工行网站如何做理财风险评估百度关键词竞价价格查询
  • 政府网站后缀的域名媒体公关
  • 一家只做外卖的网站外链发布平台有哪些
  • 如何做网站页面怎么建立网站?
  • 海网站建设网站推广有哪些方式
  • copyright技术支持 东莞网站建设百度seo公司报价
  • 网站建设可以自己弄吗知乎长沙seo报价
  • 套餐型网站建设合同seo是什么职务
  • 网络优化工程师工资一般多少seo优化方法
  • 24小时最新在线视频免费观看手机seo百度点击软件
  • 大气好看的网站南宁百度关键词优化
  • 免费网站申请注册百度站内搜索代码
  • 郑州做网站哪家专业网页设计欣赏
  • 做食品批发的网站seo搜索引擎优化原理
  • 哈尔滨网站建设制作哪家好seo的优点
  • 网站移动排名阿里云搜索引擎入口
  • 网站开发的母的目的和意义.企业管理培训公司排行榜
  • 网站建设教程详解手机最新产品新闻
  • 站群推广有哪些方式seo流量是什么意思
  • php动态网站开发总结谈谈对seo的理解