Skip to content

Latest commit

 

History

History
40 lines (35 loc) · 1.34 KB

README.md

File metadata and controls

40 lines (35 loc) · 1.34 KB

百度贴吧(GUI界面操作)

依赖参考

  • Python 3
  • scrapy 1.6
  • openpyxl
  • tkinter
  • pyinstaller (假如要打包成为EXE)

可以选择的功能

  • 切换贴吧
  • 中途暂停爬虫
  • 提前结束某个任务
  • 打包成exe程序
  • 设置需要爬取帖子的数量
  • 设置需要爬取用户的数量
  • 爬取帖子的信息
贴名 url 开贴时间 回复数量 用户数量
  • 爬取用户的信息
用户名 url 吧龄 发帖数量 关注数量 粉丝数量 客户端
  • 爬取用户关注所有的贴吧的信息
用户名 url 贴吧数量 吧名 等级

例子:三国杀文件夹中的Excel文件

使用方法

1.运行main.py后,设置GUI中的参数即可

2.假如你将程序通过pyinstaller打包成EXE,运行dist下的EXE文件即可。 由于我要上传GitHub,我把EXE部分删除了。

其他

  • 这是我第一份GitHub代码,哈哈,希望有个好的开始
  • v1.2版本 有一些BUG,假如有人用的话,我就会利用课余时间修复一下
  • MySQL版本的代码我删除掉了

联系