Caution
本仓库最开始储存本人的练习样例,后续由本人从0打造、建设、运营公司公众号:K哥爬虫,仓库改为储存公众号文章的部分代码,为公众号引流,2023年无奈变相被迫离职,公众号交还给公司其他人运营,2024年又被这家公司背刺抄袭本人网站 spiderbox.cn(点击查看文章),再加上仓库代码样例比较简单,且过于陈旧,很多都已无效,所以删掉了所有文章链接,本仓库已经没有学习价值,请在新的项目里关注我:
-
虫盒(spiderbox.cn):爬虫逆向资源导航站,全网优质博主最新逆向文章、视频同步收录更新,一站式追踪最新逆向安全技术;
-
虫术(spiderapi.cn):爬虫逆向常用 API,JS Hook、Frida Api、ADB命令、浏览器指纹、TLS指纹、数据解析提取等文档一站式查询;
-
虫规(spidergrc.cn):数据采集合规性建设(Governance, Risk management and Compliance),致力于推动数据采集合规化;
-
微信公众号虫技,分享攻防知识,探索技术边界,挖掘数据价值;搜索微信号:spider_skill 或者 IT-BOB;
-
我的个人博客:www.itbob.cn,有一些以前的逆向文章。
-
❗ 主要保存了本人在学习爬虫过程中写的代码,稍微复杂一点的在我博客里面有写分析过程,比较简单的项目,分析思路会直接写在 README 里面。
-
❗ 项目中部分代码可能已失效,原因可能是反爬措施更新、页面结构发生变化等,失效的可以提 issue,有时间会更新代码。
-
❗ 本仓库中所有内容仅供学习交流,严禁用于商业用途、非法用途,否则由此产生的一切后果均与作者无关,在本仓库中下载的文件学习完毕之后请于 24 小时内删除。
-
Material:爬虫相关资料,均从互联网收集;
-
AutomationTool:使用自动化工具进行数据采集、验证码处理等;
-
BasicTraining:基础训练,一般是比较简单的爬虫;
-
CommentPlugin:针对各大评论插件的爬虫,如 Facebook 评论插件等;
-
FightAgainstSpider:针对常见的反爬虫手段的爬虫,如字体加密等;
-
JSReverse:JS 加密解密、JS 逆向相关文章,重点关注逆向解密过程;
-
SignIn:针对各种签到、抽奖的爬虫;
-
SpiderDataVisualization:爬虫与数据可视化,如 COVID-19 数据可视化等。