yuque-spider-plus

该项目基于https://github.com/burpheart/yuque-crawl项目进行修改

语雀文档抓取工具（爬虫）可以保存任意用户整个语雀知识库为Markdown格式 (包含完整目录结构和索引)

使用：安装 python3

https://www.python.org/downloads/

执行安装运行模块

pip install requests tqdm urllib3

执行抓取：

python3 main.py 语雀文档地址

demo： python3 main.py https://www.yuque.com/burpheart/phpaudit

2024/07/03

增加需要密码需要设置cookie功能爬取

把浏览器全部cookie值复制到指定设置

命令行

示例 1：提供 URL 和 Cookie

python main.py "https://www.yuque.com/burpheart/phpaudit" --cookie "verified_books=****"

示例 2：提供 URL、Cookie 和输出路径

python main.py "https://www.yuque.com/burpheart/phpaudit" --cookie "verified_books=****" --output "download"

示例 3：仅提供 URL

python main.py "https://www.yuque.com/burpheart/phpaudit"

示例 4：提供 URL 和输出路径

python main.py "https://www.yuque.com/burpheart/phpaudit" --output "download"

示例 5：使用默认参数（显示帮助信息）

python main.py

2024/07/04

网络图片本地观看

修复出现部分图片无法本地加载的情况，把网络图片下载下来并把markdown对应的图片路径替换为相对路径的./assets路径下

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
assets		assets
README.md		README.md
input.txt		input.txt
main.py		main.py
start.bat		start.bat

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

yuque-spider-plus

2024/07/03

增加需要密码需要设置cookie功能爬取

2024/07/04

网络图片本地观看

2024/09/27

实现批量url笔记爬取

执行命令

About

Releases 2

Packages

Languages

Spritualkb/yuque-spider-plus

Folders and files

Latest commit

History

Repository files navigation

yuque-spider-plus

2024/07/03

增加需要密码需要设置cookie功能爬取

2024/07/04

网络图片本地观看

2024/09/27

实现批量url笔记爬取

执行命令

About

Resources

Stars

Watchers

Forks

Releases 2

Packages 0

Languages

Packages