本项目是基于 PyWebIO,FastAPI,AIOHTTP,快速异步的抖音/TikTok数据爬取工具,并通过Web端实现在线批量解析以及下载无水印视频或图集,数据爬取API,iOS快捷指令无水印下载等功能。你可以自己部署或改造本项目实现更多功能,也可以在你的项目中直接调用scraper.py或安装现有的pip包作为解析库轻松爬取数据等.....
一些简单的运用场景:
下载禁止下载的视频,进行数据分析,iOS无水印下载(搭配iOS自带的快捷指令APP 配合本项目API实现应用内下载或读取剪贴板下载)等.....
API-V2: 支持输入
Douyin|TikTok
用户主页爬取该作者[主页视频数据(去水印链接, 已点赞视频列表(权限需为公开), 视频评论数据, 背景音乐视频列表数据, 等等...), 详细信息请查看V2文档, 服务器响应时间有时会变长, 使用时请将timeout
值设高.
🍔Web APP: https://douyin.wtf/
🍟API-V1: https://api.douyin.wtf/docs
🌭API-V2: https://api-v2.douyin.wtf/docs
💾iOS Shortcut(快捷指令): Shortcut release
📦️桌面端下载器(仓库推荐):
scraper.py:
- 向[Douyin|TikTok]的API提交请求并取回数据,处理后返回字典(dict),支持异步。
web_api.py:
- 获得请求参数并使用
Scraper()
类处理数据后以JSON形式返回,视频下载,配合iOS快捷指令实现快速调用,支持异步。
web_app.py:
- 为
web_api.py
以及scraper.py
制作的简易Web程序,将网页输入的值进行处理后使用Scraper()
类处理并配合web_api.py
的接口输出在网页上(类似前后端分离)
以上文件的参数大多可在config.ini中进行修改
.
└── Douyin_TikTok_Download_API/
├── /static -> (PyWebIO static resources)
├── web_app.py -> (Web APP)
├── web_api.py -> (API)
├── scraper.py -> (Parsing library)
├── config.ini -> (configuration file)
- 抖音(抖音海外版: TikTok)视频/图片解析
- 网页端批量解析(支持抖音/TikTok混合提交)
- 网页端解析结果页批量下载无水印视频(V3.0.0暂时移除,请自行部署V2.X版本)
- API调用获取链接数据
- 制作pip包方便快速导入你的项目
- iOS快捷指令快速调用API实现应用内下载无水印视频/图集
- 解析作者主页内所有视频(API-V2 支持抖音/TikTok)
- 解析视频内所有评论信息(API-V2 支持抖音/TikTok)
💡欢迎提出新的建议或将你的思路在issue中与我分享,或直接提交PR至Development分支 ♪(・ω・)ノ)
- 编写一个桌面端的下载器实现本地批量下载
- API-V2添加对hash_tag页面的数据爬取 #101
- 对其他短视频平台添加支持,如:抖音火山版,快手,西瓜视频,哔哩哔哩
安装解析库:pip install douyin-tiktok-scraper
import asyncio
from douyin_tiktok_scraper.scraper import Scraper
api = Scraper()
async def hybrid_parsing(url: str) -> dict:
# Hybrid parsing(Douyin/TikTok URL)
result = await api.hybrid_parsing(url)
print(f"The hybrid parsing result:\n {result}")
return result
asyncio.run(hybrid_parsing(url=input("Paste Douyin/TikTok share URL here: ")))
💡提示:包含但不仅限于以下例子,如果遇到链接解析失败请开启一个新 issue
- 抖音分享口令 (APP内复制)
7.43 pda:/ 让你在几秒钟之内记住我 https://v.douyin.com/L5pbfdP/ 复制此链接,打开Dou音搜索,直接观看视频!
- 抖音短网址 (APP内复制)
https://v.douyin.com/L4FJNR3/
- 抖音正常网址 (网页版复制)
https://www.douyin.com/video/6914948781100338440
- 抖音发现页网址 (APP复制)
https://www.douyin.com/discover?modal_id=7069543727328398622
- TikTok短网址 (APP内复制)
https://www.tiktok.com/t/ZTR9nDNWq/
- TikTok正常网址 (网页版复制)
https://www.tiktok.com/@evil0ctal/video/7156033831819037994
- 抖音/TikTok批量网址(无需使用符合隔开)
https://v.douyin.com/L4NpDJ6/
https://www.douyin.com/video/7126745726494821640
2.84 nqe:/ 骑白马的也可以是公主%%百万转场变身https://v.douyin.com/L4FJNR3/ 复制此链接,打开Dou音搜索,直接观看视频!
https://www.tiktok.com/t/ZTR9nkkmL/
https://www.tiktok.com/t/ZTR9nDNWq/
https://www.tiktok.com/@evil0ctal/video/7156033831819037994
💡提示:也可以在web_api.py的代码注释中查看接口文档
API-V1文档: 本地:http://localhost:8000/docs 在线:https://api.douyin.wtf/docs
API-V2文档: 在线:https://api-v2.douyin.wtf/docs
API演示:
- 爬取视频数据(TikTok或Douyin混合解析)
https://api.douyin.wtf/api?url=[视频链接/Video URL]&minimal=false
- 下载视频/图集(TikTok或Douyin混合解析)
https://api.douyin.wtf/download?url=[视频链接/Video URL]&prefix=true&watermark=false
- 替换域名下载视频/图集
[抖音]
原始链接:
https://www.douyin.com/video/7159502929156705567
替换域名:
https://api.douyin.wtf/video/7159502929156705567
# 返回无水印视频下载响应
[TikTok]
original link:
https://www.tiktok.com/@evil0ctal/video/7156033831819037994
Replace Domain:
https://api.douyin.wtf/@evil0ctal/video/7156033831819037994
# Return No Watermark Video Download Response
更多演示请查看文档内容......
💡提示:最好将本项目部署至美国地区的服务器,否则可能会出现奇怪的BUG。
- 首先要去安全组开放8080(Web)和8000(API)端口。
- 在宝塔面板应用商店内搜索
进程守护
或手动安装supervisord
:
[宝塔面板]
https://www.bt.cn/new/download.html
[aapanel]
https://www.aapanel.com/new/download.html
[Supervisor]
http://supervisord.org/installing.html
- 配置项目config.ini文件
- 安装依赖文件
pip install -r requirements.txt
- 设置
supervisord
守护进程 - 启动命令:
[Web]
python3 web_app.py
[API]
python3 web_api.py
- 程序入口:
[Web]
http://localhost:8080
[API]
http://localhost:8000
💡Docker Image repo: Docker Hub
- 安装docker
curl -fsSL get.docker.com -o get-docker.sh&&sh get-docker.sh &&systemctl enable docker&&systemctl start docker
- 留下config.int和docker-compose.yml文件即可
- 运行命令,让容器在后台运行
docker compose up -d
- 查看容器日志
docker logs -f douyin_tiktok_download_api
- 删除容器
docker rm -f douyin_tiktok_download_api
- 更新
docker compose pull && docker compose down && docker compose up -d
API速度测试(对比官方API)
项目界面
Start: 2021/11/06 GitHub: @Evil0ctal Contact: [email protected]