Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

小红书用户主页爬取是否支持从上一次中断的地方继续爬取? #544

Open
dbcooper7z opened this issue Jan 21, 2025 · 1 comment
Labels
question Further information is requested

Comments

@dbcooper7z
Copy link

⚠️ 提交前确认

  • [☑️] 我已经仔细阅读了项目使用过程中的常见问题汇总
  • [☑️] 我已经搜索并查看了已关闭的issues
  • [☑️] 我确认这不是由于滑块验证码、Cookie过期、Cookie提取错误、平台风控等常见原因导致的问题

❓ 问题描述

python main.py --platform xhs --lt cookie --type creator,爬取小红书用户主页的所有帖子,爬取300条帖子后,提示”访问频次异常,请勿频繁操作或重启试试“。
第二次运行时,发现是从头开始爬取,重复的帖子信息写入json文件。爬取300条帖子后,再次提示”访问频次异常,请勿频繁操作或重启试试“。
尝试修改base_config.py中的“START_PAGE = 11”,没有用。
请问用户主页爬取是否支持从上一次中断的地方继续爬取?后续可否增加这个功能?d3eeccb好像只针对搜索的情况。

🔍 使用场景

  • 目标平台: 小红书
  • 使用功能: 用户主页爬取

💻 环境信息

  • 操作系统: MacOS 15.2
  • Python版本: Python 3.9.20
  • 是否使用IP代理: 否
  • 是否使用VPN翻墙软件:否
  • 目标平台(抖音/小红书/微博等): 小红书
@dbcooper7z dbcooper7z added the question Further information is requested label Jan 21, 2025
@dbcooper7z dbcooper7z changed the title [问题] 小红书用户主页爬取是否支持从上一次中断的地方继续爬取? Jan 21, 2025
@NanmiCoder
Copy link
Owner

不支持

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested
Projects
None yet
Development

No branches or pull requests

2 participants