Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Крашится парсинг #41

Open
ma4ypic4y opened this issue Aug 30, 2023 · 4 comments
Open

Крашится парсинг #41

ma4ypic4y opened this issue Aug 30, 2023 · 4 comments
Labels
enhancement New feature or request

Comments

@ma4ypic4y
Copy link

ma4ypic4y commented Aug 30, 2023

При парсинге с одной url более 2.5k точек появляется зависание и падает вкладка парсинга с сообщением "oops.." (иногда пишется out of memory). Тестировал на разных устройствах win/mac, но всегда отваливается на 2300 +-200 точек.
В параметрах указываю:
image

С чем это может быть связано?

@interlark interlark added the enhancement New feature or request label Jan 16, 2024
@interlark
Copy link
Owner

Связано с переполнением RAM, нужно перезапускать парсер и продолжать работу с последней успешно собранной страницы. Руки не доходят сделать в виду отсутствия свободного времени, а пул реквестов на ревью никто ещё не присылал.

@interlark
Copy link
Owner

@andbaish, какой URL?

@andbaish
Copy link

andbaish commented Jan 18, 2024

@andbaish, какой URL?

Ваш парсер может максимально 10 000 парсить так как после 845 страницы 2гис не предоставляет данные.

Проверил вручную и через парсер методом описанным здесь "нужно перезапускать парсер и продолжать работу с последней успешно собранной страницы"

Поэтому лимит 30000 даст максимально 10000 можно ли это как то магическим образом увеличить?

@interlark
Copy link
Owner

@andbaish, интересное наблюдение -- Я ещё не находил таких запросов, которые бы выдавали 10к записей в ответ.
Тут уж ничего не поделать, в любой в поисковой выдаче есть ограничения, тут выход - конкретизировать запрос.
У Google, насколько помню, 30 страниц, у Циана 70 страниц, и т. д.
Про 845 страниц у 2GIS, пока что, поверю на слово.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

3 participants