scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

А, я так понял надо через autothrottle переделывать

Читать полностью…

Scrapy

нужен кодер, который может обойти капчу

Читать полностью…

Scrapy

хотите ждать результатов запросов в этом же колбэке - делайте как делали

Читать полностью…

Scrapy

ну вот мне надо послать х*****ву тучу запросов, и кое-что сделать, как только они все закончат работу, поэтому я подумал что это хорошее решение моей проблемы 😂️️️️️️

Читать полностью…

Scrapy

блин, а у асинхронных запросов нету колбэков 😢️️️️️️

Читать полностью…

Scrapy

а если на каждом этапе код разный? :)

Читать полностью…

Scrapy

мне желательно чтоб рандом был просто 😄

Читать полностью…

Scrapy

а это всё по порядку, или там есть какой-то элемент рандома?)

Читать полностью…

Scrapy

https://docs.scrapy.org/en/latest/topics/coroutines.html#inline-requests

Читать полностью…

Scrapy

у меня на докере селениум grid, работает через SELENIUM_REMOTE_URL

Читать полностью…

Scrapy

если сервак дохлый - уже ничего не спасет. Был у меня один сайт, от 20 потоков в 503 ошибку сваливался.... Причем именно сайт падал, а не баны по проксям

Читать полностью…

Scrapy

если в браузере так, то скорее всего ничего не сделать, какая бы ни была причина

Читать полностью…

Scrapy

если сервак дохлый - никак.

Читать полностью…

Scrapy

https://stackoverflow.com/questions/75106880/add-the-spiders-name-to-each-line-of-log
Yoyoda лучший....

Читать полностью…

Scrapy

м... в другом окне открывать же. Проверил, работает в лисе

Читать полностью…

Scrapy

А concurrent_requests реально concurrent только если download_delay стоит в 0?

Читать полностью…

Scrapy

весь скрапи асинхронный

Читать полностью…

Scrapy

а делать костыли с булями уже надоело

Читать полностью…

Scrapy

конечно, иначе зачем

Читать полностью…

Scrapy

это идея для следующей версии, чтобы было из коробки

Читать полностью…

Scrapy

Кстати, возможно ли добавить в RetryMiddleware разное количество повторных попыток для каждого статуса. Например, для статуса 429 5 повторных попыток, а для статуса 403 — 2 попытки.

Читать полностью…

Scrapy

по порядку наверно, но не уверен

Читать полностью…

Scrapy

ап ту CONCURRENT_REQUESTS*

Читать полностью…

Scrapy

Вопрос:
если бы у меня было не 2 запроса, как в примере, а 100 - паучок всех их пошлёт сразу self.crawler.engine.download(r) ?

Читать полностью…

Scrapy

кто использовал scrapy-playwright, я правильно понимаю, если подниму playwright в докере и пропишу PLAYWRIGHT_CDP_URL до него, всё будет работать?

Читать полностью…

Scrapy

максимум - через пул проксей может быть лучше

Читать полностью…

Scrapy

в сайте проблема? он просто тупой и медленный хочешь сказать?

Читать полностью…

Scrapy

как обходить, что тебя сайт троттлит? браузером и через прокси, что юзает сам паук, запросы делаются как обычно

Читать полностью…

Scrapy

реально спасибо, без шуток

Читать полностью…

Scrapy

поэтому не важно, хром или лиса

Читать полностью…
Subscribe to a channel