Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
если вы в любом месте напишете return то код после return не будет выполняться
паука это не останавливает
это я однажды так сделал и запомнил неправильно, что в parse() ретурн останавливает паука
Читать полностью…а
это если return в start_requests, тогда понятно почему он стопится
Не знаю по теме ли это чата, но вот считается, мол, brightdata дорогие. А я так посчитал для себя, посравнивал — и выходит, что они чуть ли не самые дешевые :D
Читать полностью…Но как бы да, это "забудьте", но в специфическом значении
Читать полностью…Можно перевести с английского дословно. Забудьте😁. Но видимо русский язык шёл мимо
Читать полностью…подскажите как найти спамовые вебсайты?
мусорки, которые состоят чисто из рекламы
ну start_requests же генератор
если я там ретурн напишу то дальше он не будет возвращать реквесты, стоп итерайшн будет после ретурна
как пропускать пустые тела ответа? пока что делаю так
async def parse(self, response):
if response.body:
...
yield item
async def parse(self, response):
if not response.body:
#continue?
#return?
...
...
yield item
сравнивание проксей без донора - это как описание сферического коня в вакууме.
Для некоторых задач и прокся со встроенным обходом клоудфлари слабая, а для некоторых - и бесплатные нафуй не нужны :).
К примеру, мне, brightdata будет совсем не выгодная...
Есть ли библиотеки для парсинга десктопных программ, у которых есть GUI ? Если есть, то прошу перечислить. Спасибо
Читать полностью…