scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

такая же как в любом генераторе

Читать полностью…

Scrapy

если вы в любом месте напишете return то код после return не будет выполняться
паука это не останавливает

Читать полностью…

Scrapy

это я однажды так сделал и запомнил неправильно, что в parse() ретурн останавливает паука

Читать полностью…

Scrapy

а
это если return в start_requests, тогда понятно почему он стопится

Читать полностью…

Scrapy

значит у меня что то не так было)

Читать полностью…

Scrapy

окей, если считать донором airbnb*

Читать полностью…

Scrapy

Не знаю по теме ли это чата, но вот считается, мол, brightdata дорогие. А я так посчитал для себя, посравнивал — и выходит, что они чуть ли не самые дешевые :D

Читать полностью…

Scrapy

@omanamana - спс

Читать полностью…

Scrapy

nu face nimic, проехали)

Читать полностью…

Scrapy

Но как бы да, это "забудьте", но в специфическом значении

Читать полностью…

Scrapy

Можно перевести с английского дословно. Забудьте😁. Но видимо русский язык шёл мимо

Читать полностью…

Scrapy

"Забейте" грубее звучит

Читать полностью…

Scrapy

подскажите как найти спамовые вебсайты?
мусорки, которые состоят чисто из рекламы

Читать полностью…

Scrapy

проверял на мегамаркете

Читать полностью…

Scrapy

ну щас 1.3 самое сложное

Читать полностью…

Scrapy

Middleware лучше был бы мб?

Читать полностью…

Scrapy

а кстати вообще в чем разница return и yield в parse()?

Читать полностью…

Scrapy

ну start_requests же генератор
если я там ретурн напишу то дальше он не будет возвращать реквесты, стоп итерайшн будет после ретурна

Читать полностью…

Scrapy

ну значит просто ретурн делать?

Читать полностью…

Scrapy

как пропускать пустые тела ответа? пока что делаю так

    async def parse(self, response):
if response.body:
...
yield item

а хочу чтоб не было лишних отступов что то типа
    async def parse(self, response):
if not response.body:
#continue?
#return?
...
...
yield item

при return следующие страницы не обрабатываются, паук заканчивает работу, continue не могу юзать, это не цикл
что делать?

Читать полностью…

Scrapy

сравнивание проксей без донора - это как описание сферического коня в вакууме.
Для некоторых задач и прокся со встроенным обходом клоудфлари слабая, а для некоторых - и бесплатные нафуй не нужны :).
К примеру, мне, brightdata будет совсем не выгодная...

Читать полностью…

Scrapy

Есть ли библиотеки для парсинга десктопных программ, у которых есть GUI ? Если есть, то прошу перечислить. Спасибо

Читать полностью…

Scrapy

карочь, флуд почистил, если что - голосите

Читать полностью…

Scrapy

Энивей, что написано, то написано

Читать полностью…

Scrapy

по японски это дахусим

Читать полностью…

Scrapy

Можно сказать "не важно", но уже и не важно

Читать полностью…

Scrapy

невермаеенд
оууу меееен а вы из англии77

Читать полностью…

Scrapy

В феврале м-видео точно работало.

Читать полностью…

Scrapy

и curl_cffi не канает с 1.3

Читать полностью…

Scrapy

Зачем селениум?Что бы тлс обойти...

Читать полностью…
Subscribe to a channel