scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

я как то пытался scrapy-playwright юзать

Читать полностью…

Scrapy

Ваще странно, что ты после получения кукисов простым скрапи без ничего заходишь, я пробовал на сайте одном с playwright логиниться и в скрапи кукисы передавать, и мне тупо на каждый запрос без playwright обламывало (хотя я ща подумал, может я тупой и в угаре писанины не проследил, чтоб эти полученные кукисы передавались). Если прям не охота там возиться шибко, можно scrapy-playwright юзать и забить болт.

По-идее, в твоем варианте можно в errback отлавливать 403 и заходить по meta playwright или там об async def init_page как в доках, а в остальных случаях пока по башке 403 не прилетит не ходить playwright'ом, но хз.

Читать полностью…

Scrapy

ну т.е. образно - это воть)

Читать полностью…

Scrapy

погодь, а сайт леруа?

Читать полностью…

Scrapy

я сначала пробую обычным request'ом

Читать полностью…

Scrapy

без куков ты на сайт не попадешь через запросы

Читать полностью…

Scrapy

или playwright'ом каким?

Читать полностью…

Scrapy

тупо эмулируешь логин или просто переходишь в домен и все сначала работает?

Читать полностью…

Scrapy

просто перехожу на домен

Читать полностью…

Scrapy

а не оказывается что ты их как-нибудь там перезаписываешь нехорошо каждый раз?

Читать полностью…

Scrapy

хотя в моей голове тоже держалась мысль, что куки сами по себе будут обновляться и не нужно их менять

Читать полностью…

Scrapy

я просто залил куки и начал отправлять запросы

Читать полностью…

Scrapy

по-идее он сам должен держать кукисы, скрапи-то. странно что они дохнут.

Читать полностью…

Scrapy

трабл в том, что с течением времени куки дохнут, их нужно менять

Читать полностью…

Scrapy

да, внутри ты не поменяешь, но инициализировать запрос с отдельными кукисами или проксей сможешь

Читать полностью…

Scrapy

по-идее наверно если зайти с meta={"playwright": True, - то он потом эти кукисы как-то должен и в обычный вызов скрапи засунуть

Читать полностью…

Scrapy

ну да, тупанул ахахах

Читать полностью…

Scrapy

только сейчас вспомнил что там кратор стоит

Читать полностью…

Scrapy

если пашет, то без эмуляции

Читать полностью…

Scrapy

а если просто в скрапи зайдешь, чего будет?

Читать полностью…

Scrapy

я пробовал через инкогнито там вроде как нет никаких js проверок

Читать полностью…

Scrapy

да, просто на домен перехожу

Читать полностью…

Scrapy

там нет js вроде как

Читать полностью…

Scrapy

ну хотя возможно там надо какой-то js-challenge решать, ты их как получаешь в самом начале?

Читать полностью…

Scrapy

если все же получится так, что я один раз запрошу куки и больше не нужно будет их получать - я вообще буду очень рад

Читать полностью…

Scrapy

потом стал получать 403

Читать полностью…

Scrapy

ну я пытался, не через то, что ты скинул

Читать полностью…

Scrapy

по истечению n времени, сайт мне шлет 403 с куками. После того, как я их поменяю, все окей становится

Читать полностью…

Scrapy

https://docs.scrapy.org/en/latest/topics/downloader-middleware.html#multiple-cookie-sessions-per-spider

Читать полностью…

Scrapy

а зачем тебе для этого асинкавайт? тебе надо cookie jars юзать и интегерный счеткик повышать, и хоть на каждый вопрос все новое обформируйся

Читать полностью…
Subscribe to a channel