scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

Я как раз туда и смотрел, правда что в ините :D

Читать полностью…

Scrapy

Если я запускаю паучка таким образом: scrapy crawl my_spider -o output.json
Можно ли как-то в коде получить вот этот output.json?

Читать полностью…

Scrapy

Вопрос: что делать если проект, над которым работаешь, уже особо удовольствия не приносит?

Читать полностью…

Scrapy

https://playwright.dev/python/docs/evaluating

Читать полностью…

Scrapy

человек про какие то сервисы говорит, но я не нашел)

Читать полностью…

Scrapy

пробовал - ошибки вылетают

Читать полностью…

Scrapy

ну да, в этом проблема очевидно есть

Читать полностью…

Scrapy

а, ты про то, когда сдохнут, нууу, там ты просто мутишь стандартный errback, и в нем делаешь запрос с "playwright": True, - правда все предыдущие запросы гавкнутся, и будет типа дофига отлетевших запросов, наверное

Читать полностью…

Scrapy

вообще, я хочу научиться ломать эти JS и все запросами делать)) мб натыкался на статью на хабре про летуаль - там чел без браузера обошел проверку браузером https://habr.com/ru/articles/787706/

Читать полностью…

Scrapy

подумаю в сторону этого

Читать полностью…

Scrapy

ну их обновлять еще нужно будет) а вот как - другой вопрос ахахах

Читать полностью…

Scrapy

вот с ней заходишь (можно хоть логин -пароль сэмулировать даже), а ты когда уже зашел весь такой белый и пушистый, можешь на скрапи запросы без playwright фигачить

Читать полностью…

Scrapy

хм, ну кстати как вариант, спасибо) я что то не подумал по поводу того, что их можно совмещать ахахах

Читать полностью…

Scrapy

ну и все 403, 401, 418 заново планируешь из мидлварей

Читать полностью…

Scrapy

инициализировал куки - пошел пауком

Читать полностью…

Scrapy

оно будет в настройке FEEDS

Читать полностью…

Scrapy

начать делать новый проект, который приносит удовольствие, либо взять передышку от старого и вернуться с новыми силами. отдохнешь, на холодную голову придешь, глядишь и что нибудь интересное придумаешь, мотивация вернется.

Читать полностью…

Scrapy

а про выполнение прям какой-то выдранной функции, тут по чатику часто линкуют подобного рода либы, но я не помню какие. Это если прям надо убер-промышленно делать и есть время заморочиться на предмет снижения нагрузки на железки чтобы весь браузер на подгружать ради сраной js-проверки

Читать полностью…

Scrapy

ну playwright может тебе и js выполнить и даже тупо сэмулировать действия

Читать полностью…

Scrapy

хотел просто грузить модуль сам, из него вызывать функцию - получать нужный результат и идти дальше

Читать полностью…

Scrapy

ну есть всякие js2python, если ты прям кусок js-кода проверки найдешь

Читать полностью…

Scrapy

хотел все на js переписать, но проблематично

Читать полностью…

Scrapy

вот один вопрос, как связать код на js и на питоне, чтобы из питона вызывать код в нужный момент, проходить проверку и дальше запросами идти) мб знаешь)

Читать полностью…

Scrapy

вангую он это делает автоматом "из коробки", но это не точно)

Читать полностью…

Scrapy

но спасибо мужик, реально

Читать полностью…

Scrapy

а если тебе логин-пароль не надо, то ваще - первый запрос с playwright, а дальше без него. вот тока я чессгря про кукисы 100% не знаю - передает ли он в скрапи кукисы сам, или надо там чего-то подшаманивать.

Читать полностью…

Scrapy

т.е. по-сути то ты все-равно playwright юзаешь для начальных кукисов, я б советовал переписать на нем, там есть крутая хрень:
https://github.com/scrapy-plugins/scrapy-playwright#playwright_page_init_callback

Читать полностью…

Scrapy

ну он удобен тем, что ты можешь запрос с playwright отправлять, а можешь и без него. Но если все им получать то медленновато. Т.е. тебе не надо писать обвязки мучительные, у тебя playwright "из коробки" есть, и там можно эквиллибристику делать крутую.

Читать полностью…

Scrapy

1000 запросов отправил - поменял

Читать полностью…

Scrapy

у меня так и ашан работает)

Читать полностью…
Subscribe to a channel