Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
Если я запускаю паучка таким образом: scrapy crawl my_spider -o output.json
Можно ли как-то в коде получить вот этот output.json?
Вопрос: что делать если проект, над которым работаешь, уже особо удовольствия не приносит?
Читать полностью…а, ты про то, когда сдохнут, нууу, там ты просто мутишь стандартный errback, и в нем делаешь запрос с "playwright": True, - правда все предыдущие запросы гавкнутся, и будет типа дофига отлетевших запросов, наверное
Читать полностью…вообще, я хочу научиться ломать эти JS и все запросами делать)) мб натыкался на статью на хабре про летуаль - там чел без браузера обошел проверку браузером https://habr.com/ru/articles/787706/
Читать полностью…ну их обновлять еще нужно будет) а вот как - другой вопрос ахахах
Читать полностью…вот с ней заходишь (можно хоть логин -пароль сэмулировать даже), а ты когда уже зашел весь такой белый и пушистый, можешь на скрапи запросы без playwright фигачить
Читать полностью…хм, ну кстати как вариант, спасибо) я что то не подумал по поводу того, что их можно совмещать ахахах
Читать полностью…начать делать новый проект, который приносит удовольствие, либо взять передышку от старого и вернуться с новыми силами. отдохнешь, на холодную голову придешь, глядишь и что нибудь интересное придумаешь, мотивация вернется.
Читать полностью…а про выполнение прям какой-то выдранной функции, тут по чатику часто линкуют подобного рода либы, но я не помню какие. Это если прям надо убер-промышленно делать и есть время заморочиться на предмет снижения нагрузки на железки чтобы весь браузер на подгружать ради сраной js-проверки
Читать полностью…ну playwright может тебе и js выполнить и даже тупо сэмулировать действия
Читать полностью…хотел просто грузить модуль сам, из него вызывать функцию - получать нужный результат и идти дальше
Читать полностью…ну есть всякие js2python, если ты прям кусок js-кода проверки найдешь
Читать полностью…вот один вопрос, как связать код на js и на питоне, чтобы из питона вызывать код в нужный момент, проходить проверку и дальше запросами идти) мб знаешь)
Читать полностью…вангую он это делает автоматом "из коробки", но это не точно)
Читать полностью…а если тебе логин-пароль не надо, то ваще - первый запрос с playwright, а дальше без него. вот тока я чессгря про кукисы 100% не знаю - передает ли он в скрапи кукисы сам, или надо там чего-то подшаманивать.
Читать полностью…т.е. по-сути то ты все-равно playwright юзаешь для начальных кукисов, я б советовал переписать на нем, там есть крутая хрень:
https://github.com/scrapy-plugins/scrapy-playwright#playwright_page_init_callback
ну он удобен тем, что ты можешь запрос с playwright отправлять, а можешь и без него. Но если все им получать то медленновато. Т.е. тебе не надо писать обвязки мучительные, у тебя playwright "из коробки" есть, и там можно эквиллибристику делать крутую.
Читать полностью…