Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
Смешнявка в том, что в эгг добавляется файл зависимостей, и он лежит рядом с scrapy.cfg, но как заставить скрапид после распаковки эгга установить эти зависимости... загадка
Читать полностью…Всем доброго субботнего вечера
Перерыв всё что только можно, ищу помощи у коллективного разума, может тут с этим кто-то сталкивался.
Вводные:
1. Докер контейнер со scrapyd
2. Простой scrapy проект настроенный на деплой в этот контейнер
Проблема:
Добавляю новую зависимость, хочу обновить в контейнере без ребилда контейнера, и docker cp && docker exec "pip install -r requrements.txt".
Делаю scrapyd-deploy --include-dependencies.
Получаю лог ModuleNotFoundError: No module named 'зависимость'
из скрапида.
И проблема понятная, зависимость не ставится.
Возникает на этапе выполнения в scrapyd/runner.py кода:
from scrapy.cmdline import execute
execute()
можете, пожалуйста, подсказать, почему идёт ретрай?
2024-07-05 15:06:22 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET url> (failed 6 times): [<twisted.python.failure.Failure twisted.internet.error.ConnectionDone: Connection was closed cleanly.>]Читать полностью…
Если понадобится устанавливать скрапид пароль из енва, нужно установить scrapyd с гита (на pypi лежит версия не поддерживающая переменные окружения)
pip install git+https://github.com/scrapy/scrapyd.git
Всем привет
Как в scrapy.cfg и scrapyd.conf подтягивать переменные из env'а?
Допустим, при запуске scrapyd подтягивать в его конфиг пароль, и в scrapy.cfg при scrapyd-deploy
попробуй рандом отправлять если что-то решается в JS, иногда прокатывало
Читать полностью…Придется в безголовом режиме загружать капчу
И отдавать потом куки
Да
Вот недавно разобрался
Правда не получится все на запросах сделать
Требует загрузить JavaScript
твистед сам сможет await на корутину, если она указана как колбек у дефереда?
Читать полностью…доки нет, а метод вызывается в том же классе, что определён, странно что вы этого не заметили
Читать полностью…reason='shutdown' в каких случаях ещё выставляется, помимо получения sigkill?
Читать полностью…посмотри какой egg генерируется, может там действительно не добавляется зависимость
если так, убедись что requirements.txt прописан в корневой папке проекта, там где и scrapy.cfg
ребята, может кто-нибудь посмотрел?
мне всё же придётся переписать _process_request?
Без загрузки JavaScript не генерит нужные значения, которые должны идти вместе с решением капчи
Читать полностью…Там же вроде сначала отправляешь форму "Я не робот", потом тебе возвращается капча, её уже решаешь и потом получаешь свой токен или куку
Читать полностью…всем привет. Кто то работал с капчей яндекса?
не понимаю как перейти на саму страницу с капчей через запросы
нигде не вижу ссылки на адрес с самой капчей
да, у некоторых миделварей есть метод _filter. Например у scrapy.spidermiddlewares.depth.DepthMiddleware
Читать полностью…Всем привет, подскажите пожалуйста есть ли документация по методу _filter у scrapy.spidermiddlewares? Не смог сам найти. Хотелось бы понять где он вызывается
Читать полностью…Ищу людей заинтересованных в получении доп.дoxoда
Удаленно, с телефона, или компьютера
За деталями пишите в ЛС