1045
Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
а как можно динамически парсить сайт с динамическим контентом
Читать полностью…
ну и как минимум использовать браузер только чтобы авторизоваться, дальше брать куки и парсить без него
Читать полностью…
если парсить на неавторизованных акках то прокси будут слетать очень быстро
Читать полностью…
ребят кто делал скраперы/спамеры на маркетплейс площадки, подскажите что по требованиям для сервера, как сократить потребление оперативки ? у меня запускается 2 сессии - каждая открывает и обрабатывает по 6 вкладок + -, в пике потребление до 3.5 г оперативы доходит, подскажите как быть
Читать полностью…
https://dpaste.com/6NUT7FJ6V#line-71 здесь в логах None есть?
если пайплайн с сохранением метаданных раньше чем картиночный, то попробуй брать path из итема
в app.py ничего особенного просто маршрутизация и рендер темплейт ко всем html файлам
Читать полностью…
Всем привет, такой вопрос: впервые собираюсь задеплоить свой сайт на хостинге ps.kz теперь возникает ошибка, сама структура файла на картинке, загрузил в файловый менеджер ps.kz эти файлы и запустил сайт
Читать полностью…
взять куки из браузера и парсить с этими куками дальше без браузера
Читать полностью…
сложно конечно, если парсить на авторизованных акках то мягко говоря свои проблемы тоже есть
Читать полностью…
да для тестов надо было, просто в настройках "DOWNLOADER_MIDDLEWARES_BASE": {} выставил
Привет, коллеги! Возникла проблема при работе с пеплайнами в Scrapy. У меня есть два пеплайна: один для сохранения JSON-файлов, а другой — для загрузки изображений. Я хочу, чтобы изображения и JSON-файлы сохранялись в одной и той же папке. Но вместо этого при загрузке изображений создается та же структура папок, что и при добавлении JSON-файлов, только все изображения попадают во вложенную папку None.
Я уже несколько раз проверял пути, отлаживал код, использовал ChatGPT, логи, но никак не могу найти причину. Может кто-то сталкивался с подобной проблемой или знает, как это можно исправить? Буду признателен за любую помощь!
возможно из scrapy отправить реквест в обход всех мидлварей?
Читать полностью…
Подскажите, пожалуйста, недорогие сервисы по скрейпингу гугла. Чтобы быстро топ50 ссылок (без сниппетов) по запросу получить и ещё похожие запросы выгружал
Читать полностью…