scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

а как можно динамически парсить сайт с динамическим контентом

Читать полностью…

Scrapy

ну куки никуда и не деваются

Читать полностью…

Scrapy

и парсинг с авторизованных аккаунтов

Читать полностью…

Scrapy

слишком куча всего не понятно

Читать полностью…

Scrapy

хотя если честно я сам не знаю какой вопрос

Читать полностью…

Scrapy

есть варианты парсить не используя браузер ?

Читать полностью…

Scrapy

ну и как минимум использовать браузер только чтобы авторизоваться, дальше брать куки и парсить без него

Читать полностью…

Scrapy

если парсить на неавторизованных акках то прокси будут слетать очень быстро

Читать полностью…

Scrapy

ну и это много разве

Читать полностью…

Scrapy

ребят кто делал скраперы/спамеры на маркетплейс площадки, подскажите что по требованиям для сервера, как сократить потребление оперативки ? у меня запускается 2 сессии - каждая открывает и обрабатывает по 6 вкладок + -, в пике потребление до 3.5 г оперативы доходит, подскажите как быть

Читать полностью…

Scrapy

https://dpaste.com/6NUT7FJ6V#line-71 здесь в логах None есть?
если пайплайн с сохранением метаданных раньше чем картиночный, то попробуй брать path из итема

Читать полностью…

Scrapy

https://dpaste.com/6NUT7FJ6V

Читать полностью…

Scrapy

А точно нужно обойти прям все-все мидлвари?

Читать полностью…

Scrapy

в app.py ничего особенного просто маршрутизация и рендер темплейт ко всем html файлам

Читать полностью…

Scrapy

Всем привет, такой вопрос: впервые собираюсь задеплоить свой сайт на хостинге ps.kz теперь возникает ошибка, сама структура файла на картинке, загрузил в файловый менеджер ps.kz эти файлы и запустил сайт

Читать полностью…

Scrapy

взять куки из браузера и парсить с этими куками дальше без браузера

Читать полностью…

Scrapy

то есть не просто авторизация

Читать полностью…

Scrapy

я сказал что после авторизации браузер не нужен

Читать полностью…

Scrapy

вы сказали что вам браузер нужен чтобы авторизация

Читать полностью…

Scrapy

вопрос в том как сократить использование памяти

Читать полностью…

Scrapy

я puppeteer юзаю, headless false

Читать полностью…

Scrapy

сложно конечно, если парсить на авторизованных акках то мягко говоря свои проблемы тоже есть

Читать полностью…

Scrapy

а как тогда пасать авторизацию?)

Читать полностью…

Scrapy

не использовать хедлесс браузер хехе

Читать полностью…

Scrapy

То есть просто отключил мидлвари?

Читать полностью…

Scrapy

да для тестов надо было, просто в настройках "DOWNLOADER_MIDDLEWARES_BASE": {} выставил

Читать полностью…

Scrapy

Привет, коллеги! Возникла проблема при работе с пеплайнами в Scrapy. У меня есть два пеплайна: один для сохранения JSON-файлов, а другой — для загрузки изображений. Я хочу, чтобы изображения и JSON-файлы сохранялись в одной и той же папке. Но вместо этого при загрузке изображений создается та же структура папок, что и при добавлении JSON-файлов, только все изображения попадают во вложенную папку None.

Я уже несколько раз проверял пути, отлаживал код, использовал ChatGPT, логи, но никак не могу найти причину. Может кто-то сталкивался с подобной проблемой или знает, как это можно исправить? Буду признателен за любую помощь!

Читать полностью…

Scrapy

возможно из scrapy отправить реквест в обход всех мидлварей?

Читать полностью…

Scrapy

на самом сайте такая ошибка:

Читать полностью…

Scrapy

Подскажите, пожалуйста, недорогие сервисы по скрейпингу гугла. Чтобы быстро топ50 ссылок (без сниппетов) по запросу получить и ещё похожие запросы выгружал

Читать полностью…
Subscribe to a channel