scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

а большая ли польза от http/2 в плане парсинга?

Читать полностью…

Scrapy

Есть же наверное какая-то логика фильтрации юзеров и их объявлений. Есть логика запросов. Если понятно как составлять запросы, значит можно и логику реализовать и без браузера. Казалось бы.

Читать полностью…

Scrapy

просто думал что есть какие то лазейки/способы уменьшить потребление

Читать полностью…

Scrapy

у меня такая задача что нельзя просто получить желаемый json, есть нужда в том чтобы постоянно открывать новые вкладки и фильтровать юзеров, после чего фильтровать их обьявления

Читать полностью…

Scrapy

а как можно динамически парсить сайт с динамическим контентом

Читать полностью…

Scrapy

ну куки никуда и не деваются

Читать полностью…

Scrapy

и парсинг с авторизованных аккаунтов

Читать полностью…

Scrapy

слишком куча всего не понятно

Читать полностью…

Scrapy

хотя если честно я сам не знаю какой вопрос

Читать полностью…

Scrapy

есть варианты парсить не используя браузер ?

Читать полностью…

Scrapy

ну и как минимум использовать браузер только чтобы авторизоваться, дальше брать куки и парсить без него

Читать полностью…

Scrapy

если парсить на неавторизованных акках то прокси будут слетать очень быстро

Читать полностью…

Scrapy

ну и это много разве

Читать полностью…

Scrapy

ребят кто делал скраперы/спамеры на маркетплейс площадки, подскажите что по требованиям для сервера, как сократить потребление оперативки ? у меня запускается 2 сессии - каждая открывает и обрабатывает по 6 вкладок + -, в пике потребление до 3.5 г оперативы доходит, подскажите как быть

Читать полностью…

Scrapy

https://dpaste.com/6NUT7FJ6V#line-71 здесь в логах None есть?
если пайплайн с сохранением метаданных раньше чем картиночный, то попробуй брать path из итема

Читать полностью…

Scrapy

proxy6, proxys, proxy.market...
Не бесплатные, но в целом достаточно дешевые. Там где не нужны мобильные или с ротацией на каждый запрос.

Читать полностью…

Scrapy

Всем доброе время суток

Какие бесплатные proxy сервера вы используете

Читать полностью…

Scrapy

это наверн единственное что меня спасёт

Читать полностью…

Scrapy

https://docs.scrapy.org/en/latest/topics/dynamic-content.html

Читать полностью…

Scrapy

взять куки из браузера и парсить с этими куками дальше без браузера

Читать полностью…

Scrapy

то есть не просто авторизация

Читать полностью…

Scrapy

я сказал что после авторизации браузер не нужен

Читать полностью…

Scrapy

вы сказали что вам браузер нужен чтобы авторизация

Читать полностью…

Scrapy

вопрос в том как сократить использование памяти

Читать полностью…

Scrapy

я puppeteer юзаю, headless false

Читать полностью…

Scrapy

сложно конечно, если парсить на авторизованных акках то мягко говоря свои проблемы тоже есть

Читать полностью…

Scrapy

а как тогда пасать авторизацию?)

Читать полностью…

Scrapy

не использовать хедлесс браузер хехе

Читать полностью…

Scrapy

То есть просто отключил мидлвари?

Читать полностью…

Scrapy

да для тестов надо было, просто в настройках "DOWNLOADER_MIDDLEWARES_BASE": {} выставил

Читать полностью…
Subscribe to a channel