Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
Ну, у моего коллеги немного шиза по поводу этой версии, и он её не совсем в состоянии объяснить: думал, мб у кого-то ещё есть такое
Читать полностью…"3" - простое число, а "12" - не, ой вэй, не по фэншую...
Читать полностью…Пробовал, там ответ на гет запрос приходит хтмл ращметка, а при скроллинге - посылается такой же запрос на тот же адрес но аргументом с рэйнджом, типо cursor=10, где 10 это точка до куда рендерить. Но динамика не проблема, проблема в том что мне не как не попасть на сайт )
Постманом идёт...
попробуй найти их апи
через ф12 браузере потыкай на сайте куданить, посмотри куда фронт кидает запросы
ну да, просто одна строчка в parse()
if not resp.body: return
У меня в коде в таких ситуациях обычно идёт
yield ...
return
Мб немного не по теме чата: есть ли тут противники питона 3.12?
Читать полностью…Привет, пытаясь спарсить такой сайт: tap.az. Не в какую не поддается )), всё возврашает 204. Пробавал куки, хедеры - ноль результат... Менял агента, ставил scrapy_cloudflare_middleware не помогло
Читать полностью…Просто везде видел это "try free trial", а во сколько оно обойдётся только в менюшке искать :D
Читать полностью…хм, а в чем выражается "скрывание"?
там же в менюшке ссыль на цены.... или что то не то?
В мидлварях можно фильтровать то, что будет обрабатывать паучёк, да
Читать полностью…или у мидлвари можно отфильтровать ответы для запросов паука? если только в мету реквеста добавлять пометку типа что реквест от паука
Читать полностью…ну там я еще ответы приходят у которых пустое тело это норм
Читать полностью…