Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
Господа, добрый день.
Такой тупой вопрос, если мне нужно парсить очень много данных ( около 1000 категорий с товарами) то лучше scrapy ичего нет правильно?
@Lizzzavolkova732, пожалуйста, нажмите на кнопку ниже в течение указанного времени, иначе вы будете кикнуты. Спасибо! (60 сек)
При поддержке 1inch Network
просто селектор блока в котором реклама появляется отлавливай
Читать полностью…я сообщение удалил, решил пальцем в небо не тыкать, исходный код почитать и протестить)
Читать полностью…нет, у нас принято спайдеры наследовать от базоваго спайдера со своими настройками
Читать полностью…в базовом классе она почему None была) не до конца ещё ознакомился с проектом вот и не заметил
Читать полностью…если "нету" то это уже проблема.
вангую, что, не так запрос шлется. в скрапи там что то тип FormRequest.... или как то так. Никогда не задумывался над этим заголовком, всегда сам ставился
Реклама в инсте сама по себе таргетированная, между прочим
Читать полностью…вряд-ли хорошая идея для 1000 аккаунтов поднимать 1000 браузеров
Читать полностью…В поиске тех, кто хочет попробовать себя в криптовалюте.
Занятость до двух часов в день.
Работать можно с телефона или компьютера.
Обучение доступно для новичков.
Сфера: аирдропы, тестнеты, лаунчпады и прочее.
Мои условия - в личку.
здравствуйте, кто то занимался парсингом инстаграм? у меня есть вопрос насчет лимитов может кто знает какие то?
Читать полностью…про jmespath мне тоже интересно, но я хз, по-идее можно потестить. и сравнить напр. с clickhouse: https://colab.research.google.com/github/dcmoura/spyql/blob/master/notebooks/json_benchmark.ipynb
Читать полностью…добавил 'scrapy.downloadermiddlewares.cookies.CookiesMiddleware': 700 в настройки спайдера и заработало. Похоже дело было в куках, они не передавались при редиректе после запроса. Всем спасибо за помощь
Читать полностью…я смотрел response.request.headers. Если самому не передавать, то Content-Length нету
Читать полностью…