scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

если интерфейс синхронный то или так или всё синхронно делать

Читать полностью…

Scrapy

ну увы, цвета функций

Читать полностью…

Scrapy

requests синхронный конечно

Читать полностью…

Scrapy

Juan Villabona, пожалуйста, нажмите на кнопку ниже в течение указанного времени, иначе вы будете кикнуты. Спасибо! (60 сек)
При поддержке 1inch Network

Читать полностью…

Scrapy

штатный механизм "перехвата" это мидлвари

Читать полностью…

Scrapy

что такое перехватить запрос

Читать полностью…

Scrapy

если мне не изменяет моск, варн кидает считалка фингерпринта, пока - не страшно. И да, это не ошибка.
а по сабжу - оно же в редисе все хранит. Надо просто глянуть, там появился в дубфильтре новая запись или нет.
и да, проще всего, поставить dont_filter=True и будет счастье и оргазм, по крайней мере. не надо париться, тормознул дупфильтр твой реквест или нет

Читать полностью…

Scrapy

но логи вы уже читали

Читать полностью…

Scrapy

а как это понять если у меня только одна ?@wrar42

Читать полностью…

Scrapy

да , он вызывается но мне нужен не FormRequest а JsonRequest из за этого первый раз я возвращаю JsonRequest а второй раз когда он должен вызвать process_request он просто не вызывается хотя я вернул Jsonrequest и он должен был еще раз вызваться

Читать полностью…

Scrapy

что значит "не идет в process_response"

Читать полностью…

Scrapy

что именно не получается?

Читать полностью…

Scrapy

Паpсим любые группы со скрытыми участниками в телеграм рассылаем в лички ваш пост TG и What's app.
Инвайтим ваши группы в новые до 10К за раз.
Делаем чат ботов, скрипты продаём "неубиваемые" аккаунты тг.
Если интересно подробние пишите в лич.ку

Читать полностью…

Scrapy

Можете посоветовать недорогой по вашему мнению хост? Мне нужен выделенный сервер на 4 ядра и 8 оперативы, или не выделенный, не знаю как правильно называется. Использовал hetzner до этого, но они подумали, что если на сервере работает selenium, то значит это дос атака на сайт

Читать полностью…

Scrapy

мне даже исследований не понадобилось, сразу нафуй послали 🤣

Читать полностью…

Scrapy

https://journal.stuffwithstuff.com/2015/02/01/what-color-is-your-function/

Читать полностью…

Scrapy

Итого aiohttp? Или существует какая то альтернатива? просто в синхронной функции вызывать логгер... а в этом логгере наверно надо получать event loop, и в него передавать корутину. выглядит слишком мудрённо. Или только так и можно?

Читать полностью…

Scrapy

Подскажите пожалуйста про подключение ELK:
Логи отправляю по http, вопрос: requests подойдет для отправки или может заблокировать основной поток?

Читать полностью…

Scrapy

Угу, так то да, понять бы, какой смысл вкладывается в определение "перехватить"

Читать полностью…

Scrapy

до его выполнения? нет, паук только про выполненные

Читать полностью…

Scrapy

спасибо большо помогло! Еще такой вопрос когда редис тригерится я перехватываю запрос на мидлваре и меняю его а можно както в самом пауке его перехватить если да то как ?

Читать полностью…

Scrapy

а это ошибка из за чего могла выйти ?

Читать полностью…

Scrapy

ну и обычно что-то в логах видно

Читать полностью…

Scrapy

ну ищите какая мидлварь его выкинула значит

Читать полностью…

Scrapy

этот process_request выполняется вообще?

Читать полностью…

Scrapy

я в process_request возвращаю JsonRequest. но он не идет в process_response и еще выходит такой варнинг



If you are using this function in a Scrapy component, and you are OK with users of your component changing the fingerprinting algorithm through settings, use crawler.request_fingerprinter.fingerprint() instead in your Scrapy component (you can get the crawler object from the 'from_crawler' class method).

Otherwise, consider using the scrapy.utils.request.fingerprint() function instead.

Either way, the resulting fingerprints will be returned as bytes, not as a string, and they will also be different from those generated by 'request_fingerprint()'. Before you switch, make sure that you understand the consequences of this (e.g. cache invalidation) and are OK with them; otherwise, consider implementing your own function which returns the same fingerprints as the deprecated 'request_fingerprint()' function.
return request_fingerprint(request)

Читать полностью…

Scrapy

Добрый день. Пытаюсь использовать scrapy-redis, когда приходит сигнал scrapy создает FormRequest , как мне его отловить в middleware и поменять на JsonRequest ?

Читать полностью…

Scrapy

Попробуйте https://aeza.net или https://pq.hosting

Читать полностью…

Scrapy

Тогда я пошёл дальше notcoin собирать 🤝😅

Читать полностью…

Scrapy

Здравствуйте, подскажите пожалуйста как вы иследуете сайт перед парсингом, как понять какую защиту использует сайт?

Я в учебных целях пытаюсь распарсить сайт https://ee.bca-europe.com

но он очень странно себя ведёт))

Когда отправляю запрос в ответ получаю ответ типа '' нехрен здесь шарится 😊''

https://prnt.sc/ut4-jZAlpXnU

Читать полностью…
Subscribe to a channel