Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
если интерфейс синхронный то или так или всё синхронно делать
Читать полностью…Juan Villabona, пожалуйста, нажмите на кнопку ниже в течение указанного времени, иначе вы будете кикнуты. Спасибо! (60 сек)
При поддержке 1inch Network
если мне не изменяет моск, варн кидает считалка фингерпринта, пока - не страшно. И да, это не ошибка.
а по сабжу - оно же в редисе все хранит. Надо просто глянуть, там появился в дубфильтре новая запись или нет.
и да, проще всего, поставить dont_filter=True
и будет счастье и оргазм, по крайней мере. не надо париться, тормознул дупфильтр твой реквест или нет
да , он вызывается но мне нужен не FormRequest а JsonRequest из за этого первый раз я возвращаю JsonRequest а второй раз когда он должен вызвать process_request он просто не вызывается хотя я вернул Jsonrequest и он должен был еще раз вызваться
Читать полностью…Паpсим любые группы со скрытыми участниками в телеграм рассылаем в лички ваш пост TG и What's app.
Инвайтим ваши группы в новые до 10К за раз.
Делаем чат ботов, скрипты продаём "неубиваемые" аккаунты тг.
Если интересно подробние пишите в лич.ку
Можете посоветовать недорогой по вашему мнению хост? Мне нужен выделенный сервер на 4 ядра и 8 оперативы, или не выделенный, не знаю как правильно называется. Использовал hetzner до этого, но они подумали, что если на сервере работает selenium, то значит это дос атака на сайт
Читать полностью…мне даже исследований не понадобилось, сразу нафуй послали 🤣
Читать полностью…https://journal.stuffwithstuff.com/2015/02/01/what-color-is-your-function/
Читать полностью…Итого aiohttp? Или существует какая то альтернатива? просто в синхронной функции вызывать логгер... а в этом логгере наверно надо получать event loop, и в него передавать корутину. выглядит слишком мудрённо. Или только так и можно?
Читать полностью…Подскажите пожалуйста про подключение ELK:
Логи отправляю по http, вопрос: requests подойдет для отправки или может заблокировать основной поток?
Угу, так то да, понять бы, какой смысл вкладывается в определение "перехватить"
Читать полностью…спасибо большо помогло! Еще такой вопрос когда редис тригерится я перехватываю запрос на мидлваре и меняю его а можно както в самом пауке его перехватить если да то как ?
Читать полностью…я в process_request возвращаю JsonRequest. но он не идет в process_response и еще выходит такой варнинг
Читать полностью…
If you are using this function in a Scrapy component, and you are OK with users of your component changing the fingerprinting algorithm through settings, use crawler.request_fingerprinter.fingerprint() instead in your Scrapy component (you can get the crawler object from the 'from_crawler' class method).
Otherwise, consider using the scrapy.utils.request.fingerprint() function instead.
Either way, the resulting fingerprints will be returned as bytes, not as a string, and they will also be different from those generated by 'request_fingerprint()'. Before you switch, make sure that you understand the consequences of this (e.g. cache invalidation) and are OK with them; otherwise, consider implementing your own function which returns the same fingerprints as the deprecated 'request_fingerprint()' function.
return request_fingerprint(request)
Добрый день. Пытаюсь использовать scrapy-redis, когда приходит сигнал scrapy создает FormRequest , как мне его отловить в middleware и поменять на JsonRequest ?
Читать полностью…Здравствуйте, подскажите пожалуйста как вы иследуете сайт перед парсингом, как понять какую защиту использует сайт?
Я в учебных целях пытаюсь распарсить сайт https://ee.bca-europe.com
но он очень странно себя ведёт))
Когда отправляю запрос в ответ получаю ответ типа '' нехрен здесь шарится 😊''
https://prnt.sc/ut4-jZAlpXnU