Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
Совсем неправильно. Почитайте, что такое TLS fingerprinting, это обязательное знание, если заниматься парсингом в наши дни. Даже тут в канале много раз обсуждали, есть толковые статьи на хабре и т.п.
Дальше наберите в поиске curl_cffi например, одна ил либ для python с правильными отпечатками. Ну а дальше останется всем этим научиться пользоваться, да еще и к scrapy прикрутить.
TLS не в плане 1.2, 1.3... TLS отпечаток формируется в процессе обмена приветствиями клиента и сервера и установления шифрованного соединения. Он включает в себя множество параметров.
Реквест то от скрапи в общем то TLS отпечатками и отличается, если заголовки одинаковые
Читать полностью…ребят, кто парсил Mvideo? scrapy на любой запрос 302 возвращает, когда обычным запросом через requests возвращает данные. какие есть варианты решения?
Читать полностью…Причем тут посты? Открываешь network, вбиваешь в поиск запрос и смотришь ссылку
Читать полностью…И это просто твистедовая реализация фьюч, промизов и т.д.
Читать полностью…любые, возвращающие деферед, потому что хттп отправить вы и твистедом сможете
Читать полностью…а вообще тру челики сами пишут запрос как стрингу и хуярят через сокеты в 443 порт
Читать полностью…т е если я правильно понял, то только через selenuim/playwright мвидео спарсить возможно
Читать полностью…Естественно. Requests это вообще что-то по быстрому запилить, попробовать, но не для работы, особенно если речь идет об обходе защит.
Конкретно mvideo в scrapy - только с кастомным download handler возможно. С браузерными TLS. По крайней мере пару месяцев назад это работало.
На последнем lxml не работает extruct:
https://github.com/scrapinghub/extruct/issues/216
кто нибудь парсил поисковые запросы в яндексе? Можете пожалуйста скинуть или хотя бы ссылку как
Читать полностью…после asyncio больно в голову ложиться twisted, вроде понятно от куда сравнение с промисами.
Читать полностью…интересно что корутина не использовалось в описание deffered. Но спасибо.
А кстати scrapy с twisted не собирается переезжать со временем на asyncio ?
Умейте вы выгнать в ступор всего парочкой советов. Гуглю Deffered... Но как не крути: спасибо.
Читать полностью…Под асинхронными интерфейсами я как понимаю этот список подразумевается?
Читать полностью…