scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

(шутка юмора если что)

Читать полностью…

Scrapy

Совсем неправильно. Почитайте, что такое TLS fingerprinting, это обязательное знание, если заниматься парсингом в наши дни. Даже тут в канале много раз обсуждали, есть толковые статьи на хабре и т.п.
Дальше наберите в поиске curl_cffi например, одна ил либ для python с правильными отпечатками. Ну а дальше останется всем этим научиться пользоваться, да еще и к scrapy прикрутить.
TLS не в плане 1.2, 1.3... TLS отпечаток формируется в процессе обмена приветствиями клиента и сервера и установления шифрованного соединения. Он включает в себя множество параметров.

Читать полностью…

Scrapy

на мвидео какой тлс?

Читать полностью…

Scrapy

requestS

Читать полностью…

Scrapy

Реквест то от скрапи в общем то TLS отпечатками и отличается, если заголовки одинаковые

Читать полностью…

Scrapy

Заголовки, tls отпечатки

Читать полностью…

Scrapy

ребят, кто парсил Mvideo? scrapy на любой запрос 302 возвращает, когда обычным запросом через requests возвращает данные. какие есть варианты решения?

Читать полностью…

Scrapy

Причем тут посты? Открываешь network, вбиваешь в поиск запрос и смотришь ссылку

Читать полностью…

Scrapy

Вкладка запросов в браузере перестала работать?

Читать полностью…

Scrapy

Пишите на inlineCallbacks где можно, будет почти await

Читать полностью…

Scrapy

https://github.com/scrapy/scrapy/issues/6219

Читать полностью…

Scrapy

И это просто твистедовая реализация фьюч, промизов и т.д.

Читать полностью…

Scrapy

Деферреды лучше уметь, да

Читать полностью…

Scrapy

любые, возвращающие деферед, потому что хттп отправить вы и твистедом сможете

Читать полностью…

Scrapy

не знаю подойдут ли они вам

Читать полностью…

Scrapy

а вообще тру челики сами пишут запрос как стрингу и хуярят через сокеты в 443 порт

Читать полностью…

Scrapy

т е если я правильно понял, то только через selenuim/playwright мвидео спарсить возможно

Читать полностью…

Scrapy

Естественно. Requests это вообще что-то по быстрому запилить, попробовать, но не для работы, особенно если речь идет об обходе защит.
Конкретно mvideo в scrapy - только с кастомным download handler возможно. С браузерными TLS. По крайней мере пару месяцев назад это работало.

Читать полностью…

Scrapy

я для обхода тлс юзаю другие библы,но не как не реквест

Читать полностью…

Scrapy

через реквест,если тлс отпечатки не пропустят

Читать полностью…

Scrapy

пробовали заголовки копипастить?

Читать полностью…

Scrapy

На последнем lxml не работает extruct:
https://github.com/scrapinghub/extruct/issues/216

Читать полностью…

Scrapy

не нашел инфу, везде старые посты

Читать полностью…

Scrapy

кто нибудь парсил поисковые запросы в яндексе? Можете пожалуйста скинуть или хотя бы ссылку как

Читать полностью…

Scrapy

после asyncio больно в голову ложиться twisted, вроде понятно от куда сравнение с промисами.

Читать полностью…

Scrapy

интересно что корутина не использовалось в описание deffered. Но спасибо.
А кстати scrapy с twisted не собирается переезжать со временем на asyncio ?

Читать полностью…

Scrapy

Всмысле не вообще, а при работе со скрапи

Читать полностью…

Scrapy

Умейте вы выгнать в ступор всего парочкой советов. Гуглю Deffered... Но как не крути: спасибо.

Читать полностью…

Scrapy

Под асинхронными интерфейсами я как понимаю этот список подразумевается?

Читать полностью…

Scrapy

к счастью в скрапи много асинхронных интерфейсов

Читать полностью…
Subscribe to a channel