scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

взял курл взял куки и пошел

Читать полностью…

Scrapy

ты думаешь, что вот этим сообщением мне помог?)

Читать полностью…

Scrapy

ну покажи, как ты запросами будешь парсить сайт, который в основном из js состоит.... теги грузятся через js, и прочее

Читать полностью…

Scrapy

да я хз что тебе нужно

Читать полностью…

Scrapy

ну что обычно люди собирают

Читать полностью…

Scrapy

получить куки, дальше получать товары

Читать полностью…

Scrapy

https://www.letu.ru

Читать полностью…

Scrapy

у него стоит js challenge

Читать полностью…

Scrapy

ну прикольно обходить js без браузера просто) а то пока поднимешь все это дело, получишь куки, все же время это...

Читать полностью…

Scrapy

мне, лет за 15 такое, пару раз понадобилось 😂🙈
не, ну, я, так то, понимаю, что не показатель :). Кому то, возможно, постоянно требуется.

да, я не говорю про "сжатый" JS, это, чуток другое

Читать полностью…

Scrapy

думал летом научиться, а там 3 сайта минимум можно было бы без эмуляции уже делать((

Читать полностью…

Scrapy

я про это максимум одну-две статьи видел

Читать полностью…

Scrapy

да, естественно
даже CF это не одна защита, а много

Читать полностью…

Scrapy

ну я просто не парился с доп опциями) Лиса из коробки работает

Читать полностью…

Scrapy

че, у меня хром не палят

Читать полностью…

Scrapy

собрать тысячу товаров ок

Читать полностью…

Scrapy

Описание товара:import requests

url = "https://www.letu.ru/s/api/product/v2/product-detail/65900004/tabs?locale=ru-RU&pushSite=storeMobileRU"

payload = {}
headers = {
'accept': 'application/json, text/plain',
'accept-language': 'en-US,en;q=0.9,uk;q=0.8',
'referer': 'https://www.letu.ru/product/clinique-tush-vlagostoikaya-lash-power/65900004',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36',
'x-promo-msg': '8CDHp8P8LUWUlktA6uNgTw'
}

response = requests.request("GET", url, headers=headers, data=payload)

print(response.text)

Читать полностью…

Scrapy

у них весь сайт с помощью js рендерится

Читать полностью…

Scrapy

иного варианта тут нет

Читать полностью…

Scrapy

список товаров, товар, описание?

Читать полностью…

Scrapy

увидишь запрос на валидацию - там поле solution генерится js. чтобы получить solution, нужно понять откуда он берется в js, а чтобы понять это, нужно привести js к нормальному виду, то есть деобфусцировать его

Читать полностью…

Scrapy

если сможешь деобфусцировать его, то сможешь без эмуляции парсить его

Читать полностью…

Scrapy

Можно пример, видимо, мы говорим о разных вещах

Читать полностью…

Scrapy

Думаю это больше искусство исследователя

Читать полностью…

Scrapy

за все время работы мне нужно было такое сделать ну максимум до 5 сайтов, изучать как отдельно не вижу смысла

Читать полностью…

Scrapy

и те возможно были внутренние

Читать полностью…

Scrapy

а вы случаем материалы годные по деобфускации js не знаете?) мб курсы какие то... на zennoposter вроде был материал, но я как то его стороной обошел

Читать полностью…

Scrapy

наверное разная защитп есть

Читать полностью…

Scrapy

андетектед без прокси и тп, тупо uc

Читать полностью…

Scrapy

хром палят а с ff все норм

Читать полностью…
Subscribe to a channel