scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

я щас изучаю парсер на гитхабе обновленный 14 дней назад и ничего не могу понять что там такого, чего нет у меня

Читать полностью…

Scrapy

подскажите пожалуйста, куда копать или как это отладить (найти причину бана по 403)?

библиотека crawlee, сайт ozon.ru
конфиг запуска дефолтный, разве что хедеры передал частичные

Читать полностью…

Scrapy

Окей, а как aiohttp справляется с ним или что происходит?)

Читать полностью…

Scrapy

https://youtube.com/shorts/Q1tez3uVaUs?si=M89atTlSyIt4MESJ

Читать полностью…

Scrapy

Там капча geetest, может нерентабельно быть.

Читать полностью…

Scrapy

Смотрите какая штука прикольная https://github.com/Integuru-AI/Integuru

Читать полностью…

Scrapy

всем привет. подскажите пожалуйста, можно ведь в одном пауке юзать и scrapy-playwright и обычные хендлеры? я в meta не прописываю чтобы pw юзать, но не работает ничего((

Читать полностью…

Scrapy

с какой страницы запрос?

Читать полностью…

Scrapy

i am racing rockport please dm

Читать полностью…

Scrapy

Hello everyone.
I am scrapping export.
who needs me?
Please DM

Читать полностью…

Scrapy

парсинг ломаных строгих форматов это дорога в ад и есть

Читать полностью…

Scrapy

вообще парсить регуляркой html или js/json звучит как дорога в ад)

Читать полностью…

Scrapy

рекурсия (но это не про jmespath)

Читать полностью…

Scrapy

А известна максимальная вложенность? А то мб подобие такого прокатит:

find_str = "*.c"
while True:
jmespath.search(find_str, data)
find_str = "*." + find_str

Читать полностью…

Scrapy

js2xml + xpath, угу
может конкуренты jmespath умеют, не силён (не удивлюсь если нет)
jq наверняка сумеет, но через разворачивание ключей в вектор и прочую байду

Читать полностью…

Scrapy

Озон просто так не даст ничего )))) Это Вам не WB

Читать полностью…

Scrapy

никак, просто он разный

Читать полностью…

Scrapy

Всем привет. Кто может подсказать или объяснить почему когда используешь разные библиотеки то получаешь разные статус код от бекенда ?

Читать полностью…

Scrapy

Прикольна! Правда чот я демку посмотрел, не очень понял чем это отличается (особенно генерируемый код) от условного https://curlconverter.com/
Они там говорят про то, что генерится граф из пяти действий на одно действие скачки файла и определяет где его скачали и динамические части, но по-факту динамические части оно (если я правильно понял) берет из предыдущих запросов, а запрос на скачку файла - ну он происходит тупо по нажатии "скачать файл", а в динамических частях стоит чему-то поменяться (той же дате) и все, кирдык этому коду.

Наверное, это стоит попробовать на каких-то более сложных штуках. Вон тот же шейн к примеру, как он с этим справится...)

Читать полностью…

Scrapy

Всем привет! Куплю парсер th.shein.com
Нужно собрать товары и обновлять цены.

Читать полностью…

Scrapy

хендлер scrapy-playwright фолбэкает на обычный

Читать полностью…

Scrapy

запрос на получение полного описания объявления. Он раньше работал а сейчас нет.

Читать полностью…

Scrapy

Всем привет, кто-нить знает рабочий запрос формата m.avito.ru/api/15/items/ ?

Читать полностью…

Scrapy

I am scrapping import.... please dm

Читать полностью…

Scrapy

странный js попадается, но я его регуляркой чищу и через chompjs прогоняю
в нём например вместо запятых в некоторых местах слеш, внутри строчек неэкранированные кавычки
тут регулярки тема

Читать полностью…

Scrapy

Видимо ломаных респонсов вам не попадалось

Читать полностью…

Scrapy

Рекурсией парсить словарь, она идеальна для таких задач

Читать полностью…

Scrapy

пока 7 нашёл, надеюсь больше не будет)
а так да, проще выходит просто по словарю как по дереву ходить
всем спасибо!

Читать полностью…

Scrapy

ну и всегда можно json.loads() и под конкретный случай написать обход конечно

Читать полностью…

Scrapy

не думаю что такое возможно

Читать полностью…
Subscribe to a channel