scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

Пацыки, как считаете, платить 21$ в месяц за прокси это норм? (5 айпишек это)

Читать полностью…

Scrapy

Нет, скрапи про асинхронность просто

Читать полностью…

Scrapy

если вы хотите драйвить инстанс браузера руками в синхронном режиме то скрапи может даже мешать

Читать полностью…

Scrapy

ну тут два варианта, либо достаточно селекторов, либо надо что-то ещё

Читать полностью…

Scrapy

https://docs.scrapy.org/en/latest/intro/overview.html#what-s-next

Читать полностью…

Scrapy

ну как бест практика что ль..
не знаю как по-другому вопрос поставить. вдруг скрапи дает некие абстракции универсальные в принципе даже для множества простых задач

Читать полностью…

Scrapy

скинь рабочий алфавит пж

Читать полностью…

Scrapy

ребята скиньте рабочий питон для демки пж

Читать полностью…

Scrapy

я так постоянно делаю в оффе, озвучиваю то, что другие стесняются сказать 😆

Читать полностью…

Scrapy

Можете пожалуйста оч надо

Читать полностью…

Scrapy

Ребят кинте рабочий скрапи для демки с телефона на пк

Читать полностью…

Scrapy

а вот стоковый crawlee - нет. сделал все то же самое
видимо, он ему свой конфиг проставляет при запуске
или что скорее всего он на любой чих (403) просто дропает страницу так и не дождавшись проверки

Читать полностью…

Scrapy

спасибо, резонно
но попробую все таки поднять сначала... питоновский вариант

как накопаю в чем дело было - напишу сюда, что б другие не мучались (если найду конечно))

Читать полностью…

Scrapy

ну мы ж не только флаги сравниваем, или только?

Читать полностью…

Scrapy

так флаг-то относится к браузеру, как я понимаю, вот например

Читать полностью…

Scrapy

а... ага, понял
нуу вроде ясно куда двигаться, спасибо

Читать полностью…

Scrapy

о как получается. а так скрапи больше про некие автономные "юниты" для сервисов по типу apify получается?

Читать полностью…

Scrapy

селекторов достаточно, а вот самих запросов может быть много (в пределах одной сессии с браузером) - второе про ситуацию с поиском по тексту

Читать полностью…

Scrapy

ммм... у меня это будет интероп с шарповским бекендом
т.е из кода на беке, вызывается пайтонскрипт и дальше по ipc дергаю результаты

почему сразу не на шарпе - на нем многословно писать локаторы/квери к DOMу

а так задач несколько: информация с разных маркетплейсов по одному и тому же лоту
поиск по маркетплейсу с применением фильтров
в обоих случаях нужно менять геолокацию

т.е мне тут не просто страничку скачать

Читать полностью…

Scrapy

если всё что надо это страницу скачать то селениума хватит

Читать полностью…

Scrapy

а могу уточнить: обязательно ли скрапи подтягивать? или бывает резонно на чистом селене все реализовать?

Читать полностью…

Scrapy

Надеюсь это рофл. Я сюда зашел чтобы решить проблемы так то 😁

Читать полностью…

Scrapy

Фича походу на имени завязана

Читать полностью…

Scrapy

ты озвучил мои мысли, но я их писать не стал)))

Читать полностью…

Scrapy

А мне плейрайт не понравился. Я скрапи юзаю и кастомный мидлвар поставил на селениуме, пока еще не попадался сайты которые не пропускали бы. Парсю только новости.

Читать полностью…

Scrapy

так что ну его нахрен, возьму стоковый playwright, а надо будет докручу proxy rotation или что там еще нужно

Читать полностью…

Scrapy

хм, забавно получается
дефолтный (!!!) селениум проходит антибот проверку

Читать полностью…

Scrapy

вот честно говоря не знаю :(

Читать полностью…

Scrapy

ну условно, я все хедеры с клиентского браузера передал
а вот если смотреть на код выше, то не хватает только —no-sandbox и —disable-gpu

Читать полностью…

Scrapy

Во-первых - питон, а у Вас JS

Читать полностью…
Subscribe to a channel