scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

всем привет
никто не дообучал llmку по этому чату, реддиту, дс, документации и исходному коду scrapy?
сейчас просто чатгпт и прочие очень плохо галлюцинируют по этой теме)

Читать полностью…

Scrapy

я бы в текущих реалиях если уж брать браузер, на playwright рекомендовал крутить. Селен брать если тока на нем собаку съел

Читать полностью…

Scrapy

Ну я как утверждение написал, но поправьте, если не прав)

Читать полностью…

Scrapy

я покупал примерно по 1,2 за проксю на месяц германские, юзаю под чат гпт и заблокированные источники, работает норм

Читать полностью…

Scrapy

Пацыки, как считаете, платить 21$ в месяц за прокси это норм? (5 айпишек это)

Читать полностью…

Scrapy

Нет, скрапи про асинхронность просто

Читать полностью…

Scrapy

если вы хотите драйвить инстанс браузера руками в синхронном режиме то скрапи может даже мешать

Читать полностью…

Scrapy

ну тут два варианта, либо достаточно селекторов, либо надо что-то ещё

Читать полностью…

Scrapy

https://docs.scrapy.org/en/latest/intro/overview.html#what-s-next

Читать полностью…

Scrapy

ну как бест практика что ль..
не знаю как по-другому вопрос поставить. вдруг скрапи дает некие абстракции универсальные в принципе даже для множества простых задач

Читать полностью…

Scrapy

скинь рабочий алфавит пж

Читать полностью…

Scrapy

ребята скиньте рабочий питон для демки пж

Читать полностью…

Scrapy

я так постоянно делаю в оффе, озвучиваю то, что другие стесняются сказать 😆

Читать полностью…

Scrapy

Можете пожалуйста оч надо

Читать полностью…

Scrapy

Ребят кинте рабочий скрапи для демки с телефона на пк

Читать полностью…

Scrapy

Cf даже скрапи не детектит, если он не в бастионе и подрубить туда cloudscraper, которому 100 лет в обед) А если cf в бастионе, селен там также обосрется, даже зачастую с дебагпортом и всеми свистелками)

Читать полностью…

Scrapy

не, всё верно, не берут, может только для некоторых тарифов проксей

Читать полностью…

Scrapy

А, они не берут за трафик дополнительно

Читать полностью…

Scrapy

смотря какие, но можно и дешевле

Читать полностью…

Scrapy

а... ага, понял
нуу вроде ясно куда двигаться, спасибо

Читать полностью…

Scrapy

о как получается. а так скрапи больше про некие автономные "юниты" для сервисов по типу apify получается?

Читать полностью…

Scrapy

селекторов достаточно, а вот самих запросов может быть много (в пределах одной сессии с браузером) - второе про ситуацию с поиском по тексту

Читать полностью…

Scrapy

ммм... у меня это будет интероп с шарповским бекендом
т.е из кода на беке, вызывается пайтонскрипт и дальше по ipc дергаю результаты

почему сразу не на шарпе - на нем многословно писать локаторы/квери к DOMу

а так задач несколько: информация с разных маркетплейсов по одному и тому же лоту
поиск по маркетплейсу с применением фильтров
в обоих случаях нужно менять геолокацию

т.е мне тут не просто страничку скачать

Читать полностью…

Scrapy

если всё что надо это страницу скачать то селениума хватит

Читать полностью…

Scrapy

а могу уточнить: обязательно ли скрапи подтягивать? или бывает резонно на чистом селене все реализовать?

Читать полностью…

Scrapy

Надеюсь это рофл. Я сюда зашел чтобы решить проблемы так то 😁

Читать полностью…

Scrapy

Фича походу на имени завязана

Читать полностью…

Scrapy

ты озвучил мои мысли, но я их писать не стал)))

Читать полностью…

Scrapy

А мне плейрайт не понравился. Я скрапи юзаю и кастомный мидлвар поставил на селениуме, пока еще не попадался сайты которые не пропускали бы. Парсю только новости.

Читать полностью…

Scrapy

так что ну его нахрен, возьму стоковый playwright, а надо будет докручу proxy rotation или что там еще нужно

Читать полностью…
Subscribe to a channel