всем привет
никто не дообучал llmку по этому чату, реддиту, дс, документации и исходному коду scrapy?
сейчас просто чатгпт и прочие очень плохо галлюцинируют по этой теме)
я бы в текущих реалиях если уж брать браузер, на playwright рекомендовал крутить. Селен брать если тока на нем собаку съел
Читать полностью…я покупал примерно по 1,2 за проксю на месяц германские, юзаю под чат гпт и заблокированные источники, работает норм
Читать полностью…если вы хотите драйвить инстанс браузера руками в синхронном режиме то скрапи может даже мешать
Читать полностью…ну как бест практика что ль..
не знаю как по-другому вопрос поставить. вдруг скрапи дает некие абстракции универсальные в принципе даже для множества простых задач
Cf даже скрапи не детектит, если он не в бастионе и подрубить туда cloudscraper, которому 100 лет в обед) А если cf в бастионе, селен там также обосрется, даже зачастую с дебагпортом и всеми свистелками)
Читать полностью…о как получается. а так скрапи больше про некие автономные "юниты" для сервисов по типу apify получается?
Читать полностью…селекторов достаточно, а вот самих запросов может быть много (в пределах одной сессии с браузером) - второе про ситуацию с поиском по тексту
Читать полностью…ммм... у меня это будет интероп с шарповским бекендом
т.е из кода на беке, вызывается пайтонскрипт и дальше по ipc дергаю результаты
почему сразу не на шарпе - на нем многословно писать локаторы/квери к DOMу
а так задач несколько: информация с разных маркетплейсов по одному и тому же лоту
поиск по маркетплейсу с применением фильтров
в обоих случаях нужно менять геолокацию
т.е мне тут не просто страничку скачать
а могу уточнить: обязательно ли скрапи подтягивать? или бывает резонно на чистом селене все реализовать?
Читать полностью…А мне плейрайт не понравился. Я скрапи юзаю и кастомный мидлвар поставил на селениуме, пока еще не попадался сайты которые не пропускали бы. Парсю только новости.
Читать полностью…так что ну его нахрен, возьму стоковый playwright, а надо будет докручу proxy rotation или что там еще нужно
Читать полностью…