1045
Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
По ищи в интернете и чат гпт. Все из за очень частых запросов. Возможно потребуется прокси, а может есть другие способы. Я просто каждый час запросы отправляю так что у меня обычный селениум справился
Читать полностью…
Если не ошибаюсь cloudscraper не дает полностью обойти защиту. Особенно если ты собираешься делать часто запросы. Все из за того что делаешь очень часто запросы, вот тебя и блочат.
Читать полностью…
Всем привет 👋🏼
1️⃣Ищем опытного разработчика на позицию тимлида.
энтузиастов!
Стек: React, Next, Node.js API, UI kit (Mantline или подобные).
Нам подходят новички и профи:
2️⃣Ищем опытного
«Фронта»
энтузиастов!
Стэк:
- Опыт разработки на
React, Next.js, знание стиливых либ по типу Mantine, HTML/CSS
- Знание современных фреймворков и библиотек
- Способность к быстрому обучению и решению нестандартных задач
Нам подходят новички и профи:
Будем рады познакомиться с вами и обсудить детали сотрудничества!🤝
да мне честно говоря нужно просто знать когда остановиться
Читать полностью…
естественно, всякие Count и пр. не будут работать потому что страница бесконечна и всегда подгружается
Читать полностью…
Все привет, знает кто-нибудь запрос для получения реестра контрактов по ф44. Запрос на получение закупок есть в приложение и он такой "https://zakupki.gov.ru/api/mobile/proxy/917/epz/order/extendedsearch/results.html", а контратов нет
Читать полностью…
Почему, данные
Кусок о котором просили содержит мало данных, они почти все тут
посмотри тут
https://github.com/xKiian/cloudflare-jsd
почитай вот это https://www.zenrows.com/blog/bypass-cloudflare#active-detection-techniques
с клаудфлярей не работал, но акамаи, например, обходился правильными хедерами
какая та другая хрень обходилась правильным tls фингерпринтом, если используешь селениум, вроде он такой же, какой вебдрайвер и используешь
если хочешь без селениума (лучше так и делать), то смотри в сторону curl-impersonate/scrapy-impersonate
ну и прокси еще перепробуй разные, попробуй найти максимально чистые
bypass cloudflare - datadome - invisible hcaptcha (nodejs) /channel/+UkXUNTAdfv44YWRk
Читать полностью…
мало
мне предлагали 4000$ за час
было бы так я бы внес вклад в ваш бизнес )
Скинул бы вам свои биткоины )
Народ использую сервер firstbyte
Есть бот который загружает с сайта анистар аниме
Cloudscraper использовал чтобы обойти клоудфларе но на днях клоудфларе стал блокировать, раньше с селениум также было работал месяц и потом блокировался
Сегодня просто запустил бота смотрю все работает
Это из-за чего?
Всем ку, нужен человек который переделает 1 xpath для playwright(аналог selenium) чтобы скрипт работал(не работает именно из-за этого xpath. Раньше работал, но сайт немного обновили). Плачу 10$ в ton или stars
Читать полностью…
да и запросы у яндекса там могут хрен пойми какими быть
Читать полностью…
доброго вечера
подскажите пожалуйста по Playwright - если у меня динамическая страница с бесконечной лентой товаров, то как сделать итератор над локатором? ну типо я хочу что-то вроде while(myLocator.GetNext()) { ... }
Ну так то это не совсем то :).
Это js код с параметрами (d, l, u, au и т.п.), а не данные. Через js2py такие штуки решаю, чтобы не копаться какой параметр куда подставить. Хотя можно и взять в функции параметры, сопоставить со значениями в конце, сделать замены в тексте, преобразовать в формат json и т.п.
Хотя это и есть домашняя работа...
вроде такие хедерыDEFAULT_REQUEST_HEADERS = {браузера
"accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8",
"accept-encoding": "gzip, deflate, br, zstd",
"dnt": "1",
"accept-language": "en-US,en;q=0.9",
"priority": "u=0, i",
"sec-ch-ua": '"Brave";v="125", "Chromium";v="125", "Not.A/Brand";v="24"',
"sec-ch-ua-mobile": "?0",
"sec-ch-ua-platform": '"macOS"',
"sec-fetch-dest": "empty",
"sec-fetch-mode": "cors",
"sec-fetch-site": "same-origin",
"sec-fetch-user": "?1",
"sec-gpc": "1",
"upgrade-insecure-requests": "1",
}
sec-fetch-* меняй на те, которые летят с реквестов от
sec-ch-ua тож меняй в зависимости какой алгоритм фингерпринта используется (хромовский/фаерфоксовский/сафариевский)
Народ что используете чтобы обойти cloudflare есть что почитать посмотреть или копировать и посмотреть что к чему
Хочу анимешки загрузить с сайта но cloudflare selenium чекать начал (изначально не чекал примерно месяц)
Если перевести пишет лохи скиньте 30$, но кажется не там ищешь 😅
Читать полностью…
маппинг айди поколений в названия остаётся на домашнюю работу
Читать полностью…