scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

копаю репозетории через chatGPT o3-mini-high по 1688, франкенштейна боюсь собрать😬

Читать полностью…

Scrapy

это вы основатели идеи "спарсить можно все"?

Читать полностью…

Scrapy

3 месяца у меня ушло на разработку, основная проблема - динамический "бан" . Нет логина с "фингерпринта" (не путать с IP) - ты бот без вариантов и слайдер тебе не поможет.

Читать полностью…

Scrapy

Просто "гора проксей" не поможет ))))))

Читать полностью…

Scrapy

Да в принципе можно парсить. Нужна только гора проксей и слайдер антикапчу прикрутить к bs.)

Читать полностью…

Scrapy

Всем добрый вечер
Подскажите, пожалуйста, как спарсить при помощи beautiful soup на сайте 1688 товары по категориям
- цены
- оценка
- рейтинг
- продажи и тд…

Читать полностью…

Scrapy

видимо второй нужны ещё какие-то хедеры например

Читать полностью…

Scrapy

да второй нет. и айпи одинаковый

Читать полностью…

Scrapy

в оба запроса одинаково?

Читать полностью…

Scrapy

Всем привет! Кто может дать подсказку?

Проблема такая: пытаюсь спарсить один сайт, где нужна авторизация. Передаю заголовок с текущей сессией, но когда начинаю парсить другую страницу, пишет, что нет авторизации. Это из-за того, что поменялась сессия?

Читать полностью…

Scrapy

короче, наткнулся на статью, если кому надо, держите)

from selenium import webdriver

# create Chromeoptions instance
options = webdriver.ChromeOptions()

# adding argument to disable the AutomationControlled flag
options.add_argument("--disable-blink-features=AutomationControlled")

# exclude the collection of enable-automation switches
options.add_experimental_option("excludeSwitches", ["enable-automation"])

# turn-off userAutomationExtension
options.add_experimental_option("useAutomationExtension", False)

# setting the driver path and requesting a page
driver = webdriver.Chrome(options=options)

# changing the property of the navigator value for webdriver to undefined
driver.execute_script("Object.defineProperty(navigator, 'webdriver', {get: () => undefined})")

driver.get("https://www.ozon.ru")

# close the driver
driver.close()

Читать полностью…

Scrapy

мне кажется что это скорее всего глобальная проблема, т.к смена айпишников, впны и прочее никак на ситуацию не влияли. а еще осенью все работало

Читать полностью…

Scrapy

все же что-то не то.
скажите пожалуйста, точно ни у кого playwright на озон не отвалился? он у меня вообще не фурычит что только не менял. даже куки подставные - застревает на Antibot Challenge

Читать полностью…

Scrapy

Ребят, а кто-нибудь делал парсер вакансий Авито?

Читать полностью…

Scrapy

вы это везде спрашиваете или вас там несколько? а то я не знаю отвечать ли везде одно и то же или нет :)

Читать полностью…

Scrapy

подскажите, пожалуйста, есть ли подобные решения опен сорс ?

Читать полностью…

Scrapy

У меня рекорд 6 месяцев разработки. Жесткий был ресурс.)

Читать полностью…

Scrapy

Здесь проблема не в парсере. Проблема в объеме. А про это ничего в условиях задачи не сказано.
А так можно даже curl использовать. Только медленно будет очень.

Читать полностью…

Scrapy

а есть открытый код подобного парсера?

Читать полностью…

Scrapy

1688 сложно парсить, банит много и часто...

Читать полностью…

Scrapy

разобрался я не так передавал сессию =). спасибо

Читать полностью…

Scrapy

Добавил в Postman cURL первой и второй страницы. Первая работает, а вторая нет.

Читать полностью…

Scrapy

и первый работает, а второй нет?

Читать полностью…

Scrapy

передаю headers. и cookies с csrf_token , client_id и Device-Id

Читать полностью…

Scrapy

Здравствуйте, если у вас проблема с Cloudflare и невидимой hcaptcha, свяжитесь со мной.(nodejs)

Читать полностью…

Scrapy

и на другом пк проверил от другой сети та же история

может кто-нибудь у себя посмотреть работает ли хоть какой-нибудь парсер на озоне?

Читать полностью…

Scrapy

с остальным аналогично

Читать полностью…

Scrapy

Всем привет!
Есть кто-нибудь кто занимается Amazon?
Вопросы вызывают их текущие ограничения на отзывы.
Есть ли способы нагенерировать аккаунтов? или можно каким-то волшебным образом обойти ограничения/использовать иные эндпоинты (раньше работал на hz/reviews-render/ajax/reviews/get)?
Буду рад любым подсказкам и советам

Читать полностью…

Scrapy

Тогда лучше на гите, там этот ответ больше людей найдёт. Там спрашивает мой знакомый, он спросил меня так как у меня чуть больше опыта со скрапи. Но я так же понятия не имею как это заранить )

Поэтому пришёл спросить сюда )

Читать полностью…

Scrapy

А, не заметил, тогда хз)

Читать полностью…
Subscribe to a channel