Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
ну то есть никакого так сказать cheatsheet не существует? как пойдет так пойдет?
Читать полностью…Привет, кто знает, какие хедеры нужно указывать (я использую селениум), чтобы сделавить вид, что я захожу на сайт со страницы яндекса?
Привет
1 Если перейти по ссылке https://kinoxor.pro/650-mir-druzhba-zhvachka-2024-05-06-19-54.html -- Получаю ошибку Internal Server Error
2 Если вбить ссылку в поисковик яндекса и зайти на сайт -- сайт открывается нормально
Я пробовал в селениуме указывать header
"Referer": "https://yandex.ru/search/?text=https%3A%2F%2Fkinoxor.pro%2F650-mir-druzhba-zhvachka-2024-05-06-19-54.html&lr=213"
}
всем привет, подскажите, каким образом можно тянуть ссылку из ссылки?
Т.е есть вот такой сайт, где у каждой компании своя страница с данными
https://simaexpo.com/expositores/ и здесь есть кнопка которая содержит ссылку, в свою очередь с которой уже нужно парсить недостающие данные. Может у кого-то есть похожие проекты на гитхабе в открытом доступе? Если нет, то подскажите, где вообще можно почитать про это. Буду очень признателен
ребят, мне постучался прокси провайдер. Они готовы дать тест проксей для 10 человек. Поставьте пожалуйста 👍/👎 если кому нужно или нет.
—————————————-
Так как это тест, доступны такие типы прокси как
IPv4, IPv6, ISP - 7 дней
Резиденты - 30 дней - 1GB трафика
По желанию кто что захочет, выдадим любую страну, насколько я вижу все используют динамические прокси (резиденты)
Всем привет. Подскажите пожалуйста у каких хостеров приобретаете ротационные прокси?!
Читать полностью…Можно ли сейчас как-то преодолеть CloudFlare селениумом?
В прошлом году у меня это получаслось - достаточно было использовать undetected_chromedriver а сейчас никак не получается((
https://stackoverflow.com/questions/78474400/selenium-pass-cloudflare
кстати, еще вопрос, у response сразу строится selector или только при первом вызове?
Читать полностью…никак, всегжа будут обходы, но ниже вариант тчо жто захотят парсить
Читать полностью…какие существуют инструменты против парсинга? интересуюсь чтоб знать врага в лицо)
вот клаудфлейр и капчи это база, а еще как можно задетектить бота и забанить?
там написано кем блокируются, а значит вы можете найти какую документацию читать
Читать полностью…не могу понять, что надо использовать, потому что всегда делал в пределах одного сайта
Читать полностью…напишите тогда кому интересно в личку к @matthewproxyseller
Читать полностью…Ищу новых людей в команду для получения доп. дохода
Удаленно, с телефона, или компьютера
Подробности в ЛС