scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

юзаю firefox без доп оций все окей)

Читать полностью…

Scrapy

https://www.cnbc.com/2024/05/10/elon-musks-x-loses-lawsuit-against-bright-data-over-data-scraping.html

Читать полностью…

Scrapy

не забанят- не поймешь?)

Читать полностью…

Scrapy

ну то есть никакого так сказать cheatsheet не существует? как пойдет так пойдет?

Читать полностью…

Scrapy

по айпи за много запросов банитьь

Читать полностью…

Scrapy

да вообще, что используют

Читать полностью…

Scrapy

а вот можно ли в селениуме его переопределить я не знаю

Читать полностью…

Scrapy

И это автоматический хедер по моему

Читать полностью…

Scrapy

Привет, кто знает, какие хедеры нужно указывать (я использую селениум), чтобы сделавить вид, что я захожу на сайт со страницы яндекса?

Привет
1 Если перейти по ссылке https://kinoxor.pro/650-mir-druzhba-zhvachka-2024-05-06-19-54.html -- Получаю ошибку Internal Server Error
2 Если вбить ссылку в поисковик яндекса и зайти на сайт -- сайт открывается нормально


Я пробовал в селениуме указывать header


"Referer": "https://yandex.ru/search/?text=https%3A%2F%2Fkinoxor.pro%2F650-mir-druzhba-zhvachka-2024-05-06-19-54.html&lr=213"
}


но это не помогло

Читать полностью…

Scrapy

а в чём разница, один сайт или несколько?

Читать полностью…

Scrapy

я бы не назвал это кнопкой? ссылка как ссылка

Читать полностью…

Scrapy

передавать айтем в колбек

Читать полностью…

Scrapy

всем привет, подскажите, каким образом можно тянуть ссылку из ссылки?
Т.е есть вот такой сайт, где у каждой компании своя страница с данными
https://simaexpo.com/expositores/ и здесь есть кнопка которая содержит ссылку, в свою очередь с которой уже нужно парсить недостающие данные. Может у кого-то есть похожие проекты на гитхабе в открытом доступе? Если нет, то подскажите, где вообще можно почитать про это. Буду очень признателен

Читать полностью…

Scrapy

ребят, мне постучался прокси провайдер. Они готовы дать тест проксей для 10 человек. Поставьте пожалуйста 👍/👎 если кому нужно или нет.

—————————————-
Так как это тест, доступны такие типы прокси как

IPv4, IPv6, ISP - 7 дней
Резиденты - 30 дней - 1GB трафика

По желанию кто что захочет, выдадим любую страну, насколько я вижу все используют динамические прокси (резиденты)

Читать полностью…

Scrapy

Всем привет. Подскажите пожалуйста у каких хостеров приобретаете ротационные прокси?!

Читать полностью…

Scrapy

Можно ли сейчас как-то преодолеть CloudFlare селениумом?
В прошлом году у меня это получаслось - достаточно было использовать undetected_chromedriver а сейчас никак не получается((

https://stackoverflow.com/questions/78474400/selenium-pass-cloudflare

Читать полностью…

Scrapy

кстати, еще вопрос, у response сразу строится selector или только при первом вызове?

Читать полностью…

Scrapy

про ханипоты еще вспомнил

Читать полностью…

Scrapy

по кукам или каким то заголовкам смотрят?

Читать полностью…

Scrapy

никак, всегжа будут обходы, но ниже вариант тчо жто захотят парсить

Читать полностью…

Scrapy

какие существуют инструменты против парсинга? интересуюсь чтоб знать врага в лицо)
вот клаудфлейр и капчи это база, а еще как можно задетектить бота и забанить?

Читать полностью…

Scrapy

так :) это опечатка в рфц

Читать полностью…

Scrapy

По моему реферрер не так пишется

Читать полностью…

Scrapy

там написано кем блокируются, а значит вы можете найти какую документацию читать

Читать полностью…

Scrapy

не могу понять, что надо использовать, потому что всегда делал в пределах одного сайта

Читать полностью…

Scrapy

окей, и в чём сложность?

Читать полностью…

Scrapy

не понимаю о какой кнопке речь

Читать полностью…

Scrapy

напишите тогда кому интересно в личку к @matthewproxyseller

Читать полностью…

Scrapy

Ищу новых людей в команду для получения доп. дохода
Удаленно, с телефона, или компьютера
Подробности в ЛС

Читать полностью…

Scrapy

https://github.com/scrapy/scrapy/issues/5289

Читать полностью…
Subscribe to a channel