Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
ну всякие там методы есть, шанс что поможет как встретить динозавра, 50% что поможет, 50% что нет: https://stackoverflow.com/questions/38910904/avoid-the-detection-of-whether-chrome-devtoolsconsole-is-open
Читать полностью…Могу еще подобного рода прикольный сайт показать, попробуйте devtools для него открыть (когда уже показало список фильмов): https://himovies.to/home
Читать полностью…попробуй с открытой панелью разработчика перезагрузить страницу
Читать полностью…shopee не позволяет с открытой devtools посмотреть запросы, просто выкидывает на начальную страницу с авторизацией) хотя сидишь на карточке товара
Читать полностью…Я вытащил api из веб версии сайта. Все вроде как работает ну приходится менять куки каждые 7 запросов. Возможно у кого-нибудь есть api из приложение и там меньше защиты. Или кто-нибудь подскажет где можно купить api?
Читать полностью…Запускаю скриптом 2 паука одновременно, нужно чтобы у каждого из них был свой особый formatter.
Гипотетически, стоит такие форматтеры привязывать к соответствующим spider.logger-ам? Или в spider.logger будет всегда рутлоггер?
ну я через playwright page.on достал всю инфу с запросов и нашел нужный
Читать полностью…а не, я по моему точку останова ставил на запрос и потом дебаггер вылазил
Читать полностью…хочешь отследить запросы - он тебе также дебаггер вызывает
Читать полностью…я уже конечно достал нужный мне запрос и без того, но это дело можно отключить? я просто сильно за js не шарю
Читать полностью…кодом javаscript действительно можно достаточно легко определить включен ли или выключен chrome devtools у пользователя - это действительно используется антиботами.
Читать полностью…не "компания", а "собственник". Компании, как раз, разные.
а насчет "защита разная", так амазон глянь, там и верстка разная в разных разделах. А на каком то сайте нарывался, что у разных разделов было АПИ разное :)
самое интересное что компания 1 и таже, зато сайты с разными защитами
Читать полностью…Если я правильно понял вопрос, то можешь делать и так, ему в целом пофигу but you can use any custom Python logger you want.
: https://docs.scrapy.org/en/latest/topics/logging.html#logging-from-spiders
да, там просто какая-то страность с энджином. В общем проще перезапустить шел, чем с этим возиться 😄
Читать полностью…я переписал response своим, который типа вручную создал, мб из-за этого
Читать полностью…