scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

Есть кто с опытом? Можем в команду взять

Читать полностью…

Scrapy

селениумом хочешь сказать?

Читать полностью…

Scrapy

Мне нужно мониторить общую группу в ватсапе и при получении триггер сообщения писать в нее 1 слово, с интервалом ~1час.

Работать должно автономно 24/7 в докере на дедике.

Насколько я понял у ватсапа нет изичной халявной апишки, в этом проблема

Ктото уже сталкивался с таким кейсом, чем воспользовались?

Читать полностью…

Scrapy

Ещё раз огромная благодарность)

Читать полностью…

Scrapy

самым распространенным вполне возможно что и селениум

Читать полностью…

Scrapy

Если нужно подделать тлс фингерпринт, можно взять scrapy-curl-cffi

Читать полностью…

Scrapy

/channel/scrapy_python/61298

Читать полностью…

Scrapy

Знаю. В чистом виде пользовал немного

Читать полностью…

Scrapy

Не понравился сплеш. Browserless больше понравился, но он тяжёлый и много ненужной функций для меня, пришлось свою писать))

Читать полностью…

Scrapy

Его в скрапи засунуть можно?)

Читать полностью…

Scrapy

Сначала ж надо сломать все пальцы, а потом пойти, как большинство))

Читать полностью…

Scrapy

но вы уже код написали, запустили и спросили почему он не работает (кстати его не показав)
я думаю вам надо идти и смотреть исходники, ну либо создавать страницу самому и передавать её в реквесте

Читать полностью…

Scrapy

и как вы собираетесь применить это мидлварью?

Читать полностью…

Scrapy

Есть пакет tf-playwright-stealth. На сколько я понимаю, то он с коробки подкидывает красивый фингерпинт.
Код отрабатывает, но сайт сервис по определению ботов показывает, что проверку (chromium) не прохожу. Сервис видит, что это вебдрайвер.

Подключение фингрепринта осуществляется с помощью download midlware или нужно писать свой кастомный download handler?
Или есть ещё какие-нибудь готовые технические решения?

Читать полностью…

Scrapy

«Человека легче обмануть, чем убедить, что его обманули».

Марк Твен

Читать полностью…

Scrapy

реверс инжиниринг + get|post запросы

Читать полностью…

Scrapy

web версия WA всё позволяет делать.

Читать полностью…

Scrapy

Самый распространённый имхо выкинуть по максимуму все браузеры. И воспользоваться одним из решений с браузерными tls. Они есть для scrapy. А браузер - куки получить и все.

Читать полностью…

Scrapy

рекомендуемым - playwright и scrapy-playwright

Читать полностью…

Scrapy

Честно, глубоко не копал. На данный момент, какой стек является общепринятым и самым распространенным?

Читать полностью…

Scrapy

было б странно если б они были, конечно

Читать полностью…

Scrapy

Там же вроде апдейтов давно не было на скрапи-силениум?

Читать полностью…

Scrapy

ну то есть есть scrapy-selenium, но большинство скорее всего и про него не знает

Читать полностью…

Scrapy

конечно можно, он же на питоне

Читать полностью…

Scrapy

большинство селениум юзает

Читать полностью…

Scrapy

Я отдельно вытащил плейрайт в фаст апи и упаковал в докер. А в скрапи просто сделал запросы на этот апи и все. Не стал парится пихать плейрайт в скрапи, не все заросы делаю через плейрайт. И все это работает на кубеон

Читать полностью…

Scrapy

Это, я так понимаю, нужно посмотреть схему взаимодействия самого скрапи и плейврайта. Т.к. стелз применяется уже к самой Пейдж.
А в мидлваре мы получим доступ только к метадате.
Это менеджить надо на уровне хендлера

Читать полностью…

Scrapy

нет никакого "Подключение фингрепринта", вы всё перепутали видимо

Читать полностью…

Scrapy

Ребят, пытаюсь в scrapy, scrapy-playwright и tf-playwright-stealth.
Пробовал обернуть в мидлвару через 'evaluate' в process_request(). Работает не корректно, при попытке ходить на bot.sannysoft через хромиум и фф видит вебдрайвер плюс:
- в хроме варнинг на 264 кодек
- в фф половина полей связанных с видео - фейл

Не пойму, моя мидлвара отрабатывает уже после запроса чтоле?

Или фингерпинт как-то по другому имплементировать? Или есть ещё какие-нибудь технические решения?

Читать полностью…

Scrapy

Вот оно что, за день сменился сайт. Теперь никаких таблиц. И можно пагинацию брать сразу с каталога. Начал вчера запускать паука. А выдачи - 0. Ещё раз спасибо за помощь.

Читать полностью…
Subscribe to a channel