scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

В чем конкретно вопрос?

Читать полностью…

Scrapy

Парни,кто работал с BS4 в питоне?

Читать полностью…

Scrapy

ну да, но как то оверкил целый гпт для своих задач подключать

Читать полностью…

Scrapy

https://github.com/scrapinghub/article-extraction-benchmark

Читать полностью…

Scrapy

можно просто совать страницы в чатгпт

Читать полностью…

Scrapy

Как оказалось playwright + webkit вообще без каких либо проблем обходит cf примерно за 6 секунд.

Читать полностью…

Scrapy

Чем cf обходите поделитесь? даже если платно

Читать полностью…

Scrapy

все хедеры учитывать так себе идея

Читать полностью…

Scrapy

а как учитывать?
удобно было бы, если парсишь апи с одним эндпойнтом, который хедеры смотрит

Читать полностью…

Scrapy

да, не учитываются
метод урл боди

Читать полностью…

Scrapy

https://github.com/scrapy/scrapy/blob/master/scrapy/dupefilters.py#L28

https://github.com/scrapy/scrapy/blob/master/scrapy/utils/request.py#L122

в дупфильтре хедеры не учитывются?

Читать полностью…

Scrapy

обычно дупфильтр это хорошо, потому что обычно не надо делать дублирующиеся запросы

Читать полностью…

Scrapy

в общем ладно, спасибо большое)

Читать полностью…

Scrapy

хорошо, сейчас попробую

Читать полностью…

Scrapy

очевидно он не всегда разный

Читать полностью…

Scrapy

https://nometa.xyz/ru.html

Читать полностью…

Scrapy

недавно видел видос как чатгпт, клод опус, гемини строят домики в майнкрафте)

Читать полностью…

Scrapy

есть большая тема с сованием скриншота страницы в computer vision

Читать полностью…

Scrapy

есть догптшные претрейнед модели всякие, например для статей есть сразу пачка

Читать полностью…

Scrapy

какие знаете приколы с использованием ml в парсинге? я знаю autopager, а ещё есть какие нибудь решения? от zyte вроде да, но они кажись платные и не опенсорс

Читать полностью…

Scrapy

Brightdata, data unblockers proxies

Читать полностью…

Scrapy

всем привет, у кого нибудь есть опыт подключения asocks в playwrite ?
пытаюсь подключиться к ним разными путями, ничего не выходит

Читать полностью…

Scrapy

написать свой фингерпринтер, который передаёт в fingerprint() имена нужных хедеров

Читать полностью…

Scrapy

вы не видите что сайт отправляет или не знаете откуда это взять? а то на картинке боди-то не видно

Читать полностью…

Scrapy

Здравствуйте помогите распарсить сайт, проблема в том что я не пойму что отправлять в post request. Я пересмотрел все javascript теги не нашёл там ничего, искал csrf тоже ничего.

Вопрос что нужно передать в post запрос?

https://realtylink.org/en/properties~for-rent?view=Thumbnail&uc=2

Читать полностью…

Scrapy

это вообще одна из лучших вещей, я так считаю

Читать полностью…

Scrapy

теперь все полностью собирается)

Читать полностью…

Scrapy

ну да, так и есть... но как..

Читать полностью…

Scrapy

включите DUPEFILTER_DEBUG

Читать полностью…

Scrapy

типа там артикул товара, который берется с каждой страницы

Читать полностью…
Subscribe to a channel