scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

найди документацию Scrapy, добавь в конце .exe и запусти

Читать полностью…

Scrapy

Как запустить скрапи если в архиве нихуя

Читать полностью…

Scrapy

Добрый день. Есть ли какой-нибудь способ автоматически чистить scrapyd весии проекта? Заранее спасибо

Читать полностью…

Scrapy

а, как всегда, не дочитал сообщение :))
таки да, конкретно для этого os.kill, насколько я помню, и ничего более.
перебирать все объекты и искать какой из них ждет ответа и не дает закрыться пауку.... та ну нах, проще кильнуть :)

Читать полностью…

Scrapy

spider.crawler.engine.close_spider(self, reason='no_proxies')

Читать полностью…

Scrapy

как сделать unclean shutdown из пайплайна\мидлвари? при вызове self.crawler.engine.close_spider(self.crawler.spider, 'cond') в некоторых случаях ничего не закроется пока я два раза ctrl+c не нажму

Читать полностью…

Scrapy

тем более, что, так ли нужны последние обновления?

Читать полностью…

Scrapy

сразу при запуске паука

Читать полностью…

Scrapy

Погоняйте дольше и локально тоже будет

Читать полностью…

Scrapy

Это с прокси? Хотя если разница докер/не докер как будто бы не должно сказываться

Читать полностью…

Scrapy

Ну мне и так сойдет)

Читать полностью…

Scrapy

Это немного помягче, чем костыль

Читать полностью…

Scrapy

Как по-английски сказать костыль 🤔?

Читать полностью…

Scrapy

Блин, даже за чувака обидно. Старался, хотел фидбек... ну получил... а чё-то не очень он позитивный фидбек... Эх господин Синегубов, что ж вы так жестоко

Читать полностью…

Scrapy

Что прям все 370)) ладно стопаем эту всю телегу. Кому не нравится не пользуйтесь. Дальше отвечать по этой теме не буду. Обсуждайте лучше Scrapy. Всем хорошего дня!

Читать полностью…

Scrapy

не печалься :D прочитай в закрепе хелп и удивись

Читать полностью…

Scrapy

По принципу оставлять 10 последних например

Читать полностью…

Scrapy

а есть у кого-то готовые скрипты для получения email с сайтов? Задача полностью так звучит - есть стайты криптопроектов. На них есть email для сотрудничества. шаблон и точная страница не известны, надо пройти по всем страницам и с каждой страницы сохранить адреса электорнных почт. Сохранить нужно в базу. Желательно в контейнере с логированием. Готов предложить финансовое вознагрождение для решения этой задачи

Читать полностью…

Scrapy

это у меня я в def process_request(self, request, spider):
но, насколько я помню, это soft kill

Читать полностью…

Scrapy

хорошо работает

os.kill(os.getpid(), signal.SIGINT)
os.kill(os.getpid(), signal.SIGINT)

но выглядит как то костыльно

Читать полностью…

Scrapy

я думал для того докера и существует, чтобы работал на любом сервере с конкретными зависимостями.

Читать полностью…

Scrapy

"с прокси, проблема только из докера" - иии? что разного? пральна, система и компоненты системы,
вариантов мног, целых 1,5
1. откатиться до старого curl-ffi
2. искать, чего надо обновить в системе докера

Читать полностью…

Scrapy

Не в параллель в несколько потоков? Или это прямо сразу появляется?

Читать полностью…

Scrapy

с прокси, проблема только из докера

Читать полностью…

Scrapy

Ребят, обновился curl-cffi-0.7.1 и соответственно scrapy-impersonate-1.3.1, и перестал запускаться парсер на scrapy из докера, локально все ок, генерирует исключение, кто сталкивался?

Traceback (most recent call last):
File "/home/airflow/.local/lib/python3.11/site-packages/curl_cffi/requests/session.py", line 1263, in request
await task
curl_cffi.curl.CurlError: Failed to perform, curl: (56) CONNECT tunnel failed, response 407. See https://curl.se/libcurl/c/libcurl-errors.html first for more details.

The above exception was the direct cause of the following exception:

Читать полностью…

Scrapy

Это легитимный костыль

Читать полностью…

Scrapy

буквально так же, Crutch
ещё можно сказать
изобретать велосипед - invent a bicycle

Читать полностью…

Scrapy

ну, плохой результат - это, то же, результат.
А чего он хотел, что все кинутся кричать "ой, какая крутячая тулзовина для регуляров"..... в чатике с инструментом, который изумительно работает с xpatch/css..... и сидят тут именно кодеры.... ну, такое себе.
в чатике по зенке будет намного больше положительных отзывов

Читать полностью…

Scrapy

Ну перегрузить start_requests и всё

Читать полностью…

Scrapy

есть ли возможность указать колбек для start_urls?

Читать полностью…
Subscribe to a channel