1045
Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
spider.crawler.engine.close_spider(self, reason='no_proxies')Читать полностью…
как сделать unclean shutdown из пайплайна\мидлвари? при вызове self.crawler.engine.close_spider(self.crawler.spider, 'cond') в некоторых случаях ничего не закроется пока я два раза ctrl+c не нажму
Это с прокси? Хотя если разница докер/не докер как будто бы не должно сказываться
Читать полностью…
Блин, даже за чувака обидно. Старался, хотел фидбек... ну получил... а чё-то не очень он позитивный фидбек... Эх господин Синегубов, что ж вы так жестоко
Читать полностью…
Что прям все 370)) ладно стопаем эту всю телегу. Кому не нравится не пользуйтесь. Дальше отвечать по этой теме не буду. Обсуждайте лучше Scrapy. Всем хорошего дня!
Читать полностью…
Дядь, не бурчи, я второй день после отпуска, дай мозгу хоть тут отдохнуть. 😂
Читать полностью…
Поверьте не только мне он удобен но и многим профи, например из сообщества Zennoposter. По сути это клон их стандартного конструктора регулярных выражений. Но он доступен только в Zennoposter. Я просто сделал его в виде веб-версии и плагина для Хрома)
Читать полностью…
Лично для моих рабочих задач мой конструктор закрывает 90% регулярок. Шпаргалка чисто для справки, на всякий случай. На мой взгляд regexp-helper достаточно общее и информативное название по которому пользователь поймет что инструмент ему поможет в составлении регулярок. Конкурировать с сервисами 101 и подобными никогда в планах не было)
Читать полностью…
короче, я понял в чем затык у присутствующих - все думают со старта это функционал аля регексп101 и подобных сайтов, но это не конструктор регулярных выражений а штука, хорошо выполняющая только одну функцию, аля "составитель выделения подстрок по маркеру начала и конца", и поэтому "этот ваш шпаргалка нам и нахер не нужон", если в такой парадигме повернуть то да, тут согласен.
Я бы разве что переименовал его в regexp substring searcher
хорошо работает
os.kill(os.getpid(), signal.SIGINT)
os.kill(os.getpid(), signal.SIGINT)
я думал для того докера и существует, чтобы работал на любом сервере с конкретными зависимостями.
Читать полностью…
"с прокси, проблема только из докера" - иии? что разного? пральна, система и компоненты системы,
вариантов мног, целых 1,5
1. откатиться до старого curl-ffi
2. искать, чего надо обновить в системе докера
Не в параллель в несколько потоков? Или это прямо сразу появляется?
Читать полностью…
Ребят, обновился curl-cffi-0.7.1 и соответственно scrapy-impersonate-1.3.1, и перестал запускаться парсер на scrapy из докера, локально все ок, генерирует исключение, кто сталкивался?
Traceback (most recent call last):Читать полностью…
File "/home/airflow/.local/lib/python3.11/site-packages/curl_cffi/requests/session.py", line 1263, in request
await task
curl_cffi.curl.CurlError: Failed to perform, curl: (56) CONNECT tunnel failed, response 407. See https://curl.se/libcurl/c/libcurl-errors.html first for more details.
The above exception was the direct cause of the following exception:
буквально так же, Crutch
ещё можно сказать
изобретать велосипед - invent a bicycle
ну, плохой результат - это, то же, результат.
А чего он хотел, что все кинутся кричать "ой, какая крутячая тулзовина для регуляров"..... в чатике с инструментом, который изумительно работает с xpatch/css..... и сидят тут именно кодеры.... ну, такое себе.
в чатике по зенке будет намного больше положительных отзывов
Проверьте мне, если из 370 онлана об удобстве говорите только Вы, то это что то до и значит 😁
Читать полностью…
ну, выше, как раз, и говорилось, что инструмент совсем не помогает. То, что он удобен лично Вам - не вопрос, вполне возможно. То, что, он удобен широкой аудитории - сильно сомневаюсь. Начинающий скажет "ой, сколько не понятных окошек, а чего туда писать", продвинутый скажет "фу, мля, нафуя мне это все надо".
У меня был случай общения с инструментом, заточенным под конкретного человека. Я когда увидел интерфейс софтины так и сказал "хоспади, да как же во всем этом разобраться, да как же оно работат". А человек, который пользовался, чудеса творил с пасрингом сайтом, причем, все это было очень быстро, не смотря на кучу полей ввода.
В общем, озвучу сугубо свое мнение. Что до конструктора для новичка, что до проф. инструмента - оно не дотягивает.
По разбегу глаз - это как с городами, которые красивые с птичьего полета, но при этом жить и них, находясь на земле, адски неудобно. Часто максимально мерзко выглядящие тулзы в долгой работе самые удобные. Одна из самых удобных метрик -
1. количество лишних кликов
2. количество нажатий клавишек
3. сколько километров пропутешествовала мышка. Вот это туда-сюда, в долгую - заколебет (ну, не тут, тут это по-факту не особо надо, да, это уже если начать пиликать как корабли бороздят просторы космосы))
Да шпаргалка была добавлена позже. В начале была одна страница с конструктором и все) Мне больше нравится когда все разложено по вкладкам. А на 101 глаза разбегаются что куда, со старта не понятно))
Читать полностью…