scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

lxml обязательно подчеркивать? запрос все равно фигачишь через реквестс)

Читать полностью…

Scrapy

смотря в чём ботлнек

Читать полностью…

Scrapy

значит он и использует его

Читать полностью…

Scrapy

так он скрапи и использует

Читать полностью…

Scrapy

scrapy тоже использует lxml, раз вы решили заострить на этом внимание

Читать полностью…

Scrapy

1000 категорий, там по несколько десятков товаров в категории, у каждого товара несколько десятков страниц с лотами.
У меня парсер на lxml это сайт уже 7 дней парсит...и только половину прошел.

Читать полностью…

Scrapy

звучит как не очень много данных

Читать полностью…

Scrapy

ох, лизонька, нету тут пассивных, мы тут все активные...

Читать полностью…

Scrapy

Реклама в инсте сама по себе таргетированная, между прочим

Читать полностью…

Scrapy

вряд-ли хорошая идея для 1000 аккаунтов поднимать 1000 браузеров

Читать полностью…

Scrapy

мне нужно парсить появляющююся рекламу в ленте

Читать полностью…

Scrapy

через апишку моэно парчить все?

Читать полностью…

Scrapy

В поиске тех, кто хочет попробовать себя в криптовалюте.

Занятость до двух часов в день.
Работать можно с телефона или компьютера.
Обучение доступно для новичков.
Сфера: аирдропы, тестнеты, лаунчпады и прочее.

Мои условия - в личку.

Читать полностью…

Scrapy

здравствуйте, кто то занимался парсингом инстаграм? у меня есть вопрос насчет лимитов может кто знает какие то?

Читать полностью…

Scrapy

про jmespath мне тоже интересно, но я хз, по-идее можно потестить. и сравнить напр. с clickhouse: https://colab.research.google.com/github/dcmoura/spyql/blob/master/notebooks/json_benchmark.ipynb

Читать полностью…

Scrapy

смотря как ты его готовишь и как твой парсер с lxml написан. Но в целом, на скрапи будет побыстрее из-за асинхронщины с коробки (хоть она и на твистеде, но тож неплохо). А как ты там lxml писал - мыж не знаем, толи ты мультитрединг юзал, толи aiohttp, толи тупо в лоб товары перебираешь и по pickle рассовываешь сначала...

Читать полностью…

Scrapy

Scrapy я не использую,я написал свой парсер с использованием библиотеки lxml для парсинга, сам написал для парсера функции сохранение состояния, запись данных в файл и прочее. Добавил асинхронность и обработку категорий пакетами. Но работает все очень медленно для такого количества данных, которые я забираю из сайта. Я уже оптимизировал как мог, и xpath запросы и очистку памяти принудительную.

Я зашел спросить у вас (те кто работает из scrapy) стоит ли мне попытаться использовать ее, чтобы хоть как-то ускорить процесс парсинга.

Читать полностью…

Scrapy

бери многопоточность, и пофиг что у нас гил, это все равно будет быстрее

Читать полностью…

Scrapy

но возможно дело не в этом

Читать полностью…

Scrapy

Вот мне нужно что-то побыстрее

Читать полностью…

Scrapy

звучит как есть аиохттп

Читать полностью…

Scrapy

Господа, добрый день.
Такой тупой вопрос, если мне нужно парсить очень много данных ( около 1000 категорий с товарами) то лучше scrapy ичего нет правильно?

Читать полностью…

Scrapy

@Lizzzavolkova732, пожалуйста, нажмите на кнопку ниже в течение указанного времени, иначе вы будете кикнуты. Спасибо! (60 сек)
При поддержке 1inch Network

Читать полностью…

Scrapy

Вопрос лишь в выгоде

Читать полностью…

Scrapy

просто селектор блока в котором реклама появляется отлавливай

Читать полностью…

Scrapy

Ну проверь сам, не знаю что тебе нужно

Читать полностью…

Scrapy

У них апишка вроде бы открытая и расписанная 🤔

Читать полностью…

Scrapy

Я вернулся из небытия

Читать полностью…

Scrapy

я сообщение удалил, решил пальцем в небо не тыкать, исходный код почитать и протестить)

Читать полностью…

Scrapy

нет, у нас принято спайдеры наследовать от базоваго спайдера со своими настройками

Читать полностью…
Subscribe to a channel