scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

ну условно так, и по кругу ходит

Читать полностью…

Scrapy

а ты на скрапи пишешь? или свою реализацию с асинкио?

Читать полностью…

Scrapy

на стековере же в приведенном ответе пишут, что мол надо use asyncio.Queue for the communication between producers and consumers
ну или может pool какой, хз

Читать полностью…

Scrapy

есть вариант конечно запускать в два потока, чтобы в одном обновлялись и записывались в файл куки, а в другом паук их собирал и делал свое дело)

Читать полностью…

Scrapy

а, ну в макоси все проще)

Читать полностью…

Scrapy

привет) спасибо большое, что написал, буду знать впредь) а так, у меня есть MacOS, так что тут уже в другом проблема, спасибо)

Читать полностью…

Scrapy

можно запускать под виндой из-под wsl2 или докера (с линуксовым образом об ту же wsl2), лучше, чтобы все файлы были "унутре" конта (т.е. при создании конта монтируешь всю папку внутрь), иначе скорость будет херовая, если будут связи с виндовой подмонтированной папкой. (возможно, в винде 11 на новой файловой системе они это сделали лучше, но это неточно).

Читать полностью…

Scrapy

В гугле тонна информации по этому вопросу

Читать полностью…

Scrapy

да я пробовал уже, тоже самое

Читать полностью…

Scrapy

инсталляция lxml битая

Читать полностью…

Scrapy

Драсть, подскажите что делать? Последние версии стоят👀

Читать полностью…

Scrapy

не понятно ничего((((

Читать полностью…

Scrapy

у вас нет asynccontextmanager

Читать полностью…

Scrapy

https://bugs.python.org/issue45996

Читать полностью…

Scrapy

уже весь инет перекопал, ничего нет по этому поводу... вроде как есть вопрос, но он открыт до сих пор на форумах..

Читать полностью…

Scrapy

просто в мидлварях хочу для каждого запроса куки менять

Читать полностью…

Scrapy

ну мне надо внимательнее почитать статью) может быть придумаю что-то, а так просто каждые 400 запросов заново инициализировать браузер и прочее ну сам понимаешь, такое себе. тем более, что еще и задержка в 5 сек стоит, а запросов может быть около 100к, вот и расходуется время просто так

Читать полностью…

Scrapy

не, там писали что их так юзать нельзя)

Читать полностью…

Scrapy

да тут в асинхронных генераторах проблема, выше писали что не фиксится это, так что пофиг)

Читать полностью…

Scrapy

если надо без headless, то https://github.com/scrapy-plugins/scrapy-playwright/issues/78

Читать полностью…

Scrapy

подробней читай тут: https://github.com/scrapy-plugins/scrapy-playwright/issues/7#issuecomment-817394494

Читать полностью…

Scrapy

хм, хотел посоветовать wheels, обнаружил прискорбный факт, что сайт Gohlke wheels помер
https://www.reddit.com/r/Python/comments/vcaibq/christoph_gohlkes_windows_wheels_site_is_shutting/

Читать полностью…

Scrapy

придётся тогда самому выяснять что с ней не так

Читать полностью…

Scrapy

предлагаю переустановить

Читать полностью…

Scrapy

не видя ошибки можем только сказать то же самое

Читать полностью…

Scrapy

если не получается понять что там написано, то да, использовать асинхронный генератор не получится

Читать полностью…

Scrapy

а говорите ничего нет

Читать полностью…

Scrapy

и даже https://stackoverflow.com/questions/72204244/python-asynchronous-generator-is-already-running не нашли?

Читать полностью…

Scrapy

вы на русском ищете что ли?

Читать полностью…

Scrapy

вот что я получаю по кд

Читать полностью…
Subscribe to a channel