Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
на стековере же в приведенном ответе пишут, что мол надо use asyncio.Queue for the communication between producers and consumers
ну или может pool какой, хз
есть вариант конечно запускать в два потока, чтобы в одном обновлялись и записывались в файл куки, а в другом паук их собирал и делал свое дело)
Читать полностью…привет) спасибо большое, что написал, буду знать впредь) а так, у меня есть MacOS, так что тут уже в другом проблема, спасибо)
Читать полностью…можно запускать под виндой из-под wsl2 или докера (с линуксовым образом об ту же wsl2), лучше, чтобы все файлы были "унутре" конта (т.е. при создании конта монтируешь всю папку внутрь), иначе скорость будет херовая, если будут связи с виндовой подмонтированной папкой. (возможно, в винде 11 на новой файловой системе они это сделали лучше, но это неточно).
Читать полностью…уже весь инет перекопал, ничего нет по этому поводу... вроде как есть вопрос, но он открыт до сих пор на форумах..
Читать полностью…ну мне надо внимательнее почитать статью) может быть придумаю что-то, а так просто каждые 400 запросов заново инициализировать браузер и прочее ну сам понимаешь, такое себе. тем более, что еще и задержка в 5 сек стоит, а запросов может быть около 100к, вот и расходуется время просто так
Читать полностью…да тут в асинхронных генераторах проблема, выше писали что не фиксится это, так что пофиг)
Читать полностью…если надо без headless, то https://github.com/scrapy-plugins/scrapy-playwright/issues/78
Читать полностью…подробней читай тут: https://github.com/scrapy-plugins/scrapy-playwright/issues/7#issuecomment-817394494
Читать полностью…хм, хотел посоветовать wheels, обнаружил прискорбный факт, что сайт Gohlke wheels помер
https://www.reddit.com/r/Python/comments/vcaibq/christoph_gohlkes_windows_wheels_site_is_shutting/
если не получается понять что там написано, то да, использовать асинхронный генератор не получится
Читать полностью…и даже https://stackoverflow.com/questions/72204244/python-asynchronous-generator-is-already-running не нашли?
Читать полностью…