1045
Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
ну если обновить страницу то уже будут новые обьявления)
Читать полностью…
ну там трафик большой, каждую секунду +- в одной и той же категории уже новых 50 обьяв
Читать полностью…
ну ты же смотришь НОВЫЕ объявы только из того что я понял выше. С какой скоростью на сервисе генерятся новые объявы?
Читать полностью…
тут надо понимать специфику работы площадки и как она продвигает обьявления
Читать полностью…
смотри, мысленный эксперимент, если бы сервис был ОЧЕНЬ быстрым, и ты бы задал за минуту где-то 100500 запросов - то в ответах по 50 чанков были бы разные данные, или в целом дубликатов бы тебе навалило?
Читать полностью…
а "глубина" просмотра примерно какая, как ты отбриваешь дубликаты?
Читать полностью…
дубликаты не то, что юзеры дубликатом подают, а то что в json'e отдается
Читать полностью…
я не удивлюсь, если там условный пул из 5000 объяв и оно его крутит отдавая по 50 пока новые поступают
Читать полностью…
и тогда ты хошь расшибешься выше RPS сервиса не прыгнешь.
Читать полностью…
ну, так проверь это. может там в пределе допустим 500 объяв в минуту в среднем у сервиса.
Читать полностью…
а это надо тестить) я хз по идеи дубликаты могут быть ну или рано или поздно будут появляться
Читать полностью…
потому-что у тебя сервис задает скорость. или ты ее там по 5 минут обрабатываешь одну объяву?
Читать полностью…
в текущей конфигурации из того что ты описал зная то, что мы знаем, никак не ускорит.
Читать полностью…
и тут вопрос ускорит ли процес поиска нужных аккаунтов если я сделаю что-то типо кеширования
Читать полностью…