1045
Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
не зависит там странно от даты (а то бывают акселераты и такие...)
Читать полностью…
дубликаты не то, что юзеры дубликатом подают, а то что в json'e отдается
Читать полностью…
я не удивлюсь, если там условный пул из 5000 объяв и оно его крутит отдавая по 50 пока новые поступают
Читать полностью…
и тогда ты хошь расшибешься выше RPS сервиса не прыгнешь.
Читать полностью…
ну, так проверь это. может там в пределе допустим 500 объяв в минуту в среднем у сервиса.
Читать полностью…
а это надо тестить) я хз по идеи дубликаты могут быть ну или рано или поздно будут появляться
Читать полностью…
потому-что у тебя сервис задает скорость. или ты ее там по 5 минут обрабатываешь одну объяву?
Читать полностью…
в текущей конфигурации из того что ты описал зная то, что мы знаем, никак не ускорит.
Читать полностью…
ну если обновить страницу то уже будут новые обьявления)
Читать полностью…
ну там трафик большой, каждую секунду +- в одной и той же категории уже новых 50 обьяв
Читать полностью…
ну ты же смотришь НОВЫЕ объявы только из того что я понял выше. С какой скоростью на сервисе генерятся новые объявы?
Читать полностью…
тут надо понимать специфику работы площадки и как она продвигает обьявления
Читать полностью…
смотри, мысленный эксперимент, если бы сервис был ОЧЕНЬ быстрым, и ты бы задал за минуту где-то 100500 запросов - то в ответах по 50 чанков были бы разные данные, или в целом дубликатов бы тебе навалило?
Читать полностью…