scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

ну или доставать по урлу и сравнивать, ок

Читать полностью…

Scrapy

изменилось какое-либо поле айтема

Читать полностью…

Scrapy

Ну тёска походу не понимает как она работает

Читать полностью…

Scrapy

бд в вопросе уже есть

Читать полностью…

Scrapy

ошибаетесь, ну либо несите ссылку на этот механизм

Читать полностью…

Scrapy

DM me if you need a webscraper

Читать полностью…

Scrapy

хех, стоит "вежливо" попросить, так сразу, хоть что то получается написать.
ну, насчет выполнения тестовых - это сугубо личные проблемы индивидуумов.
я спать - надо будет кого побанить, пингую

в скрапиджоб не выпинываю. Булат как то писал, что согласен, что бы тут постили....

Читать полностью…

Scrapy

так 100 тестовых заданий дашь, потом глядишь - половина система написана уже по ТЗ)))))

Читать полностью…

Scrapy

А что рассказывать? ТЗ в лс кидаю

Читать полностью…

Scrapy

либо рассказываем, кратко, о чем речь. Либо - медленно идем в бан.

Читать полностью…

Scrapy

надо выбрать каждый элемент по очереди

Читать полностью…

Scrapy

Ну или не знаю как делать чтобы защита не сработала

Читать полностью…

Scrapy

вы правы) дело в них

а есть методики решения таких... проблем?

Читать полностью…

Scrapy

возможно дело в том что на нерусских айпи защита очень чуткая

Читать полностью…

Scrapy

за границей такое всегда, с впн не пробовал

Читать полностью…

Scrapy

рекомендую считать хэш и делать по нему апсёрт, вы ж не хотите всю бд каждый раз сравнивать

Читать полностью…

Scrapy

смотря что такое поменялась и equal

Читать полностью…

Scrapy

А как это лучше реализовать? В piplines написать какую-нибудь функцию records_are_equal, например и если они отличаются записывать?

Читать полностью…

Scrapy

ну вот в том то и дело, что я не могу его найти и решил спросить тут есть ли он?)

Читать полностью…

Scrapy

Всем привет! Я пишу скрепер, который должен работать в бесконечном цикле и проверять одни и те же статьи. Мне нужно сделать так: если статья поменялась создается новая строка в бд, старая не меняется. Если статья не изменилась скрепер просто пропускает ее.

Я где-то слышал, что у scrapy есть встроенный механизм для такого сценария? или я ошибаюсь и придется придумывать что-то свое?

Hello everyone! I'm writing a scraper that needs to run in an infinite loop and check the same articles repeatedly. Here's what I want to achieve: if an article has changed, a new row should be created in the database, while the old one remains unchanged. If the article hasn't changed, the scraper should simply skip it.

I've heard that Scrapy has a built-in mechanism for this kind of scenario. Is that true, or will I need to implement something custom?

Any advice would be appreciated.

Читать полностью…

Scrapy

ну щас рынок нанимателя, они могут по-идее чо угодно придумывать и нормально будет)

Читать полностью…

Scrapy

Делать парсеры на python, парсить разные сайты от яндекса до мелких и записывать в csv файлы

Читать полностью…

Scrapy

осталось 3 минуты...
потом, к овнеру за разбаном

Читать полностью…

Scrapy

5 мин я раздумья. время пошло

Читать полностью…

Scrapy

Здравствуйте! Предлагаю работу на постоянную основу. Если хотите быть в нашей команде вам нужно выполнить легкое тестовое задание на парсинг с python(undetected-chromedriver). Телеграм: /channel/assistant_yours

Читать полностью…

Scrapy

Привет, кто знает как называется такая капча? Хочу попробовать её решать с помощью rucaptcha

Читать полностью…

Scrapy

Использовать русские айпи

Читать полностью…

Scrapy

окей, я щас попробую тогда изначально включить куки и попробовать пройти проверку, если при следующих запусках не будет, то в принципе вопрос сам собой решится (лишние куки проще вычистить)

осталось понять как сделать так что б капча не появлялась в моменте работы... ротация прокси?🤔

Читать полностью…

Scrapy

да собственно в том, что мне капчу не показывает на личном браузере, но с пв детектит. вот и думаю в чем тут мб дело - то ли куки, то ли опции какие-нибудь

Читать полностью…

Scrapy

ммм, да, с впн сижу
но на своем браузере такого не было🤔

Читать полностью…
Subscribe to a channel