scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

тут первый ответ:
https://stackoverflow.com/questions/78753057/python-scrapy-get-all-urls-in-the-webpage-without-duplicate-urls

Читать полностью…

Scrapy

эээ, вообще то , это на уровне ядра а не на уровне паука....
если не игнорит - значит чем то они отличаются

Читать полностью…

Scrapy

🙄🤣☺️😁😚🤣☺️👍
Haбиpaю людeй жeлaющиx пoлyчaть дoxoд нa CRYPTO. 🪙

Пo вpeмeни зaнятocть дo 2 чacoв в дeнь.
Мoжнo paбoтaть кaк c тeлeфoнa тaк и c пк.
Haпpaвлeниe: ТECТHEТ, APБИТPAЖ. 💼
Oбyчaeм нoвичкoв 🇧🇾🇦🇲🇷🇺
Paбoтaeм на oфициaльныx биpжax: Bitget, Bybit, OKX, Mexc.

Чтoбы yзнaть пoдpoбнee пишитe нa aккayнт:
@Alexander4137

Читать полностью…

Scrapy

по урлу, но с самым большим номером записи видимо, или как вы там будете различать записи разных версий одной страницы

Читать полностью…

Scrapy

ну или доставать по урлу и сравнивать, ок

Читать полностью…

Scrapy

изменилось какое-либо поле айтема

Читать полностью…

Scrapy

Ну тёска походу не понимает как она работает

Читать полностью…

Scrapy

бд в вопросе уже есть

Читать полностью…

Scrapy

ошибаетесь, ну либо несите ссылку на этот механизм

Читать полностью…

Scrapy

DM me if you need a webscraper

Читать полностью…

Scrapy

хех, стоит "вежливо" попросить, так сразу, хоть что то получается написать.
ну, насчет выполнения тестовых - это сугубо личные проблемы индивидуумов.
я спать - надо будет кого побанить, пингую

в скрапиджоб не выпинываю. Булат как то писал, что согласен, что бы тут постили....

Читать полностью…

Scrapy

так 100 тестовых заданий дашь, потом глядишь - половина система написана уже по ТЗ)))))

Читать полностью…

Scrapy

А что рассказывать? ТЗ в лс кидаю

Читать полностью…

Scrapy

либо рассказываем, кратко, о чем речь. Либо - медленно идем в бан.

Читать полностью…

Scrapy

надо выбрать каждый элемент по очереди

Читать полностью…

Scrapy

видел вариант где создают сет прйденных и в parse_item проверяют есть ли юрл в них... Но это вариант так себе - т.к. всё равно же запрос идёт, хоть и данные не тянем...

Читать полностью…

Scrapy

Привет, а как филтровать уже пройденные ссылки в CrawlSpider ? Если использовать обычный Спайдер, то он сам их игнорит, а так - нет

class FollowAllSpider(CrawlSpider):
name = 'xozyayushka_list'
DOWNLOAD_DELAY = 0
start_urls = ['https://xozyayushka.az/']
allowed_domains = ['xozyayushka.az']
rules = [Rule(LinkExtractor(), callback='parse_item', follow=True)]
...

Читать полностью…

Scrapy

Спасибо, получилось)

Читать полностью…

Scrapy

Не русский он получается конкретно

Читать полностью…

Scrapy

рекомендую считать хэш и делать по нему апсёрт, вы ж не хотите всю бд каждый раз сравнивать

Читать полностью…

Scrapy

смотря что такое поменялась и equal

Читать полностью…

Scrapy

А как это лучше реализовать? В piplines написать какую-нибудь функцию records_are_equal, например и если они отличаются записывать?

Читать полностью…

Scrapy

ну вот в том то и дело, что я не могу его найти и решил спросить тут есть ли он?)

Читать полностью…

Scrapy

Всем привет! Я пишу скрепер, который должен работать в бесконечном цикле и проверять одни и те же статьи. Мне нужно сделать так: если статья поменялась создается новая строка в бд, старая не меняется. Если статья не изменилась скрепер просто пропускает ее.

Я где-то слышал, что у scrapy есть встроенный механизм для такого сценария? или я ошибаюсь и придется придумывать что-то свое?

Hello everyone! I'm writing a scraper that needs to run in an infinite loop and check the same articles repeatedly. Here's what I want to achieve: if an article has changed, a new row should be created in the database, while the old one remains unchanged. If the article hasn't changed, the scraper should simply skip it.

I've heard that Scrapy has a built-in mechanism for this kind of scenario. Is that true, or will I need to implement something custom?

Any advice would be appreciated.

Читать полностью…

Scrapy

ну щас рынок нанимателя, они могут по-идее чо угодно придумывать и нормально будет)

Читать полностью…

Scrapy

Делать парсеры на python, парсить разные сайты от яндекса до мелких и записывать в csv файлы

Читать полностью…

Scrapy

осталось 3 минуты...
потом, к овнеру за разбаном

Читать полностью…

Scrapy

5 мин я раздумья. время пошло

Читать полностью…

Scrapy

Здравствуйте! Предлагаю работу на постоянную основу. Если хотите быть в нашей команде вам нужно выполнить легкое тестовое задание на парсинг с python(undetected-chromedriver). Телеграм: /channel/assistant_yours

Читать полностью…

Scrapy

Привет, кто знает как называется такая капча? Хочу попробовать её решать с помощью rucaptcha

Читать полностью…
Subscribe to a channel