scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

сори за банальный вопрос, просто санити чек)

Читать полностью…

Scrapy

а точнее .bg-grey .page-title-2+ .text

Читать полностью…

Scrapy

это всё может упереться в то что это find(), а не нормальные селекторы, но опять же лол

Читать полностью…

Scrapy

а от него уже прыгать вниз (на соседа)

Читать полностью…

Scrapy

ну хочется быть уверенным
потому что если это блок "Причины" то лол

Читать полностью…

Scrapy

ты скриншот кинь или словами да

Читать полностью…

Scrapy

какой блок интересует?

Читать полностью…

Scrapy

обычно когда классы хитро-мудро названы, где-то рядом тупой json лежит, а еще конвертация из этой каши во "внутренние" названия. И чаще это не защита от ботов, а просто какая-нибудь околофронтендовая либа. А вообще - хочешь лучше совет, линкани в пастебине кусок html-я побольше, лучше даже тупо весь исходник (ну можешь повырезать там секреты)

Читать полностью…

Scrapy

Библиотека pyTelegramBotAPI. Возможно вопрос будет выглядеть, как не по теме данного чата, но я считаю что здесь я получу самый правильный ответ на этот вопрос . Как сделать цикл, который будет срабатывать каждые 5 минут, но при нажатии кнопки цикл должен остановиться ?

Читать полностью…

Scrapy

Try/except и залогируй документ, потом глянешь как надо было

Читать полностью…

Scrapy

Всё возможно в теории

Читать полностью…

Scrapy

я сделал так,но боюсь что если какой-то див на другой странице будет отсутствовать, полетит логика

Читать полностью…

Scrapy

только текстовым наполнением,они размещены в контейнере основного контента страницы по порядку, но в них абсолютно разный текст

Читать полностью…

Scrapy

да в том то и дело, что они только с разным текстовым наполнением и общие признаки у них одинаковые

Читать полностью…

Scrapy

в такой постановке вопроса - по номеру

Читать полностью…

Scrapy

правильно понимаю, что если в extension сохранить ссылку на crawler.stats, то при сигнале spider_closed все статы будут актуальны на момент закрытия паука, а не на момент вызова from_crawler?

Читать полностью…

Scrapy

да там даже такое сработает (что все-таки хуже чем прыгать от причин): .b-text-block-6+ .bg-grey .container

Читать полностью…

Scrapy

ну или идешь до конта, содержащего причины (но берешь весь container, и потом в нем берешь этот text)

Читать полностью…

Scrapy

тебе надо подвязываться "<h2 class="page-title-2">Причины</h2>"

Читать полностью…

Scrapy

simptom_reasons = simptom_page_bs4.find_all('div', class_='b-text-block-6__text text')[2].text а, я понял судя по

Читать полностью…

Scrapy

ну этот b-text-block-6__text - это обозначение куска текста бустрапом или чем-то таким, там их мильярд

Читать полностью…

Scrapy

https://www.smclinic.ru/simptomy/alkaloz/

Читать полностью…

Scrapy

1. пользовать что то вроде Celery
2. не бесить модера в выходной вопросами не по теме чата

Читать полностью…

Scrapy

ну зачем так сайты делать?)Антипарсерская защита какая-то

Читать полностью…

Scrapy

но вы же не можете сформулировать чем третий лучше второго, значит так тому и быть

Читать полностью…

Scrapy

но надеюсь такого не будет

Читать полностью…

Scrapy

simptom_reasons = simptom_page_bs4.find_all('div', class_='b-text-block-6__text text')[2].text

Читать полностью…

Scrapy

бгг, ну, если они ничем не отличаются - значит, они все три и нужны? а, если, не нужны все три, то, чем то они отличаются?

Читать полностью…

Scrapy

чем-то же вы для себя их отличаете

Читать полностью…

Scrapy

Есть 3 div с одинаковыми классами и абсолютно идентичной вложенностью как при использовании find грамотно выбирать только те div которые тебе нужны?

Читать полностью…
Subscribe to a channel