1045
Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
Тоже кстати такие же мысли посещали. Ну они наверно всех посещают.
Читать полностью…
def process_spider_exception(self, response, exception, spider):
return [Test1Item(name='error')]
хотя такое работает
process_spider_exception модифицировать надо, я так понимаю
хочу выводить в оутпут { "error": "что-то" }, если происходит любая ошибка (http либо внутри обработки запроса)
Читать полностью…
чатжпт предложил перенаправлять с signals.spider_error на мой обработчик
Читать полностью…
Мне казалось что был тест, но я его не вижу, значит не должно работать
Читать полностью…
первый запрос проходит всегда, но дальнейшие нет
решил проблему, использую прокси
здравствуйте, нужно обойти Cloudflare при скрепинге, есть идеи как?
использую playwright
Обидно конечно за чат, раньше был мегаактивным, а сейчас стих
Читать полностью…
я словарь пробовал, и с ним не работало, именно с итемом работает
Читать полностью…
ерунда короче какая-то выходит, я на сигнал могу попасть, но из него не получается менять оутпут
Читать полностью…
Возможно есть открытый баг, у нас их много про еррбэки от одного пользователя
Читать полностью…
class MySpider(scrapy.Spider):Читать полностью…
name = "myspider"
allowed_domains = ["somewebsite.com"]
def start_requests(self):
yield scrapy.Request(
url,
callback=self.parse,
errback=self.errback,
dont_filter=True,
)
def errback(self, failure: Failure):
logging.error('Error happened')
logging.error(failure.getTraceback())
yield {"error": str(failure.value)}
def parse(self, response):
1 / 0