scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

burp suite, charles proxy, mitm proxy для питона

Читать полностью…

Scrapy

всем привет, подскажите софт каким можно запросы отснифать, в инспекторе не видны )

Читать полностью…

Scrapy

я чето кстати заметил что parsel в разы быстрее bs4, даже с lxml + cchardet

Читать полностью…

Scrapy

вроде даже на цсс можно написать

Читать полностью…

Scrapy

серьёзно? любой парсер с XPath

Читать полностью…

Scrapy

но тогда да, все куки придётся прописывать явно

Читать полностью…

Scrapy

тогда по сути надо игнор кук от сервера

Читать полностью…

Scrapy

А месячная прибыль -200% ?

Читать полностью…

Scrapy

akamai ставит свои куки и я ухожу в бесконечный редирект вот

Читать полностью…

Scrapy

Возможно вручную прописанные в банку не кладутся, я не помню какое поведение текущее

Читать полностью…

Scrapy

чето так не выходит, попадаю в бесконечный редирект

Читать полностью…

Scrapy

а можно как нибудь как дефолтные хедеры, выставить дефолтные куки? я пока так делаю

RequestWithCookies = partial(
FormRequest,
method='GET',
cookies={ },
)

Читать полностью…

Scrapy

перенаправьте stdout

Читать полностью…

Scrapy

только сейчас понял что это не хттп код, а вендовый эррно, и соответственно ничего они не возвращают и не присылают

Читать полностью…

Scrapy

а, кстати да, если не смог подключиться, о каком ответе идёт речь)

Читать полностью…

Scrapy

он платный вроде, не ?

Читать полностью…

Scrapy

ну так парсел клёвый

Читать полностью…

Scrapy

https://www.w3schools.com/cssref/css_selectors.php#:~:text=a%20%3Cdiv%3E%20element-,element%2Belement,-div%20%2B%20p

Читать полностью…

Scrapy

ось following-sibling

Читать полностью…

Scrapy

Существует ли какой-нибудь парсер HTML с логикой, подобной look-behind в регулярных выражениях: чтобы можно было найти некий элемент, следующий за определённым другим элементом?

Читать полностью…

Scrapy

это тоже можно сделать, через dont_merge_cookies

Читать полностью…

Scrapy

вручную выставленеые куки хранятся в банке и отправляются, да,
но куки которые присылает акамаи сохраняются и отправляются тоже

он по ним понимает, что присылает их не человек, и чтоб остановить парсинг, все реквесты с такими куками шлет в редирект

а вот если я каждый раз буду слать реквесты только с нужными мне куками, без тех которые еще пришли от сервера, все реквесты будут проходить

я больно глубоко не углублялся, сделал выводы один раз просмотрев дебаг

наверное, по хорошему, надо поднять настоящий браузер, открыть там страницу, сэмулировать человеческое поведение, стырить оттуда куки и слать их

Читать полностью…

Scrapy

ну это ничего не объясняет

Читать полностью…

Scrapy

Тем более читайте тогда

Читать полностью…

Scrapy

Читайте COOKIES_DEBUG
Смысл-то в том, что если мы один раз куку отправили, она так и останется в банке

Читать полностью…

Scrapy

А зачем? Одного раза должно быть достаточно

Читать полностью…

Scrapy

scrapy fetch "url" > file.txt ?

Читать полностью…

Scrapy

а можно ли как-нибудь чтоб scrapy fetch сохранял вывод в файл?

Читать полностью…

Scrapy

вообще, да, если прилетело process_exception - то уже "ой, все, у меня лапки".

Читать полностью…

Scrapy

а чего там смотреть... там же, вроде, низкий уровень ошибки, так что и ответа никакого не будет...

Читать полностью…
Subscribe to a channel