scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

всем привет! оффтоп

кто пользуется тайп хинтами, пробовали компиляцию через mypyc?
если кто-то из разработчиков scrapy пробовал какую часть скомпилировать, то как прошел эксперимент? что не понравилось? просто интересно

сам этим занимался когда надо было отдельно обрабатывать поля в пришедших данных, которые имеют тип data/datetime
самым удобным решением оказалось пробегать по всем полям и узнавать их класс, если он один из нужных, то чето с ним делать
из интереса закомпилировав эту функцию с mypyc, данные стали обрабатываться на 30% быстрее, а от меня требовалось просто добавить пару строчек в pyproject.toml. бесплатный буст считай

Читать полностью…

Scrapy

Do you have a solution to bypass Cloudflare

Читать полностью…

Scrapy

о, спасибо! значит осталось соответствие установить элемента с json-ом. это будет намного более стабильнее чем сейчас

Читать полностью…

Scrapy

"такая байда" - это что ? Тип корпуса вилки в розетку ? )))

Читать полностью…

Scrapy

#вакансия
Всем привет!
Ищу мастера парсинга в свой проект.
Мы парсим iherb, goat, amazon, asos, macys, stockx, finishline, newbalance, michaelkors, coachoutlet, zappos и еще около 30 источников.
Мне нужно закрыть 2 направления:
1) парсинг нового контента с этих сайтов (достаточно выгрузки в CSV)
2) поддержка профилей (на PHP или Python) парсинга цен и наличия остатков
Пишите в ЛС @Abrokot , обсудим подробнее.

Читать полностью…

Scrapy

теперь уже и "наличие пайтона"? вам бы в концепциях разобраться

Читать полностью…

Scrapy

Тогда как проверить наличие пайтона, мб "правильно установить"?

Читать полностью…

Scrapy

Создай virtual environment и там работай

Читать полностью…

Scrapy

ребята привет. помогите с чем траблы могут быть? сори если не по теме

Читать полностью…

Scrapy

Всем добрый вечер!
Посоветуйте платформу с готовым парсером яндекс вордстат, который можно связать со своим кодом по API

Основная задача:
- В боте ТГ нажимаю кнопку
- из google sheets берутся данные (категории + товары)
- происходит автоматический парсинг по категориям в яндекс вордстат
- выявляются лучшие категории с наибольшим спросом
- по ТОП 5 категориям происходит парсинг товаров
- из 100 товаров выявляются ТОП 10 товаров которые пользуются спросом
- все это заносится в google sheets

Читать полностью…

Scrapy

Что-то у нас бот начал спам пропускать

Читать полностью…

Scrapy

я писал про то, что, если нужно качество - надо платить. Чем выше качество требуется, тем больше приходится платить.

Читать полностью…

Scrapy

Для меня дороговата оказывается

Я много бесплатных нашел но почему-то не подключается

А vpn поможет? Вроде они дешевле

Читать полностью…

Scrapy

Мне пока не нужны прокси. Я новостные сайты парсю. Там не так уже нужны

Читать полностью…

Scrapy

Просто расписание чуть не стабильно

Читать полностью…

Scrapy

you can try zyte proxies

Читать полностью…

Scrapy

one more off-topic message and you'll get banned

Читать полностью…

Scrapy

В вёрстке есть json в котором лежит много инфы, в том числе и цены

Читать полностью…

Scrapy

подскажите пожалуйста кто работал с озоном - как такую байду находить? внутри элемента искать по знаку рубля?

Читать полностью…

Scrapy

всё как и в прошлый раз

Читать полностью…

Scrapy

Амазон app сторе кто-то может взять на парсинг?

Читать полностью…

Scrapy

Укажи правильный path

Читать полностью…

Scrapy

Установи библиотеки и python
Так же extensions

Читать полностью…

Scrapy

По-идее, https://yandex.ru/dev/direct/doc/dg-v4/ru/reference/CreateNewWordstatReport.html

Там ограничение 1000 фраз в сутки. Если какому-нибудь ЧАТГПТ распишете задачу, разбивая на подзадачки, он вам требуемый функционал напишет, за исключением парсинга товаров, не очень понятно где, ну допустим вы какой-то магаз что полегче парсить возмете, но как из них топ10 выделить со спросом - это уже магия для меня, есть платформы, которые а-ля движение свободного остатка пишут и позволяют его получать? Вот тут я хз, есть ли такие сервисы. Наверное, какой-нить wildberries или ozon сам такое должен отдавать, чтоб конкурентная ниша заполнялась. И требования там довольно большие: https://seller-edu.ozon.ru/analytics-and-metrics/analytics-for-premium/competitive-position
Но как я понял, вы примерно такой сервис и пишете, тока немного в обход...

И ещё там какие-то баллы запроса у Яндекса и по переходу 404 ошибка, мде.

Читать полностью…

Scrapy

Is there a LinkedIn account that can be obtained from logs? Please contact me.

Читать полностью…

Scrapy

Всем привет 👋🏼

1️⃣Ищем опытного разработчика на позицию тимлида.
энтузиастов!

Стек: React, Next, Node.js API, UI kit (Mantline или подобные).

Нам подходят новички и профи:

2️⃣Ищем опытного
«Фронта»

энтузиастов!

Стэк:
- Опыт разработки на
React, Next.js, знание стиливых либ по типу Mantine, HTML/CSS
- Знание современных фреймворков и библиотек
- Способность к быстрому обучению и решению нестандартных задач

Нам подходят новички и профи:

Будем рады познакомиться с вами и обсудить детали сотрудничества!🤝

Читать полностью…

Scrapy

Бесплатные и не должны работать

Читать полностью…

Scrapy

ну, к примеру, fineproxy, proxy6 - второй с IPv6 работает, если сайт держит, вааще супер.
проксятники мониторить и пробовать надо. Большинство дают либо тестовый период, либо тестовые покси.

а насчет стоимости - так это, больше, вопрос производительности и "засратости" проксей. Если тебе нужна большая производительность, придется платить. И, если прокся дешовая, ее пользуют все кто не лень...

Читать полностью…

Scrapy

А есть прокси подешевле?

Читать полностью…

Scrapy

У них расписание есть, один раз получаю это и ближе к этому времени начну проверять, думаю так сильно сократиться
А так я просто весь день проверяю каждую 4минуты

Читать полностью…
Subscribe to a channel