scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

о, спасибо! значит осталось соответствие установить элемента с json-ом. это будет намного более стабильнее чем сейчас

Читать полностью…

Scrapy

"такая байда" - это что ? Тип корпуса вилки в розетку ? )))

Читать полностью…

Scrapy

#вакансия
Всем привет!
Ищу мастера парсинга в свой проект.
Мы парсим iherb, goat, amazon, asos, macys, stockx, finishline, newbalance, michaelkors, coachoutlet, zappos и еще около 30 источников.
Мне нужно закрыть 2 направления:
1) парсинг нового контента с этих сайтов (достаточно выгрузки в CSV)
2) поддержка профилей (на PHP или Python) парсинга цен и наличия остатков
Пишите в ЛС @Abrokot , обсудим подробнее.

Читать полностью…

Scrapy

теперь уже и "наличие пайтона"? вам бы в концепциях разобраться

Читать полностью…

Scrapy

Тогда как проверить наличие пайтона, мб "правильно установить"?

Читать полностью…

Scrapy

Создай virtual environment и там работай

Читать полностью…

Scrapy

ребята привет. помогите с чем траблы могут быть? сори если не по теме

Читать полностью…

Scrapy

Всем добрый вечер!
Посоветуйте платформу с готовым парсером яндекс вордстат, который можно связать со своим кодом по API

Основная задача:
- В боте ТГ нажимаю кнопку
- из google sheets берутся данные (категории + товары)
- происходит автоматический парсинг по категориям в яндекс вордстат
- выявляются лучшие категории с наибольшим спросом
- по ТОП 5 категориям происходит парсинг товаров
- из 100 товаров выявляются ТОП 10 товаров которые пользуются спросом
- все это заносится в google sheets

Читать полностью…

Scrapy

Что-то у нас бот начал спам пропускать

Читать полностью…

Scrapy

я писал про то, что, если нужно качество - надо платить. Чем выше качество требуется, тем больше приходится платить.

Читать полностью…

Scrapy

Для меня дороговата оказывается

Я много бесплатных нашел но почему-то не подключается

А vpn поможет? Вроде они дешевле

Читать полностью…

Scrapy

Мне пока не нужны прокси. Я новостные сайты парсю. Там не так уже нужны

Читать полностью…

Scrapy

Просто расписание чуть не стабильно

Читать полностью…

Scrapy

По ищи в интернете и чат гпт. Все из за очень частых запросов. Возможно потребуется прокси, а может есть другие способы. Я просто каждый час запросы отправляю так что у меня обычный селениум справился

Читать полностью…

Scrapy

Если не ошибаюсь cloudscraper не дает полностью обойти защиту. Особенно если ты собираешься делать часто запросы. Все из за того что делаешь очень часто запросы, вот тебя и блочат.

Читать полностью…

Scrapy

В вёрстке есть json в котором лежит много инфы, в том числе и цены

Читать полностью…

Scrapy

подскажите пожалуйста кто работал с озоном - как такую байду находить? внутри элемента искать по знаку рубля?

Читать полностью…

Scrapy

всё как и в прошлый раз

Читать полностью…

Scrapy

Амазон app сторе кто-то может взять на парсинг?

Читать полностью…

Scrapy

Укажи правильный path

Читать полностью…

Scrapy

Установи библиотеки и python
Так же extensions

Читать полностью…

Scrapy

По-идее, https://yandex.ru/dev/direct/doc/dg-v4/ru/reference/CreateNewWordstatReport.html

Там ограничение 1000 фраз в сутки. Если какому-нибудь ЧАТГПТ распишете задачу, разбивая на подзадачки, он вам требуемый функционал напишет, за исключением парсинга товаров, не очень понятно где, ну допустим вы какой-то магаз что полегче парсить возмете, но как из них топ10 выделить со спросом - это уже магия для меня, есть платформы, которые а-ля движение свободного остатка пишут и позволяют его получать? Вот тут я хз, есть ли такие сервисы. Наверное, какой-нить wildberries или ozon сам такое должен отдавать, чтоб конкурентная ниша заполнялась. И требования там довольно большие: https://seller-edu.ozon.ru/analytics-and-metrics/analytics-for-premium/competitive-position
Но как я понял, вы примерно такой сервис и пишете, тока немного в обход...

И ещё там какие-то баллы запроса у Яндекса и по переходу 404 ошибка, мде.

Читать полностью…

Scrapy

Is there a LinkedIn account that can be obtained from logs? Please contact me.

Читать полностью…

Scrapy

Всем привет 👋🏼

1️⃣Ищем опытного разработчика на позицию тимлида.
энтузиастов!

Стек: React, Next, Node.js API, UI kit (Mantline или подобные).

Нам подходят новички и профи:

2️⃣Ищем опытного
«Фронта»

энтузиастов!

Стэк:
- Опыт разработки на
React, Next.js, знание стиливых либ по типу Mantine, HTML/CSS
- Знание современных фреймворков и библиотек
- Способность к быстрому обучению и решению нестандартных задач

Нам подходят новички и профи:

Будем рады познакомиться с вами и обсудить детали сотрудничества!🤝

Читать полностью…

Scrapy

Бесплатные и не должны работать

Читать полностью…

Scrapy

ну, к примеру, fineproxy, proxy6 - второй с IPv6 работает, если сайт держит, вааще супер.
проксятники мониторить и пробовать надо. Большинство дают либо тестовый период, либо тестовые покси.

а насчет стоимости - так это, больше, вопрос производительности и "засратости" проксей. Если тебе нужна большая производительность, придется платить. И, если прокся дешовая, ее пользуют все кто не лень...

Читать полностью…

Scrapy

А есть прокси подешевле?

Читать полностью…

Scrapy

У них расписание есть, один раз получаю это и ближе к этому времени начну проверять, думаю так сильно сократиться
А так я просто весь день проверяю каждую 4минуты

Читать полностью…

Scrapy

Каждые четыре минуты, проверяю новых серий

Читать полностью…

Scrapy

Народ использую сервер firstbyte
Есть бот который загружает с сайта анистар аниме

Cloudscraper использовал чтобы обойти клоудфларе но на днях клоудфларе стал блокировать, раньше с селениум также было работал месяц и потом блокировался

Сегодня просто запустил бота смотрю все работает

Это из-за чего?

Читать полностью…
Subscribe to a channel