Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
озон пускает без авторизации. Правда json мусорные. https://api.ozon.ru?url=/products/{article}
Читать полностью…у тиктока есть api, и куча оберток, и есть кажись обертка об playwright, котора может выгрузить судя по примеру трендовые видосики: https://github.com/davidteather/TikTok-Api
(сам я не проверял, но вангую оно живое и работает, судя по коду и issues).
Не понял, обьясните в смысле заменить? И что за парсель? 🤨
Читать полностью…Добрый день 💃
Подскажите, парсю tiktok через selenium и beautiful soup, хочу достать трендовые видео:
from selenium import webdriver
from bs4 import BeautifulSoup
import time
driver = webdriver.Chrome()
driver.get("https://www.tiktok.com/discover/location-trends?lang=en")
time.sleep(1)
soup = BeautifulSoup(driver.page_source, 'html.parser')
videos = soup.find_all('div', {'class': ' css-at0k0c-DivWrapper e1cg0wnj1'})
print(len(videos))
for video in videos:
print(video.a['href'])
'class': ' css-at0k0c-DivWrapper e1cg0wnj1'
С данными либами что андей написал при реквесте 403 status code, нужна полная имитация браузера и чтобы джс на фоне выполнялся для получения лицензии или вылезет капча
Читать полностью…выше Андрей написал. Ну и, в догонку - для начала надо убедиться на 100%, что реквестами нельзя победить...
Читать полностью…все не так
1.тормозной
2. глюкавый
3. память жрет как не в себя....
не, я, так то, понимаю, что, иногда - без него совсем никак, но, это совсем уж редкие случаи
Подскажите как скрыть от сайта режим --headless , для хромдрайвера, подсовывает капчу, имитацию клика сделал через экшн но не проходит проверка
Читать полностью…кто selenium использует, подскажите что делать если в class есть пробелы
cke_wysiwyg_div cke_reset cke_enable_context_menu cke_editable cke_editable_themed cke_contents_ltr. Селениум такие классы найти не может Читать полностью…
Ищу партнеров в команду для получения доп.дoxoда
Удаленно, с телефона, или компьютера
За деталями пишите в ЛС
А что порекомендуете на замену? Чтоб также можно было куки для логина использовать
Читать полностью…Каждый раз когда вы про селениуем пишете я ощущаю тоже самое, как про BS вопросики тут.
Читать полностью…да, было в настройках HTTPCACHE_ENABLED = True,
выключил, начал скачивать
а, нашёл, оно специально пишет cached когда HttpCacheMiddleware его закешировал, т.е. как я сразу и подумал
Читать полностью…