scrapy_python | Unsorted

Telegram-канал scrapy_python - Scrapy

1045

Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs

Subscribe to a channel

Scrapy

Нужен просто html. Есть парсер новостных сайтов, все парсит нормально. Все работает отлично вот нужны заблченные сайт теперь

Читать полностью…

Scrapy

Народ как вы обходите клаудфаер. Я вот пробую через camoufox. Тяжелая какая то. Как будто не стабильная. Делаю что то типа аналога у скрапи сплэш но на плейрайте через фаст апи

Читать полностью…

Scrapy

На странице это выглядит так: блок с картинкой и заголовком, а в нём таблица с конкретными товарами.
И в каждый товар нужно добавить эту картинку, а название сконкатенировать с заголовком блока

Читать полностью…

Scrapy

ну, пока шутка) но третья версия скрапи имхо гораздо реальнее чем четвертая у питона и первая у фастапи)

Читать полностью…

Scrapy

2.15.0 вышел: https://docs.scrapy.org/en/latest/news.html#scrapy-2-15-0-2026-04-09
Highlights:
* Experimental support for running without a Twisted reactor
* Experimental httpx-based download handler

Читать полностью…

Scrapy

как бы нам получить какую-нибудь асинхронность не сильно переписывая код

Читать полностью…

Scrapy

из современного знаю они только в асинхронной алхимии остались

Читать полностью…

Scrapy

в итоге у них аж целых два джита, а у нас только половина)
правда юзверей у них прям мало, чисто как dsl для шопифая остался))

Читать полностью…

Scrapy

всмысле был ли в стандартной десктопной установке? не знаю
но в репозиториях-то был

Читать полностью…

Scrapy

первую версию google кста на питоне и джаве написали, в 94 примерно

Читать полностью…

Scrapy

в линуксах он при этом был и ставился, но я не вспомню что его вообще там использовало

Читать полностью…

Scrapy

в те года он вообще редко где был как будто
многое что встречал, веб в основном, и что было написано до ~2016 года было на пыхе

а что на питоне: zope прям супер экзотика, только слышал что у кого есть что-то живое на нем, больше всего из старого это питон 2.7 и штанга

Читать полностью…

Scrapy

ну мне с направлением повезло) в смежных факультетах до сих пор на листочках бейсик пишут

хотя был предмет «параллельное программирование», там вот интересно, на контрольных писали кресты с опенмп на листочках

вроде я его не сдал даже) ушел в академ, вернулся, а его в программе уже нет)

Читать полностью…

Scrapy

помню в универе на первом курсе перед тем как начать веб разработку изучать как раз знакомились с технологиями через реквестс+бс4, потом перетекли на фласк и штангу

Читать полностью…

Scrapy

ща как 3.0 дропнем и заживем

Читать полностью…

Scrapy

попробуй найти origin ip сайта

Читать полностью…

Scrapy

то есть только в названии проблема?

Читать полностью…

Scrapy

Товарищи, а вот как правильнее разбирать вложенные элементы?
Пока у меня вот такой код:

    for block in response.css('div.product_block'):
block_loader = GoodItemLoaderDefault(item=dict(), selector=block, urljoin=urljoin)
block_loader.add_css('url_item', 'div.product_block_img > a::attr(href)')
block_loader.add_css('url_img', 'div.product_block_img img::attr(src)')
block_item = block_loader.load_item()
for good in block.css('table.variants tr'):
n += 1
loader = GoodItemLoaderDefault(item=dict(block_item), selector=good)
loader.add_css('title', 'td.name::text')
loader.add_css('artikul', 'td.name::text', re=re_art)
loader.add_css('price', 'td.price::text', re=re_prace)
loader.add_css('valuta', 'td.price::text', re=re_valuta)
loader.add_css(
'code', 'td.to_cart input[type="hidden"]::attr(name)', re=re_code)
item = loader.load_item()

И вроде напрашивается .nested_* - но нельзя.
Может ввести для подобного использования какое нибудь .nested_copy_* ?

Читать полностью…

Scrapy

Чет кажется кидалово какой-то 🤔

Читать полностью…

Scrapy

Это шутка такая или анонс? Не улавливаю

Читать полностью…

Scrapy

мне кажется это всё было от бедности

Читать полностью…

Scrapy

а раньше часто кстати гевентами/гринлетами баловались? просто уже год почти прошел с обсуждения добавления виртуальных потоков в питон
пока никак не двигается, но к обсуждению возвращаются)

так то было бы прикольно асинхронщину бесцветную иметь

Читать полностью…

Scrapy

ещё рубисты ходили и рассказывали что питон ваш отстой, надо на руби писать, вот рельсы смотрите, а ещё у нас символы есть как в лиспе

Читать полностью…

Scrapy

по дефолту в смысле шел? прикол)

Читать полностью…

Scrapy

https://github.com/7mind/jopa
есть и свежая jopa

Читать полностью…

Scrapy

в эпоху питона 2.3-2.5 на нём реально почти ничего не было

Читать полностью…

Scrapy

Кажется язык не так и важен, имхо
Просто в 2004 питона в вузе почти не было
А вот в 2025 у дочки в школе - уже вовсю

Читать полностью…

Scrapy

бейсик помню
паскаль помню
ассемблер помню
winapi помню
кресты помню

питон не помню )

Читать полностью…

Scrapy

блин а вот раньше как будто все изучение питончика с парсинга начинали, бьютифул суп был установлен в глобальных пакетах обязательно прям
а сейчас все как будто с фастапишки начинают, к парсингу ажиотажа среди новеньких нет уже

Читать полностью…

Scrapy

Реклама или я наивный?))

Читать полностью…
Subscribe to a channel