1045
Чат создан чтобы делиться опытом о Scrapy/Python и другими парсинг технологиями. Вежливость и уважение к другим участникам группы. Троллинг не приветствуется. FAQ: https://github.com/bulatbulat48/ru-scrapy-python Работа: t.me/scrapy_jobs
На странице это выглядит так: блок с картинкой и заголовком, а в нём таблица с конкретными товарами.
И в каждый товар нужно добавить эту картинку, а название сконкатенировать с заголовком блока
ну, пока шутка) но третья версия скрапи имхо гораздо реальнее чем четвертая у питона и первая у фастапи)
Читать полностью…
2.15.0 вышел: https://docs.scrapy.org/en/latest/news.html#scrapy-2-15-0-2026-04-09
Highlights:
* Experimental support for running without a Twisted reactor
* Experimental httpx-based download handler
как бы нам получить какую-нибудь асинхронность не сильно переписывая код
Читать полностью…
из современного знаю они только в асинхронной алхимии остались
Читать полностью…
в итоге у них аж целых два джита, а у нас только половина)
правда юзверей у них прям мало, чисто как dsl для шопифая остался))
всмысле был ли в стандартной десктопной установке? не знаю
но в репозиториях-то был
первую версию google кста на питоне и джаве написали, в 94 примерно
Читать полностью…
в линуксах он при этом был и ставился, но я не вспомню что его вообще там использовало
Читать полностью…
в те года он вообще редко где был как будто
многое что встречал, веб в основном, и что было написано до ~2016 года было на пыхе
а что на питоне: zope прям супер экзотика, только слышал что у кого есть что-то живое на нем, больше всего из старого это питон 2.7 и штанга
ну мне с направлением повезло) в смежных факультетах до сих пор на листочках бейсик пишут
хотя был предмет «параллельное программирование», там вот интересно, на контрольных писали кресты с опенмп на листочках
вроде я его не сдал даже) ушел в академ, вернулся, а его в программе уже нет)
помню в универе на первом курсе перед тем как начать веб разработку изучать как раз знакомились с технологиями через реквестс+бс4, потом перетекли на фласк и штангу
Читать полностью…
Товарищи, а вот как правильнее разбирать вложенные элементы?
Пока у меня вот такой код:
for block in response.css('div.product_block'):
block_loader = GoodItemLoaderDefault(item=dict(), selector=block, urljoin=urljoin)
block_loader.add_css('url_item', 'div.product_block_img > a::attr(href)')
block_loader.add_css('url_img', 'div.product_block_img img::attr(src)')
block_item = block_loader.load_item()
for good in block.css('table.variants tr'):
n += 1
loader = GoodItemLoaderDefault(item=dict(block_item), selector=good)
loader.add_css('title', 'td.name::text')
loader.add_css('artikul', 'td.name::text', re=re_art)
loader.add_css('price', 'td.price::text', re=re_prace)
loader.add_css('valuta', 'td.price::text', re=re_valuta)
loader.add_css(
'code', 'td.to_cart input[type="hidden"]::attr(name)', re=re_code)
item = loader.load_item()
а раньше часто кстати гевентами/гринлетами баловались? просто уже год почти прошел с обсуждения добавления виртуальных потоков в питон
пока никак не двигается, но к обсуждению возвращаются)
так то было бы прикольно асинхронщину бесцветную иметь
ещё рубисты ходили и рассказывали что питон ваш отстой, надо на руби писать, вот рельсы смотрите, а ещё у нас символы есть как в лиспе
Читать полностью…
в эпоху питона 2.3-2.5 на нём реально почти ничего не было
Читать полностью…
Кажется язык не так и важен, имхо
Просто в 2004 питона в вузе почти не было
А вот в 2025 у дочки в школе - уже вовсю
бейсик помню
паскаль помню
ассемблер помню
winapi помню
кресты помню
питон не помню )
блин а вот раньше как будто все изучение питончика с парсинга начинали, бьютифул суп был установлен в глобальных пакетах обязательно прям
а сейчас все как будто с фастапишки начинают, к парсингу ажиотажа среди новеньких нет уже
первый запрос проходит всегда, но дальнейшие нет
решил проблему, использую прокси
здравствуйте, нужно обойти Cloudflare при скрепинге, есть идеи как?
использую playwright