1946
Сборник Python новостей: https://pythondigest.ru Наш симулятор IT инцидентов: https://incidenta.tech
coverage - 7.14.1
https://pypi.org/project/coverage/7.14.1/
Утилита позволяющая измерить процент покрытия тестами. Скачать можно по ссылке: https://pypi.python.org/pypi/coverage/
turbovec - vector index
https://github.com/RyanCodrai/turbovec
Как я обучил GPT с нуля на русском языке — и что из этого получилось
https://habr.com/ru/articles/1037532/
Всё началось с наивной мысли: зачем платить за API или тащить 7B-модель, если мне нужна маленькая модель для простых разговоров на одном языке? Логика казалась железной — большие модели умеют всё и на всех языках сразу, но это же избыточно. 0.7B, заточенная под один язык и один стиль общения, должна справляться не хуже. Спойлер: это было наивно. Но путь оказался ценнее результата.
Зеленые потоки Celery. Gevent и Eventlet
https://habr.com/ru/articles/1036606/
Вторая статья цикла о внутрянке Celery: на этот раз — зелёные потоки (gevent/eventlet). Как gevent и eventlet работают под капотом Celery, что такое Hub, monkey patching и почему autoscale для гринлетов бесполезен. А ещё — неожиданный бенчмарк: prefork против gevent на одном ядре. Спойлер: gevent проигрывает, но не спешите его хоронить. Для тех, кто выбирает пул под свои задачи.
Реверс-инжиниринг Xiaomi Smart Band 10
https://habr.com/ru/articles/1038812/
У носимых устройств есть парадокс: браслет измеряет ваши пульс, сон и активность, но готового открытого API для интеграции этих данных в сторонние системы (например, домашний мониторинг или локальную БД) производитель не предоставляет.
Как мы вывели в админку ошибки yt-dlp, которые жили только в логах. Bridge на 200 строк и борьба с alert-fatigue
https://habr.com/ru/articles/1036904/
История о том, как сделать видимыми ошибки yt-dlp, которые молча умирали в логах воркера. Bridge на 200 строк, классификатор content vs infra, борьба с alert-fatigue. Читать
RAG в enterprise: 70-80% проблем не в модели, а в данных
https://habr.com/ru/companies/alpinadigital/articles/1036196/
Эта статья родилась из работы над AlpinaGPT. Мы недавно зарелизили в нём по-настоящему крутых AI-ассистентов и AI-проекты: с подключаемыми базами знаний, общим контекстом чатов и нормальной памятью между сессиями. Я начал смотреть, как RAG сделан у других — и оказалось, что во многих продуктах на рынке всё гораздо проще и грубее, чем нам кажется.
5 слоев кэширования в веб-приложениях: Полное руководство для Python-разработчиков
https://habr.com/ru/articles/1031748/
Кэширование — ключевой механизм оптимизации производительности веб-приложений, позволяющий снизить задержки и уменьшить нагрузку на серверы. В этой подробной статье рассмотрим пять основных уровней кэширования, применимых в современных веб-системах. Ты узнаешь о внутреннем и внешнем кэше, кэшировании на уровне reverse proxy, браузера и фронтенда.
pika - 1.4.1
https://pypi.org/project/pika/1.4.1/
Библиотека работы с AMQP. Скачать можно по ссылке: https://pypi.python.org/pypi/pika/
gevent - 26.5.0
https://pypi.org/project/gevent/26.5.0/
Библиотека для Python, которая позволяет вам писать асинхронные сетевые приложение использую синхронный API. Скачать можно по ссылке: https://pypi.python.org/pypi/gevent/
Сводка pythonz 10.05.2026 — 17.05.2026
https://pythonz.net/articles/645/
А теперь о том, что происходило в последнее время на других ресурсах.
scrapy - 2.16.0
https://pypi.org/project/scrapy/2.16.0/
Гибкий фреймворк для написания web-пауков (парсеров). Скачать можно по ссылке: https://pypi.python.org/pypi/scrapy
numpy - 2.4.6
https://pypi.org/project/numpy/2.4.6/
Модуль для работы с многомерными массивами. Скачать можно по ссылке: https://pypi.python.org/pypi/numpy/
Строки в Python: всё не так просто, как кажется
https://habr.com/ru/companies/yandex_praktikum/articles/1031556/
Начинающим разработчикам строки обычно кажутся едва ли не самым простым, что есть в языке программирования. Возможно, причина в том, что знакомство с новым языком зачастую начинается с вывода на экран строки Hello, world!.«Это же просто набор символов, заключённый в кавычки!» — обычно восклицает джуниор Python-разработчик.Но в Python всё немного интереснее. И за простым синтаксисом скрывается большой набор возможностей, правил и нюансов. Более того, если посмотреть внимательнее, окажется, что в Python целый зоопарк строковых представлений и связанных с ними особенностей. Поговорим и о базовом использовании, и о важных деталях, которые стоит помнить каждому разработчику.
Использование машинного обучения в работе с SolidWorks (2 часть): тестирование и практическое применение
https://habr.com/ru/articles/1035378/
В прошлой статье я поделился своими наработками в области работы ИИ с CAD-программами (в моём и нашем случае, SolidWorks). В этот раз поделюсь практическими результатами на примере тестового ядра своей программы.В статье поделюсь тестами программы, опишу интерфейс и поделюсь мыслями о дальнейшем развитии.
dograh - Open Source Voice Agent Platform
https://github.com/dograh-hq/dograh
Детекция чужого почерка в экзаменационных бланках без эталонного образца
https://habr.com/ru/articles/1037850/
Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это.
presidio: Detect, Redact, & Anonymize Sensitive Data (PII)
https://github.com/microsoft/presidio
SQLAlchemy - 2.0.50
https://pypi.org/project/sqlalchemy/2.0.50/
Библиотека работы с базами данных. Скачать можно по ссылке: https://pypi.python.org/pypi/SQLAlchemy/
Сводка pythonz 17.05.2026 — 24.05.2026
https://pythonz.net/articles/646/
А теперь о том, что происходило в последнее время на других ресурсах.
#python #pydigest
IT-новости про Python перед вами.
Часть материалов из выпуска Python Дайджест:
- Зеленые потоки Celery. Gevent и Eventlet
- Как я обучил GPT с нуля на русском языке — и что из этого получилось
- Детекция чужого почерка в экзаменационных бланках без эталонного образца
- Как тестировать внешние API в Python: от DI-мока до настоящего HTTP-сервера
- RAG в enterprise: 70-80% проблем не в модели, а в данных
- presidio: Detect, Redact, & Anonymize Sensitive Data (PII)
- dograh - Open Source Voice Agent Platform
Заходите в гости - https://pythondigest.ru/issue/649/
Как тестировать внешние API в Python: от DI-мока до настоящего HTTP-сервера
https://habr.com/ru/articles/1034864/
Почти каждый сервис, который мы сегодня пишем, ходит куда-то наружу — платёжный шлюз, биллинг, чужой публичный API. И каждый раз, когда садимся писать тесты на этот код, упираемся в один и тот же вопрос: как протестировать клиента, не привлекая внимания санитаров выходя в реальный мир?Эта статья про то, как выбирать инструмент под эту задачу. Не абстрактно — на одном маленьком, но гордом настоящем сервисе catfact-demo-service, в tests/ которого рядом лежат пять способов протестировать одну и ту же интеграцию.
Pyrog. Основа для приложения мечты
https://habr.com/ru/articles/1035774/
Около трёх лет назад я выпустил программный комплекс для ускорения разработки и управления мини-приложениями на Python + PySide6, которые помогают мне в повседневной работе.За время его эксплуатации я обнаружил ряд архитектурных недостатков, которые ухудшали опыт его использования, да и многие возможности, о которых я мечтал не были реализованы. Так или иначе, я нашел в себе силы исправить свои ошибки и реализовать задуманное. Поэтому, если вы, как и я, пишете инструменты на Python или хотите этим заняться, то можете взять на вооружение мой инструмент, он бесплатный и имеет открытый исходный код. Присоединиться к проекту
click - 8.4.1
https://pypi.org/project/click/8.4.1/
Фреймворк для простого создания интерфейсов командной строки.. Скачать можно по ссылке: https://pypi.python.org/pypi/click/
greenlet - 3.5.1
https://pypi.org/project/greenlet/3.5.1/
Модуль для легковесных потоков в Python. Скачать можно по ссылке: https://pypi.python.org/pypi/greenlet/
Выделение одного значащего признака из набора данных с помощью машинного обучения. Используется Apache Spark
https://habr.com/ru/articles/1035962/
В первой части была создана инфраструктура для запуска машинного обучения. Там же была создана БД с данными для использования в примерах.В данной части будет искаться, какой тип файлов вызывает увеличение нагрузки. При этом, зная, какой именно тип файла был указан как вызывающий нагрузку.Будет использоваться машинное обучение в Apache Spark.
fast-volleyball-tracking-inference — детектор волейбольного мяча на скорости 80 fps (CPU). Или «не YOLO единым»
https://habr.com/ru/articles/1035966/
Так сложилось, что я люблю играть в волейбол и активно снимаю свои игры и тренировки.У любителей обычно стоит стационарная камера на штативе, которая захватывает всю площадку (или почти всю) в формате 16:9. При этом современные соцсети потребляют контент вертикально (9:16) и короткими роликами около минуты.Задача: быстро делать вертикальные видео из любительских волейбольных съёмок.Центральный объект внимания в волейболе — мяч. Значит, нужно определять начало розыгрыша и дальше уверенно следить за мячом. Если сопровождать мяч и делать кроп из 16:9 в 9:16 — получаем готовый вертикальный ролик.При изучении темы детекции объектов почти сразу попадаешь на семейство YOLO.
The Real Python Podcast – Episode #295: Agentic Architecture: Why Files Aren't Always Enough
https://realpython.com/podcasts/rpp/295/
What are the limitations of using a file-based agent workflow? Why do massive context windows tend to collapse? This week on the show, Mikiko Bazeley from MongoDB joins us to discuss agentic architecture and context engineering.
lxml - 6.1.1
https://pypi.org/project/lxml/6.1.1/
Мощный и быстрый модуль для обработки XML/HTML. Скачать можно по ссылке: https://pypi.python.org/pypi/lxml/
medical-research-skills
https://github.com/aipoch/medical-research-skills