1946
Сборник Python новостей: https://pythondigest.ru Наш симулятор IT инцидентов: https://incidenta.tech
Как мы научились честно считать эффект промокодов: Causal Inference в онлайн-доставке
https://habr.com/ru/companies/X5Tech/articles/1005410/
Сегодня расскажу о модели, которую мы построили для оценки реального эффекта промокодов. Главные вопросы: кому, какой, и зачем мы выдаем промокод. Спойлер: ответ нас удивил. И именно этот ответ стал главной причиной, по которой эту модель вообще стоило строить.
redis - 7.3.0
https://pypi.org/project/redis/7.3.0/
Python клиент для Redis. Скачать можно по ссылке: https://pypi.python.org/pypi/redis/
Научил ИИ-агента помнить важное и забывать лишнее в SQLite
https://habr.com/ru/articles/1006622/
Я делаю локально работающего ИИ-агента и столкнулся с тем, что стандартный подход «закинуть текст в векторную базу, достать по косинусу» для долгоживущего агента не работает: контекст замусоривается, факты конфликтуют, ничего не забывается. Вместо этого реализовал графовую когнитивную память поверх одного файла SQLite
Propensity Score Matching: как строить аналоги A/B-тестов, когда эксперименты невозможны
https://habr.com/ru/companies/yandex/articles/1004060/
В этой статье я расскажу, как мы применяли PSM (Propensity Score Matching) — статистический метод, который позволяет корректно сравнивать группы, уменьшая систематические различия между ними. Подробно разберу, как выровнять группы теста и контроля с помощью PSM, расскажу о типичных ошибках (например, утечке признаков), дам практические рекомендации по сбору и выбору фич для мэтчинга, а также покажу, как валидировать полученные результаты и оценить их достоверность.
Ускоряем pandas, не переписывая код. Мой опыт с FireDucks
https://habr.com/ru/companies/ozontech/articles/1005590/
В своей работе я часто сталкиваюсь с проблемой масштабируемости в pandas. Код, который быстро работает на гигабайте данных, начинает невыносимо тормозить на десяти. Уверен, эта боль знакома многим.
Managing Shared Data Science Code With Git Submodules
https://codecut.ai/managing-shared-data-science-code-git-submodules/
Learn how to manage shared code across projects using Git submodules. Prevent version drift, maintain reproducible workflows, and support team collaboration with practical examples.
Unit Testing: Catching Speed Changes
https://pythonspeed.com/articles/speed-unit-tests/
This second post in a series covers how to use unit testing to ensure the performance of your code. This post talks about catching differences in performance after code has changed.
django-cms - 4.1.10
https://pypi.org/project/django-cms/4.1.10/
Легкая в использовании и удобная для разработки CMS. Скачать можно по ссылке: https://pypi.python.org/pypi/django-cms/
Grep-AST или Как мы заменили векторный поиск всего одной библиотекой
https://habr.com/ru/companies/ecom_tech/articles/1005610/
Сегодня хочу поделиться одной малоизвестной библиотекой, которую мы волей судьбы откопали на просторах github, попробовали использовать для поиска по нашей кодовой базе, и, о чудо! Это ощутимо помогло нам. Казалось бы, такой маленький шаг для человечества, но такой полезный для нашего проекта.
Как меня опрокинул автоматический скоринг Сбера
https://habr.com/ru/articles/1005464/
Моя ситуация - абсолютно понятная: в связи с рождением ребёнка мы решили улучшить жилищные условия: продать квартиру и взять вторичку в ипотеку в лучшем районе. Учитывая известные события на вторичном рынке, сам по себе процесс покупки квартиры является довольно стрессовым: нужно проверить надёжность продавцов, составить договор, и т.д. То, что сделка у нас проходит по альтернативной схеме с образованием длинной цепочки, добавляет волнений.
Django - 5.2.12
https://pypi.org/project/django/5.2.12/
Мощный web-фреймворк. Скачать можно по ссылке: https://pypi.python.org/pypi/Django/
Анатомия WebSocket: человечный разбор RFC 6455
https://habr.com/ru/articles/1004772/
Как правило, работа с веб-сокетами сводится к паре строк: connect() и send(). Удобные абстракции библиотек превратили этот протокол в магическую трубу, по которой летают данные в обе стороны. Но магия заканчивается ровно в тот момент, когда соединение молча отваливается с кодом 1006, балансировщик рвет коннект, а в логах появляются странные ошибки фрагментации. В этой статье мы спустимся с небес высокоуровневых фреймворков на уровень байтов и битовых масок.
SQLAlchemy - 2.0.48
https://pypi.org/project/sqlalchemy/2.0.48/
Библиотека работы с базами данных. Скачать можно по ссылке: https://pypi.python.org/pypi/SQLAlchemy/
dj-control-room - The control room for your Django app
https://github.com/yassi/dj-control-room
Литания: создаем свой язык программирования с лексером, парсером и интерпретатором
https://habr.com/ru/companies/selectel/articles/1003948/
В наше время программирование стало очень доступным из-за развития инструментов и языков. Написать «привет, мир» может практически каждый, а количество фреймворков для JavaScript уже воспевается в шутках. Теперь, чтобы выделиться и впечатлить друзей и коллег, нужно спускаться глубже. Придумаем свой язык шуточный программирования!
Как я определял дистрибутивы Linux по установленным пакетам, и при чем тут KUMA?
https://habr.com/ru/articles/1006546/
Как определить дистрибутив Linux? А что, если имеется только информация о пакетах, установленных на устройстве? История одного «велосипеда» или мы не нашли готового решения.Представьте, что вам нужно определить дистрибутивы, опираясь исключительно на установленные пакеты.
10 900 тестов или почему ваш мониторинг должен быть протестирован
https://habr.com/ru/articles/1006610/
Мониторинг мониторинга - звучит как масло масляное. Ведь наш сервис должен быть надёжнее, чем объекты, которые он отслеживает. Расскажу, как мы дошли до 10 900 автоматических тестов (5100 на бэкенде и 5812 на фронтенде). Все цифры и технологии - строго из нашего репозитория . Без хайпа, только факты, код и архитектурные решения.
Как мы сделали AI code review через Ollama без облака?
https://habr.com/ru/articles/1006258/
Как запустить AI code review по git diff на своей машине через Ollama - без облака и API-ключей? Установка, конфиг и пример отчёта.
Векторный поиск в PostgreSQL: PGVector, SQLAlchemy и FastAPI
https://habr.com/ru/articles/1006364/
Реализуем сервис семантического поиска на базе PostgreSQL с расширением PGVector. В статье: настройка БД через Docker, миграции Alembic, асинхронный слой на SQLAlchemy и API на FastAPI.
py2many: Transpiler of Python to Many Other Languages
https://github.com/py2many/py2many
How the Self-Driving Tech Stack Works
https://cardog.app/blog/autonomous-driving-stack-technical-guide
A technical guide to how self-driving cars actually work. CAN bus protocols, neural networks, sensor fusion, and control system with open source implementations, most of which can be accessed through Python.
Знакомьтесь, Эндрю Кучлинг (цикл заметок о выдающихся питонистах)
https://habr.com/ru/articles/1006200/
Замысел в том, чтобы написать цикл о 10 программистах, чьи имена не особо примелькались, но чьи заслуги невозможно переоценить. Начну я этот цикл с Эндрю Кучлинга (A.M. Kuchling). Я всегда знал его как автора официального туториала по регуляркам в питоне, пожалуй, лучшего по теме. Но масштаб этого человека куда больше.
Использование алгоритма Hunt&Kill для создания клеточного лабиринта
https://habr.com/ru/articles/1005970/
Статья про то, как создавать клеточные лабиринты с помощью алгоритма Hunt&Kill + реализация на языке python.
От скалярной тоски к SIMD-эйфории: как подружить IDA Pro с инструкциями RISC-V P Extension
https://habr.com/ru/companies/kaspersky/articles/1005630/
В жизни практически каждого исследователя безопасности прошивок однажды наступает момент, когда он или она сталкивается с новым или не особо известным микроконтроллером или свежей процессорной архитектурой с кастомными расширениями. В последнее время такие моменты наступают все чаще — за прошедшие несколько лет рынок наполнился огромным количеством новых чипов из Поднебесной, в частности, на базе RISC-V, со своими собственными расширениями и реализациями ядер. И вот не так давно на анализ нашим исследователям попало устройство c таким чипом на базе RISC-V, c базовым набором инструкций RV32I и расширением P (причем еще и не последней версии), добавляющим короткие SIMD-операции (Packed-SIMD Instructions). То, что наши эксперты видели его впервые — абсолютно нормально.
Django - 4.2.29
https://pypi.org/project/django/4.2.29/
Мощный web-фреймворк. Скачать можно по ссылке: https://pypi.python.org/pypi/Django/
Django - 6.0.3
https://pypi.org/project/django/6.0.3/
Мощный web-фреймворк. Скачать можно по ссылке: https://pypi.python.org/pypi/Django/
Создание идеального лабиринта с помощью упрощённого алгоритма Прима
https://habr.com/ru/articles/1004900/
Лабиринты использовались в видеоиграх с момента их появления. Первой видеоигрой с процедурно генерируемым лабиринтом была Beneath Apple Manor, выпущенная в 1978 году. Лабиринт в ней генерировался методом деления на комнаты и коридоры, из-за этого лабиринт часто выглядел однообразным и предсказуемым, что портило впечатление от игры.
Автоматизированный анализ графита по ISO 945: архитектура и инженерная реализация модуля
https://habr.com/ru/articles/1004932/
Я пытаюсь реализовать свою систему анализа металлов и сплавов. И хочу представить один из них. Если кому-то интересно или есть изображения, которые нужно измерить, верифицировать с другими системами я только - за. Немного теории из мира металловедения, который чем-то схож с миром биологии.
The *1000 most popular* Django packages
https://wagtail.org/blog/the-1000-most-popular-django-packages/
Based on GitHub stars and PyPI download numbers.
Variational Bayes UKF: комплексирование измерений GPS
https://habr.com/ru/articles/1001458/
В условиях «городского каньона» GPS-сигнал подвержен эффектам многолучевого распространения и экранирования, что порождает аномалии в измерениях псевдодальности.Классические фильтры Калмана, предполагающие аддитивный гауссовский шум, в таких условиях демонстрируют резкое падение точности оценки позиционирования.