[Видео] Обработка свыше 400М прод. событий в сутки
https://www.youtube.com/watch?v=rFphrGkfPCQ
В KION в сутки поступает свыше 400 миллионов продуктовых событий (помимо технических). На основе этих событий продуктовые вертикали строят аналитику, следят за продуктом, принимают бизнес решения. Качество поступаемых данных критично важно. В докладе расскажу про весь pipeline событий, как мы их готовим для аналитиков и продактов.
[Видео] Классификация запросов клиентов. Дёшево и сердито
https://www.youtube.com/watch?v=-q4KMw8FUNA
Когда у вас достаточно большой и разношёрстный спектр запросов клиентов, а вам необходимо все это валидировать, и на это нет ресурсов в виде LLM или NN — "Что же делать?". Расскажу, как сделать классификацию быстро и без больших затрат на разметку и обучение.
Как мы делаем опенсорс курсы для программистов от программистов
https://ift.tt/N92uE6e
Мы разочаровались в курсах по программированию и поэтому сделали свои собственные. Не для вайтишников, а для типичных разрабов. В процессе нас хакнул инфлюенсер и забанил сервер телеграма. Покоцанные, но не сломленные, мы представляем проект, над которым работали полтора года по ночам. Курсы по программированию с задачами в online IDE и прагматичной теорией. Никаких сертификатов и гарантий трудоустройства. Сплошной хардкор и опенсорс!
aiohttp - 3.9.4
https://ift.tt/Z8dnhCs
http клиент/сервер для asyncio. Скачать можно по ссылке: https://pypi.python.org/pypi/aiohttp
kombu - 5.3.7
https://ift.tt/6A0hjIx
Фреймворк для работы с AMQP. Скачать можно по ссылке: https://pypi.python.org/pypi/kombu/
Разбор задач «Квеста на миллион»
https://ift.tt/SX185vY
Разбираем задачи прошедшего квеста на миллион. Для простоты, в разборе будем использовать формализованные формулировки задачи. Ознакомиться с исходными формулировками можно в самом квесте. Квест открыт и доступен для прохождения.
Мега-Учебник Flask Глава 3: Веб-формы (издание 2024)
https://ift.tt/LpOkXW7
В главе 2 я создал простой шаблон для домашней страницы приложения и использовал поддельные объекты в качестве заполнителей для того, чего у меня еще нет, например, пользователей и записей в блоге. В этой главе я собираюсь устранить одно из многих недостатков, которые у меня все еще есть в этом приложении, в частности, как принимать входные данные от пользователей через веб-формы.
#python #pydigest
IT-новости про Python перед вами.
Часть материалов из выпуска Python Дайджест:
- Как перезапускать PySpark-приложение и зачем это может понадобиться
- Универсальные типы в python
- Максимизируем продуктивность: Создание ИИ-секретаря с Whisper и ChatGPT
- Об одной изящной задаче
- Мега-Учебник Flask Глава 2: Шаблоны (издание 2024)
- ingestr - CLI tool to copy data between any databases
- Django - 5.0.4
Заходите в гости - https://pythondigest.ru/issue/538/
Flask - 3.0.3
https://ift.tt/aUnmAGH
Web-фреймворк на основе Werkzeug, Jinja2 и благих намерениях. Скачать можно по ссылке: https://pypi.python.org/pypi/Flask/
Pandas: от хаоса к красоте кода
https://ift.tt/3kK8g5c
Работа с pandas.DataFrame может превратиться в неловкую кучу старого (не очень) доброго спагетти-кода. Я и мои коллеги часто используем эту библиотеку, и хотя мы стараемся придерживаться хороших практик программирования, таких как разделение кода на модули и модульное тестирование, иногда мы все равно мешаем друг другу, создавая запутанный код.
Универсальные типы в python
https://ift.tt/8J4nPXW
Универсальные типы в python являются незаменимым инструментом, который позволяет выявлять множество ошибок на моменте написания кода, а также делает код чище и элегантнее.
Мониторинг Apache Airflow. Оценка «прожорливости» тасок
https://ift.tt/UXiwl8N
Случались ли у вас ситуации, когда количество DAG’ов в вашем Airflow переваливает за 800 и увеличивается на 10-20 DAG’ов в неделю? Согласен, звучит страшно, чувствуешь себя тем героем из Subway Surfers… А теперь представьте, что эта платформа является единой точкой входа для всех аналитиков из различных команд и DAG’и пишут более 50 различных специалистов. Подкосились ноги, холодный пот и желание уйти из IT?
[Видео] Токены отмены как паттерн и как библиотека cantok.
https://www.youtube.com/watch?v=89ke-Z3Iieo
Код на C# и на Go часто пронизан специальными объектами, отвечающими за прекращение работы — они называются токенами отмены, либо в случае Go — контекстами. Это супер-удобно и делает программы компактнее + надежнее, но питонисты про такое почему-то не в курсе. Мне пришлось решать эту проблему и написать свой инструмент + начать популяризировать паттерн.
Индуктивная статистика: доверительные интервалы, предельные ошибки, размер выборки и проверка гипотез
https://ift.tt/yb67Sq2
Одной из самых распространённых задач современной аналитики является формирование суждений о большой совокупности (например, о миллионах пользователей приложения), опираясь на данные лишь о небольшой части этой совокупности - выборке. Можно ли сделать вывод о миллионной аудитории крупного мобильного приложения, собрав данные об использовании лишь для 100 пользователей?
Pydantic: Simplifying Data Validation
https://ift.tt/KobZ8xc
Discover the power of Pydantic, Python's most popular data parsing, validation, and serialization library. In this hands-on tutorial, you'll learn how to make your code more robust, trustworthy, and easier to debug with Pydantic.
Python для анализа годовых температур в Москве
https://ift.tt/ebscaCx
Давайте на примере анализа годовых температур в Москве разберемся как с его помощью можно выгрузить, предобработать и визуализировать данные новичку в этом деле.
Сводка от pythonz net 31.03.2024 — 07.04.2024
https://ift.tt/nrSusbP
А теперь о том, что происходило в последнее время на других ресурсах.
Класс Reverse Mapping на Python
https://ift.tt/qQIdrNs
В процессе разработки часто приходится использовать словари для получения значения по ключу. Это отлично подходит для маппинга полей различных систем. Например, в одной системе тип документа "Договор", а в другой "Contract". Либо одна система принимает буквенный код валюты "RUB", а другая числовой "643". Для того чтобы они понимали друг друга, необходимо переводить значения в понятные для этой системы, и для этого прекрасно подходят словари.
Сказ о том, как я эмулятор Intel 4004 на Python писал (часть 2)
https://ift.tt/Grt82Rz
Это вторая часть о том, как я писал и продолжаю писать и улучшать эмулятор Intel 4004 с очень ограниченным функционалом на языке Python. В этот раз я решился переписать эмулятор с нуля, исправив довольно весомые ошибки предыдущего эмулятора..
Как перезапускать PySpark-приложение и зачем это может понадобиться
https://ift.tt/cNVP1Aa
Мы используем PySpark, который позволяет очень быстро распределённо обрабатывать данные в оперативной памяти узлов нашего кластера на базе Hadoop. Я поделюсь способом, с помощью которого можно снизить потребление ресурсов кластера за счёт перезапуска PySpark-приложений между выполняемыми Spark-задачами, и расскажу, как это делать правильно.
Синтетическое генерирование данных (SMOTE)
https://ift.tt/Jhc68t2
Почему несбалансированные данные — это большая проблема? К примеру у нас есть набор данных, где один класс значительно преобладает над другим. В такой ситуации наша ml моделька может просто "забить" на малочисленный класс, сосредоточившись на многочисленных классах. Это приводит к ситуации, когда модель хорошо работает на общем уровне, но плохо распознаёт важные исключения или редкие случаи.
Propensity score matching: как оценивать маркетинговые кампании, если невозможно провести A/B тесты
https://ift.tt/VK3ihCo
В этой статье я расскажу, как оценивать маркетинговые кампании, если провести A/B- тесты нельзя. Еще обсудим логику в Propensity Score Matching (PSM), и то, какую пользу инструмент может принести вашему бизнесу. А в конце статьи покажу, как достаточно просто можно развернуть такую штуку у себя.