Сборник наиболее интересных Python материалов. https://pythondigest.ru/ Сделать донат - https://boosty.to/pydigest Блог автора - @whydaily Рекомендуем хостинг https://firstvds.ru/?from=421453
numpy - 1.24.0rc2
https://pypi.org/project/numpy/1.24.0rc2/
Модуль для работы с многомерными массивами. Изменения описаны по ссылке https://pypi.org/project/numpy/1.24.0rc2/. Скачать можно по ссылке: http://pypi.python.org/pypi/numpy/
SQLAlchemy - 2.0.0b4
https://pypi.org/project/sqlalchemy/2.0.0b4/
Библиотека работы с базами данных. Изменения описаны по ссылке https://pypi.org/project/sqlalchemy/2.0.0b4/. Скачать можно по ссылке: http://pypi.python.org/pypi/SQLAlchemy/
redis - 4.4.0
https://pypi.org/project/redis/4.4.0/
Python клиент для Redis. Изменения описаны по ссылке https://pypi.org/project/redis/4.4.0/. Скачать можно по ссылке: http://pypi.python.org/pypi/redis/
Обучение Russian SuperGLUE моделей с помощью библиотеки DeepPavlov
https://habr.com/ru/post/703334/?utm_campaign=703334&utm_source=habrahabr&utm_medium=rss
В последние годы соревнования GLUE (http://gluebenchmark.com/) и SuperGLUE (http://super.gluebenchmark.com/) на английском языке стали стандартным бенчмарком для определения возможностей универсальных языковых моделей, таких как BERT, RoBERTa в решении широкого круга задач обработки естественного языка, в том числе задач с недостаточной обучающей выборкой. Соревнования GLUE/SuperGLUE представляют собой наборы задач NLP на основе ранее представленных датасетов. Академическое сообщество NLP довольно быстро расправилось с GLUE, отчасти вследствие того, что задачи были довольно однотипные, они сводились либо к парной текстовой классификации, либо к классификации единственной последовательности. Ответом на это был новый набор задач SuperGLUE, в состав которого вошли вопросно-ответные задачи, задачи кореференции и задачи семантического следования. На данный момент модели, обученные на базе ERNIE и DeBERT, превзошли качество разметки человеком.
Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++
https://habr.com/ru/post/703202/?utm_campaign=703202&utm_source=habrahabr&utm_medium=rss
InvokeAI 2.2 теперь доступен для всех. В этом обновлении добавлены UI Outpainting, Embedding Management и другие функции. Ознакомьтесь с выделенными обновлениями ниже, а также с полным описанием всех функций, включенных в релиз. Что нового?
Вам нужен чистый код? Используйте правило шести
https://habr.com/ru/post/703172/?utm_campaign=703172&utm_source=habrahabr&utm_medium=rss
Все хотят писать чистый код. Этому посвящены целые книги.
Но вам не нужно читать книги, чтобы начать писать более чистый код прямо сейчас. Есть одна «хитрость», которой может научиться любой кодер, она делает код гораздо менее запутанным.
Выбор оптимального решения для хранения разнородных данных pandas
https://habr.com/ru/post/703064/?utm_campaign=703064&utm_source=habrahabr&utm_medium=rss
Проблема выбора формата файла, с которым предстоит работать для чтения и записи pandas.DataFrame, заключается как раз в том, что есть из чего выбрать: даже сам pandas включает в себя функционал, позволяющий работать с большим перечнем типов файлов. Обилие доступных для данной задачи форматов обусловлено невозможностью решить проблему импорта/экспорта раз и навсегда: ничего идеального, как и формата для хранения данных, к сожалению, не существует, поскольку даже самый, на первый взгляд, оптимальный и минимально затратный по ресурсам pickle способен создать очень много проблем.
Сравнение производительности моделей обнаружения объектов YOLO v5, v6 и v7
https://habr.com/ru/post/702790/?utm_campaign=702790&utm_source=habrahabr&utm_medium=rss
Если вы выполняете проект по обнаружению объектов, высока вероятность того, что вы выберете одну из многих моделей YOLO. Учитывая количество моделей обнаружения объектов YOLO, сделать выбор в пользу лучшей из них непросто.
Группируем текстовые записи с помощью Python и CountVectorizer
https://habr.com/ru/post/702626/?utm_campaign=702626&utm_source=habrahabr&utm_medium=rss
Данные для анализа были взяты из сводной базы ICTRP (https://www.who.int/clinical-trials-registry-platform) (International Clinical Trials Registry Platform — Платформа международного реестра клинических исследований) Всемирной организации здравоохранения. Для целей данной статьи нужна не полная база, а только одно поле Primary_sponsor, которое содержит название главной заинтересованной в исследовании организации — «спонсора».
Как я использовал нейросеть для категоризации трехмерных тел
https://habr.com/ru/post/702252/?utm_campaign=702252&utm_source=habrahabr&utm_medium=rss
Значимость темы машинного обучения (machine learning) сегодня очевидна. Это огромный домен знаний в Computer Science, которому в России, в частности, посвящают конференции уровня недавней AI Journey (https://ai-journey.ru/). Существует множество способов применения ML в различных областях, среди самых исследованных: распознавание изображений/видео/голоса, процессинг текста. Однако есть и более любопытные задачи, с которыми справляется ML. Например, обучение с подкреплением, что позволяет ИИ играть в игры типа Го (https://ru.wikipedia.org/wiki/AlphaGo), идентификация людей по фотографии, распознавание жестов, движений и поз человека.
Как наши преподаватели снимают с себя рутину, или история одного бота
https://habr.com/ru/post/702202/?utm_campaign=702202&utm_source=habrahabr&utm_medium=rss
Работа преподавателя, кроме чтения лекций, включает довольно много рутины, например, проверку выполненных домашних заданий. И если вопросы в домашке не сводятся к простым однозначным ответам, а подразумевают выбор правильного подхода, реализацию алгоритма и написание кода, на это уходит значительное время.
Посчитайте сумму n-го ряда пирамиды нечетных чисел
https://habr.com/ru/post/702162/?utm_campaign=702162&utm_source=habrahabr&utm_medium=rss
Эта задача преследовала меня на двух интервью подряд, и я решил ее!
Мультиканальная атрибуция в EdTech: ожидание/реальность или что мы вынесли из этого опыта
https://habr.com/ru/post/702210/?utm_campaign=702210&utm_source=habrahabr&utm_medium=rss
В какой-то момент у нас в компании стали приходить запросы от маркетологов, чтобы мы поглубже изучили взаимодействие маркетинговых каналов и попробовали мультиканальные модели атрибуции.
Получаем статистку Telegram-канала при помощи api и python
https://habr.com/ru/post/702148/?utm_campaign=702148&utm_source=habrahabr&utm_medium=rss
В некоторых группах в Telegram доступна интересная и познавательная статистика, которую можно посмотреть не только со смартфона, но и нехитрых действий с api. А если каналов много, то вообще очень полезная вещь.
Introduction to OpenCV AI Kit (OAK)
https://pyimagesearch.com/2022/11/28/introduction-to-opencv-ai-kit-oak/
Django - 4.1.4
https://pypi.org/project/django/4.1.4/
Мощный web-фреймворк. Изменения описаны по ссылке https://pypi.org/project/django/4.1.4/. Скачать можно по ссылке: http://pypi.python.org/pypi/Django/
selenium - 4.7.0
https://pypi.org/project/selenium/4.7.0/
Модуль для автоматизации тестирования web-приложений. Изменения описаны по ссылке https://pypi.org/project/selenium/4.7.0/. Скачать можно по ссылке: http://pypi.python.org/pypi/selenium/
#python #pydigest
Сборник Python новостей уже перед вами.
В выпуске Python Дайджест вы найдете:
- Как мы создавали сервис для улучшения города в Ташкенте (Узбекистан)
- Как я писал трекинг парковочных мест
- Выбор оптимального решения для хранения разнородных данных pandas
- Как с нуля разработать систему аналитики для телеграм бота?
- Истоки Python
- Ускоряем тестирование: быстро, модно, без рутины
- Как мы допилили PyTest для счастья разработчиков, билд-инженеров, тестировщиков и менеджеров
Заходите в гости - https://pythondigest.ru/issue/467/
Присылайте интересные новости через форму на сайте.
Как я писал трекинг парковочных мест
https://habr.com/ru/post/703276/?utm_campaign=703276&utm_source=habrahabr&utm_medium=rss
Здесь предисловие. Это мой первый пост на Хабре, да и вообще первая публикация в стиле, в котором я постараюсь все разложить по полочкам и рассказать с какими трудностями, я новичок во всей этой теме (студент второго курса) столкнулся и как я их решил (возможно примитивно).
Работа с поверхностными и глубокими копиями в Python
https://habr.com/ru/post/702486/?utm_campaign=702486&utm_source=habrahabr&utm_medium=rss
В этой статье объясняется, как делать копии списков Python, массивов NumPy и датафреймов Pandas при помощи операций получения срезов, списочного индексирования (fancy indexing) и логического (boolean indexing). Эти операции очень часто используются при анализе данных и должны рассматриваться всерьёз, поскольку ошибочные предположения могут привести к падению быстродействия или неожиданным результатам.
НЕЙРОННАЯ СЕТЬ ДЛЯ РАСПОЗНАВАНИЯ ОБРАЗОВ С TENSORFLOW: КАК С НЕЙ РАБОТАТЬ
https://habr.com/ru/post/703130/?utm_campaign=703130&utm_source=habrahabr&utm_medium=rss
В сегодняшней статье хотим поделиться опытом, как можно начать использовать TensorFlow в целях распознавания образов. Напомним, что TensorFlow — открытая программная библиотека для машинного обучения, разработанная компанией Google для решения задач построения и тренировки нейронной сети с целью автоматического нахождения и классификации образов, достигающая качества человеческого восприятия.
Выявление незаконных построек по спутниковым снимкам с помощью CV
https://habr.com/ru/post/702764/?utm_campaign=702764&utm_source=habrahabr&utm_medium=rss
Заметил, что вам очень нравится вместе с нами разбирать решения задач с хакатонов. Сегодня расскажу, как я занял 4 место в соревновании по выявлению незаконных построек по спутниковым снимкам и что мне не хватило, чтобы попасть в топ-3 на Цифровом прорыве.
Как с нуля разработать систему аналитики для телеграм бота?
https://habr.com/ru/post/702658/?utm_campaign=702658&utm_source=habrahabr&utm_medium=rss
В этом посте расскажем о том, как мы создавали для нашего продукта (MMO RPG игра в телеграм) собственную систему аналитики
Реализация и применение Entity Component System на примере python
https://habr.com/ru/post/702598/?utm_campaign=702598&utm_source=habrahabr&utm_medium=rss
Entity Component System (ECS) - это паттерн, используемый при разработке видеоигр, для хранения игровых объектов.
Истоки Python
https://habr.com/ru/post/702458/?utm_campaign=702458&utm_source=habrahabr&utm_medium=rss
Вашему вниманию представляется перевод статьи "The Origins of Python" за авторством Ламберта Меертенса - соавтора языка ABC и коллеги Гвидо ван Россума.
В своей статье Меертенс вспоминает как зарождалось программирование, своё участие в разработке языка ABC, знакомство с молодым Гвидо ван Россумом и зарождение языка Python.
Ускоряем тестирование: быстро, модно, без рутины
https://habr.com/ru/post/702302/?utm_campaign=702302&utm_source=habrahabr&utm_medium=rss
Придя в "стартап", я столкнулся с особенностями здешней атмосферы: все гибко, быстро, часто меняются цели, и в угоду этому результат иногда получается не совсем корректным. Мне свежим взглядом со стороны было легко подметить те места, особенно в тестировании, решив которые, можно было бы добиться лучших результатов для нашей компании.
Так что в этом посте мы рассмотрим изменения процессов тестирования и доставки новых фич, проделанные нами за полгода, с точки зрения того, как в ContactPay это было раньше, что изменили и к каким результатам это привело.
Как мы допилили PyTest для счастья разработчиков, билд-инженеров, тестировщиков и менеджеров
https://habr.com/ru/post/701670/?utm_campaign=701670&utm_source=habrahabr&utm_medium=rss
В этой статье расскажу о нашей модульной обвязке для PyTest, которая позволяет запускать тесты продуктов на разном железе. Фокус в том, что тесты при этом остаются простыми, а на сдачу мы получаем трассируемость от требований к результатам прогонов тестов, написанных по данным требованиям. В итоге у нас фактически получилась замкнутая система CI/CD с наглядным качеством кода.
Зачем __name__ == "__main__"?
https://habr.com/ru/post/702218/?utm_campaign=702218&utm_source=habrahabr&utm_medium=rss
В этой небольшой статье мы рассмотрим один из самых популярных "новичковых" вопросов - зачем нам конструкция if __name__ == "__main__".
Как школьники МЭШ взломали
https://habr.com/ru/post/702104/?utm_campaign=702104&utm_source=habrahabr&utm_medium=rss
История о том, как школьники нашли глупейшую ошибку в production версии электронного журнала г. Москвы и построили на этом бизнес.
Полное руководство по модулю asyncio в Python. Часть 2
https://habr.com/ru/post/701982/?utm_campaign=701982&utm_source=habrahabr&utm_medium=rss
Публикуем вторую часть руководства по модулю asyncio в Python, в которой представлены разделы оригинала №3 и 4. Читать головокружительную первую часть.