№ 4931117861 Публикуем интересные/полезные фичи/библиотеки языка. По вопросам сотрудничества: @adv_and_pr Канал на бирже: https://telega.in/c/seniorpy
Распределение памяти в Python: сколько и в каких случаях занимают типы данных
В этом материале разберем, как устроено выделение памяти под объекты в Python. Потом кратко о том, как работает очистка памяти от неиспользуемых объектов. И, наконец, о разнице в занимаемой памяти на примере типов list, dict и tuple.
Смотреть статью
Узнай грейд и рыночную зарплату + получи план развития бесплатно
На связи shortcut_sh/videos">ШОРТКАТ. Мы провели 300+ собеседований с менторами из бигтеха, собрали ключевые вопросы с собесов и сделали тест, который поможет оценить навыки.
Вот как это работает:
1. Ты проходишь экспресс-тест за 20 минут или его расширенную версию
2. Бронируешь звонок для презентации обратной связи по ответам — можем встретиться уже на следующий день!
3. К созвону проверим ответы, чекнем СV и на основе этого оценим твой грейд.
Ещё подскажем зарплату в рынке, построим план развития до следующего уровня и расскажем про наш новый продукт, который поможет получить выгодный оффер в 2025 году.
Переходи в бота и проходи тест бесплатно, а дальше расскажем, что и как 👉@shortcut_python_bot
Реклама. ООО "ШОРТКАТ", ИНН: 9731139396, erid: 2VtzqwA35MD
Узнаём кодировку текста
Наверное, у всех были ситуации, когда вы открыли файл или получили ответ от сервера, а внутри оказывается набор странных символов в непонятной кодировке.
Пакет chardet
как раз был создан для работы с кодировками. Его метод detect
выдает предполагаемую кодировку с точностью от 0 до 1.
В примере на картинке мы сделали запрос к серверу, получили ответ, взяли его содержимое и проверили кодировку через метод detect
.
Перемешиваем буквы в строке
Строки неизменяемы в Питоне, поэтому чтобы перемешать буквы в словах текста, каждое слово преобразуются в список символов, список перемешивается, затем объединённые символы назад в список слов присваиваются.
Получаем текущее имя пользователя в Python
Модуль ОС в Python предоставляет функции для взаимодействия с операционной системой. ОС входит в стандартные служебные модули Python. Этот модуль предоставляет портативный способ использования функций, зависящих от операционной системы.
Метод os.getlogin() в Python используется для получения имени пользователя, вошедшего в систему на управляющем терминале процесса.
Преобразование WORD в PDF с помощью Python
Устали от необходимости использовать онлайн-конвертеры docx в PDF с дрянным интерфейсом и ограничениями на конвертацию, тогда начинайте пользоваться модулем docx2pdf.
Установка модуля - pip install docx2pdf
Подробнее можно ознакомиться здесь.
Метод get
у словарей
У словарей есть метод get
, который возвращает значение по переданному ключу.
Если такого ключа в словаре нет, исключение не выбрасывается, а возвращается значение по умолчанию, которое передаётся вторым аргументом, или же None
, если второй аргумент не передан.
В примере мы не передаём второй аргумент, и в переменную name попадает None
. Полезнее было бы передать ещё какую-нибудь строку в метод get
, и она бы подставилась в name
.
⚡️ В сети начали массово сливать курсы и книги известных онлайн школ
Вот отсортированная база с тонной материала(постепенно пополняется):
БАЗА (4687 видео/книг):
(363 видео, 87 книги) — Python
(415 видео, 68 книги) — Frontend
(143 видео, 33 книги) — ИБ/Хакинг
(352 видео, 89 книги) — С/С++
(343 видео, 87 книги) — Java
(176 видео, 32 книги) — Git
(293 видео, 63 книги) — C#
(174 видео, 91 книги) — DevOps
(167 видео, 53 книги) — PHP
(227 видео, 83 книги) — SQL/БД
(163 видео, 29 книги) — Linux
(107 видео, 43 книги) — СисАналз
(181 видео, 32 книги) — Go
(167 видео, 43 книги) — Kotlin/Swift
(112 видео, 24 книги) — Flutter
(137 видео, 93 книги) — DS/ML
(113 видео, 82 книги) — GameDev
(183 видео, 37 книги) — UI/UX
(129 видео, 73 книги) — QA
(213 видео, 63 книги) — Rust
(121 видео, 24 книги) — Ruby
Скачивать ничего не нужно — все выложили в Telegram
Быстрая сортировка
Быстрая сортировка (quicksort) — это один из наиболее известных и широко применяемых алгоритмов сортировки. Она основана на использовании стратегии "разделяй и властвуй".
В этом коде мы выбираем элемент в середине списка в качестве "опорного". Затем мы создаем три списка: один для элементов меньше опорного, один для элементов равных опорному, и один для элементов больше опорного.
Мы рекурсивно применяем быструю сортировку к списку элементов, которые меньше и больше опорного элемента. Это продолжается до тех пор, пока не останется список, который нужно сортировать. В конце, мы объединяем отсортированные списки вместе.
Переводим mp3 в mov
Для перевода формата аудио из mp3 в mov вам понадобится использовать специализированные библиотеки для обработки аудио файлов в Python. Одной из таких библиотек является FFmpeg.
В этом примере мы используем функцию input() из библиотеки ffmpeg для указания входного файла, а затем функцию output() для указания выходного файла. Затем мы запускаем процесс конвертации с помощью функции run().
exceptions
В Python и многих других языках программирования, exceptions
(исключения) — это механизм, который позволяет обрабатывать ошибки и нестандартные ситуации во время выполнения программы. Когда возникает ошибка, Python генерирует исключение. Если исключение не обрабатывается, программа может завершиться с ошибкой.
В данном примере кода, операция x = 10 / 0
вызовет исключение ZeroDivisionError
, так как нельзя делить на ноль. Однако благодаря конструкции try
и except
, программа не завершится с ошибкой. Вместо этого будет выведено сообщение «Произошла ошибка деления на ноль!».
Задача
У вас есть девять цифр: 1, 2, …, 9. Именно в таком порядке. Вы можете вставлять между ними знаки «+», «-» или ничего. У вас будут получаться выражения вида 123+45-6+7+89. Найдите все из них, которые равны 100.
Мне кажется, в таком виде его проще всего и писать и читать и тестировать. Тут у меня три функции: all_combinations — итератор, который выдает все числа для операций (в терминах задачи: вставляет пустые места); all_signs — выдаёт все возможные сочетания знаков + и - заданной длинны (для единообразия, это тоже итератор с рекурсией); perform_operations — выполняет операции.
Тут, конечно, просится решение, избавленное от if-ов и кодирования операций с помощью символов. Но это решение будет более громоздким, о нём можно рассказать, но и писать, и читать его дольше.
PyTorch
PyTorch — это библиотека машинного обучения. Она позволяет создавать нейронные сети и обучать их на графических процессорах, что ускоряет процесс обучения и улучшает точность моделей.
В этом примере мы загружаем датасет MNIST с рукописными цифрами, создаем простую нейронную сеть с двумя полносвязными слоями и функцией активации ReLU
, обучаем ее с помощью стохастического градиентного спуска, а затем тестируем результат на отложенных данных.
При этом мы используем функцию потерь CrossEntropyLoss
, которая подходит для задач классификации, и оптимизатор SGD
.
Использование речевых технологий Яндекса на примере аудиосообщений Telegram или чат-бот для распознавания аудиосообщений
Смотреть статью
Просмотр всех файлов в папке с помощью Python
В этом примере мы указываем путь к папке, которую нам нужно просмотреть, с помощью переменной folder_path
.
Затем мы вызываем функцию os.listdir()
, которая вернет список всех файлов и папок в указанной папке. Мы проходим циклом for
через этот список и выводим на экран имена файлов.
FuzzyWuzzy
Множество раз вам могло прийти в голову реализовать “размытую” функцию поиска для вашей программы, которая в процентах может сравнивать строки. FuzzyWuzzy предоставляет готовое и лёгкое решение.
В первом примере кода на картинке с помощью fuzz.ratio
мы сравниваем две строки и получаем ответ 83, означающий, что они совпадают на 83%.
Если у вас есть список строк, и совпадения необходимо искать во всех строках, FuzzyWuzzy поможет выделить наиболее похожие. Это мы и делаем во втором примере, сравнивая строки data visualisation
и custom behavior
со строками из arr
. При этом в функцию process.extract
в качестве параметра также передаётся limit
, задающий, сколько значений мы хотим получить.
Функция monotonic()
Функция monotonic() модуля time возвращает значение, в долях секунды "монотонных" часов, то есть часов, которые не могут двигаться назад, т. е. не зависят от корректировки/обновления системных часов.
Контрольная точка возвращаемого значения не определена, поэтому допустима только разница между результатами последовательных вызовов.
Функция time.monotonic() идеально подходит для измерения времени выполнения программ большой длительности так как не зависит от корректировки системных часов.
Функция time.monotonic_ns() похожа на time.monotonic(), но возвращает время в наносекундах. Работает не на всех платформах.
Открываем веб-сайт в своем веб-браузере с помощью Python
Модуль webbrowser предоставляет высокоуровневый интерфейс, позволяющий отображать пользователям веб-документы.
Документация доступна по ссылке.
LeetCode теперь в Telegram!
LeetCode — это сайт, который позволяет быстро готовиться к техническим собеседованиям по программированию. Там публикуются задачи с собеседований в Google и Microsoft с решениями.
Подписывайтесь: @leetcode
Сортировка вставками
Как и сортировка выборкой, этот алгоритм сегментирует список на две части: отсортированную и неотсортированную. Алгоритм перебирает второй сегмент и вставляет текущий элемент в правильную позицию первого сегмента.
Предполагается, что первый элемент списка отсортирован. Переходим к следующему элементу, обозначим его х. Если х больше первого, оставляем его на своём месте. Если он меньше, копируем его на вторую позицию, а х устанавливаем как первый элемент.
Переходя к другим элементам несортированного сегмента, перемещаем более крупные элементы в отсортированном сегменте вверх по списку, пока не встретим элемент меньше x или не дойдём до конца списка. В первом случае x помещается на правильную позицию.
Время сортировки вставками в среднем равно O(n²), где n — количество элементов списка.
Учишь Python, но как дело доходит до собственного кода — всё, кирдык? 😥
На форумах только одно: «Больше практиковаться!» А толку? Ноль понимания и никакой поддержки от профи…
Плавали - знаем)) Поэтому специально для тебя - чат Python-щиков 🤝
Что получишь?
1️⃣ Сможешь задавать любые вопросы без страха и осуждения и получать ответы за минуты, а не часы поиска в инете
2️⃣ Регулярные плюшки в виде стримов от препода с 15-ти летним опытом
3️⃣ Общение с единомышленниками и заряд мотивации
➡️ А еще, забирай в закрепе БЕСПЛАТНЫЙ вводный курс по Python
Короче, всё для прокачки! Залетай к нам — ссылка на чат (тык)
Валидаторы данных
Не стоит писать собственные регулярные выражения для валидации почты и URL.
Модуль validators
даёт возможность использовать уже готовые валидаторы для самых распространенных задач. Документация доступна здесь.
Конвертируем словарь в список в Python
Благодаря следующему примеру кода с картинки мы можем с легкостью преобразовать наш в словарь в список.
Как сделать из Python-скрипта исполняемый файл
Исполняемый файл — это файл, который может быть установлен или запущен на компьютере без использования дополнительного программного обеспечения или библиотек.
Смотреть статью
Узнаем сколько всего опредленных букв в строке
Один из способов узнать количество определенных букв в строке максимально быстрым методом – использовать метод count
для строки. Этот метод принимает символ или подстроку и возвращает количество их вхождений в строку.
Этот метод является достаточно быстрым, так как использует внутренние оптимизации CPython, которые работают на низком уровне. Он также не требует дополнительной памяти, за исключением простой переменной, используемой для хранения результата.
Бинарный поиск
Бинарный поиск — это эффективный алгоритм поиска элемента в отсортированном массиве. Он работает путем разделения массива пополам и сравнивает искомый элемент с элементом в середине массива. В зависимости от результата сравнения, половина массива, в которой элемент точно не может находиться, исключается из дальнейшего поиска. Этот процесс повторяется, пока не будет найден элемент или пока остается только один элемент в массиве.
В этом примере функция binary_search
принимает отсортированный массив arr
и искомый элемент target
. Она ищет элемент в массиве и возвращает его индекс, если он найден, и -1, если элемент отсутствует. Каждая итерация сужает диапазон поиска путем сравнения среднего элемента с искомым элементом и сдвига границ поиска в соответствии с результатом сравнения.
Введение в машинное обучение с помощью scikit-learn (перевод документации)
Смотреть статью
Построение горизонтальной гистограммы с помощью seaborn
Слева представлен код для построения гистограммы, справа результат работы нашей программы.
Библиотека FeatherFeather
— это библиотека для эффективного чтения и записи таблиц данных в двоичный формат. Она использует формат Apache
Arrow
для сериализации данных, что позволяет быстро читать и записывать данные без потери информации.
В этом примере мы использовали две основные функции библиотеки:
- feather.write_dataframe()
: записывает таблицу данных в файл формата Feather
.
- feather.read_dataframe()
: читает таблицу данных из файла формата Feather
.Feather
позволяет быстро и эффективно обмениваться данными между Python и R, а также обеспечивает быстрое чтение и запись таблиц данных на диск.
Обучите свою первую ML-модель!
✅ Интенсив для начинающих разработчиков ML «Машинное обучение на службе Data Science» от Otus.
Научитесь решать задачи классификации методами ML
Обучите свою первую модель для решение задачи классификации рукописных цифр
👉 Регистрация: https://otus.pw/1kC2/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru