⚙️ bashplotlib
Хотите строить графики в консоли?
$ pip install bashplotlib
➡️ Преобразование двух списков в словарь
Предположим, у нас имеется два списка. Один из них содержит имена студентов, а второй — их оценки. Как преобразовать эти два списка в словарь?
✔️ Для решения задачи можно прибегнуть к функции zip()
.
Python Learning 👩💻
➡️ clean-text для нормализации и очистки текста
Отличный однострочный код для нормализации и очистки текста — идеально для проектов по обработке естественного языка.
Контент, созданный пользователями в Интернете и в социальных сетях, часто бывает грязным. Предварительно обработайте свои данные с помощью clean-text, чтобы создать нормализованное текстовое представление. Например, преобразуйте этот испорченный ввод:
A bunch of \\u2018new\\u2019 references, including [Moana](https://en.wikipedia.org/wiki/Moana_%282016_film%29).
»Yóù àré rïght <3!«
A bunch of 'new' references, including [moana](<URL>).
"you are right <3!"
🔵 Практический интенсив «Python-разработчик: основы за 2 дня» — 16-17 июля в 19:00 мск.
О перспективах направления Python и многом другом расскажет Грегори Салиба, старший разработчик ЭквантаЛаб с опытом в разработке более 3 лет.
На вебинаре вы:
☑️ Самостоятельно напишете Telegram-бота с карточными мини-играми.
☑️ Познакомитесь с синтаксисом языка и сферами его применения.
☑️ Поймете как продолжить обучение, какие навыки потребуются, чтобы стать backend-разработчиком на Python.
☑️ Узнаете, чего ждут работодатели от junior-разработчиков и что делать, чтобы найти работу без опыта.
🎁 Приятные бонусы: полезный гайд для начинающего Python-разработчика и гайд о сленге в IT всем участникам интенсива!
Реклама. ООО "ХЕКСЛЕТ РУС". ИНН 7325174845. erid:LjN8KQsz9
⚙️ Оптимизация памяти в Python: Использование генераторов вместо списков
Когда мы работаем с большими наборами данных, важно помнить об эффективном использовании памяти. Одной из полезных фишек Python для оптимизации памяти является использование генераторов вместо списков.
➡️ Пример кода
Допустим, у нас есть задача найти квадраты чисел от 1 до 1 000 000. Сначала посмотрим, как это сделать с помощью списка:
# Плохая практика: использование списка
squares = [x**2 for x in range(1, 1000001)]
# Лучшая практика: использование генератора
squares = (x**2 for x in range(1, 1000001))
➡️ clean-text для нормализации и очистки текста
Отличный однострочный код для нормализации и очистки текста — идеально для проектов по обработке естественного языка.
Контент, созданный пользователями в Интернете и в социальных сетях, часто бывает грязным. Предварительно обработайте свои данные с помощью clean-text, чтобы создать нормализованное текстовое представление. Например, преобразуйте этот испорченный ввод:
A bunch of \\u2018new\\u2019 references, including [Moana](https://en.wikipedia.org/wiki/Moana_%282016_film%29).
»Yóù àré rïght <3!«
A bunch of 'new' references, including [moana](<URL>).
"you are right <3!"
➡️ PyForest: Один импорт для всех важных модулей
Импортируйте все ключевые библиотеки Python одной строкой. Это удобно для всех ваших проектов по Data Science и при создании нового окружения в Conda.
🗣️ При работе с данными вы используете библиотеки, такие как pandas, matplotlib, seaborn, numpy и sklearn. Прежде чем приступить к работе, нужно их импортировать.
Библиотека решает несколько проблем:
• Однообразие: импорт всегда одинаковый и скучный.
• Пропущенные импорты мешают работе.
• Иногда нужно искать точные строки импорта, например, import matplotlib.pyplot as plt или from sklearn.ensemble import GradientBoostingRegressor.
🔗 Ссылочка на доку
Python Learning 👩💻
Иван Попов проводит эфиры редко, но каждый из них — выжимка полезной информации и мотивация)
На вебинаре он поделится тем, как видит этот рынок, опираясь на свой многолетний опыт.
9 июля в 19.00 по МСК
эфир "Как выйти на заработок 100.000р на торговле акциями за пол года?"
—
▪️ Сколько реально зарабатывать, если совмещать с основной работой
▪️ Какие шаги тебе нужно делать, чтобы выйти на 300К
▪️ Как начать торговать, не имея своего капитала
Переходите по ссылке и регистрируйтесь на вебинар
в закрепе канала.
🔗Ivan Popov
Лучи добра.
⚙️ Unstructured для предварительной обработки текста
ℹ️ Unstructured - это доступная библиотека Python для легкого извлечения текста из документов. Она упрощает очистку текста, обрабатывая все, от удаления маркеров до управления эмодзи и языкового перевода.
🔗 Ссылочка на доку
Python Learning 👩💻
⚙️ TorchAudio для обработки аудиосигнала
ℹ️ Библиотека машинного обучения для обработки звука и сигналов с помощью PyTorch.
🗣️ TorchAudio предоставляет функции ввода-вывода, обработки сигналов и данных, наборы данных, реализации моделей и компоненты приложений.
🔗 Ссылочка на доку
Python Learning 👩💻
⚙️ NLTK для обработки естественного языка
ℹ️ NLTK (Natural Language Toolkit) — один из наиболее популярных инструментов для обработки естественного языка.
✔️ Особенности NLTK:
• Поддерживает более 50 языковых наборов данных и обученных языковых моделей.
• Предлагает классификацию текста, выделение корней, токенизацию, тегирование, синтаксический анализ.
• Функции для анализа настроений или мнения, выраженного во фрагменте текста.
🔗 Ссылочка на доку
Python Learning 👩💻
⚙️ Использование функции sorted()
В Python очень легко сортировать некие последовательности данных с использованием встроенной функции sorted()
, которая берёт на себя решение всех сопутствующих задач.
🗣️ Эта функция сортирует любые последовательности (списки, кортежи) и всегда возвращает список с отсортированными элементами. Рассмотрим пример сортировки списка чисел в порядке возрастания:
sorted([3,5,2,1,4]) # [1, 2, 3, 4, 5]
sorted(['france', 'germany', 'canada', 'india', 'china'], reverse=True) # ['india', 'germany', 'france', 'china', 'canada']
➡️ Возврат из функции нескольких значений
В Python есть возможность возврата из функции нескольких значений. Этого нет во многих других популярных языках программирования.
✔️ Для возврата из функции нескольких значений их нужно разделить запятыми. На основе этого списка значений Python создаст кортеж и вернёт его туда, откуда была вызвана функция.
Python Learning 👩💻
➡️ Использование коллекций Python
Коллекции Python — это контейнерные типы данных. В частности, это списки, множества, кортежи, словари. Модуль collections
даёт в распоряжение разработчика высокопроизводительные типы данных, которые помогают улучшить код, сделать его чище и облегчить работу с ним. Этот модуль содержит множество полезных методов. Здесь мы рассмотрим метод Counter()
.
Этот метод принимает итерируемый объект, такой, как список или кортеж, и возвращает словарь, содержащий сведения о количестве различных объектов в исследуемом списке (Counter Dictionary). Ключами такого словаря являются уникальные элементы, представленные в итерируемом объекте, а значениями — количества таких элементов.
Counter()
⚙️ Оптимизация памяти в Python: Использование генераторов вместо списков
Когда мы работаем с большими наборами данных, важно помнить об эффективном использовании памяти. Одной из полезных фишек Python для оптимизации памяти является использование генераторов вместо списков.
➡️ Пример кода
Допустим, у нас есть задача найти квадраты чисел от 1 до 1 000 000. Сначала посмотрим, как это сделать с помощью списка:
# Плохая практика: использование списка
squares = [x**2 for x in range(1, 1000001)]
# Лучшая практика: использование генератора
squares = (x**2 for x in range(1, 1000001))
➡️ Конкатенация строк
Если нужно конкатенировать список строк, сделать это можно в цикле for
, по одной добавляя строки к итоговому результату.
🗣️ Однако такой подход будет весьма неэффективным, особенно в том случае, если список оказывается достаточно длинным. В Python строки являются иммутабельными сущностями. В результате каждая операция по конкатенации строк означает необходимость копирования пары строк в новую строку.
join()
:characters = ['p', 'y', 't', 'h', 'o', 'n']
word = "".join(characters)
print(word) # python
Как стать Python-разработчиком за 4 месяца? 🐍 Об этом расскажут аж на 2-х бесплатных уроках от Merion Academy!
Забирай целый набор из бесплатных полезностей:
📍2 бесплатных урока, где вы познакомитесь с базой, освоите синтаксис и сразу начнете писать свою программу для портфолио.
📍 В дополнение бесплатный интенсив по развитию карьеры, где HR-эксперты расскажут лайфхаки, как создавать сильные резюме и проходить собеседования, так, чтобы вас взяли на работу.
📍Курс по английскому для IT тем, кто захочет учиться дальше.
👉 Регистрируйтесь по ссылке чтобы забирать бесплатные уроки, интенсив по карьере и гайд.
Что еще важно знать:
1. У ребят одна из самых доступных цен, которая в 4-5 раз ниже, чем в других известных школах, но качество обучения на том же уровне. Это достигается за счет того, что в Мерионе не тратят миллионы на продвижение, а рекламируются только на собственных ресурсах и в тематических телеграм-каналах. Кроме этого у них также отсутствуют расходы на младших менторов, которые в большинстве онлайн-платформах представляются вам как "персональный ментор-преподаватель", но на самом деле являются просто бывшими студентами этих же курсов.
2. Есть возможность опции оплаты через сервис "Яндекс-Долями", т.е. учиться сразу, но платить по чуть-чуть.
Merion Academy – это экосистема доступного образования, которая включает в себя:
merionacademy">Youtube-канал, где простыми словами говорят о сложных вещах.
IT-академию, где обучат востребованным направлениям по самым доступным ценам.
IT-базу знаний с полезными статьями
Реклама: ООО "МЕРИОН НЕТВОРКС" ИНН: 7721855710 Erid: 2VtzqwbASyw
✔️ Autoviz: Автоматическая визуализация любого набора данных одной командой
Визуализация используется для показа данных с помощью графиков и диаграмм. В Data Science визуализация помогает понять наборы данных и найти связи между ними. Она также помогает выявить закономерности для дальнейшего анализа.
🗣️ Для визуализации данных в Python часто используют Matplotlib, Seaborn, Plotly и другие. Но перед использованием этих библиотек нужно определить тип графика и аргументы. AutoViz решает эту проблему, быстро предоставляя нужную информацию.
🔗 Ссылочка на доку
Python Learning 👩💻
⚙️ XlsxWriter для записи файлов в формате Excel
ℹ️ XlsxWriter — это очень мощный модуль Python для записи файлов в формате Excel. Он поддерживает добавление текста, чисел, формул, изображений и макросов Excel — среди прочих функциональных возможностей.
✔️ XlsxWriter даже интегрируется с pandas, известным пакетом Python для работы с данными.
🔗 Ссылочка на доку
Python Learning 👩💻
⚙️ Fabulous — вывод картинок в консоль
ℹ️ Вам не достаточно красивого вывода таблиц в консоль? А как насчёт вывода текста с тенями или даже картинок? Теперь это возможно!
🗣️ Использовать только в небольших количествах во избежание перелома чувства прекрасного
🔗 Ссылочка на доку
Python Learning 👩💻
⚙️ Temporian для предварительной обработки временных данных
ℹ️ Temporian предлагает новую парадигму для работы с временными данными. Будучи специально разработанными для него, плюс его основные вычисления, выполняемые как высокооптимизированный код C ++, позволяют ему сделать обычные временные операции более безопасными, простыми в написании и намного, намного быстрее в выполнении - с бенчмарками, показывающими ускорение более чем в 100 раз по сравнению с эквивалентным кодом pandas.
🔗 Ссылочка на доку
Python Learning 👩💻
⚙️ Taipy для создания пользовательских интерфейсов
ℹ️ Taipy - это библиотека Python, которая позволяет специалистам по обработке данных создавать увлекательные повествования на основе своих данных.
🗣️ Магия Taipy заключается в его способности привязывать переменные и выражения к состоянию визуальных компонентов в пользовательском интерфейсе.
🔗 Ссылочка на доку
Python Learning 👩💻
🦾 Как превратить веб-разработку на Python в свою суперсилу?
✔️ Освоить фреймворк Django, который упрощает и ускоряет работу над веб-приложениями со сложной логикой.
✔️ Изучить фронтенд-разработку на Vue.js.
✔️ Научиться реализовывать и поддерживать проекты с рендерингом на стороне сервера, а также работать с API.
🔥 И все это всего за 5 месяцев на онлайн-курсе «Django-разработчик» от OTUS. Под руководством опытных экспертов вы не только изучите лучшие инструменты и практики, но и создадите 3 сильных проекта для портфолио.
Старт уже 26 июня!
➡️ Пройдите короткий тест, чтобы получить персональную консультацию менеджера и специальную цену на курс: https://clck.ru/3BUYEBРеклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
⚙️ Gensim для извлечения семантических тем
ℹ️ Пакет Python с открытым исходным кодом, смоделированный для извлечения семантических тем из больших документов и текстов для обработки, анализа и прогнозирования поведения человека с помощью статистических моделей и лингвистических вычислений.
🗣️ Gensim имеет возможность обрабатывать огромные данные, независимо от того, являются ли они необработанными и неструктурированными.
🔗 Ссылочка на доку
Python Learning 👩💻