Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
Представьте, что у вас есть несколько таблиц Postgres, с которыми вам нужно работать и обрабатывать данные из таблиц с помощью Pandas по расписанию.
Как вы можете этого добиться?
Kestra, orchestrator проект с открытым исходным кодом, который поможет вам без особых усилий организовать этот рабочий процесс, используя файл YAML
.
https://pypi.org/project/kestra/
@data_analysis_ml
📌Создание ИИ-помощников в Hugging Chat Assistant
Не так давно Hugging Face упростила создание собственных чат-ботов. Технический руководитель площадки Филипп Шмид сообщил, что Hugging Chat Assistant позволит создавать и публиковать ИИ-помощников за пару кликов.
Шмид сравнивает эту функцию с GPT от OpenAI и добавляет, что разработчики могут использовать «любую доступную открытую LLM, например Llama2 или Mixtral».
Hugging Chat Assistant позволяет быстро выбрать имя бота, задать аватар и описание, а также отправить системное сообщение для настроек его поведения. Он предлагает различные варианты начала бесед.
ИИ-помощников можно эффективно использовать в разных задачах Data Science и Machine Learning
📎 Hugging Chat Assistant
@data_analysis_ml
🖥 Selenium отлично подходит для задач веб-автоматизации.
Helium еще больше расширяет эти возможности, упрощая сложные задачи, выполнение которых может быть затруднительным при использовании Selenium.
Под капотом Helium перенаправляет каждый вызов в Selenium. Разница в том, что API Helium гораздо более высокоуровневый. В Selenium вам нужно использовать HTML-идентификаторы, XPaths и селекторы CSS для идентификации элементов веб-страницы.
Helium позволяет ссылаться на элементы с помощью видимых пользователю меток. В результате скрипты Helium обычно на 30-50% короче аналогичных скриптов Selenium. Более того, они легче читаются и более стабильны по отношению к изменениям на веб-странице.
Поскольку Helium - это просто оболочка для Selenium, вы можете свободно смешивать две библиотеки. Например:
# A Selenium API:
driver.execute_script("alert('Hi!');
📌Полезная статья от Google о применении LLM в рамках Social learning
Статья о том, что LLM все чаще позволяют использовать вспомогательных агентов, которым было бы полезно эффективно учиться друг у друга (тут можно вспомнить модели Mixtral, где несколько нейросетей работают вместе).
Обсуждается вопрос, способны ли LLM учиться друг у друга с помощью социального обучения.
В целом, неплохая статья, потому что объединение нейросетей в "группы экспертов" — одна из современных тенденций, это позволит снизить количество галлюцинаций и другие проблемы нейросетей.
📎 Статья от Google
📎 Вообще о понятии "социальное обучение" от Сбера
@data_analysis_ml
👉 Изучите OpenCV
Это репозиторий содержит прмиеры с кодом статьи и лучшие практики по работе с компьютерным зрении.
🔗 https://github.com/spmallick/learnopencv
@data_analysis_ml
📌Линейная, логистическая и регрессия Пуассона
На этой схеме детально видно отличие этих распространённых видов регрессии, даже нечего комментировать. Разве что совсем чуть-чуть.
▶️Линейная регрессия имеет много практических применений. Большинство приложений попадают в одну из двух широких категорий:
— Если целью является прогнозирование, линейную регрессию можно использовать для подгонки модели к наблюдаемому набору данных.
— Если цель заключается в том, чтобы объяснить изменчивость выходной переменной, можно применить линейный регрессионный анализ для количественной оценки силы взаимосвязи между выходной и входными переменными.
▶️Логистическая регрессия:
— Применяется: когда мы хотим оценить связь между бинарной зависимой переменной и одной или несколькими независимыми переменными.
— Проверяет: есть ли связь между бинарной переменной и каждой из независимых переменных.
— Данные: зависимая переменная, которая принимает два значения, и независимые переменная.
— Нулевая гипотеза: коэффициент при каждой из независимых переменных равен нулю (т.е. нет связи между зависимой и независимой переменной).
▶️Регрессия Пуассона — это особый тип регрессии, в котором переменная отклика состоит из «данных подсчета».
Регрессию Пуассона можно использовать, к примеру, для изучения количества студентов, окончивших определенную программу колледжа, на основе их среднего балла при поступлении на программу и их пола. В этом случае «количество выпускников» — это переменная ответа, «средний балл успеваемости при поступлении на программу» — непрерывная предикторная переменная, а «пол» — категориальная предикторная переменная.
Подробнее про каждый из видов регрессии можно почитать тут:
📎 линейная
📎 логистическая
📎 Пуассона
@data_analysis_ml
⚡️ReviewNB
Интерфейс #Jupyter_notebook на #GitHub имеет ограничения, в том числе невозможность отображения интерактивных графиков, математических выражений и открытия больших ноутбуков.
Интеграция ReviewNB с GitHub
снимает все эти ограничения.
https://www.reviewnb.com
@data_analysis_ml
🦆 Оптимизатор запросов Duckdb объединяет фильтры и агрегации в одну операцию, считывая только релевантные столбцы.
Эта оптимизация делает DuckDB эффективнее для агрегаций данных по сравнению с pandas.
📌 DuckDb
@data_analysis_ml
🔥 Годный сайт, описывающий реализации нейросетей
Нереально полезный сайт, тут содержится много полезностей по ML и DS, например, реализация различных нейронных сетей.
На скрине показана имплементация LSTM, каждый шаг подробно описан со всеми нужными формулами.
Если нажать на название переменной, то она подсветится везде, что тоже очень удобно
📎 Сайт
@data_analysis_ml
📊 Uniplot
Uniplot легковесная библиотека, которая генерирует графики в терминале.
Эта библиотека была нужна для того, чтобы использовать графики как часть вашего конвейера CI / cd для анализа данных / машинного обучения - всякий раз, когда что-то идет не так, вы получаете не только ошибку и трассировку, но и графики, которые показывают, в чем заключалась проблема.
▪Github
@data_analysis_ml
🌟 Открытая книга для специалистов в области AI и ML
Книга состоит из 3 глав.
⏩Глава 1: Освоение OpenAI API
Первая глава знакомит читателей с API ChatGPT. Предоставлена дорожная карта для понимания ключевых стратегий, включая модерацию, Machine Reasoning и Prompt Chaining.
⏩Глава 2: LangChain
Вторая глава посвящена практике использования LangChain. Описан процесс разработки, от настройки среды до внедрения передовых методик извлечения информации (Document Loaders, Text Splitters, Semantic Search, RAG Systems).
⏩Глава 3: ML Ops для LLMs, или LLMOps
Третья глава представляет собой руководство по интеграции LLM в рабочие процессы.
Описываются ключевые этапы от выбора модели до ее развертывания и мониторинга.
Стоит учитывать, что книга не может охватить много аспектов, по-большей части всё вокруг прикручивания готового чат-бота для своих целей
Но при всё при этом можно найти для себя много всего полезного
📎 Книга
@data_analysis_ml
🌐 Хочешь быть в числе крутых аналитиков данных?
Тогда присоединяйся к онлайн-соревнованию Data Fusion Contest 2024 от ВТБ и Т1 и покажи лучшим экспертам отрасли, на что ты способен! Более 1000 аналитиков уже приняли вызов и вступили в борьбу за призовой фонд в 2 млн рублей.
📈💡Используй новые ML/DS подходы и решай задачи по геоаналитике и по моделям оттока клиентов. Ты в деле?
Не упусти возможность применить в работе самые передовые технологии для анализа данных. Участвуй в онлайн-встречах и обменивайся ценным опытом с единомышленниками.
Соревнование уже началось, но ты еще успеваешь запрыгнуть в последний вагон. Регистрируйся по ссылке — https://vk.cc/cvlpkk
*ML - машинное обучение
*DS - анализ данных
Привет!
Это команда Концепт-Разработка. Мы занимаемся развитием и внедрением продуктов в сфере больших данных, корпоративных хранилищ данных, BI и систем управления данными. У себя в канале развиваем сообщество бизнес и системных аналитиков, разработчиков и data-инженеров.
+ Актуальные вакансии;
+ Интересные разработки;
+ Проекты федеральных заказчиков;
+ Новости индустрии и многое другое.
Подписывайся на канал, мы будем рады и экспертам, и начинающим специалистам.
Реклама. ООО "КОНЦЕПТ РАЗРАБОТКА". ИНН 7703471165. erid: LjN8KPCGN
🚀 GPM AdTech Challenge
от «Газпром-Медиа» и Getintent
Когда: 18-30 марта
Формат: гибридный
Призовой фонд: 1 000 000 рублей
Ты можешь стать победителем независимо от своего технического бэкграунда. Выбирай один из трех треков, создавай прототип и выигрывай 1 000 000 рублей.
Регистрация до 13 марта: https://cnrlink.com/gpmdataa
🎙 Frontend Мeetup от Росбанка
Когда: 22 марта
Формат: очный, Казань
Вас ждут доклады специалистов Росбанка, СберМаркета и VK Добра.
Авторы лучших вопросов получат мерч.
Регистрация до 18 марта: https://cnrlink.com/rbkazandataa
💢 «Халява, приди!» от Codenrock
Когда: весь март
Формат: онлайн
Реши несложные, но увлекательные задачи по программированию и получи возможность стать обладателем промокода на любой маркетплейс. Это ли не халява?
Регистрация до 20 марта: https://cnrlink.com/halyavadataa
Реклама. ООО "ЦУКЕР СТУДИЯ". ИНН 7751071015. erid: LjN8JxK2o
🚀 Датасет Amazon Reviews получил четвертое обновление!
Amazon Reviews, один из крупнейших и наиболее широко используемых наборов данных отзывов, насчитывающий более 500 миллионов отзывов пользователей, более 48 миллионов товаров, более 60 миллионов токенов, из 33 категорий.
https://amazon-reviews-2023.github.io
@data_analysis_ml
Стать BI-аналитиком за 5 дней? Это реально вместе с Visiology!
Можно ли за одну неделю:
◾ научиться работать с BI-платформой?
◾ работать с моделями данных?
◾ самостоятельно подключать источники данных?
◾ делать запросы на языке DAX?
◾ получить реально красивые дашборды на любые случаи жизни?
Можно, если пройти марафон по Visiology вместе с DataYoga!
⚡ Уникальная возможность совершенно без затрат и в динамичном формате стать мастером по Visiology 3 — самой востребованной BI-платформы*. Такого предложения больше не будет! Регистрируйтесь прямо сейчас!
Помимо полезных навыков и знаний за активное участие в марафоне можно получить мерч Visiology! 😊
Участвовать в марафоне! Стартуем 18 марта!
*По продажам лицензий, данные из рейтинга TAdviser*
Реклама. ООО "ВИЗИОЛОДЖИ". ИНН 7705352195. erid: LjN8K16tx
Вариант для тех, кто ищет виртуальный сервер с хорошей веб-защитой — Aéza:
– Виртуальные сервера до 6.0 ГГц на лучших процессорах;
– Профессиональная фильтрация атак StormWall;
– Круглосуточная поддержка;
– Anycast фильтрация;
– Низкие цены;
– 15% кешбэка по ссылке.
Бесконечно можно смотреть на три вещи: на огонь, воду и скидку от Aeza!
Говорят: твоё от тебя не уйдет. А зачем ждать? Динозавры тоже ждали и остались в прошлом
Используй 50% скидку и погнали в будущее!
Кроме того, сейчас Aéza раздает личные бесплатные сервера, забираем тут. Регистрация, подписка, платежи не потребуются.
Реклама. Индивидуальный предприниматель Лобанов Леонид Константинович. ИНН 781625705648 erid: LjN8KEr3S
🔥 Крутейшая подборка для Дата Саентиста. Лучшие бесплатные курсы, книга, разбор вопросов с собеседований, roadmap, полезные материалы по Python, Go, Linux и многое другое.
▪100 вопросов для подготовки к собесу Data Science
▪Видео
▪100 вопросов для подготовки к собесу Python
▪Вопросы Middle
▪Видео
▪Вливаемся в Data Science: подробный roadmap что и где изучать
▪Machine Learning инженер: что/где/как изучать, чтобы въехать
▪ Моя большая практическая шпаргалка SQL (SQLite) с готовыми запросами
▪ Шпаргалка для алгособеса — алгоритмическая сложность, структуры данных, методы сортировки и Дейкстра
▪ Шпаргалка для алгособеса 2 — графовые и строковые алгоритмы
▪40 Полезных инструментов Дата Саентиста
▪Go — 100 вопросов/заданий с собеседований
▪Видео
▪ Где изучать Linux в 2024. Бесплатные курсы, книги и ресурсы
▪Видео
▪ Бесплатные курсы для изучения искусственного интеллекта в 2024 году
▪NumPy: оттачивайте навыки Data Science на практике
▪Numpy полный бесплатный курс
▪Где изучать Python в 2024. Бесплатные курсы, книги и ресурсы
▪ Видео
▪Где искать работу Дата Саентисту в 2024 году
▪Ресурсы для поиска работы Python разработчикам
▪ Бесплатные курсы по большим языковым моделям для дата-сайентистов
❤️ Сохраняй себе, чтобы не потерять
@machinelearning_ru
Присоединяйтесь к конкурсам GitVerse!
Объявляем о начале регистрации на конкурсы в рамках олимпиады «IT-Планета 2024». Вас ждут два трека, увлекательные задания и призовой фонд в размере 500 тыс. рублей*!
Готовы принять новый вызов?
До 31 марта зарегистрируйтесь и пройдите отборочное тестирование на площадке для разработчиков GitVerse от СберТеха. Вы можете принять участие в двух конкурсах:
👉 «Прикладное программирование if...else»
Конкурс для разработчиков в возрасте от 18 до 35 лет, которые создают прикладное ПО. Требования к участникам — знать C/C++/Java/Python, разбираться в алгоритмах и уметь применять их на практике.
Подробные условия конкурсов и регистрация.
👉 «Разработка игр – GameDev»
Соревнование для разработчиков игр от 18 до 35 лет. Участвовать можно самостоятельно или вместе с командой до 4 человек. Требования — классно разбираться в игровых механиках, знать все о движках и выбирать правильное решение для прототипирования игры.
Каждый конкурс состоит из трех этапов: отборочное тестирование, основной этап — отправка проектов или решение прикладных задач — и очный финал.
Подробные условия конкурсов и регистрация.
Следите за новостями!
*За вычетом НДФЛ
⭐️Новость дня: генеративные нейросети Яндекса включили в международный рейтинг самых перспективных ИИ-разработок
- В рейтинг попали две нейросети компании: текстовая YandexGPT и мультимодальная YandexART
- Это первый международный рейтинг Global Generative AI Landscape 2024, который опубликовал AIPort (сообщество дата-саентистов, ML-экспертов и энтузиастов в сфере ИИ)
- Яндекс стал одной из 11 компаний со всего мира, разрабатывающих более одного типа GenAI-моделей
- Исследование охватило продукты из 62 стран, которые, согласно глобальному индексу искусственного интеллекта Tortoise, больше всего инвестируют в развитие ИИ
📌 Новость
@data_analysis_ml
HOSTKEY – международный хостинг-провайдер предлагает в аренду выделенные и виртуальные GPU-серверы с почасовой или месячной оплатой.
🔥Доступны конфигурации с игровыми картами RTX4090 и профессиональными RTX A500 24Gb и Tesla H100 / A100 80Gb. Дата-центры в России, Нидерландах и Исландии. Скидки до 30%. Стоимость от 10 руб./ч или 7 500 руб. в месяц.
HOSTKEY предлагает гранты для перспективных проектов в области Data Science и для победителей конкурсов по исследованию данных на платформе Kaggle и других площадках.
Спрос на серверы высокий, количество серверов ограничено.
🔥Закажите сервер сегодня или оставьте заявку на предзаказ.
erid: LjN8K97ZZ
Кто круче нейросети?
Только тот, кто ее обучает.
Примите участие в бесплатном интенсиве «Погружение в Data Science: обучите свою первую нейросеть за два дня» от онлайн-школы Skillfactory.
С 19 по 20 марта будете знакомиться с:
– сферой Data Science и ее направлениями;
– элементарным анализом данных на Python;
– алгоритмами машинного обучения.
А за лучшее решение домашнего задания вы сможете получить подарок — мини-курс по аналитическому мышлению.
Регистрируйтесь: https://go.skillfactory.ru/&erid=2VtzqxZU1vB
Реклама. ООО «Скилфэктори», ИНН: 9702009530
Как организовать безоблачное долгосрочное хранение неструктурированных данных на серверах компании?
⏰ 21 марта в 16:00 МСК
⚡️ Регистрация: https://bit.ly/49Qu1tS
Обсудим реализацию архитектуры растянутого хранилища на несколько ЦОДов на примере продукта Cloud Storage. Рассмотрим кейс миграции более 150 ТБ хранимых данных в объектное хранилище от VK, в контуре компании, с протоколом доступа S3 API. Расскажем:
🔹Как обеспечить надежность хранения данных и удовлетворить требованиям регуляторов,
🔹Какие есть плюсы, минусы и подводные камни существующих типов систем хранения данных,
🔹Какие варианты хранения доступны в текущих условиях и как выбрать наиболее подходящий.
Регистрация: https://bit.ly/49Qu1tS
У Тинькофф открылась стипендиальная программа для студентов на 2024 год!
В отборе могут участвовать студенты бакалавриата, специалитета и магистратуры (кроме выпускного курса) из всех городов и ВУЗов.
Стипендия выдаётся на один учебный год и составляет 25 000 ₽ в месяц.
Кроме этого:
— доступ к лекциям;
— общение с менторами;
— отложенный оффер на стажировку или работу в Тинькофф.
Более подробная информация и форма подачи заявки 👉 по ссылке
Переходите и подавайте заявку на одну из крупнейших в стране частных стипендий для студентов!
erid:2VtzqwmWK5n
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673
Екатеринбург, 21 марта приглашаем на митап IT Talk by Sber! 😉
Поговорим о том, как сделать правильную анимацию в браузере, обсудим управление UI через backend и узнаем о проблемах наследования кода. А после — ответим на все вопросы, пообщаемся и просто отлично проведём время.
Спикеры и темы:
- Михаил Прядун, Frontend Developer, «Правильная анимация и хороший CSS»
- Алексей Кардашов, Java Developer, «Управление UI через backend в стеке jvm с использованием composite screen platform»
- Ирина Шахтарина, аналитик, «Это всё, что останется после меня: проблемы наследования кода и передачи права на него»
Встречаемся 21 марта в 18:30 в Технохабе Сбера по адресу ул. Розы Люксембург, 56а.
Ждём всех крутых разработчиков Урала! Регистрируйтесь по ссылке 💚
📌Годная статья по кластеризации в Machine Learning
Что освещается в статье?
• Алгоритмы кластеризации — K-means, Spectral Clustering и DBSCAN
• На чём основан K-means
• О работе Spectral Clustering, как он работает с нелинейно разделимыми данными, устойчив ли к выбросам
• Как DBSCAN группирует точки на основе плотности и самостоятельно определяет количество кластеров.
• Как работает Affinity Propagation; соотношение между данными и выбором репрезентативных образцов
• Подводные камни алгоритмов кластеризации, такие как выбор оптимальных параметров и высокая вычислительная сложность
📎 Статья
@data_analysis_ml
⭐️Что такое алгоритм ADD-DEL и где используется?
Алгоритм ADD-DEL используется для определения наиболее значимых признаков и улучшения производительности модели.
ADD-DEL является одним из методов отбора признаков, основанных на пошаговом поиске. Он работает так:
⏩Начальная точка: Начальное множество признаков пустое.
⏩Добавление признаков (ADD): Алгоритм просматривает все признаки, которые еще не были добавлены в множество, и добавляет тот признак, который приводит к наибольшему увеличению критерия оценки. Этот процесс повторяется, пока добавление новых признаков не перестанет улучшать критерий оценки.
⏩Удаление признаков (DEL): После того, как невозможно улучшить критерий оценки путем добавления новых признаков, алгоритм начинает удалять признаки. Он просматривает все признаки, которые уже были добавлены в множество, и удаляет тот признак, который приводит к наименьшему ухудшению критерия оценки. Этот процесс повторяется, пока удаление признаков не перестанет улучшать критерий оценки.
⏩Процесс продолжается до достижения определенного критерия остановки, например, до достижения определенного числа признаков или улучшения производительности модели.
В целом алгоритм ADD-DEL используется довольно часто, для подробного ознакомления вот ниже полезные ссылки
🖥 Код с объяснением алгоритма
📎 Лекции МГУ
📎 Лекция Воронцова К.В.
@data_analysis_ml
🔺 Полезные ссылки для специалиста по Data Science
Эти источники помогут освежить знания по DS, особенно полезно будет полистать перед собеседованием
Изучение основ Python
⏩ Питонтьютор — понятный и удобный курс для освоения базы. Там много задач для практики, которые попадаются на собеседованиях.
⏩ Основы Python-разработки — ещё один бесплатный курс: за 20 часов вы изучите основы и напишете простой код.
⏩ Основы программирования и анализа данных на Python — короткий видеокурс. Особенно рекомендую лекции 7—10 про полезные библиотеки Pandas, NumPy, Matplotlib и Seaborn.
Основы SQL
⏩ Интерактивный тренажёр по SQL — курс с множеством практических заданий на создание SQL-запросов. Рекомендую начать с него.
⏩ Основы работы с базами данных и SQL — ещё один курс с интерактивным тренажёром.
⏩ Упражнения на SQL-EX — тренажёр написания запросов SELECT. Регулярно решайте задачи, чтобы уверенно чувствовать себя на собеседованиях.
Библиотеки Python
⏩ Python PANDAS, полный курс для начинающих — библиотека Pandas помогает удобно работать с табличными данными и похожа логикой на SQL. Основные операции стоит знать наизусть: чтение таблиц, редактирование, работа с пропусками, изменение типов данных. После изучения теории возьмите какой-нибудь датасет и вручную «покрутите» его в Jupyter Notebook
⏩ Основы NumPy — библиотека NumPy помогает быстро и удобно производить математические операции. Она используется во многих других библиотеках. Необязательно знать все операции наизусть, главное — уметь быстро в них сориентироваться при необходимости.
⏩ Matplotlib — библиотеки для визуализации данных. В Seaborn графики выглядят красивее, а Matplotlib гибко настраивается. Заучивать все функции и методы необязательно.
⏩ 50 оттенков Matplotlib — статья с примерами графиков, чтобы построить что-то подобное для своих данных.
Алгоритмы и структуры данных
⏩ Тренировки по алгоритмам — лекции с теорией, домашними заданиями и разборами. Сдавайте задания вовремя, чтобы получить сертификат. Лучших участников готовят к прохождению алгоритмических собеседований.
⏩ LeetCode — сайт с задачами для подготовки к собеседованиям. Решайте уровни Easy и Medium перед интервью.
Математика для анализа данных
⏩ Бесплатный курс «Основы математики для цифровых профессий» поможет закрыть пробелы в базовой математике, чтобы перейти к более сложным темам.
⏩ Теория вероятностей поможет проанализировать данные и отличить случайности от закономерностей. Смотрите лекции от МФТИ и других крутых универов по теорверу на YouTube.
⏩ Основы математической статистики — курс связан с теорвером, и с его помощью можно научиться делать достаточно точные выводы о данных по их выборке.
Курс ведёт Анатолий Карпов — ex-тимлид команды аналитики в отделе бизнеса и рекламы VK. Он крутой специалист, рекомендую его вебинары на YouTube
Продуктовая аналитика
⏩ Публичное собеседование по продуктовой аналитике
⏩ ML для оптимизации цен на основе эластичности по цене
⏩ Как мы не сделали рекомендательную систему в банке
Этого должно быть вполне достаточно, чтобы начать проходить собеседования по чистой продуктовой аналитике.
Используйте все эти ресурсы по максимуму 🔥
@data_analysis_ml
🔅Секреты успешного анализа данных: 10 принципов, которые работают
Эти 10 принципов — подборка практических и довольно очевидных правил, главное — придерживаться их. Начнём!
1️⃣Определите цель анализа данных.
Подумайте о том, что для вас на данный момент важнее всего: выявить скрытые закономерности в данных, предсказать будущие тренды или что-то другое.
2️⃣Обеспечьте качество данных.
Подготовка данных к анализу - это ваш первый шаг к созданию шедевра аналитики.
3️⃣Применяйте разнообразные методы анализа.
Уверенность в владении разнообразными методами анализа поможет вам принимать обоснованные решения и открывать новые перспективы.
4️⃣Используйте современные инструменты для обработки данных.
Открывайте новые горизонты современных технологий, обогащайте свои навыки и возможности в области обработки данных и становитесь настоящим профи данных.
5️⃣Создавайте эффективные модели прогнозирования.
Используя эффективные модели прогнозирования, вы вооружаетесь сильным инструментом, позволяющим вам принимать осознанные решения и идти впереди конкурентов.
6️⃣Осуществляйте визуализацию данных для наглядного представления информации.
Визуализация делает данные живыми и наглядными, что поможет вам принимать обоснованные решения.
7️⃣Учитывайте контекст и особенности данных.
Это позволит вам строить глубокие и точные модели, учитывая все нюансы и особенности, что помогает принимать обоснованные и эффективные решения.
8️⃣Используйте машинное обучение и искусственный интеллект.
ML и AI — это ваш мощный арсенал в битве за понимание и прогнозирование данных.
9️⃣Проводите регулярную проверку и обновление данных.
Это поможет вам принимать обоснованные решения, опираясь на достоверные и актуальные факты.
0️⃣Извлекайте практическую пользу из результатов анализа.
Это поможет вам использовать данные не только как информацию, но и как мощный инструмент для достижения целей и реализации задач.
В общем, данные — это не просто цифры и факты, это ключ к принятию обоснованных решений. Используйте их на полную!
@data_analysis_ml
🤗 Новый курс "Модели с открытым исходным кодом на Hugging face".
huggingface изменил правила игры, позволив разработчикам легко использовать любую из сотен тысяч уже готовых моделей с открытым исходным кодом для сборки в своих проектах.
Этот курс научит вас лучшим практикам работы с hf, в том числе поиску и выбору моделей.
Вы научитесь пользоваться библиотекой Transformers
и познакомитесь с несколькими моделями обработки текста, аудио и изображений, включая сегментацию изображений с нулевым кадром, классификацию аудио с нулевым кадром и распознавание речи.
Вы также научитесь использовать мультимодальные модели для визуального ответа на вопросы, поиска изображений и подписи к изображениям. Наконец вы поработаете с Gradio и Hugging Face Spaces.
https://deeplearning.ai/short-courses/open-source-models-hugging-face/