💡 Data analyst
В репозитории представлены проекты курса Аналитик данных.
Интересные проекты с кодом, с которыми стоит ознакомиться.
Основные инструменты и навыки используемые в работах:
-Языки: Python, SQL
-Анализ данных: библиотеки Pandas, NumPy, SciPy, Statsmodels
-Визуализация: Matplotlib, Plotly, Seaborn
-Построение дашбордов: Tableau
-Метрики юнит-экономики, когортный анализ
-А/В-тестирование
-Работа с гипотезами
-Машинное обучение: библиотеки Scikit-learn, XGBoost
➡️ Github
@data_analysis_ml
✔️ Блокнот-шпаргалка для быстрого Data preprocessing
Часто люди, заходящие в область Data Science, имеют не совсем реалистичные представления о том, что их ждет. Многие думают, что сейчас они будут круто писать нейросети, создавать голосового помощника из Железного Человека или обыгрывать всех на финансовых рынках.
Но работа Data Scientist завязана на данных, и один из важнейших и время затратных моментов — это обработка данных перед тем, как их подавать в нейросеть или анализировать определенным способом.
В этой статье наша команда опишет то, как можно легко и быстро обработать данные с пошаговой инструкцией и кодом. Мы старались сделать так, чтобы код был довольно гибким и его можно было применять для разных датасетов.
➡️ Читать дальше
@data_analysis_ml
✅ 10 быстрых трюков Pandas для активизации вашего аналитического проекта
Pandas – это популярная библиотека анализа данных на Python. Это, безусловно, обеспечивает вам гибкость и инструменты, необходимые для обработки данных.
Однако для эффективной работы вы должны знать простые в использовании приемы, позволяющие сэкономить время. Поэтому мы рассмотрим 10 быстрых, но очень полезных трюков в pandas, которые вы можете освоить менее чем за 10 минут.
Даже если вы уже хорошо разбираетесь в методах и функциях pandas, вы все равно найдете некоторые из этих приемов действенными. Если вы абсолютный новичок, то эта статья – подходящее место для начала вашего обучения.
➡️ Читать дальше
@data_analysis_ml
🚀 AWESOME DATA SCIENCE
Репозиторий данных с открытым исходным кодом для изучения, применения и решения реальных проблем в data science.
Это кратчайший путь к началу изучения науки о данных. Опытным специалистам, репозиторий поможет найти необходимые топики, которые удобно систематизированы.
🖥 GitHub
@data_analysis_ml
✔️ Репозитории и датасеты практически для всех типов проектов в области Data Science. Более 100 датасетов.
Полный список хранилищ данных для каждого типа проблем
Блог содержит несколько полезных наборов данных и репозиториев, классифицированных по различным классам проблем и отраслей промышленности.
➡️ Читать дальше
@data_analysis_ml
📓 Автоматическая обработка текстов на естественном языке и анализ данных
В учебном пособии рассматриваются базовые вопросы компьютерной лингвистики: от теории лингвистического и математического моделирования
до вариантов технологических решений. Дается интерпретация основных
лингвистических объектов и единиц анализа. Приведены сведения, необходимые для создания отдельных подсистем, отвечающих за анализ текстов
на естественном языке. Рассматриваются вопросы анализа тональности и
тематического моделирования текстов, извлечения информации из текстов.
➡️ Книга
@data_analysis_ml
Ищем учеников на бесплатное обучение по созданию искусственного интеллекта с нуля. Опыт программирования не важен!🤖
Всего за 3 вечера под руководством Дмитрия Романова - основателя Университета Искусственного Интеллекта, лидера обучения AI-разработке в РФ, вы с легкостью напишете свой первый искусственный интеллект👨💻
Какие нейронные сети вы создадите?
▫️Классификация людей на входящих и выходящих из автобуса
▫️Обнаружение возгораний
▫️Оценка стоимости квартир
▫️Оценка резюме соискателей
▫️Прогнозирование стоимости полиметаллов
▫️Сегментация изображений самолетов
▫️Распознавание команд умного дома⠀
Лучше освоить навыки создания нейронных сетей вам помогут домашние задания с проверкой от кураторов.⠀
Приходите на бесплатное обучение и напишите искусственный интеллект за 3 вечера💪
Регистрация по ссылке
Из-за чего работодатели отказывают начинающим бизнес-аналитикам?
Команда Яндекс Практикума опросила 15 представителей разных компаний, которые собеседуют новичков на должность бизнес-аналитика. Оказалось, многим джунам отказывают, потому что:
— у них мало опыта проведения интервью с заказчиками;
— они не могут разговорить собеседника;
— они не умеют слушать, слышать и понимать людей;
— у них нет критического и структурного мышления;
— они не умеют работать в команде.
Работодатели часто считают, что новичка несложно научить SQL, основным нотациям и другим хардам. А вот учить софтскилам — сложнее и дольше.
На основе опроса Практикум разработал курс для бизнес-аналитиков. Он помогает прокачать харды и софты, которых ждут от новичков работодатели. Студенты проведут около 20 интервью, соберут и опишут требования клиентов, презентуют решения и рассчитают финансовую выгоду. А ещё — поработают в паре с системным аналитиком.
→ Курс можно попробовать бесплатно. Если захотите продолжить — до января включительно действует ранняя цена.
Data Science | Machinelearning - самый большой русскоязычный канал с полезными материалами на такие темы как, Machine Learning, Data Science, Алгоритмы, Python. Так же часто публикуются крутые 🔥 вакансии.
👉 Вам сюда: @devsp
А любителям читать статьи в оригинале вот сюда:
👉 @ds_international
Добро пожаловать!
❔❔❔⚠️Пройдите тест на углубленные знания в сфере Machine Learning. Professional
🧑💻Вырвитесь из однотипных задач. Освойте продвинутые подходы.
Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на углубленном курсе - «Machine Learning. Professional»
⏰ Время прохождения теста ограничено 30 минут
📌 РЕЗУЛЬТАТ ПРОХОЖДЕНИЯ КУРСА:
Серьезное портфолио с проектами и возможность претендовать на Junior+ и Middle позиции Data Scientist
🖌ПРОЙТИ ТЕСТ:
https://otus.pw/ZP7D/
Курс «Английский для аналитиков» от Яндекс Практикума
Для специалистов, которые хотят изменить свою профессиональную жизнь и работать в международной команде. Обучение построено вокруг рабочих ситуаций и полезных для карьеры навыков:
• Самопрезентация. Рассказ о своей роли, задачах, сфере ответственности на поведенческом интервью и в неформальной беседе.
• Работа в команде. Стендапы, планирование спринтов, демонстрация навыков командной работы на собеседовании.
• Общение с заказчиками и исполнителями. Сбор требований у стейкхолдеров и постановка задач для разработчиков.
• Презентация результатов работы. Выступление на митапах, неформальное общение с коллегами из отрасли.
• Обсуждение решений по проекту. Генерация и аргументация идей, участие в мозговых штурмах.
• Рефлексия и самоанализ. Ретроспектива, ревью, ответы на сложные вопросы.
Запишитесь на бесплатную консультацию. Определим ваш уровень языка, расскажем про обучение и ответим на все вопросы
Знаете Python и имеете базу в аналитике данных? Поможем освоить машинное обучение и выйти на новый уровень.
На курсе Start ML за 7 месяцев объясним, как устроены алгоритмы машинного обучения, и научим применять их на практике. Опытные аналитики и ML-инженеры из Яндекса и Райффайзен расскажут, как обучать модели и нейронные сети, а также оценивать их влияние на ключевые бизнес-метрики с помощью статистики и A/B-тестов.
Благодаря курсу вы расширите свои компетенции аналитика и сможете применять продвинутые методы для решения ваших рабочих задач. В конце обучения вы создадите собственный ML-сервис — рекомендательную систему социальной сети, которая поможет закрепить все полученные знания.
Попробуйте бесплатную демоверсию на сайте, а также записывайтесь на ближайший поток курса до 9 декабря —
по промокоду DAML15 дарим скидку 10%.
🖥 Математическая модель предсказала лидера ЧМ по футболу в 2022 году
Математическая модель учитывает данные прошлых лет и показатели сборных.
Дисклеймер: не используйте модель для ставок на спорт, ради бога! Это всего лишь математика, развлечение для гиков, а не оракул, которому можно безусловно доверять. Реальность куда более непредсказуема, поэтому поберегите свои деньги.
❤️ Читать
@data_analysis_ml
Системный аналитик и бизнес-аналитик — современные IT-профессии, в которых умение слушать и понимать людей нужнее, чем техническое образование. Узнайте, чем они отличаются и что вам больше подходит.
→ Бесплатные вебинары Яндекс Практикума, 5 и 6 декабря в 19:00
5 декабря обсудим системных аналитиков.
Вести вебинар будут эксперты:
◾️ Маргарита Нижельская
Ex-head of system analyst в компании МегаФон.
◾️ Дмитрий Столяров
Ведущий инженер-аналитик в компании Диасофт.
Они на понятных примерах расскажут:
— чем занимаются системные аналитики,
— почему они сейчас нужны на рынке,
— в каких компаниях работают,
— кому подойдёт профессия,
— какие навыки нужны младшему системному аналитику.
6 декабря обсудим бизнес-аналитиков.
Вебинар проведут
◾️ Екатерина Якимова
Руководитель группы аналитиков в компании «Цифровая индустриальная платформа»
◾️ Артём Исакин
Руководитель трудоустройства направления анализа данных.
На примере вакансий и тестовых заданий она разберёт задачи бизнес-аналитиков и расскажет, в чём их отличие от системных аналитиков. А ещё — обсудим, сколько получают бизнес-аналитики, нужны ли они сейчас на рынке и какие навыки освоить для старта в профессии.
После вебинаров можно будет задать вопросы спикерам.
→ Зарегистрироваться на вебинар
⁉️ Что входит в зону ответственности системного аналитика в текущих реалиях? Какие требования предъявляют команды и компании к системному аналитику?
📌 Узнайте 19 декабря в 20:00 мск на открытом уроке онлайн-курса «Системный аналитик. Advanced» в OTUS.
👉 Тема вебинара: «Профстандарт РФ «Системный аналитик» 2.0. Нужен ли он нам?»
🔸 В 2022 году, при разработке новой версии профстандарта системного аналитика рабочая группа постаралась ответить на эти вопросы. Уточнили цель деятельности, включили работы проектирования и условия продуктовой разработки. Перегруппировали трудовые функции, знания и умения.
🔥 На вебинаре попробуем разобраться, поможет ли профстандарт системным аналитикам-практикам, и если да, то как.
💣 Для регистрации на вебинар пройдите вступительный тест
Реклама. Информация о рекламодателе на сайте www.otus.ru
🔥 Онлайн показ проектных работ
Приглашаем 20 декабря в 18:00 на онлайн показ проектных работ от выпускников курса «Machine Learning. Professional» от OTUS — https://otus.pw/OAdA/
⚠️ У вас есть возможность спросить напрямую у выпускников и руководителя курса Марию Тихонову о программе и посмотреть на проекты, которые вы тоже сможете реализовать после обучения.
На вебинаре вы:
➖Получите представление, как и какие задачи вы сможете решать после курса.
➖Познакомитесь с форматом и преимуществами обучения от вчерашних студентов.
➖Узнаете, насколько полезным и интересным было обучение.
🟡 Пройдите вступительный тест, чтобы записаться на урок
https://otus.pw/OAdA/
💣 Как парсить сайты с помощью Python?
🗓 Узнайте 14 декабря в 18:00 на открытом уроке «Парсинг данных: собираем датасет своими руками».
👉 Занятие пройдет для для DS/ML-специалистов в рамках онлайн-курса «Natural Language Processing (NLP)» от OTUS.
💻 Что вас ждет на вебинаре?
🔸 Узнаем, как можно собирать датасеты методами Python.
🔸 Обсудим, какие существуют библиотеки для парсинга данных, практические методы парсинга данных.
🔸 Научимся парсить сайты с помощью Python и собирать датасеты из открытых источников.
🦾 Спикером выступит Мария Тихонова, руководитель курсов по ML в OTUS и специалист по анализу данных в команде AGI NLP в SberDevices.
🔥 Зарегистрируйся на занятие - https://otus.pw/gL9OR/
Реклама. Информация о рекламодателе на сайте www.otus.ru
Давно мечтаете освоить Python? Попробовать профессию аналитика данных? Или, может быть, изучить все разделы Data Science?
🎄Новогодняя пора – отличный повод для осуществления своих желаний.
🎁 Мы подготовили для вас подарок: скидка 10% на программы Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ при условии заключения договора до 31 декабря 2022:
Курс «Python для автоматизации и анализа данных» стартует 7 февраля. Стоимость со скидкой – 63 000₽.
Профессия «Специалист по Data Science» стартует 14 февраля. Стоимость со скидкой – 418 500₽.
Профессия «Аналитик данных» стартует 22 февраля. Стоимость со скидкой – 351 000₽.
🤖 НИКАКИХ СОБАЧЕК
На финтех-форуме мы показывали животных. А как строим финтех — расскажем на Alfa Digital Open.
Где? Онлайн, 13 декабря. Каждый год мы рассказываем про наши новые digital-сервисы, технологии и людей, которые делают Альфу 🧑🏻💻👩🏻💻
Что обсудим:
— Как перезапустили мобильный банк Альфа-Онлайн за месяц, а не за год.
— Как научили нейросети распознавать мошенников в 3 раза лучше людей.
— Сколько раз мы ошибались, пока делали приложение для сотрудников 📱
Это бесплатно? Да. Мы делимся знаниями бесплатно.
Где записаться? Прямо сейчас на сайте 👈
@alfabank
⭐️ По прогнозам Research Guru, к 2028 году рынок мобильной разработки достигнет $25 млрд. С 2022 по 2028 год годовой темп роста составит 39,9%. Представляем подборку каналов по мобильной разработке для быстрого старта в професии.
📱 APP DEV - быстрый вход в мобильную разработку. Практика, советы от профи, полезные инструменты.
🖥 Android разработка - бесплатный авторский канал, который научит созданию приложений.
🖥 React - создание технологичных приложений на React.
🖥 Java/Kotlin - здесь собраны отборные гайды и материалы по java разработке.
🖥 GitHub для аналитика данных: репозитории по Data Science, визуализации данных и глубокому обучению
Гитхаб — это не просто площадка для хостинга и совместной разработки IT-проектов, но и огромная база знаний, составленная сотнями экспертов. К счастью, сервис предоставляет не просто инструменты для работы с открытым исходным кодом, но и качественные материалы для обучения. Мы выбрали некоторые популярные репозитории и отсортировали их по количеству звезд в порядке убывания.
Эта подборка поможет разобраться, на какие именно репозитории стоит обратить внимание, если вас интересует работа с данными и сфера глубокого обучения.
➡️ Читать
@data_analysis_ml
📌 12 бесплатных материалов по статистике – разберется каждый
Многие из ошибок, совершаемые аналитиками, да и не только аналитиками, но и продактами, предпринимателями, маркетологами вызваны непониманием концепций статистики, что приводит к запуску неправильного теста или неправильной интерпретации результатов.
Поэтому тут подборка материалов, которые помогут разобраться (бесплатно все, кроме книг – их возможно придется приобрести).
➡️ Читать дальше
@data_analysis_ml
⭐️ Как предсказывать загрязнение воздуха с помощью нейросетей
Кратко о данных. Специальное оборудование производило замеры содержания в воздухе различных газов и взвешенных частиц, температуры воздуха, скорости ветра, атмосферного давления, даты и времени. Измерения производились каждые 20 минут в течении полутора лет. Следовательно, датасет содержит около 34 тыс. строк.
После осмотра файлов выяснилось, что в данных присутствуют сбойные измерения, от этих строк необходимо избавиться.
➡️ Читать дальше
@data_analysis_ml
🖥 Pandas и Python: Советы и рекомендации по науке о данных и анализу данных
Здесь мы приведем все приемы и советы Pandas и Python, которые вы можете использовать в дальнейшем в своих проектах.
Содержание разделено на два основных раздела:
- Трюки и советы Pandas относятся только к Pandas.
- Трюки и советы на Python, связанные с Python.
Также предоставляются видео с канала YouTube. Каждое видео охватывает примерно два или три трюка одновременно.
➡️ Читать дальше
@data_analysis_ml
✔️ Список 50 бесплатных курсов по Data Science и аналитике данных
Сохраняйте себе и делитесь, чтобы не потерять.
➡️ Список
@data_analysis_ml
✔️ readysetdata: набор скриптов для очистки определенных наборов данных.
git clone https://github.com/saulpw/readysetdata.git
cd readysetdata
🖥 GitHub
@data_analysis_ml
🏓 PYTHON CHARTS - энциклопедия визуализации данных.
Проект поможет вам научиться или прокачать навыки визуализации данных с помощью графиков, созданных в matplotlib, seaborn, plotly и других инструментах. Вы также найдете готовые инструкции по созданию конкретных примеров графиков и диаграмм.
✅️ Python charts
@data_analysis_ml
20 Бесплатных курсов, чтобы научиться делать дашборды
➡️ Читать дальше
@data_analysis_ml
⭐️ Почему точные модели не всегда полезны
Для начала позволю себе заметить, что в интернете есть много качественного технического контента, посвященного оцениванию моделей. Такие метрики, как F1-score (гармоническое среднее), MSE (средняя квадратическая ошибка), MAE (среднее абсолютное отклонение), Huber Loss (функция потерь Хьюбера), precision (точность), recall (полнота), cross-entropy loss (потери перекрестной энтропии) и многие другие, детально описаны на различных платформах. Однако эти метрики обычно фокусируются на подгонке модели к данным, а не на оптимизации ее для конкретного бизнеса.
Чего зачастую не хватает, так это инструментов экономического анализа для оптимизации полезности модели. Полезность определяется просто как удовольствие или ценность, которые клиент может получить от услуги — в данном случае от модели МО.
Хотя эта концепция не преподается будущим специалистам МО, я уверен: экономический анализ и оценка полезности имеют большое значение для создания практичных и долговечных моделей в реальном мире. Пока все заинтересованные стороны (технические и нетехнические работники) совместно не создадут экономический слой МО-модели, бизнес-ценность и предельную полезность машинного обучения можно считать неопределенными.
Примечание. Эта публикация предназначена для технических МО-специалистов, а также для менеджеров по продуктам и менее технически подготовленных заинтересованных лиц, работающих с ИИ-продуктами. Здесь будет немного математики, но в заключительный раздел включены высокоэффективные концептуальные шаги.
➡️ Читать дальше
@data_analysis_ml