Telegram-канал tobeanmlspecialist - Стать специалистом по машинному обучению: Unsorted

Стать специалистом по машинному обучению

25 Dec 2023 15:17

Евгений Соколов. Как преподавать и изучать компьютерные науки

Стать специалистом по машинному обучению

21 Dec 2023 10:24

Привет, друзья!

Прошло чуть больше месяца с момента старта MLBookClub - клуба, посвященного чтению книг по машинному обучению. Хочу поделиться некоторыми итогами и мыслями за этот месяц.

Для чтения клубом была выбрана книга Себастьяна Рашки "Python и машинное обучение". Самым активным читателям удалось за этот месяц продвинуться до 7-й главы (примерно треть книги). Изначально планы были читать бодрее, но книга оказалась не самого начального уровня и подразумевает довольно крепкую математическую базу. Соответственно, в процессе пришлось обращаться к другим источникам, чтобы разобраться с тем, отчего MSE, вдруг, становится лосс-функцией, что за правдоподобие и как из него можно вывести функцию потерь, как работает регуляризация, что за матрица рассеяния и так далее.

Вот, для примера вопросы, рассмотренные в одной из глав книги:

1. Обучение простых ML-алгоритмов для классификации

- Первые идеи относительно нейронных сетей
- Формальное определение искусственного нейрона
- Правило обучения персептрона
- Реализация алгоритма обучения персептрона на Python
- Методика OvA для многоклассовой классификации
- Сходимость персептронов
- Адаптивные линейные нейроны и сходимость обучения (Adaline)
- Минимизация функции потерь с помощью градиентного спуска
- Реализация алгоритма обучения Adaline на Python
- Подбор гиперпараметров
- Улучшение градиентного спуска посредством масштабирования признаков
- Стохастический градиентный спуск
- Мини-пакетный градиентный спуск

В процессе было несколько активных дискуссий, в которых участники клуба делились своим видением освещаемых тем и дополнительными источниками, в которых некоторые аспекты раскрываются подробнее.

Вообще, у меня пока двойственное ощущение от книги. С одной стороны есть неплохая структура, помогающая систематизировать свои знания, а с другой как-будто многое дается очень поверхностно. Видимо, подразумевается, что читатели откуда-то из математики должны хорошо себе представлять все эти методы. Но даже не смотря на это ощущение я, в целом, оцениваю чтение книги как довольно полезное занятие, укрепляющее фундаментальные знания, и направляющее в сторону изучения непонятных моментов.

За месяц провели 4 онлайн-встречи клуба, во время которых делились впечатлениями от прочитанного и отвечали на вопросы друг друга.

Также за месяц было смонтировано 3 подкаста (очередной ожидается завтра). Кажется, давно такой кучности выпусков не было. И еще один в этом году точно выйдет. Это тоже стало возможным благодаря клубу и хорошему специалисту по монтажу, который снял с меня нелегкий труд постпродакшна.

Помимо конспекта книги в репозитории клуба появились некоторые дополнительные полезные материалы, включая основы LaTeX для красивого оформления формул в конспекте, некоторые тонкости работы с Jupyter Notebook и настройку удаленного доступа к Jupyter через SSH.

Большинство участников клуба решили продлить участие в клубе, что также может свидетельствовать о том, что участники находят пользу для себя в таком участии. Но также есть и те, кому формат не подошел или кто не смог выдерживать темп чтения.

Если вы желаете присоединиться к клубу, чтобы читать и обсуждать умные книги по машинному обучению с умными людьми, пожалуйста, ознакомьтесь с условиями (пост 1, пост 2) и подавайте заявку на вступление. Будем рады новым участникам!