tobeanmlspecialist | Unsorted

Telegram-канал tobeanmlspecialist - Стать специалистом по машинному обучению

8249

Канал о машинном обучении для людей Рассказываю о последних трендах в ML, учусь разбираться в терминах вместе с вами. Для разбора теории приглашаю профессионалов. Подкаст: https://mlpodcast.mave.digital С вопросами и предложениями пишите @kmsint

Subscribe to a channel

Стать специалистом по машинному обучению

Евгений Разинков начал читать новый курс по машинному обучению "AI: от основ до трансформеров", в котором отошел от своей предыдущей практики четкого разделения курсов по классическому ML и DL, а решил совместить в одном, в связи с тем, что алгоритмы классического машинного обучения хоть и красивы с точки зрения математики, очевидно, проиграли трансформерам, которые захватили власть в ML последние несколько лет. Вводная лекция здесь.

Читать полностью…

Стать специалистом по машинному обучению

Один из моих любимых ютуберов пару дней назад выложил ролик по мотивам статей и интервью Элиезира Юдковского об искусственном интеллекте. Неплохой обзор, дающий понимание почему многие специалисты по ИИ, таки, опасаются этого самого ИИ. Если вам заходит такое популярное изложение - рекомендую.

https://youtu.be/fJOPGbbqMvw?si=ufeWHeyXRbmXbD-X

Читать полностью…

Стать специалистом по машинному обучению

Исходя из своего опыта обучения, я заметил, что самый эффективный способ - это решать задачи, которые нужно решить :) Ну, то есть не столько учебные и рафинированные, сколько реальные. Приведу пример.

Как-то я поймал себя на том, что вообще не понимаю как работает командная строка. Просто магия какая-то: пишешь какие-то буквы, наверное, что-то происходит, появляются еще какие-то буквы. Иногда желаемое достигается, а иногда нет. Первым озарением было то, что первым словом в командной строке нужно писать либо программу, либо встроенную команду самого терминала. Именно эта программа (команда) будет выполнена. И понимание даже такой простой вещи радикальным образом улучшило мой опыт взаимодействия с командной строкой.

Оказывается, если почему-то не запускается python-скрипт с помощью команды python <скрипт>, то, возможно, под именем python находится совсем не тот интерпретатор, который в виртуальном окружении. И оказывается, чтобы запустить скрипт нужным интерпретатором можно вместо python <скрипт> написать <полный путь до интерпретатора> <скрипт>. То есть первым ключевым словом в командной строке может быть не только название программы или встроенной команды, но и полный путь до нужной программы, если терминал не знает, где ее искать. Вот, вроде бы мелочь, а я постоянно сталкиваюсь с непониманием этого момента у многих начинающих инженеров.

Вторым открытием было то, что цифры после команды chmod - это закодированное в восьмеричной системе представление строки с правами -rwxrwxrwx (первая группа символов rwx - это права пользователя, вторая - права группы, а третья права остальных). И сразу все стало понятно! А то пишешь chmod 600 - вроде, работает, но что за число такое 600? Почему именно его выбрали? Полностью схему преобразования строки с правами в число приводить не буду, пост не об этом, но если вы не знали о таком кодировании - рекомендую разобраться, прям, ощущение того, что перешел на новый уровень игры не покидает долго. И таких открытий происходит довольно много именно, когда решаешь реальные задачи, а не просто набираешься теоретических знаний ради теоретических знаний.

И, вот, как я уже сказал выше, самый эффективный способ учиться - решать реальные, а не учебные задачи. Учебные тоже хорошо, но только на этапе, когда совсем ничего непонятно и надо упростить порог входа, но затем как можно быстрее нужно переключаться на реальные.

Хочу поделиться тем, как лично я ускорил свой собственный прогресс в изучении сразу целого спектра технологий. Я нашел старенький компьютер за копейки, накатил на нем Ubuntu и настроил к нему доступ по SSH, получив свой собственный сервер. По ходу настройки пришлось решить миллион сопутствующих задач. Разобраться в том как увидеть по SSH этот компьютер в домашней сети. Как настроить роутер так, чтобы без выделенного провайдером IP адреса получить по SSH доступ к этому компьютеру, не находясь в домашней сети. Как удаленно устанавливать сервисы в докере, как устанавливать и настраивать без докера. Как смотреть логи, как перезапускать systemctl и так далее и так далее. А запустить свою модель на видеокарте, которая плохо поддерживается контрибьюторами библиотек - тот еще челлендж, но зато потом прекрасно понимаешь почему карты Nvidia RTX так дорого стоят и, в принципе, перестаешь от этого расстраиваться. Вот, фиг бы я всему этому научился по книжкам или ютуб-роликам. Книжки и ютуб-ролики хорошо ложатся на практику. Потыкался-потыкался, что-то получилось или нет, пошел посмотрел как другие делают и как правильно надо. Вот, тогда это работает, прям, отлично.

Возможно, кто-то спросит: а зачем все это админство нам, специалистам (или будущим специалистам) по ML? У нас же фит-предикт, а всей инфраструктурой пусть девопсы занимаются и прочие эникейщики. А я отвечу, что ситуации бывают самые разные и важно не столько досконально знать как решается та или иная задача вне вашей области компетенции, а знать куда копать, если рядом никого нет, кто может решить задачу за вас. А такая интуиция появляется после того, как лично потрогал ручками весь пайплайн, начинающийся задолго до фит-предикта.

Читать полностью…

Стать специалистом по машинному обучению

Наткнулся на канал Виталия Кулиева - практика от ML, который делится своим опытом. Незаслуженно мало просмотров у таких насыщенных информацией роликов. Ролики дают как понимание общей картины того, что есть машинное обучение, так и частные полезные сведения. Темп, правда, у Виталия замедленный, что заснуть можно. Но скорость x1.5 или x2.0 решает вопрос.

Есть ролики, посвященные выбору железа для тренировки моделей. Есть туториалы как файнтюнить модели, есть разбор вопросов на собеседовании. В общем, полезный kuliev.vitaly">канал.

Читать полностью…

Стать специалистом по машинному обучению

Хорошим способом "пощупать" современный искусственный интеллект является взаимодействие с моделями на базе Stable Diffusion. Их уже существует в свободном доступе большое количество. И уже довольно неплохо развита инфраструктура вокруг них: появляется все больше сопутствующих сервисов, типа, готовых картинок и примерных промтов для них, генераторы промптов, на заданную тему, туториалы по файнтюнингу моделей и многое другое.

Возможно, многих отпугивает то, что нужна нормальная видеокарта от Nvidia, цена на которую только начинается от 20000 рублей. Но спешу вас успокоить. Во-первых, даже на процессоре можно запустить, хотя это и будет мучительно долго. На генерацию одной картинки уходит до получаса. А во-вторых, сейчас майнеры усиленно избавляются от своих видеокарт и продают их за копеечные цены. Так, я для экспериментов купил по объявлению на авито карту RX580 за примерно 5000 в отличном состоянии и теперь генерация одной картинки размером 512x512 занимает от 20 секунд до 1.5 минут, в зависимости от настроек.

Для того, чтобы погрузиться в этот мир - пришлось оживить старый комп сборки 2012 года, на котором еще стояла 32-разрядная система Windows 7 и было видно только 2 ядра процессора из 4-х реальных. В комментарии к посту я прикладываю несколько изображений, которые сгенерировал минут за 10 через различные вариации промта "machine learning podcast".

А еще один плюс работы с такими моделями - там нет фильтров, которые делают модели тупее. Если вам нужно NSFW - пожалуйста, вы сами, как взрослый, можете отвечать за свой выбор, а не пользоваться тем, что решили корпорации, представляя нас с вами маленькими неразумными детьми.

Если интересно попробовать - вот некоторые полезные ссылки:
1. Видеомануал по установке Stable Diffusion WebUI, если у вас видеокарта от AMD. Мануал рабочий, проверил.
2. Предобученные модели на huggungface
3. Предобученные модели на civitai
4. Сайт для вдохновения, чего бы запросить у нейросети
5. Промт-генератор
6. XpucT">Ютуб-канал, на котором можно почерпнуть много полезного о том, как с помощью подбора и коррекции промтов добиваться желаемого

Ну, а если вы уже творите с помощью Stable Diffusion и ей подобных - присылайте ваши картинки в комментарии к посту. Будет интересно посмотреть.

Читать полностью…

Стать специалистом по машинному обучению

Данила Медведев. Риски ИИ

Читать полностью…

Стать специалистом по машинному обучению

Кое-как доделала вторую часть презентации с планом обучения Machine Learning с нуля, за ноль рублей.

Первую часть, где рассказано про то, где можно получить базу в плане математики и программирования, можно увидеть здесь. Ну, а в только что дописанной второй части (см. вложение) раскрывается следующая часть учебного плана: а именно, какие бесплатные курсы, лекции и дополнительные материалы использовать, чтобы изучить классические алгоритмы машинного обучения (Classic ML) и глубокое обучение (DL).

#учебные_материалы

Читать полностью…

Стать специалистом по машинному обучению

По-любому кто-нибудь где-нибудь сейчас собирает датасет и тренирует модельки на успешных случаях мошенничества и социального инжениринга и мы все чаще будем становиться жертвами разводняков самого разного уровня. И анти-мошеннические системы как всегда будут, в основном, только догонять, редко когда срабатывая на опережение появления новых схем.

Буквально полчаса назад сам чуть не попался на красивый развод. Постучался ко мне в личку некто, представившийся админом паблика про новости технологий и предложил взаимопиар. Я глянул, что у него довольно живой канал и под 30000 пользователей, и у каждого поста за последние несколько месяцев по 6-10 тыс. просмотров. Думаю, как-то странно, зачем ему с таким количеством пользователей взаимопиар с очень небольшим каналом. Ну, я такой вопрос и задал. Он пишет: "А какой у вас канал?". Я послал ссылку и написал, что как-то странно предлагать взаимопиар админу канала, который ты не смотрел. Он ответил: "Ну, мне помощники сделали подборку админов интересных каналов, я им напрямую сейчас пишу, просто ваш канал не посмотрел сразу. Канал у вас интересный, но я думал, что у вас аудитория больше. Недавно канал завели?". Я отвечаю: "Нет, уже года полтора веду или даже больше, просто почти не продвигаю как сам растет, так и хорошо". Он мне: "Хороший у вас канал. Я подпишусь". Я поблагодарил, а он мне пишет: "Хотите ваш канал прокламирую?". Я спросил про условия. Мне отвечает: "Вообще реклама у меня стоит 3200 за 2 часа, но сейчас место есть, могу за 1600 предложить". Ну и расписал, что если не придет как минимум 250 человек, то деньги вернет. Я думаю, интересное предложение, но у меня прямо сейчас на карте свободных 1600 нету.

И вы не поверите, ровно в этот момент в другом чате мне пишет мой клиент и делает заказ на 1630 рублей. Я думаю, ни фига себе совпадение! Как раз на рекламу хватает :) Пишу админу технопаблика и говорю, видимо, судьба готов купить рекламу. Только подтвердите мне, что вы админ этого самого паблика. Он мне говорит, там ссылка в описании паблика - можете посмотреть. Я захожу и вижу ссылку на аккаунт админа, вроде, все совпадает - нажимаю на ссылку - открывается точно такой же чат, как и тот, в котором я общался - все совпадает и картинка и описание, только чат новый. Я написал туда, но ответа не пришло. Я в первый чат, говорю, напишите мне с того аккаунта, который указан в паблике. Он мне присылает ссылку на чат в котором вы общаемся и говорит: "Вот по этой ссылке напишите мне и я отвечу". Ну, я уже понял, что меня разводят и вдруг все сообщения из чата пропали, я не успел заскриншотить.

Ох, намучаемся мы, когда ИИ изучит психологию и будет находить индивидуальные ключики к каждой потенциальной жертве.

Будьте бдительны!

PS. Клиент, который перевел 1630 к разводке отношения не имеет. Я уверен. Просто крутое совпадение.

Читать полностью…

Стать специалистом по машинному обучению

В теории вероятностей теорема Байеса является чуть ли не ключевой концепцией, имеющей множество практических применений. Мне стоило не малых усилий, чтобы более менее начать понимать как она работает. Жаль, что эта книга не попалась мне раньше. Сейчас освежаю в памяти байесовский подход и понимаю, что написано все довольно понятно и подробно.
Вероятностное программирование на Python

Читать полностью…

Стать специалистом по машинному обучению

Забыл выложить файл последнего выпуска подкаста. Исправляюсь

Читать полностью…

Стать специалистом по машинному обучению

https://youtu.be/jnFVmtaeSA0

Читать полностью…

Стать специалистом по машинному обучению

Если вы как и я пользуетесь подкастами, как одним из способов самообразования, могу порекомендовать хороший выпуск Теории Большой Бороды про основы статистики:
Посмотрите этот подкаст: 236: Почему статистика контринтуитивна и зачем ее нужно знать каждому https://ru.player.fm/1xpebp

Читать полностью…

Стать специалистом по машинному обучению

https://youtu.be/vzjzaM9745Y?t=920

Читать полностью…

Стать специалистом по машинному обучению

https://pikabu.ru/story/_8091525

Читать полностью…

Стать специалистом по машинному обучению

https://www.youtube.com/watch?v=QC73lKmJS0s

Читать полностью…

Стать специалистом по машинному обучению

А вы уже тоже успели поиграться? :) Качество, конечно, поражает. Впрочем, как и цены сервиса. Но, во-первых, думаю, это не надолго и появятся аналоги дешевле как только вау-эффект спадет, а во-вторых, есть возможность сделать тестовое видео до 2-х минут бесплатно.

Читать полностью…

Стать специалистом по машинному обучению

Короче, уверен, если вы последуете совету - найти старый комп, поставить на него линукс и практиковаться в решении ваших задач через удаленный доступ - вы обалдеете от прогресса. А ваша ценность как специалиста возрастет радикально!

P.S. Если старенького компа нет или вам не хочется возиться с железом - можно найти за очень небольшие деньги (примерно 500 руб в месяц) выделенный виртуальный сервер и практиковаться на нем. Но лично мне нравится наблюдать за железом, собранным своими руками :)

Читать полностью…

Стать специалистом по машинному обучению

В продолжение предыдущего поста. В одном из роликов Виталий говорит о важности для специалиста по ML умения работать с реляционными базами данных. Я целиком и полностью разделяю это мнение и сам уже какое-то время являюсь активным пользователем СУБД PostgreSQL. Какая же непростая и навороченная это система. По-тихоньку разбираюсь, помимо прочего, с помощью книг, которые есть в бесплатном доступе на postgrespro. Какие-то попроще и дают общее понимание, а какие-то для углубленного изучения.

В канале, посвященном постгресу есть рекомендация в какой последовательности читать эти книги:

"Начать стоит с «Первого знакомства». Ее можно прочитать за вечер-другой и получить какое-то примерное представление о реляционных базах и о Постгресе.
Затем методично изучить «Основы языка SQL». Это те знания, без которых невозможно полноценно работать с данными.
Две оставшиеся книги более сложные. «Основы технологий баз данных» — это теоретический фундамент. Ее надо пробовать читать, но быть готовым к тому, что ко многим местам придется возвращаться по нескольку раз. Идеально чередовать с практикой.
А «PostgreSQL изнутри» можно читать после того, как будет получен какой-то опыт работы с Постгресом и захочется разобраться, как он устроен."

Читать полностью…

Стать специалистом по машинному обучению

Мне кажется, что любому IT-специалисту не нужно объяснять важность владения командной строкой. Не так важно чем конкретно вы занимаетесь, так или иначе приходится сталкиваться с терминалом. Вот три источника, которые дают очень неплохое понимание как работает командная строка и операционная система Linux, в целом:

1. Книга "Командная строка LINUX" - автор Уильям Шоттс. Прикладываю в первом комментарии. Очень толково и по существу написана.

2. Бесплатный курс от Хекслета "Основы командной строки" - можно сразу попрактиковаться в эмуляторе терминала, не выходя из браузера.

3. Для тех, кто любит видео - очень хороший ролик "Разжёванный курс по Linux для чайников". Преподаватель, ну, очень толково все объясняет. Комфортно смотрится на х1.5

Лично я стал активно использовать командную строку после того, как прочитал первую часть книги Андрея Столярова "Программирование. Введение в профессию 1. Азы программирования", в которой он убедительно доказал, что с помощью командной строки можно очень эффективно управлять компьютером. Намного эффективнее, чем с помощью графического интерфейса. Эту книгу тоже прикладываю в комментариях к посту.

Читать полностью…

Стать специалистом по машинному обучению

Приветствую тех, кто любит учиться и при этом не верит в то, что курсы должны стоить дорого, и что за эти деньги его научат писать 100500 нейросетей за 3 дня и сразу трудоустроят с з/п 300кк/сек!

Кто меня читает давно - знают, что я сам "вечный студент" и много учусь на разных платформах. При этом я отдаю предпочтение, в основном, Степику, на котором, в последнее время, качественных курсов стало значительно больше, чем когда я несколько лет назад там зарегистрировался.

И я довольно долго ждал, чтобы кто-нибудь сделал хороший курс по асинхронности в Python, потому что тема не простая, но важная, а хороших материалов по ней днем с огнем. И так я долго ждал, что меня часто посещали мысли самому закрыть этот пробел. И, вот, наконец-то нашелся человек, который этот пробел закрыл! Я как-то уже рекомендовал курс от этого автора. Тогда это был курс по парсингу. Полезный курс, который меня научил эффективно автоматизировать процесс сбора данных для датасетов. До сих пор пользуюсь им как справочником.

Но сегодня не про парсинг, а про асинхронность. Если вы давно хотели разобраться с этой темой, то теперь появилась хорошая точка входа - курс Асинхронный Python от Павла Хошева. Я уже начал его проходить и могу сказать, что качество достойное! И Павел продолжает улучшать курс, добавляя новые материалы.

Мы с Павлом давно общаемся и он в очередной раз предложил скидку для подписчиков канала. Если вы решили разобраться с асинхронностью в Python с помощью курса Павла - воспользуйтесь промокодом MLPODCAST, который даст скидку 20% к итак очень демократичной цене.

В общем, рекомендую! Чтобы не получилось как на одной известной картинке (см первый комментарий к посту) Если она не кажется вам смешной, значит, тем более пора закрыть большой пробел :)

Читать полностью…

Стать специалистом по машинному обучению

Собрал исключительно из своего опыта изучения
https://docs.google.com/spreadsheets/d/14Kjx9O9PiNLYMugZxgtw0ELeHq2TWC14s4LM1KZESjQ/edit?usp=sharing

Я так скажу: истории про "Войти в Айти" - это во многом т.н. "инфобизнес", так как на собеседованиях надо знать ГОРАЗДО больше, чем рассказывают на курсах.

Читать полностью…

Стать специалистом по машинному обучению

Наверное, стажировки - это самый понятный и эффективный способ "вкатиться" в любую профессию. У кого еще получить первоначальный опыт, как не у тех, кто уже понимает рынок и делает для пользователей что-то полезное? Если бы у меня сейчас была цель устроиться на какую-нибудь новую для меня работу, в которой у меня есть только теоретические знания - я бы всеми правдами и неправдами пытался попасть на стажировку к лидерам рынка. Ведь после качественной стажировки тебе уже не смогут сказать, что ты совсем без опыта и найти работу мечты будет значительно проще.

Мы с ребятами из Яндекса решили запустить небольшой цикл ответов на вопросы про стажировки. Наверное, вы слышали, что они постоянно набирают стажеров, в том числе и по аналитике данных и по машинному обучению. На вопросы будут отвечать как HR-менеджеры, непосредственно отбирающие потенциальных стажеров, так и заказчики от бизнеса, которые точно знают какие специалисты им нужны. Так вот, чтобы этот цикл был максимально приближенным к жизни, мы решили предварительно собрать вопросы, которые интересуют будущих специалистов по машинному обучению и аналитике.

Задавайте ваши вопросы в комментариях к этому посту, а мы обязательно на них ответим в подкасте!

Читать полностью…

Стать специалистом по машинному обучению

Один из выпусков подкаста как-нибудь посвящу математике для машинного обучения. На ум приходят пока 2 возможных гостя - Воронцов и Райгородский. Но это попозже. Сейчас нашел статью на Хабре, которая мне понравилась с дорожной картой изучения математики. Делюсь.
https://habr.com/ru/post/432670/

Читать полностью…

Стать специалистом по машинному обучению

Ольга Перепелкина. Федеративное обучение

Читать полностью…

Стать специалистом по машинному обучению

https://youtu.be/-MUM0QflLOg

Читать полностью…

Стать специалистом по машинному обучению

Добрый вечер!

Появилась видеозапись четвертой лекции по курсу Computer Vision using Deep Learning на тему "Single-Shot Detector":
https://youtu.be/F5nMyPtCOdM

Лекция посвящена задаче обнаружения объектов и методу Single-Shot Detector (SSD). В рамках лекции рассмотрена архитектура SSD.

Обратите внимание, эти вопросы будут рассмотрены в следующей лекции:
- целевые функции SSD;
- особенности процесса обучения.

Читать полностью…

Стать специалистом по машинному обучению

Не смотря на вечернее время, не могу не поделиться наконец-то готовым выпуском подкаста :) Беседуем с Ольгой Перепелкиной Deep Learning Product Manager компании Intel о подходах к распознаванию эмоций, федеративном обучении (обучении на приватных данных) и карьере в ML. Интересного прослушивания!
https://anchor.fm/kmsrus/episodes/023-ML-eutiao/a-a58djp8

Читать полностью…

Стать специалистом по машинному обучению

Путеводитель по курсам (на степике в основном)

Читать полностью…

Стать специалистом по машинному обучению

Вот такой курс бесплатно выложили на UDEMY. Доступен, вроде, только сегодня.
https://www.udemy.com/course/data-analyst-powerbipowerpivotpowerquerypivotchartdax/?ranMID=39197&amp;ranEAID=*7W41uFlkSs&amp;ranSiteID=.7W41uFlkSs-UmAiXPGjQd1NaX1.iIpmFw&amp;utm_source=aff-campaign&amp;utm_medium=udemyads&amp;LSNPUBID=*7W41uFlkSs&amp;couponCode=1C98CD0372E441D65135

Читать полностью…

Стать специалистом по машинному обучению

Залипательный проект от Яндекса "Музыка звёзд". Можно послушать как "звучат" космические объекты, а в конце интересный рассказ о том, как это звучание было получено. Алгоритмы разные и без нейросетей не обошлось. Если хотите порелаксировать - рекомендую!
https://soundofstars.ru/

Читать полностью…
Subscribe to a channel