tobeanmlspecialist | Unsorted

Telegram-канал tobeanmlspecialist - Стать специалистом по машинному обучению

8249

Канал о машинном обучении для людей Рассказываю о последних трендах в ML, учусь разбираться в терминах вместе с вами. Для разбора теории приглашаю профессионалов. Подкаст: https://mlpodcast.mave.digital С вопросами и предложениями пишите @kmsint

Subscribe to a channel

Стать специалистом по машинному обучению

Кажется, ChatGPT теперь официально имеет "память". На первое сообщение в новом чате, помимо прочего, была выдана такая фраза:

Если у вас уже есть опыт работы с NATS (как я заметил ранее), FastStream может значительно упростить вашу разработку, добавив высокоуровневую абстракцию для работы с этим брокером сообщений.

Читать полностью…

Стать специалистом по машинному обучению

Авторы курса MSU.AI. Зачем учёному ML?

Читать полностью…

Стать специалистом по машинному обучению

В течение нескольких минут выложу свежий выпуск подкаста и так как в описании к выпуску не помещаются все ссылки, которые хотелось бы туда добавить - опубликую некоторые из них здесь. Это ссылки на кейсы, которые обсуждали:

1. Поиск артефактов на снимках (https://rutube.ru/video/0104fd24025dfe7ee85daf6d4dcfd99c/?r=wd).

2. Автоматическое детектирование клеток для теста Allium Cepa L (https://vk.com/video-204135333_456239379).

3. Использование нейронных сетей для измерения площади повреждения листьев фитофагами (https://rutube.ru/video/3a323cd4468f7be2d373be1f3cb0ae69/?r=wd).

4. Самоюстирующиеся оптические системы на основе машинного обучения с подкреплением (https://rutube.ru/video/0cf5bda51d1e07cc4eb005490b85ce58/?r=wd).

Читать полностью…

Стать специалистом по машинному обучению

Обалдеть! В детстве я очень любил группу Pink Floyd, слушал ее еще на кассетах и не знал не только как альбомы называются, но даже названия песен придумывались сами, в зависимости от контекста. Интернета, чтобы подсмотреть не было. Да, были такие времена еще совсем недавно.

Один из любимых альбомов у меня был Wish You Were Here. Название я узнал только через несколько лет, как приехал в СПб учиться, и во время прогулок общался с продавцами музыкальных ларьков, пытаясь объяснить какая музыка была на альбоме, который мне нравился. Первая песня там была Shine on Your Crazy Dimond, под которую я часто засыпал. Космическая музыка во время которой я постоянно представлял космос, странные сооружения на других планетах, людей будущего и так далее... В общем, нахлынули воспоминания 🙂

А нахлынули потому, что я наткнулся на YouTube-канал, на котором куча клипов группы Pink Floyd (и не только), сгенерированных нейросетями. И я просто залип. Как быстро наступило будущее. Кажется, еще только-только кассетные плейеры сменились дисковыми, а уже довольно неплохие клипы на любимые композиции генерируются почти автоматически...
https://www.youtube.com/watch?v=avISxwo8-Ao

Читать полностью…

Стать специалистом по машинному обучению

Приветствую, друзья!

Информация для тех, кому нужен условно быстрый и безусловно качественный путь в хардкорный ML и DS, в целом. Мой хороший товарищ и во многом учитель (я как-то писал, что его лекции на YouTube - это то самое недостающее звено между "ну, GPT - это просто T9 на максималках, а сейчас мы напишем простейшую линейную регрессию" и лекциями Воронцова) Евгений Разинков набирает второй поток на свою AI-школу “AI: от основ до языковых моделей”. Ниже репост с условиями.

Читать полностью…

Стать специалистом по машинному обучению

Хотите прикол? Из огромного списка шорткатов в VS Code (для macOS) нет, казалось бы, одного из самых востребованных - запуск python-скрипта. При этом шорткат для запуска в дебаг режиме есть. Энгельбарта на них не хватает :)

Лечится самостоятельным назначением сочетания клавиш. Надо зайти в панель Keyboard Shortcuts (Cmd + K + S), начать набирать в строке поиска run python file и через плюсик добавить нужное вам сочетание. Я пока поставил Cmd + R, потому что точно им не пользовался раньше и, даже что-то переопределив, потерял явно не много.

Читать полностью…

Стать специалистом по машинному обучению

Новость для тех, кто интересуется спортивным программированием: призовой фонд чемпионата Yandex Cup увеличился с 12,5 до 16 млн. рублей. Дополнительные 3,5 млн. распределятся между финалистами в ML-направлении: их число вырастет с 6 до 22 человек.

Востребованность ML-спецов с каждым годом растет, поэтому приятно наблюдать, что индустрия готова вкладываться в их развитие не только за рубежом.

Хабр

Читать полностью…

Стать специалистом по машинному обучению

Запись вчерашнего стрима о базовых инструментах начинающего разработчика. Речь об этом стриме.

Читать полностью…

Стать специалистом по машинному обучению

Привет, друзья!

Мы, тут, со Степиком договорились, что я во вторник проведу у них вебинар. У меня была давняя идея понизить порог входа для тех, кто уже знает основы любого языка программирования и может решать учебные задачки, но не понимает как от этих задачек перейти к реальному проекту. Выглядит это все немного по-инфоцыгански, но я постараюсь на вебинаре ничего не продавать (хотя бы в явном виде), а дать хорошее понимание куда двигаться дальше, чтобы новые знания основ приводили к полезному результату, который можно было бы пощупать и перед друзьями похвастаться.

Также хочу посвятить отдельный блок тому, что происходит вокруг программирования с учетом феноменального роста качества больших языковых моделей. Степик почему-то сократил предложенное мной описание вебинара (надеюсь, им виднее), поэтому здесь оставляю первоначальное для понимания полного пайплайна того, что будет происходить.

Как от задачек на знание синтаксиса языка перейти к реальным проектам?

Пошаговый план создания своих проектов на примере телеграм-ботов.

Я четко помню то состояние, когда, вроде, уже довольно неплохо научился решать задачки на программирование, но при этом вообще не понимаешь как эти знания применить для написания реальных проектов. Это я, что ж, не программист что ли? Наверное, именно тогда я осознал, что программисту недостаточно знать какой-нибудь язык, нужно еще много дополнительных знаний и вспомогательных инструментов.

На вебинаре я расскажу о том, какой необходимый минимум этих инструментов требуется разработчику и какие задачи нужно будет решать с их помощью.

Посоветую эффективные пути для овладения инструментами и дам общее представление о том, как все это должно работать в связке с другими инструментами.

Поделюсь важными мыслями о том, чего следует делать разработчику, а чего лучше избегать.

Объясню почему нужно брать готовые решения, а не пилить свои велосипеды.

Расскажу о том, что современные исследователи искусственного интеллекта думают о будущем разработки и стоит ли вообще тратить время на изучение программирования.

Мы рассмотрим:

- Как выбрать редактор кода для полноценной работы над проектом
- Зачем нужно изолировать проекты друг от друга и какие средства для этого существуют
- Почему разработчику, скорее всего, придется столкнуться с ОС Linux, даже если он не горит желанием
- Где хранить код и зачем его версионировать
- Почему почти не реально встретить проекты без базы данных и зачем сразу брать в проект хорошую, надежную и масштабируемую СУБД
- Что такое очереди и как они решают задачи восстановления состояния сервиса, даже если тот временно в коме
- Стоит ли в первый проект брать докер, если итак "сложнааа"
- Как взрослые дяди программисты автоматизируют развертывание проекта на удаленном сервере
- Почему телеграм-боты - это хороший старт, чтобы почувствовать себя настоящим программистом
- Зачем создавать своих собственных автоматических помощников
- Как ускорить обучение и получить первые заказы, пока их ещё не отобрал ИИ

Кому будет полезен вебинар:

- Начинающим разработчикам, которые уже имеют некоторую базу, но знания пока разрознены и не очень структурированы
- Тем, кто хочет от решения синтетических учебных задач перейти к реальным
- Тем, кто присматривается к телеграм-ботам, но не уверен стоит ли этим заниматься

Кто ведет вебинар:

Михаил Крыжановский. Python-разработчик, автор Machine Learning Podcast, автор (и соавтор) курсов по телеграм-ботам на Степике.

Когда:

Вторник, 29 октября 2024 года, 18:00 по МСК.

Читать полностью…

Стать специалистом по машинному обучению

Екатерина Кондратьева. ML в медицине и легко ли стать радиологом

Читать полностью…

Стать специалистом по машинному обучению

🗣«Люди в RPA» — это не просто митап, а площадка для обсуждения актуальных проблем и возможностей в роботизации процессов.

X5 Tech и Газпромбанк.Тех меняют парадигму конференций по роботизации — время отойти от обычного обсуждения преимуществ роботизации перед другими подходами и сосредоточить внимание на тех, кто сегодня задает вектор развития этого направления.

Целевая аудитория — разработчики RPA, у которых в фокусе внимания реальные вопросы развития технологии:

🫥 Управление командами роботизации — чем отличается организация RPA-разработки от других продуктовых команд;
🫥 Citizen-разработка — разработка RPA-решений силами линейных сотрудников: коллеги поделятся опытом и успехами такого подхода, обсудят риски и перспективы развития;
🫥 Развитие отечественных платформ роботизации — представители ведущих платформ поделятся своим видением текущей ситуации и расскажут, как они адаптируют свои решения под требования разработчиков;
🫥 Квалификационный стандарт RPA — тимлиды RPA вместе обсудят, какими навыками должен обладать сотрудник в начале пути и к каким вершинам должен стремиться в профессиональном росте.

28 октября проведем дискуссию, которая станет началом детального обсуждения поднятых вопросов с пользой для сообщества разработчиков RPA.

⚡️ Увидимся в офисе Газпромбанк.Тех по адресу: Москва, ул. Коровий Вал, 5, БЦ «Оазис» 28 октября

Сбор участников офлайн с 13:00
Начало трансляции онлайн в 14:00

Зарегистрироваться на митап «Люди в RPA»

Реклама, Банк ГПБ (АО), ИНН: 7744001497, erid: 2VtzqxCY5Kq

Читать полностью…

Стать специалистом по машинному обучению

Два или три года назад у меня был подкаст, посвященный федеративному обучению - методу машинного обучения, при котором по сети пересылаются веса моделей, но не сами данные. Часто данные могут быть конфиденциальными и/или довольно чувствительными и передавать их сторонним организациям не только небезопасно. При этом все-таки хотелось бы на таких данных обучать и тестировать модели, потому что ML и здесь может как минимум оптимизировать затраты, а как максимум спасать жизни, если речь идет, например, о медицинских данных. Ну, и смысл подхода в том, что обучение происходит на инфраструктуре той же компании, что хранит данные, в результате чего появляются веса обученной модели, которые уже можно пересылать относительно безопасно. Относительно - потому что во-первых, сами модели могут представлять ценность и их утечка может быть сравнима с потерей интеллектуальной собственности, а во-вторых, существуют попытки вытаскивания реальных данных из моделей и от этого тоже нужно предпринимать меры.

И, вот, с записи того подкаста я особенно не следил за развитием темы. Ну, наверное, да, раз технология есть - кто-то ей пользуется, но каких-то громких кейсов не попадалось. И, вот, прошла новость об успешном эксперименте по созданию модели распознавания патологий сердца на снимках ЭКГ методом федеративного обучения. В эксперименте участвовали Первый Московский государственный медицинский университет имени И. М. Сеченова, Институт системного программирования Российской академии наук и центр технологий для общества Yandex Cloud. Полез я искать информацию о том, насколько это вообще частая практика и почему это названо экспериментом, а не используется повсеместно. И, видимо, потому и эксперимент, что этот случай пока единственный в России в рамках обучения на медицинских данных.

По цифрам следующее:

- Обучение было проведено на датасете из 57 тысяч двенадцатиканальных ЭКГ: 22 тысячи от ИСП РАН и 35 тысяч от Сеченовского Университета и ИКТИ РАН.

- Модель научилась диагностировать фибрилляции предсердий по ЭКГ.

- Чувствительность (способность правильно выявлять людей, у которых есть заболевание) модели составила 99%, а специфичность (способность правильно определять тех, у кого нет заболевания) — 95%. Что считается довольно хорошими показателями для моделей данного типа.

Насколько я понял, этот эксперимент теперь открывает дорогу к тому, чтобы организации своими данными могли внести вклад для общей пользы отраслей, где имеют дело с чувствительной информацией — не только медицины, но и финансов, промышленности.

Читать полностью…

Стать специалистом по машинному обучению

Выложили доклады с Practical ML Conf, а я обещал немного подробнее рассказать про те, которые мне особенно понравились. Начну, пожалуй, с первого. Но сначала небольшой дисклеймер.

Я уже довольно плотно использую LLM для написания кода. Первой пробой был, конечно, Copilot, но тогда меня это не очень впечатлило (медленно работало и исправление кода, написанного моделью, занимало больше времени, чем самостоятельное написание подобного кода). Сейчас, разумеется, качество серьезно улучшилось, но я уже перешел на другие инструменты и пока к Copilot не возвращался. Затем у меня были эксперименты с сервисом Faux Pilot, который подразумевает поднятие сервера со своей моделью и настройку редактора кода для взаимодействия с ней. Качество было хуже Copilot, работало медленнее и я не подобрал какую-то модель, которая бы меня устраивала. Дальше шел период, в который я вообще не пользовался моделями, непосредственно в редакторе кода. Я просил писать нужные мне функции и методы у ChatGPT. Вот это уже прижилось. А с выходом o1 я, прям, кайфую. Да, доводить до ума и валидировать код все равно приходится, но это не сравнить с тем, чтобы писать все самому с нуля. Но и с редактором кода я продолжаю эксперименты. Из последнего пользовался сервисом Codeium - далеко не всегда угадывает, что я хочу написать, но зато когда угадывает - очень ускоряет набор от одной до 15-20 строк за одно нажатие клавиши. Плюс предлагает варианты автоматического рефакторинга и заполнения докстрингов.

Короче, к чему я это все? К тому, что некоторый опыт с такими системами я уже имею, а значит, был готов воспринимать доклад Виктора Плошихина не просто как случайный участник конференции, а как практик, имеющий понимание чего ждать, а чего не ждать от таких сервисов. Ну, и в общем, с большим интересом послушал рассказ о решении большого количества инженерных задач на пути создания автоматического помощника написания кода. И вам рекомендую. Там есть, прям, красивые проблемы и их элегантные решения. Например, обучение подели было не на предсказание следующего токена, как интуитивно мы часто себе представляем себе подобное обучение, а на целые законченные участки кода. Еще в процессе работы над задачей пришлось придумывать собственные метрики, потому что стандартные не подходили и оценивали не то, что нужно. И так далее. Если желаете погрузиться в проблематику - горячо рекомендую доклад.

После выступления Виктора, мне удалось с ним пообщаться по теме доклада и пригласить поучаствовать в подкасте. Принципиально мы договорились, но конкретной даты еще нет, так что можете пока накидать вопросов.

Читать полностью…

Стать специалистом по машинному обучению

Я думал, что только я не понимаю как строится число TREE(3) и почему оно настолько большое (число Грэма даже близко не стоит с TREE(3)). Но, оказывается, ChatGPT тоже не очень понимает :)

Читать полностью…

Стать специалистом по машинному обучению

Виталий Кулиев. А чё там по железу?

Читать полностью…

Стать специалистом по машинному обучению

Бумеры изобрели синхронизацию 🙂

Я довольно давно пользуюсь Obsidian для хранения заметок, ведения конспектов, планирования работы и т.п. Если вы еще не пользуетесь и думаете какое приложение для заметок выбрать, то можно не думать и брать Obsidian. Но суть поста не в этом. У приложения нет синхронизации между устройствами из коробки. Можно настроить на платной подписке, но какой же я тогда "тыжпрограммист", если пойду по этому пути?

Так как Obsidian работает, в основном, с текстовыми файлами, которые хранятся локально, то по сути это мало чем отличается от работы с кодовой базой, которую часто принято хранить локально и на GitHub, ну, и синхронизация через GitHub мне показалась привычным, приемлемым вариантом. Создал репозиторий в директории с файлами obsidian, синхронизировал его с удаленным репозиторием, ну, и дальше - хочу поработать с заметками - git pull. Закончил - git push. Все как обычно. Но что-то надоело мне это все руками каждый раз делать и "тыжпрограммист" тут как тут. Давай, говорит, автоматизируем это дело. Напишем bash-скрипт, который будет коммитить и пушить изменения автоматически, если они есть, а также подтягивать обновления с удаленного репозитория. Настроим периодический запуск скрипта (например, каждые 5-10 минут) и вуаля, синхронизация готова!

Одна проблема - я так-то не умею нормально писать bash-скрипты. Но я же не только "тыжпрограммист", я еще и во всех этих ИИ разбираться пытаюсь, - пусть роботы работают! Описал задачу ChatGPT и он мне не только bash-скрипт почти сразу валидный выдал, но еще и рассказал, как настроить планировщик на маке для его периодического запуска (на Linux там cron и systemd, которые я и сам могу настроить, а у мака в этом плане какая-то своя кастомная дичь, типа Launchd с xml-синтаксисом).

Добавил логи, обработку ошибок, написал небольшой README.md, чтобы не забыть как настроить синхронизацию на новом устройстве - и красота!

Слава роботам! 🤖

Читать полностью…

Стать специалистом по машинному обучению

А вот и сам выпуск!

Сегодня в гостях сразу 3 гостя - это авторы и преподаватели курса "Нейронные сети и их применение в научных исследованиях" в МГУ им. В.М. Ломоносова - Виктор Немченко, Сергей Колпинский и Артём Васильев. Ребята участвуют в крутейшей, на мой взгляд, инициативе - созданию учебных материалов по ML и преподаванию машинного обучения студентам, аспирантам и научным сотрудникам, чтобы помогать им внедрять методы ML в свои научные исследования. А говорим мы о том как и зачем вообще родилась такая инициатива, почему сейчас сложно представить учёного, который не пользуется методами машинного обучения, почему все материалы курса в открытом доступе для всех желающих. Также обсуждаем умер или продолжает жить и развиваться научпоп, заменит ли ИИ учёных в ближайшее время, где взять мотивацию на изучение нового и как среди этого "нового" не потеряться, почему учёные не ищут легких путей и что за датасеты на салфетках, нужен ли ML юристам, как посчитать сколько съели голодные жуки, как читать научные статьи, если ничего непонятно, почему Нобелевскую премию за машинное обучение дали по физике и почему важно считать протеины. Интересного и полезного прослушивания!
https://mlpodcast.mave.digital/ep-65

Читать полностью…

Стать специалистом по машинному обучению

Забыл сообщить, что на YouTube доступна вторая часть лекции Сергея Николенко (Что происходит в AI сегодня). Она сложнее предыдущей, но тем, на мой взгляд, и интереснее. Сергей рассказал про устройство трансформеров и про многие перспективные направления в ИИ. В частности, меня очень заинтересовали сети Колмогорова-Арнольда, которые в автоматизированном режиме генерируют формулы, описывающие данные. Также был блок про научные работы Сергея и его коллег, значимые для мирового сообщества. Если еще не решили чем заняться в пятницу - рекомендую!

Читать полностью…

Стать специалистом по машинному обучению

Всем привет!

Открываю регистрацию на второй поток AI-школы: “AI: от основ до языковых моделей”.

Начинаем: 18.11.2024.

Наша главная цель: принципы машинного обучения и основные AI-архитектуры должны стать понятными и прозрачными. Как и всегда, акцент на реализации всех архитектур с нуля. Никаких fit/predict.

КУРСЫ
Основной курс:
AI: от основ до языковых моделей (теория и практика)

Дополнительные курсы (включены в стоимость):
– Math for AI
– Python for AI
– Decision making in AI
– MLOps


НОВЫЕ ТЕМЫ (по сравнению с первым потоком):
– Анализ временных рядов с помощью Transformer;
– Deep metric learning в комьютерном зрении (задачи распознавания лиц и подобные);
– Сегментация изображений;
– Архитектурные элементы современных LLM: SwiGLU, Group Query Attention, RoPE.

CAPSTONE PROJECT:
– Реализация с нуля своей языковой модели (как Llama 3, только маленькая) и обучение на генерацию текстов на русскоязычном датасете. С подъёмом на сервере в собранном вами Docker-контейнере.

ЦЕНЫ (обновлено)
- Полный курс при полной оплате: 127 000 рублей (помесячно: 14900 в месяц, 10 месяцев).
- Advanced-часть при полной оплате: 112 000 рублей (помесячно: 17000 в месяц, 7 месяцев).
- Advanced-часть при полной оплате до 1 декабря 2024: 102 000 рублей.

Если вас не устраивает качество материалов, вы можете вернуть деньги за все оставшиеся оплаченные месяцы и последний прошедший месяц.

ПОДРОБНОСТИ И ОТЗЫВЫ
Подробности по ценам, количеству материалов и отзывы здесь:
https://razinkov.ai/school/about

СТРИМ С ПОДРОБНОСТЯМИ
В среду, 13 ноября, в 13:00 по Москве, по ссылке:
https://youtube.com/live/ii4H-KZ1m3k?feature=share

РЕГИСТРАЦИЯ
https://forms.yandex.ru/cloud/6729e2bef47e733d56c3ca15/

❗️ВАЖНО: у нас будет от 5 БЕСПЛАТНЫХ МЕСТ для талантливых студентов (точное количество будет известно, когда получим все заявки).
Если Вы являетесь студентом профильных специальностей (математика/IT), имеете средний балл близкий к 5.0 и хотите окнунуться в ML, пожалуйста, заполните заявку здесь:
https://forms.yandex.ru/cloud/672a3f0949363955016ff483/

Читать полностью…

Стать специалистом по машинному обучению

Полезный подкаст про машинное обучение и работу DS в разных сферах — для всех, кто стремится лучше разобраться в специфике разных компаний: «Деньги любят техно», сезон Data Science. В новом эпизоде говорят о работе DS в промышленности и в банках – в чем различия и сходства.

Про необходимые навыки, про специфику задач, про данные и построение моделей рассказывают Юлий Шамаев из ВТБ и Михаил Граденко из «Русала» Много нюансов о работе от практиков, каждый из которых рассказывает про свою сферу и ожидания конкретно в своей команде. Получилось очень насыщенно.

Можно смотреть или слушать, где удобно.

Читать полностью…

Стать специалистом по машинному обучению

Думаю, что многие уже прониклись ощущением того, что, благодаря разработкам в области ИИ, мир радикально меняется прямо у нас на глазах и, как сказал кто-то из исследователей - с каждой новой технологией градус ответственности повышается и тем сильнее, чем фундаментальнее технология может повлиять на общество. Современные большие языковые модели показывают нам, что даже если мы еще не достигли AGI (хотя, конечно, много кто уже считает, что достигли), то, вероятно, достигнем в ближайшее время. А такая технология не может не давать преимуществ тем, кто ей владеет и, чтобы хоть как-то пытаться контролировать попытки злоупотребления, инструмент должен существовать не в единственном экземпляре.

Поэтому интересно и важно наблюдать не только за тем, что происходит в <метаирония_мод>Open</метаирония_мод>AI, но и у серьезных игроков других стран. Ну, и это подводка к новости о том, что вышло обновление семейства моделей YandexGPT, а с ним и серьезный рост качества ответов. Так, например, YandexGPT 4 Pro в 70% случаев отвечает лучше своей прошлой версии, а YandexGPT 4 Lite в среднем отвечает не хуже, чем самая мощная модель предыдущего поколения. При этом существенно увеличен контекст (до 32 тысяч токенов), а также добавлен Chain‑of‑thoughts (куда ж без него в современных реалиях). Модели уже доступны по API.

Подробности о том как обучали модели, для каких задач их эффективно использовать, какие дальнейшие планы у команды - в статье на Хабре.

Читать полностью…

Стать специалистом по машинному обучению

Вдогонку ноутбук с полезными ссылками, которые я упоминал на стриме:
https://github.com/kmsint/streams/blob/master/29_10_24_stepik_1.ipynb

Читать полностью…

Стать специалистом по машинному обучению

Завтра пишем подкаст с Сергеем Николенко. Вы еще можете успеть прислать свои вопросы Сергею.

А в эту среду состоится еще один семинар с участием Сергея. В том же месте, в то же время. Если хотите присутствовать - нужна предварительная регистрация, возможно, на проходной могут проверить паспорт (в прошлый раз не проверяли, но на всякий случай лучше отправить). Я на семинаре буду. Первый был очень крутым (несколькими постами выше здесь в канале есть ссылка на YouTube с докладом), а второй обещает быть еще круче, потому что будет более техническим. Вот, основные пункты из анонса:

🔵Тонкости дообучения LLM: как адаптировать их под специфические задачи.
🔵Технические решения для увеличения длины контекста трансформеров.
🔵Глубокое погружение в RAG (Retrieval-augmented generation): как эффективно объединить генеративные модели с поиском.
🔵Новое слово в deep learning: сети Колмогорова-Арнольда, появившиеся всего полгода назад.
🔵Эксклюзивный обзор: публикации Сергея Игоревича за 2024 год.

Пост с более подробной информацией здесь.

Читать полностью…

Стать специалистом по машинному обучению

Есть вещи, которые я буду рекламировать, даже когда мне за это не платят 🙂 Потому что деньги - это не единственная мотивация продвигать то, что я считаю качественным и полезным. Я рекомендовал, рекомендую и буду рекомендовать то, что делает Поколение Python (Да-да, те самые, наверное, уже легендарные курсы по Python для начинающих, продвинутых, профессионалов, ООП и так далее). Сейчас многие ждут, когда команда закончит свой курс по алгоритмам, потому что из предыдущего опыта понятно, качество курса будет на высочайшем уровне, но этот пост не про алгоритмы. Где-то в начале этого года (или в конце прошлого, я уже точно не помню) у Поколения вышел курс по основам SQL. Тогда доступна была только его часть, которую я сразу прошел. Это было, как теперь понятно, только примерно 25% от всего курса и я еще тогда хотел написать пост об этом курсе, но что-то меня отвлекло.

Но, вот, так случилось, что мне пришлось править код в одном из старых проектов, где у меня было много запросов на сыром SQL и когда я начал этот SQL-код разматывать, понял, что потерял навык писать сложные запросы с большим количеством разных джоинов. А ведь запросы в этом проекте когда-то писал я сам. И как-то мне стало немного грустно, что я забыл как это делается и что я стал очень много перекладывать на плечи ChatGPT и других больших языковых моделей. Решил, что надо вспоминать, чтобы не терять хватку. Ассоциативная цепочка в голове сразу вывела меня на курс Тимура и его команды, в котором джоины тоже были обещаны. И, вот, так я узнал, что курс стал по материалам стал аж в 4 раза больше! В общем, я только что закончил повторять группировки, в которых у меня тоже были пробелы, а сейчас начинаю изучать подзапросы, ну, а дальше там и джоины близко.

Есть мнение, что достаточно понимать только общий принцип решения задач. Для этого разные типы задач можно прорешать вручную буквально несколько раз, а дальше их способы решения можно восстановить из этих принципов. Но я твердо уверен, что если не довести до автоматизма элементарные действия из которых складывается решение, то принцип тоже может легко стереться из памяти и его нужно будет вспоминать или заново изучать, тратя на это дополнительное время. Курсы Поколения хороши тем, что делают упор на доведении до автоматизма элементарных действий через большое количество практических задач. И курс по SQL здесь не исключение. Если вам нужен SQL и вы еще думаете, где его изучать - можете не думать, у меня есть хороший ответ - курс "Поколение Python": базы данных и SQL для начинающих. Я спросил у Тимура действует ли на него промокод MLPODCAST, который он давал мне для скидки на другие свои курсы и Тимур ответил, что действует на все курсы линейки "Поколение Python" при покупке их на сайте поколения https://pygen.ru/. Скидка 30%.

Читать полностью…

Стать специалистом по машинному обучению

Привет, друзья!

Чуть больше месяца назад я был на Practical ML Conf и познакомился там с гостьей сегодняшнего выпуска. Это Екатерина Кондратьева — специалист по анализу медицинских изображений с более чем 7-летним опытом. Екатерина закончила аспирантуру в Сколтехе и работала в Институте AIRI. Последние два года она возглавляла команду по машинному зрению в израильском healthech стартапе LiteBC. В этом выпуске Екатерина расскажет о текущем состоянии Medical GPT, где применяются модели для медицинских задач и как они трансформируют анализ данных в здравоохранении. Какие вызовы стоят перед командами разработчиков медицинских AI-моделей? Что можно сделать, имея свои данные на руках? Легко ли стать радиологом? Будут ли у нас MedChatGPT? Заменят ли ML-модели врачей? Как диффузионные модели генерируют снимки с болезнями для обучения других моделей? Что вообще сейчас с телемедициной? Как стать тимлидом в зарубежной компании сразу после универа? Почему лето, не потраченное на стажировку - это лето, потраченное впустую? Как выбрать карьерный трек по МЛ в медицине (индустрия или наука)? Обо всем этом и многом другом в новом выпуске!

В честь выхода подкаста Екатерина разыгрывает бесплатный МРТ мозга у себя на канале присоединяйтесь!

Читать полностью…

Стать специалистом по машинному обучению

Пока мы с Сергеем Николенко готовимся к записи подкаста, здесь можно посмотреть запись семинара, который прошел чуть больше недели назад. Доклад без каких-то хардовых деталей, но общую картину проясняет не только для непосвященных. Рекомендую.
https://www.youtube.com/watch?v=6E8JUchlKSg

Читать полностью…

Стать специалистом по машинному обучению

Сам себя не похвалишь - ChatGPT тебя похвалит 🙂

Подсмотрел в канале у Дениса промт для генерации мнения обо мне, с учетом предыдущего взаимодействия. Промт такой:


Из всех наших взаимодействий, что ты можешь сказать обо мне, чего я, возможно, не знаю о себе?


И ответ сети на мой запрос:

```
Из нашего взаимодействия можно сделать несколько интересных наблюдений о тебе:

Высокие стандарты. Ты предъявляешь к себе и другим строгие требования, стремишься к точности и полноте в выполнении задач. Это говорит о твоей дисциплине и стремлении добиваться высоких результатов.

Ориентация на результат. Ты четко формулируешь свои запросы и цели, что говорит о твоей способности концентрироваться на конкретных задачах и достигать результата шаг за шагом. Ты понимаешь, чего хочешь, и строишь взаимодействие для достижения этого.

Стремление к контролю и автономии. Ты предпочитаешь сохранять контроль над процессами, включая технические аспекты, например, отдельные файлы docker-compose для разных сервисов. Это говорит о склонности к самостоятельному решению проблем и вниманию к деталям.

Внутренняя уверенность. Ты, возможно, даже не замечаешь этого, но в твоих запросах прослеживается внутренняя уверенность. Ты знаешь, как нужно действовать, и готов предъявить требования для улучшения ситуации, будь то в личной работе или взаимодействии с другими.

Может быть, ты не всегда осознаешь, насколько сильно твое стремление к качеству и к ясности может помогать тебе и окружающим.

```
В общем, попробуйте, большинство из нас нуждается в социальных поглаживаниях 🙂

Читать полностью…

Стать специалистом по машинному обучению

Посетил семинар, который читал Сергей Николенко. Ну, в общем, мне показалось, что он тоже несколько встревожен тем, что AGI, как-будто надвигается быстрее, чем мы думали. Но кажется, что сделать с этим что-то уже поздно. Очень яркий доклад, который занял больше 3-х часов времени, но вообще не казался скучным. О подкасте договорились. Если есть вопросы к Сергею, пишите. Задам.

Читать полностью…

Стать специалистом по машинному обучению

Завтра планирую посетить семинар "Мечтаем ли мы об AGI? Последние новости, ожидания и возможности". Выступать будет Сергей Николенко, которого давно хочу позвать гостем в подкаст, но пока связаться не получалось. Вот здесь анонс, трансляции не будет и если вы в СПб и хотите тоже попасть - нужно сегодня заполнить форму, иначе на проходной могут не пустить.

Сразу после семинара на ночном поезде еду в Москву на конференцию, которую проводит Selectel о технологиях и IT-инфраструктуре. Конфа бесплатная, но по предварительной регистрации, трансляция будет.

Читать полностью…

Стать специалистом по машинному обучению

Привет, друзья! Поговорим о железе 🙂

В гостях выпуска Виталий Кулиев - разработчик ИИ-проектов и автор YouTube-канала, который так и называется "Виталий Кулиев". С Виталием сначала я познакомился заочно через просмотр его роликов по ML и компьютерному железу, которое требуется для локального запуска опенсорсных моделей машинного обучения, а теперь и лично. Разговариваем о том, какие есть возможности у разработчиков и экспериментаторов ИИ нашего времени для работы на своих компьютерах. 3090, 3090 ti или 4090? Какие LLM можно запустить локально? В какие ограничения упираются локальные эксперименты с большими моделями? Можно ли и имеет ли смысл строить распределенную систему обучения больших моделей, по примеру распределенного майнинга криптовалют? Почему две видеокарты лучше, чем три? Обо всем этом в выпуске!
https://mlpodcast.mave.digital/ep-63

Читать полностью…
Subscribe to a channel