🎙️🎙️🎙️
Всем привет, врываемся в новую неделю с новым эфиром, и такого у нас с вами еще не было, к нам в гости идет Женя Никитин - кофаундер и технический директор Цельс (celsius.ai).
И тут вы такие «а, что? Какой цельс?», а меж тем это оооочень крутые ребята, которые применяют ML в медицине в промышленных масштабах. Это и детектирование заболеваний на ранней стадии, и анализ исследований (например флюорограмм) на наличие патологий, и еще много чего. На секунду у ребят более 3 миллионов обработанных исследований.
В общем не знаю как вам, а мне жутко все это интересно и поэтому с Жекой будем говорить про ML и его практическое применение, про будущее LLM, про то, как вырастают из небольших стартапов (и как у них там все без энтерпрайзных механик устроено).
Женя, среди прочего известен как фанат обезьян, (почти) обладатель нью-йорского Phd и автор прекрасного канала «Варим МЛ» (ссылка в первом комментарии)
В общем будет огонек, сам приходи, теще перешли, кота привлеки 👀
Как говорит мой дед - у меня голова с дырой. Вчера участвовал в конфе TechTrain, а прорекламировать это забыл. Но всегда можно посмотреть записи!
- Сначала я побыл экспертом на достойнейшем докладе Ромы Куцева про ускорение и удешевление разметки данных. Думал, что просто представлю Рому и позадаю ему вопросы от зрителей, а в итоге стал чуть ли не со-докладчиком 😆
- Потрепался на круглом столе про всякие разные применения ML в современном мире. Лайтовый и нетехнический разговор, но мне понравилось.
В общем, залетайте, смотрите, всех поздравляю с началом осени! Скоро начну работу над новыми лонгридами - последнее время был сильно занят на работе, немножечко пересобираем оргструктуру компании.
#Жека #machinelearning
Идея этого поста родилась, когда я работал над проектом публичной модел-карты, которой я хочу сопровождать каждый большой релиз новой версии модели. В нём я рассказываю про внутреннюю и внешнюю прозрачность и про инструменты, которые мы используем на тернистом пути к этой самой прозрачности. Буду отдельно благодарен за фидбек по проекту публичной карточки, она, как вы видите, ещё в работе.
И спасибо, что читаете, не за горами заветные 2К! У меня нет стремления наращивать аудиторию любыми средствами - у этого канала нет и никогда не будет никакой финансовой подоплёки. Но писать, когда знаешь, что есть люди, которые читают (и не только из ML, кстати) - намного приятнее.
#Жека #management #machinelearning
Я забрался аж в Черногорию, а значит пришло время для очередного выездного поста. Тут я нахожусь, потому что меня позвали на замечательное мероприятие Яндекса - CTO Day в Белграде. Вообще я в восторге от этих трёх дней, не каждый день у стартапных CTO выдаётся возможность понетворкаться с техническими директорами крупнейший компаний страны. Даже выпала возможность выступить на FuckUp Night, где-нибудь потом расскажу этот доклад публично. Эта поездка - ещё и отличный повод для этого поста.
Я сам никогда не работал в бигтехе и, кто знает, может никогда уже и не поработаю. При этом у меня есть друзья и знакомые из крупных компаний, я постоянно с ними болтаю о работе, в том числе много расспрашиваю о том, как у них всё устроено. Что-то мне нравится, чему-то я завидую, что-то откровенно не понимаю, но в любом случае их мир сильно отличается от стартаперского. Не думаю, что какой-то хуже или лучше - просто очень разные и всё.
Одним из больших преимуществ и одновременно вызовов стартапа - очень быстро меняющаяся роль. За последние четыре года я побывал в роли ML-рисёчера и инженера, бэкендера, тимлида, деврела, девопсера, рекрутера, эвент-менджера, лида лидов. Какие-то "шляпы" я примерял и снимал, часто носил несколько одновременно. Недавно компания пережила непростую фазу "отрицательного найма", и я решил, что это хороший повод опять что-то поменять. Долгое время я занимался в основном делами ML-отдела, немного подвыгорел и явно уже не фонтанировал новыми идеями. Я передал пост Head of AI своему коллеге и решил посмотреть по сторонам. Начать я решил со сбора информации - назначил встречи с коллегами из других команд, а параллельно новый Head of AI общался со всеми ML-щиками. А ещё мне захотелось расширить кругозор - и я прочитал книгу Think Like a CTO. Сегодня делюсь с вами конспектом 1-2 глав - как обычно с моими очень ценными комментариями. Вообще я хотел сделать сразу по всей книге, но это оказалось довольно трудозатратным делом. Если увижу отклик - обязательно допишу, как вернусь из отпуска.
#Жека #books #management
Друзья! Конкуренты! Хейтеры! Мы ждём всех 2 июня на нашем великолепном и кошмарном треке "Ужасы медицинских данных" в рамках ODS-датафеста
Расписание:
11:25 - 11:30 - собираемся, знакомимся с модераторами секции (я и Тоник Голубев)
11:30 - 11:45 - я открою секцию коротеньким дайджестом о том, что происходит на рынке ИИ - "Российский DL в радиологии: что происходит на рынке в 2023 году?"
11:45 - 12:15 - моя замечательная коллега Вероника Семёнова вайбово расскажет про гадости, которые можно встретить на гистослайдах - "Обзор артефактов на гистопатологических изображениях"
12:15 - 12:35 - доклад Юлии Агафоновой (AI Talent Hub), который особенно зайдёт тем, кто хочет вкатиться в медицинский ML, но почему-то боится - "Личный путь ML-разработчика в мире медицинских данных"
12:35 - 13:05 - куда же мы без Кати Кондратьевой (AIRI), нашего традиционного любимого спикера, в этот раз слушаем мощный апдейт топового доклада про "непопсовые направления анализа медицинских снимков v2"
13:05 - 13:40 - коллеги из Сбера всегда приходят с крутыми нестандартными докладами, в этот раз Кудин Степан и Соколова Елена поведают про "ускорение проведения исследования ПЭТ КТ с помощью DL шумоподавления"
13:40 - 14:05 - Коля Холод расскажет про мою любимую фишку этого года - эмбеддинги врачей-разметчиков, "Learning annotator’s style in medical imaging"
14:05 - 14:30 - Тоник Голубев закроет секцию и попробует объяснить на медицинских примерах, кто же всё такой этот ваш data-centric AI (примечание - если кто был на моём докладе на Codefest, то они пересекаются слегка примерами, но в целом совсем про разное)
время указано по МСК, расписание ещё может немного поменяться, буду обновлять его в посте
ждём вас 2 июня в спейшл-чате и на ютубе (ссылку добавлю позже)
ссылка на сам трек на сайте ODS
спасибо всем, кто пришёл на выступление на Кодфесте! это одна из моих любимых конференций) выкладываю слайды с кликабельными ссылками
#Жека
Дорогие друзья, в конце мая состоится очередной дата-фест, а это значит, что пора бы уже и объявлять Call for papers на традиционную секцию "Ужасы медицинских данных"!
Несмотря на название, можно заявляться с любой темой, которая относится к медицине и ML. Писать мне в личку (@crazyfrogspb) с названием и описанием доклада и базовой инфой о спикере.
Для примера вот страница трека 2021 года, 2022 и мини-секции с Дата-Хэллоуина.
#Жека
В понедельник доложился на Опентокс и решил по мотивам написать пост про публичные выступления. Внутри - история моей фобии выступлений, несколько советов для новичков, список всех моих докладов на внешних конфах и митапах. Бонусом - моё ценнейшее мнение про ситуацию с ODS.
Кстати, надо бы сделать и каталог постов, их уже больше, чем докладов...
#Жека #life
Накатал тред про создание Варим ML. Планирую иногда писать в свой твиттер-акк что-нибудь более личное, подписывайтесь, если интересно.
А ещё сегодня вышло моё интервью для Data Award 2023.
#Жека
Немного об интерпретируемости в медицинском ML - что, как и нужно ли вообще?
#Жека #ML
Подвожу личные итоги года, а заодно хочу спросить, интересно ли бы вам было видеть в канале не только лонгриды про ML и процессы, но и какие-то более личные заметки разного формата, связанные с работой в Цельсе, профессией, образованием и жизнью.
С наступающим!
#Жека #life
Всем привет, это не совсем пост, а просто реклама Дата-Ёлки от ODS, которая будет в эту субботу. Я там буду подводить итоги года по medical imaging, да не просто так, а аж оффлайн! Залетайте послушать, буду очень рад. Моя секция предварительно в 14:30.
#Жека
Есть у меня традиция - писать посты в Сапсане по пути в Москву. Сегодня поговорим о моём любимом инструменте всех времён и народов - ClearML.
#Жека #mlops
сорри за спам, но мы так этого ждали, что не могу не зафиксировать в истории)
огромное вам спасибо!
Все знают, что при обучении сеток каждую эпоху надо шаффлить датасет. А есть ли смысл ещё как-то влиять на процесс сэмплинга данных? Может быть!
#Жека #machinelearning
в последнее время люблю формат свободной беседы без особого сценария и слайдов, уверен, будет круто)
в среду в 19:30
#Жека
Прошу прощения, это во многом банальный и наивный, но важный для меня, особенно во времена, когда с каждым днём дышать становится всё тяжелее, текст про стереотипы и дискриминацию при найме. В том числе честно рассказываю про свои стереотипы и страхи, которые до сих пор со мной.
#Жека #management
Кажется, формат конспектов книг с моими комментариями зашёл неплохо. Я пока разгребаю дела и не доделал конспект по Think Like a CTO, но в отпуске я прочёл классическую книжку Deep Work про углублённую работу.
#Жека #books
всем привет, наконец пришла пора и для бесполезного с точки зрения контента поста. сегодня мне исполнился 31 год, и я просто хотел сказать вам всем спасибо за то, что вы читаете этот канал. если хотя бы кому-то оказался полезным хоть один пост - всё уже не зря. спасибо, друзья!
P.S.
буду особенно рад обратной связи, что заходит, что лишнее, что полезно, что нет
#Жека
И сразу вдогонку конспект книжки Managing ML Projects. Уже прочитаны и лежат в очереди на конспектирование и/или обзор Think Like a CTO, ML System Design (ранний доступ), How to Lead in DS, Ensemble Methods in ML.
#Жека #management #machinelearning #books
Всех приветствую! В последнее время писал я откровенно мало - конференции, работа, отпуск и всё такое. Но уже довольно давно у меня в загашнике лежит кое-что странное - огромный гайд по большинству модификаций архитектуры DETR. Текст вышел на 90 тысяч символов.
Я всё возвращался к этому опусу, находил новые статьи, добавлял ссылки, но дальше тянуть уже неохота 🙈 Это гугл-док с открытыми комментариями, поэтому можете задавать вопросы и указывать на ошибки. Если будет интерес, в планах вторая часть поста с моими собственными экспами и большим количеством визуализаций.
Пользуясь случаем, хочу пригласить вас на пару крутых мероприятий:
- 27-28 мая в Новосибирске пройдёт Codefest, я там выступаю с прикольным новым докладом про model-centric и data-centric подходы
- 2 июня в рамках ODS-датафеста пройдёт очередной трек "Ужасы медицинских данных". Про него потом ещё напишу отдельно.
Запрыгиваю в последний вагон хайп-поезда, ведь сегодня на повестке дня - AI-апокалипсис.
#Жека
Дорогие друзья, как вы заметили, здесь давенько не было контента. Да, много работы, да, скоро выступаю на OpenTalks.AI в Ереване, но основная причина не в этом. Дело в том, что я пишу статью (постом назвать язык не поворачивается) про все вариации архитектуры DETR с 2020 года и по текущий момент - с погружением в теорию, код и с тестированием части архитектур на реальном проекте. На данный момент в статье 32 страницы и 50к символов 🌈
Уж не знаю, будет ли это кому-то интересно, но назад дороги нет... Опубликую после возвращения из Еревана. Кстати, если кто-то будет на конфе, пингуйте в комментариях, давайте пересечёмся!
#Жека #ебанулся
Популярный вопрос - что нужно знать, чтобы продуктивно у нас работать? Попробовал на него ответить в очередном лонг-риде.
#Жека #machinelearning
Возвращаемся с новогодних каникул с постом про постановку целей на год.
Ещё отдельной целью добавлю - сохранить наш кайфовый коллектив.
#Жека #life #management
Отстрелялся на ODS Дата-Ёлке с итогами года по medical imaging! Запись стрима тут, PDF презы в комментах
#Жека
Я снова в командировке, на этот раз в Сочи на Конгрессе молодых учёных, а значит пришло время для нового поста из кальянки. Рассказываю про историю появления и развития нашего первого проекта - Маммография.
На всякий случай предупреждение - в посте присутствует мат на скриншотах 😜
#Жека #machinelearning
Я был в статусе студента и школьника ровно 20 лет. Жизнь и обучение в трёх странах и университетах были очень разными, каждый период был по-своему прикольным и точно оставил на мне свой след. Сегодня как раз и рассказываю при три своих универа, а заодно делюсь кучей материалов и книжек.
#Жека #life #machinelearning
Приходите на "Ужастики медицинских данных" на ODS Data Halloween в эту субботу!
Наша секция пройдёт с 11 до 13, время докладов примерное:
- 11:00 - Егор Шестопалов, "Эволюция DL-сёрвинга в стартапе"
- 11:25 - Никита Лештаев, "Что врачу хорошо, то инженеру смерть. Дополнительные требования к медицинским ИИ-сервисам"
- 11:45 - Евгений Гутин, "Что такое хорошо, что такое плохо. Качество рентген-снимков"
- 12:05 - Евгений Никитин, "Сценарии применения ML в рентгенологии"
#Жека
От меня тут давно ничего не было, потому что переезжал в другую страну (начал ещё в мае и только сейчас всё устаканилось). Долго думал о чём бы написать пост, но так как сейчас на работе пишу библиотеку для метрик лёрнинга, а о такой задаче знает не очень много людей, про неё и будет пост.
#Миша #обзор #CV