Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap
Зачем вести канал в телеграме
🤔 У меня очень своеобразная причина для ведения TG канала. Начиналось все с потребности делиться какими-то вещами про работу, преподавание и ML. Потом жизнь как-то так сложилась, что потребность всецело закрывается общением с близкими, друзьями и студентами (как в универе, так и со взрослыми, у меня в школе, в Сколково и на корпоративных курсах).
🙅♂️ Казалось бы, время закрывать канал за ненадобностью. Но вот не совсем. Вы могли заметить, что в наше время любой фрик имеет возможность самовыразиться в интернете не только в комментах, но и как блоггер. Но откуда появляется это «любой фрик»? А дело в том, что правило «помолчи, может за умного сойдешь» работает фантастически стабильно. Стоит человеку начать делиться своими мыслями и рассуждениями, давать советы, оценивать ситуации, комментировать новости, сразу становится понятно, какой забористый кисель у него в голове вместо мозгов.
💼 Похожую ситуацию я часто видел в корпоративной карьере. Те люди, которые лучше всего разносят руководство за неоптимальное управление и наиболее пылко рассказывают, а как надо было, сами столкнувшись с вызовами управления стабильно оказываются не такими боевитыми, как на словах. Не мешки ворочать, короче. Пример с управлением это просто пример деятельности, включающей многокритериальную оптимизацию в условиях неполной информации, так-то аналогичных примеров хватает в любой профессии :)
🤦♂️ Но вот засада: когда стоишь в сторонке и критикуешь, легко забыть о самом главном. Сам-то такой же. Сам-то тоже как рот откроешь, так слова быстрее мыслей могут побежать, если нет тренировки. А как на публику что скажешь или напишешь, так вообще жуть: и этих обидел, и тем не мил, и те, к кому обращался, вообще не поняли, что сказать хотел.
🚀 Так вот самое классное и полезное применение TG канала для его автора это свое собственное развитие. Во-первых, тренировка по формулированию и донесению мыслей. Во-вторых, развитие навыка подбирать нужные слова с учетом всех рисков (а их, когда пишешь даже на сто человек, всегда много). Ну а в-третьих, если я через год читаю свои старые посты и думаю «Боже мой, какую же ересь я нёс!», я спокоен, ведь значит еще что-то меняется в голове.
❤️ А еще есть в-четвертых: интересно что-то вбросить и читать комменты. Правда классные вещи пишете, много новых мыслей, очень люблю своих подписчиков.
Пишите, кстати, в комментариях, что бы вы хотели чаще видеть в этом канале :)
Вопросы на собеседованиях по ML
Вчера готовился к вебинарам про вопросы с собеседований по ML (в конце базового курсс ML у нас есть опциональный модуль с разбором вопросов в качестве повторения пройденных тем).
С учетом того, что сам лет 10 собеседовал по DS, вспомнил порядка сотни вопросов, которые задавал сам или задавали коллеги. Дальше просмотрел около 300 вопросов, которые спрашивают на собеседованиях сейчас.
Из интересных наблюдений:
🥋 вопросы Avito неплохо перекликаются с Яндексовыми по уровню понимания ML (это комплимент Avito)
🧑🏫 есть любители поспрашивать про математику на собеседованиях (запомнились ПСБ и Okko, возможно были и другие)
🪦 вопросы про SVM, который уже давно нигде во всей красе не используется, хоть и встречаются редко, но бывают (правда не в IT-компаниях)
👴🏻 вопросы про PCA еще пока держатся, встречаются чаще, чем SVM, иногда спрашивают даже про SVD
🔥 наиболее частые вопросы такие, какие я и предполагал: логрегрессия, линейная регрессия, регуляризация, градиентный бустинг, иногда случайный лес, метрики качества.
Некоторые вопросы перекликаются с теми, которые я давным-давно в Яндексе сам вводил в употребление и добавлял в Фемиду (внутренняя система, где хранятся вопросы и результаты собеседований), либо добавляли коллеги по мотивам моих собеседований. Например, ставший классическим вопрос про то, какие алгоритмы могут давать отрицательные прогнозы на новых данных, обучившись только на неотрицательных таргетах. Не утверждаю конечно, что совпадающие с моими вопросы позаимствовали именно у меня (знаю человека, который искренне верит, что его идею украли Apple и Amazon, смотрится крайне забавно), но тот факт, что всех собеседующих притягивает примерно к одним и тем же вопросам, по модулю небольшого количества выбросов, меня скорее радует.
Напишите в комментариях:
1) какие у вас есть наблюдения насчет собесов по ML?
2) какие вопросы на ваш взгляд задают чаще всего, и какие вопросы вам запомнились?
А если пост наберет 300 🔥огонёчков, я буду выкладывать примеры вопросов с собеседований и свои комментарии в канале (давайте выясним, интересно вам это или нет :)
Как сделать всё «неправильно» и все равно стать ценным сотрудником в компании
🎯 Я уже рассказывал, как стать ценным сотрудником, опираясь на интересы руководства. Но есть и «неправильный» способ, который на самом деле очень даже хороший. А именно — вы просто делаете то, что вам больше всего нравится, откликается и во что вы вовлечены.
😟 Если то, что вы делаете с удовольствием, перестаёт нравиться вашему руководству, вы просто меняете место работы. И так до тех пор, пока не произойдёт идеальный мэтч между тем, что нравится вам, и тем, что именно в вашей работе ценят.
🗺️ Этот подход — это более широкий взгляд на ситуацию. Обычно, когда люди задают вопрос «Как стать ценным сотрудником», они имеют в виду то место, где сейчас работают. Но правда в том, что если вы хотите заниматься любимым делом, то вам нужно и место работы подобрать подходящее.
💼 Обращать внимание на интересы руководства, конечно, тоже нужно. И неплохо идти навстречу друг другу и находить варианты, когда всем хорошо. Но выбор места определяет довольно много. Единственная ремарка: подходящих вам вакансий и компаний должно быть много. Если у вас редкая специализация, или если вы просто дошли до того уровня, где на всю страну 10 вакансий и на каждую нанимают год или больше, так легко уже не получится. Тут нужно будет решать вопрос не сменой места, а донесением руководству и коллегам, почему работать нужно именно ту работу, что нравится вам, и именно так, как это делаете вы. Это тоже возможно, но сложнее.
Когда думаешь о вузе, обычно представляешь себе лекции, конспекты и долгие годы теории. А что, если обучение сразу погрузит тебя в реальный бизнес, даст опыт работы и сделает востребованным специалистом уже на старших курсах?
Центральный университет – это место, где знания не откладываются «на потом». Первый год студенты изучают разные специальности, чтобы на втором выбрать то, что действительно интересно. Преподаватели – эксперты с международным опытом и практикой из реального бизнеса, которые помогают разобраться в тонкостях современного мира IT и управления.
Особенно приятно, что каждому студенту назначается персональный наставник – будь то профессор или практик из индустрии. Такой подход даёт возможность не только глубже понять учебный материал, но и сформировать собственный карьерный путь. А стажировки можно пройти у партнеров уже после второго курса, которых больше 50, например Т-Банк, VK и Kaspersky.
К слову о возможностях: сейчас идет набор на бакалавриат по направлениям искусственный интеллект, разработка, бизнес и аналитика. И самое интересное – у абитуриентов есть возможность получить грант, покрывающий 100% стоимости обучения (грант до 2 800 000₽!). Есть гранты и с частичным покрытием. Грант выдается на весь период обучения! А после обучения выдается диплом о высшем образовании государственного образца!
Если вы мечтаете о вузе, где теория и практика идут рука об руку, где каждый день приносит новые возможности для развития, переходите по ссылке и участвуйте в конкурсе грантов уже сейчас.
Реклама. АНО ВО «Центральный университет», ИНН 7743418023, Erid: 2SDnjeEDiGC
😈 Челлендж по запуску 12 простых IT-проектов за 12 месяцев
Летом 2023 г. появилось комьюнити инди-хакеров, в котором ребята решили запускать 1 простой продукт в онлайне каждый месяц.
И в реальном времени показывать: как разрабатывают, продвигают и сколько получилось заработать на запусках таких микро-проектов.
Например, вот 👉 пост про то, почему американцы платят $40 за простой конвертер картинок, который сделали за 4 недели. Несмотря на то, что вокруг полно бесплатных аналогов)
👉 Этот пост про то, как за 2 недели запустили темную тему с тарифами от $5 до $99. Четыре таких продукта приносят на пассиве как зп среднего разработчика.
А вот 👉 тут — как все может грустно закончиться, если 2 года пилить сложный продукт, не показывая его рынку.
👉 Здесь, как за 30 дней сделали приложение для решения задач по математике, которое через 4 месяца вышло на $1200/месяц.
А 👉 здесь рассказывают, как заработали 1 700 000 рублей на боте для создания фотокниг и какие фейлы допустили.
Первая находка в их комьюнити IT билдеров — метод, который позволяет сделать запуск за 1 месяц.
Вторая находка — метод продвижения, который они используют. В среднем на продвижение одного IT-продукта уходит $150, причем есть продукты с 200К+ юзеров 🙂
Вот здесь можно подписаться на канал, чтобы подглядеть за их запусками. А может, и попробовать сделать такой простой продукт самому)
Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqwUcZ2e
Подкаст с Юрой Кашницким
📰 Продолжаю звать на YouTube-канал своей школы MLinside интересных гостей. В этот раз был Юра Кашницкий @new_yorko_times :)
👨🏫Большинство людей знает Юру как автора курса mlcourse.ai от ODS, но в беседе было много всего интересного помимо образования :) Про курсы мы конечно тоже не сдержались поговорить, кто досмотрит до этого момента - делитесь в комментариях своими мыслями про идеальный прикладной курс.
🔥🔥🔥О трудоустройстве в Гугл, переезде в Нидерланды, танцах на шесте и machine learning в Европе - смотрите в интервью: https://www.youtube.com/watch?v=dnIDhGeJCpI
🥇Как стать сотрудником, с которым не расстанутся
В этот раз мы обсудим наиболее очевидный путь, позже будет продолжение с менее стандартными способами (а их много, например некоторые категории сотрудников просто нельзя увольнять)
Цель формулируется очень просто: ваша ценность для босса должна быть больше вашей стоимости как в деньгах, так и в других накладных расходах.
Значит план очень простой:
1. Узнаем, что ценно для босса
2. Максимизируем эту ценность
3. Регулярно информируем босса о всех победах
Параллельно не задалбываем слишком сильно босса своими требованиями х3 к зарплате, интересных задач и удаленки с теплых морей (тут надо научиться чувствовать). Но помним, что быть «да-чуваком» и на все соглашаться тоже не стоит. Неспособность заботиться о своих интересах принижает вас в глазах руководителя, и отношение к вам тоже меняется. Никто не любит мямлей. Кроме того, yes-guy соглашается на то, что потом не может сделать, что часто заканчивается плохо.
Если кратко - вот и все. Если чуть подробнее, вот еще комментарии по пунктам:
1. У всех в корпорации есть KPI, их максимизация обычно человеку ценна. Иногда речь не про формальные KPI, за которые дают премию, а про «понятийные», за которые босса похвалит/не уволит его босс или он сам себя похвалит - тут уж кому что важно. Чтобы это узнать, нужно общаться.
2. Скорее всего, придется работать, и это самый прямой путь. Более сложный - найти тех, кто все сделает, организовать процесс, а боссу зарепортить результат. Плюс в том, что как организатор вы можете сделать руками других людей гораздо больше. А важнейшее правило такого подхода - выбить у босса или дать в рамках своих возможностей какие-то ощутимые бенефиты тем, кто работал над задачей. Те, кто только присваивают результаты и не делятся плюшками с исполнителями, рискуют, что в их честь назовут салат 🔪🔪🔪
3. Тут все просто - не теряйтесь. Приемлемая для босса периодичность общения это дело индивидуальное. Бывает, что мелкий начальничек «не занимается микроменеджментом» и хочет видеть вас раз в квартал, а крупный предприниматель ожидает доклада каждую неделю, а бывает наоборот. Опять же, общаемся, понимаем, задаем уточняющие вопросы. Важный момент - заботиться о том, чтобы в плане работ был предусмотрен не только долгострой, но и быстрые победы, пусть и небольшие. Это создает позитивный фон, скрашивающий ожидание больших результатов.
Все написанное выше может показаться какой-то очевидностью, но стоит задать себе вопрос «а все ли из этого я делаю?», и ответ может очень удивить.
Скрытые KPI – моя версия
Спасибо вам за комментарии под предыдущим постом, реально заставили задуматься и вспомнить разных ситуаций
Дисклемер: речь о корпорациях
А картинка из статьи на хабре, статью комментировать не буду, но картинка классная.
Сначала кейсы
Кейс 1
Как вы думаете, что будет если удачно показать презентацию акционеру?
Внеплановая премия на 50М рублей – как вам?
Кейс 2
Очень крепкий начальник DS-отдела тащит звездный (уникальный, имиджевый, денежный, на благо клиентам и тд) проект, визибилити на самом высоком уровне, получает грейд, звание, еще пару команд. А меньше чем через год вынужден уволиться. Почему?
Кейс 3
Регулярная оперативка у президента Банка, президент не в настроении. AI идет четвертым, последним вопросом. Шеф докладывает результаты моей команды – гробовое молчание секунд 15, вступается один старший вице-президент – “мои ребята провалидировали, все сделано грамотно”, затем второй – “а мои уже пропилотировали, работает, эффекты есть”, мы с шефом выдыхаем, президент выдает – “а для физиков когда это же сделаете?”.
Давайте попробуем суммаризировать этот опыт:
1) Больше всех в колхозе пахала лошадь, но председателем она так и не стала => визибилити очень важен
2) Если вы сделали один классный и значимый проект – вы задали планку, и у вас даже после повышения может не хватить задач / полномочий / ресурсов / гороскопа сделать что-то такого же масштаба
3) А “на радарах” надо быть регулярно, желательно либо с важной либо с хайповой темой – а фокус постоянно меняется, поэтому темы тоже надо менять – люто плюсую комментарий под предыдущим постом на тему новизны и early adopter
4) Достижения должны не убывать по значимости => правильное планирование и револьверные схемы
5) Любой манагер обучен представлять результаты своих сотрудников как свои. Как же тогда получить визибилити? Искать недооцененные темы, где шеф видит вероятность провала (и последствия там таковы что кадровые решения неминуемы – тогда он всегда сможет пожертвовать тем кто докладывал и сослаться на ошибку сотрудника, который за это был им уволен).
6) Надо уметь балансировать между стремлением “сделать нормально” и закрыть тех. долги и ростом вширь в хайповые темы. Инвестируйте в рост тоже, копать картоху можно долго
7) Решать все проблемы шефа плохая стратегия если вам не платят 100500 денег – кто же вас отпустит на повышение если вы так удобны? Если у вас хорошие отношения с начальником – значит, вам недоплачивают. Вообще залог хороших отношений с людьми – с вас они имеют больше, чем вы с них. И быть на расстоянии повышает шанс воспользоваться возможностью из п4. Здесь, как и из любого правила, есть исключение -- если вас купили с потрохами, еще и с опережением ваших запросов -- то логично честно впрячься -- такая ситуация хоть и может оказаться неустойчивой, но сулит нереально редкий баланс нервы / деньги
8) А вот решать проблемы шефа своего шефа – работающая история. Ведь стейкхолдер так похож на shareholder ;)
9) У акционера проблемой могут быть не деньги, а померяться чем-н с акционерами другой крупной компании
10) Поддержка смежников (за периметром феода вашего синьора) критически важна – более того, не раз наблюдал “десанты” из соседних подразделений – испытанная временем практика – "женишься" сам или "женишь сына" на "дочке" соседнего феодала и он перестает тебя атаковать (особенно полезно когда тебя атакуют другие, с которыми ты породниться или заключить союз не успел). Речь о приеме на работу к себе в структуру на ненизовую должность -- еще таких называют парашютистами
11) Не встревать в конфликтные темы (когда две вертикали бьются за какую-то бизнес-линию или даже зону ответственности) – они потом решение найдут, а ваша голова полетит. Паны дерутся – у холопов чубы трещат.
Итого: у всех, кто хочет расти, есть незафиксированный kpi “не реже раза в месяц/квартал -- в зависимости от левела -- доложить на уровне шеф+1 результаты, имеющие новизну, выхлоп и при этом относящимся либо к сиюминутно важным фокусам того уровня либо к жизненно-важной теме для кор-бизнеса”
Вы просили про DeepSeek - ситуация вкрай запутана🤔
Полный обзор всего загадочного и странного в этой истории по порядку:
1️⃣Начнем с того, действительно ли DeepSeek R1 лучше ведущих закрытых моделей - нет..
Да, он хорош, но по бенчмаркам на уровне o1 от OpenAI без какого-то превосходства, да и по ощущениям (я пользую и ту и ту) на обычных жизненных задачах модели очень близки.
Но все равно успех DeepSeek удивителен, мы еще забываем про V3, которая ранее превзошла GPT4o и Claude 3.5⭐️⭐️⭐️
А еще DeepSeek лучше всех справилась с “последним экзаменом человечества" - тестом из 3 тыс. вопросов, большинство из которых составлялись учеными⚡️⚡️⚡️
Все модели🤖: Gemini от Google, Claude от Anthropic, Grok от xAI, 4o и o1 от OpenAI и DeepSeek R1, - этот тест провалили, не набрав и 10%, но..
R1 получила 9,4%, а o1 всего 9,1% при том, что R1 не работает с картинками и такие вопросы пропускала❓
2️⃣В чем же тогда поднявшийся ор?..
DeepSeek ворвалась в лидеры менее, чем за год, а еще ее модели открытые и бесплатные (говорят, халява на R1 до 8го февраля)💸
+ китайцы сделали хитрый ход, забрав полрынка разрабов — API DeepSeek’а на 100% совместимо с библиотеками OpenAI, т.е. для миграции нужно просто удалить платный API от OpenAI и вставить бесплатный от DeepSeek’а🤣🤣🤣
3️⃣Самое большое влияние на этот разгон в стратосферу оказала инфа о том, что обучение R1 в 20 раз дешевле..
Давайте разбираться..
Во-первых, есть мнение, что DeepSeek перенял наработки от Llama после ее мощного рывка в 2024м, когда она вынесла всех по бенчам и сделалась открытой..
Если это так, то тогда с какого момента считать стоимость обучения и что там в ядре на L0 (выложил в комменты уровни обучения моделей)?.. Если там Llama - тогда ясно, почему DeepSeek такая “дешевая”🗡
Во-вторых, мы не знаем как и для чего учили модель..
Учитывая, что превосходство R1 не особо ощущается, может ее и учили на бенчи с арены - у всех “производителей” моделей эта практика стала нормой👍
А еще DeepSeek финансируется китайским хедж-фондом High-Flyer💸, основанным Лян Вэньфэном, а что важно финансистам? Чтобы модель стоила поменьше, а эффект от нее был побольше.. А что значит побольше? Шаг к AGI? Нет, конечно.. Качнуть рынки?.. Возможно🤙
В-третьих, сразу за взлетом R1 всплыл факт😁
Альтман почувствовал неладное - его беза узнала, что связанные с DeepSeek лица выкачивали через API OpenAI данные, обходя ограничения😈 По сути o1 учила R1💳
..OpenAI и Microsoft инициировали расследование, но доказательств никаких нет🔥
Т.е кто-то в OpenAI слил что нужно в DeepSeek, а DeepSeek с самого начала была “заточена” на низложение OpenAI.. Забавное свидетельство в конце поста))))
4️⃣Вернемся к “качнуть рынки” - чем обусловлено крушение рынка и антирекорд NVIDIA: -12% и -400 млрд $ за сутки?..
Да ничем - чем выше хайп в ИИ, тем меньше новости и колебания рынка связаны с реальностью🥳
Рынок среагировал на x20 меньшую стоимость обучения R1, и типа все эти уже трлнные инвестиции в строительство мега-ИИ-кластеров не оправданы😳
Но обучение базовых моделей, думаю, забирает не больше 5% этих огромных мощностей.. Остальное тратится не на инфраструктуру для обучения таких моделей, а на инференс, т.е. вычислительные мощности для запуска тысяч ИИ-агентов для миллиардов людей, добавьте туда мультимодальность (обработка видео, голоса, изображений, логические размышления, растущий контескт и работа с памятью) - потребность во всем этом в эру агентности будет только расти📈
Поэтому, уверен, ребята из фонда, финансирующего DeepSeek, успели закупиться “дешевой” NVIDIA🧠
PS Ну и обещанная бомба)) Когда я писал пост, вспомнил слайд с презентации Microsoft в мае 2024, на котором показана эволюция GPT, где каждое поколение сравнивалось: GPT3 с акулой, GPT4 с касаткой, GPT5 с огромным китом.. (см. картинку☝️)
А теперь гляньте на лого DeepSeek’а))) мать его гребаный КИТ😂😂😂
Все не просто так, и не ждите более в индустрии ИИ честной игры..
PPS пару дней назад вся база запросов пользователей DeepSeek “утекла” в сеть - во всем виноваты хакеры😀
Все свидетельства изложенных фактов в комментах👉))
ЧИТАТЬ D_PEOPLE
Первый бесплатный курс MLinside
Мы опубликовали на Stepik наш первый бесплатный курс (он же демо платного) - https://stepik.org/users/984760246/
Первым (коммерческим) курсом в MLinside был базовый курс ML. Не то чтобы мало на свете введений в ML. Для меня, например, после 15 лет преподавания, гораздо более интересный курс это ML в бизнесе, который мы тоже уже стартовали в MLinside, и где рассматриваем стандартные задачи, решаемые в компаниях. Но сработал тот же принцип несрезания конверсии, о котором я рассказывал в прошлом посте: вот придет кто-то на ML в бизнесе, поймет, что пока рано, и много чего из базы непонятно, а без базового курса и идти некуда 🙂
Первый поток мы набрали очень быстро, и с головой погрузились в проведение курса. Но в какой-то момент стало понятно, что поток закончится через 6 месяцев, отзывы от самых быстрых студентов пойдут через 3-4 месяца, и все это время не публиковать никакой информации о «Базе ML» будет как-то опрометчиво.
Решением стала публикация отдельных лекций в открытом доступе. Подписчики нас попросили выложить примеры лекций всех преподавателей курса, чтобы можно было оценить подачу материала. Я выбрал несколько видео от каждого, и оказалось, что в целом, даже только по выбранным фрагментам уже можно чему-то научиться.
В самом деле, в итоговый список попали:
- часть лекций по математике
- пара видео про питон
- семинары про линейную регрессию и SGD
- семинар, где собирается простая нейросеть на коленке не в PyTorch, а прям с нуля ручками с объяснением, как это работает
- лекции и семинары по метрикам качества и особенностям их оптимизации и валидации моделей
Посмотрев на все это, мы выложили материалы на Stepik в виде демо курса «База ML». Так что теперь у нас есть небольшой бесплатный курс, где можно познакомиться с основными концепциями: какая математика и какой питон нужны в ML, как работают внутри ML модели на примере линейных моделей и нейросеток (в частности, как и там и там применяется оптимизация с помощью SGD), как валидировать ML модели на примере задачи регрессии. Ко всему этому еще есть тесты и задания, так что проверить себя тоже можно :)
Что будет дальше? По мере расширения нашей линейки курсов, будет больше материалов в открытом доступе. Кроме того, у нас уже сформировался длинный список дополнительных видео для существующих курсов, что-то из них тоже будет опубликовано. Так что ждите новых анонсов! Также пишите, каких видеолекций/курсов вам не хватает в открытом доступе. Подумаем, что можем сделать 🙂
Попросил тут ChatGPT сгенерировать вопросы по ML, теперь дрожу от ужаса, что скоро нас заменят 😭
Читать полностью…Тем временем подкаст ТехТок возвращается после новогодних праздников :) Завтра выпускаем интервью с Сергеем Марковым про GenAI. Кстати, с момента записи интервью у Сергея уже вышла его книга, так что можно почитать электронную версию и даже заказать печатную: https://markoff.science/#book
Читать полностью…#c_level Про болтовню и болтунов
Самая сложная часть работы, когда весь ваш календарь превращается в сплошные встречи (а на C-level часто так), это отсутствие х2 скорости речи, как на YouTube, люди, втирающие какую-то дичь, и люди, не отвечающие прямо на поставленный вопрос и старающиеся все заболтать
Причем как настоящий переговорщик получает от процесса переговоров не меньше удовольствия, чем от успешного их завершения, а настоящий продавец - от процесса продажи, настоящий любитель поболтать тоже воспринимает процесс как прекрасный танец в котором ему одно удовольствие исполнить главную партию. Если вам нужен сугубо результат, а надавать болтуну по щам вне зоны ваших полномочий, пытка неимоверная
В какой-то момент я начал развивать терпение по принципу «представьте, что вы психиатр». Как это? А вот так: если кто-то бодро забежит к вам в кабинет на четвереньках, надо не кричать «ты больной?», а вкрадчивым голосом интересоваться: «ой, а кто это тут у нас, собачка или кошечка?». И внезапно люди, несущие ахинею на совещании становятся очень интересными, ведь там свой волшебный мир, ждущий своих исследователей :)
Как натренировать этот навык? А очень просто, либо ходите на совещания, если их уже достаточно для антропологических целей, либо подписывайтесь на телеграмм-каналы и читайте иногда. Нет, это не прогрев, серьезно, знаете сколько всего интересного пишут. Если вам нужен навык «я видел некоторое говно» - интернет и телега в частности вас точно не оставят в беде
Вопрос на засыпку: все ли понимают причину такой дипломатичной формулировки в статье? Не про «не хотели обижать мэтра», а именно почему не хотели и ни в коем случае нельзя было? :)
Читать полностью…Компенсации в топ-менеджменте (часть 2/3)
Продолжаю рассказ про то, как оплачивается работа топов. В прошлый раз мы поговорили про зп и STI, теперь остались LTI и льготы.
‼️ Кстати говоря, текст может быть полезен не только тем, кто уже метит в топ-менеджмент. Аналогичная схема вознаграждения распространяется по компаниям все больше и часто применяется просто для высокогрейдовых сотрудников. Общая идея здесь в том, что компании все равно выгодней платить вам деньги не большим фиксом в месяц, а разбив сумму на зп+STI+LTI. Также не стесняйтесь задавать вопросы в комментариях.
📈Акции
LTI или Long-Term Incentive - долгосрочная мотивация. Обычно это какая-то большая сумма сумма денег, выдаваемая либо напрямую в виде акций компании (если компания публичная, т.е. торгуется на бирже), либо в денежном выражении, но так, чтобы фактическая сумма была привязана к показателям компании (всякой там ебитде, гросс марже и прочим ругательствам - у кого к чему).
В случае топов эта сумма может быть сравнима или даже заметно больше, чем зарплата+премия, но она распределяется на 3-4 года. Это называют вестингом акций: они за вами уже закреплены, об этом подписаны все документы, но получаете вы акции постепенно. Есть компании с равномерным вестингом - например, 25% каждый год из 4 лет, есть компании с неравномерным - например, в первый год поменьше, второй побольше, а на третий прям много. Смысл неравномерности опять же в том, чтобы в будущем перед вами всегда был большой куш, который вы захотите заработать.
Этот куш имеет и обратный эффект: чтобы его получить, люди готовы проявлять чудеса осторожности и не вступать лишний раз в конфликты, что приводит к довольно медленному решению вопросов. Исправляется эта проблема просто: топ-менеджеров достаточно легко увольняют. Т.е. если вы весь такой аккуратный выживальщик и нигде не идете на активное нанесение добра компании, чтобы избежать конфликтов, это будет видно. После пары сигналов от руководства вы все равно попрощаетесь и с работой, и с бонусами, ведь над вами есть еще СЕО, который финансово заинтересован в результате. С другой стороны, если вы побежите с шашкой наголо ломать все, что работает - прогноз вашей выживаемости тоже обычно неутешительный.
🥇Льготы и прочие плюшки
Тут уже зависит от корпоративной культуры, и кто во что горазд: кабинеты, служебные машины, водители, ассистенты, вторые ассистенты, премиум ДМС и так далее и так далее. Мое мнение - кабинет это довольно удобно, когда у тебя миллиард встреч в неделю, личный ассистент это тоже удобно, когда календарь сложный. Лично для меня играть в тетрис с календарем всегда было сложнее, чем любой этот ваш машинлернинг или даже теорфиз.
Остальное зависит от рода деятельности. Если вы управляете каким-то бизнесом компании, где нужно много ездить по другим компаниям на переговоры, здорово, если вас возят. Если весь день сидите в одном здании, то вообще пофиг. Кстати, иногда вместо водителя и машины люди просто предпочитают компенсацию такси.
Кроме того, вы удивитесь, как много топ-менеджеров ездит на метро. Когда ты топ, опоздать на встречу, стоя в пробке, - часто непозволительная роскошь. А метро внезапно прогнозируемое и надежное 🙂
Что касается ДМС, многие на этом уровне уже привыкли ходить к врачу заранее, а следовательно платить за медицину сами. ДМС предполагает, что уже есть жалобы, а премиум ДМС просто включает в себя топовые клиники или топовых врачей в них, но как и обычный ДМС не покрывает какие-то серьезные необязательные операции, улучшающие качество жизни. Так что радикальных отличий от обычного ДМС здесь нет, просто пакет услуг и выбор врачей шире.
#c_level
Шутки про data quality в конгрессе
Никогда не думал, что застану при жизни шутки в конгрессе США про качество данных в базах данных по населению. А твиттерские даже не выкупили стёб Трампа 🤣
Без математики в мире ИИ никуда.
Образовательный проект Popmath подготовил 4-х месячные онлайн-курсы для взрослой аудитории для всех, кому важно осмыслить математику, а не просто заучить набор формул.
На ваш выбор два курса:
📍Математика для взрослых: для желающих получить прочную математическую базу. Предварительные знания не требуются.
📍Линейная алгебра: для тех, кто хочет разобраться в предмете поглубже и выйти за рамки базовых знаний математики.
🔆 Формат курсов:
- 16 лекций и 16 семинаров через Zoom
- обратная связь с преподавателями в Телеграм
- яркие 2D- и 3D-анимации для лучшего восприятия материала
Старт групп: середина марта
По всем вопросам можете писать @popmath_support
Реклама. ИП Пясецкая Наталья Игоревна
ИНН 773714262272
erid: 2VfnxwEf9U4
Темная правда про собесы
На днях вел заключительный вебинар у первого потока Базового ML в нашей школе MLinside, и на примере одного частого вопроса на собеседованиях рассказал очень грустную вещь про собесы и вообще рабочее общение.
Если на вопрос есть нестрогий (или вообще неправильный), но популярный ответ, а вы знаете как ответить дотошно и максимально корректно, не спешите это делать на собеседовании. Есть два варианта: вам поймут, и вас не поймут. Да-да, вас собеседует тоже живой человек, который может быть умным, глупым, бодрым, уставшим, да каким угодно. Если от вас ожидают услышать ответ, что занавески синие, потому что главный герой в депрессии, а не потому что они блин синие - возможно всем будет проще, если вы скажете то, что от вас ожидается. Что вы, сочинения в школе не писали? :)
Подвох здесь есть. Если вы неверно оценили собеседника, дав более правильный ответ тому, кто его не поймет, вы еще имеете шанс объяснить свою позицию. А вот когда пошли по пути наименьшего сопротивления и выдаете за правильный ответ широко распространенную лажу, а вас собеседует знающий спец, ну что вы ему скажете? Что думали, что он тупой? Что не хотели провоцировать конфликт? Нет, этот собес уже провален.
А вам приходилось специально упрощать ответы на собеседовании, чтобы быть понятым? Это по-вашему зло или нормальное проявление уважения к собеседнику?
Python как первый язык программирования в университете
Многие изучали в университете алгоритмы и ООП на C++. Плюсы «плюсов» в этом качестве конечно понятны: учишься работать на языке, который с одной стороны достаточно выразителен, а с другой стороны не всё на свете делает за тебя. Хотя не знаю, насколько так можно говорить про современные стандарты плюсов, но все-таки. Скорость плюсов хороший довод за, если мы говорим про курс алгоритмов. Ну и эстетика языка тоже важный фактор. Помимо себя знаю много людей, у которых именно с эстетической точки зрения С++ любимый язык (правда, что характерно, все они не пишут на нем на работе😂).
Но с другой стороны, а стоит ли мешать изучение алгоритмов и принципов ООП еще и с изучением плюсов? Может в 2025 году можно уже первым языком в универе давать Python? Особенно в контексте подготовки MLщиков, не всем из которых понадобится писать плюсовый код (тем, кому понадобится, давать плюсы дальше).
Призываю вас поделиться в комментах своими мыслями. А может даже кто-то знает бакалавриаты, где обучение уже построено так? Вопрос не праздный, возник при обсуждении университетских учебных программ.
😴 Экзамены и комитеты во сне
Приснился сегодня забавный сон: я снова работаю в топ-менеджменте и что-то докладываю на заседании правления. Надо кстати сказать и выступил нормально, и прошло хорошо, но проснулся все равно с облегчением. Даже задумался: странно, что такое привычное дело и столько эмоций во сне.
К чему я это: разговорился с другом, начали вспоминать, как во сне после универа то диплом защищаешь, то экзамены сдаешь. У меня тоже такое было: я после МФТИ еще несколько лет во сне пересдавал экзамен по дискретной математике, на котором так себе отвечал и нахаляву получил от экзаменатора «отл» с пожеланием идти отсыпаться (курсе на 2 или 3).
А поделитесь в комментариях, были ли у вас подобные истории?
Вопрос на засыпку: почему L1 регуляризация разреживает?
Нет, я серьезно. На собеседованиях все любят спрашивать, а так, чтобы интервьюер мог показать это сам - большая редкость. Ромбики и кружочки рисовать или рассказывать про то, что производная +-1 быстрее к минимуму сходится - это в пользу бедных. Если надо, расскажу в комментариях, почему. Так как доказывал бы это строго?
Мне как всегда студент принёс красивое доказательство, а заодно вспомнили с Ильей Ирхиным и доказательство постарше - которое он сам предлагал, когда вели вместе DMIA. Пишите в комментах свои версии, а я потом поделюсь нашими :)
Не проект
Небольшой оффтоп. Много занимаясь образованием (даже при том, что в основном вузовским и обучением взрослых людей), часто сталкиваюсь с темой детского образования. Например, в этот понедельник читал лекцию в школе.
Учащихся собрали в актовом зале, причем учеников из всех классов от 5 до 11, так что было непросто. Ну представьте, у меня еще нет адаптации лекции для 5-классника. А каков обычно ребенок в 5 классе? Он же крутится как волчок и не умолкает ни на секунду, сам таким был когда-то, помню. Вот под этот гул нужно было не терять ни мысль, ни надежду ("ха-ха" скажут в ответ на мое нытье учителя) и рассказывать мою неадаптированную лекцию. Задумался о том, чтобы сделать версию с более активным развлечением слушателя и борьбой за его внимание. Даже больше скажу: может в том и секрет гениальной лекции, чтобы даже вниманием пятиклассника суметь завладеть?
Но вообще применительно к детям, и особенно к детскому образованию, хотел задать вам вопрос, который не дает мне покоя. Часто слышу формулировку: "мой ребенок - это мой главный проект". И меня от нее выворачивает, прям физически начинает тошнить. Как и от человека, который это говорит вслух. Хочется кричать: "он не проект, он живой и его надо любить". Но это первый эмоциональный позыв. Ну и, конечно, вслух я ничего не говорю, еще бы мне родителю давать совет как воспитывать своего ребенка - суицидальных наклонностей не имею 😂
Однако если подумать, в этой фразе есть и позитивный подтекст. И я не про то, что уж хотя бы "главный" проект (это, кстати, тоже хорошая новость), а про серьезное отношение в целом. Про планирование и про попытку дать ребенку что-то конкретное и измеримое, а не продолбать все, действуя по наитию и обходясь без планов.
А вы как думаете: можно ли говорить, что ребенок - это проект, или вас тоже коробит от этой формулировки?
Никита тут опять выдал нелицеприятную базу про жизнь в корпорации. Искренность, правдивость и точность поста зашкаливает, что не просто смело, а капец как смело :) Как всегда - накидывайте в комментах свои вопросы про жизнь в корпе (можно как Никите, так и мне - я не такой смелый, но на что-то тоже готов ответить)))
Читать полностью…У Димы Трофимова вышел хороший обзор истории с DeepSeek. Кратко и по делу, так что обязательно читаем
Читать полностью…#образование Про платный и бесплатный контент
Давным-давно, когда мы с Эмели Драль впервые пробовали продавать корпоративное обучение по Data Science (вероятно лет 7-8 назад), я спрашивал совет у одной очень матерой пиарщицы про то, как вообще выходить на рынок, где можно и нужно засветиться, ну и вообще какими мыслями может поделиться.
Первый её совет был такой: сначала позаботьтесь о том, чтобы ваша конверсия не срезалась невозможностью у вас что-то заказать. Вот если у вас есть лендинг, нужно чтобы все кнопки «заказать» там 100% работали, все указанные почты читались, ответы были оперативными и т.д. Только после этого имеет смысл приводить какой-то трафик. Банально? До безумия. Но конечно я миллион раз и сам косячил в этом и за другими замечал.
Наш курс Data Mining in Action проводился девять лет и был бесплатным для слушателей. Каждый набор к нам кто-то подходил и говорил: «Вы неправильно живете, что не берете деньги за это!». Мы не только не брали, мы еще и сами вкидывали свои, чтобы были материалы, чтобы был выпускной, много для чего. Привлекали некоторое финансирование от компаний-партнеров, но существенно меньше общего бюджета.
И вот мне это начало самому надоедать, потому что часто не хватало денег чтобы удерживать людей в проекте. Это же не чисто моя благотворительность, это была еще и благотворительность наших препов. А всем рано или поздно начинает не хватать времени. Со специализацией на Coursera была отчасти похожая история, но уже чуть получше. Да и просто честолюбие потешить тем, что на каждой второй встрече говорят, что учились по твоим лекциям, уже дорогого стоило ))
Но в итоге мое возвращение в массовое образование в прошлом году помимо преподавания в МФТИ и ВШЭ ожидаемо включило в себя запуск коммерческой онлайн-школы ML. Тут конечно я сразу оценил контраст между тем, когда что-то раздаешь людям бесплатно, и когда продаешь. В первом случае тебя все благодарят, а во втором орут, что «Буратин теперь в ML гонят».
Но и в возможностях для организации тоже контраст крутой. Теперь видосы красивые, обратная связь быстрая (на фоне того что было на бесплатном курсе - безумно быстрая), домашки проверяются, даже видосы на канале школы на YouTube периодически залетают. Ну а люди, которые осмысленно заплатили за курс, ходят на занятия и делают домашки, да и даже если не всегда делают, оказались очень приятной и благодарной аудиторией, с которой огромное удовольствие работать.
Если вы думаете, что я хочу сказать «нафиг бесплатное образование», не спешите с выводами. Оказалось, что полезные бесплатные материалы это база маркетинга в современном массовом образовании. Сначала к вам долго присматриваются по роликам на ютьюбе или выложенной pdf с учебником, а потом в какой-то момент решаются уж пойти и серьезно поучиться. Поэтому сейчас у меня новый заход в создание бесплатных материалов, видеолекций и курсов. И об одной такой вещи я расскажу вам здесь на днях. Изменилось только одно - теперь не режу конверсию тем, что ничего нельзя купить, как 10 лет назад :))) Можно, уже как минимум два курса есть в MLinside и еще несколько на подходе.
Интервью с Сергеем Марковым про GenAI в подкасте ТехТок
Таймлайн:
00:00:00 - Начало
00:03:55 - Кратко о расцвете генеративных моделей
00:09:58 - Важные достижения ДО выхода ChatGPT
00:13:05 - Как учили первые Российские генеративные модели
00:16:51 - Почему пальцы проблема и разнообразие датасетов
00:21:41 - Различия подходов к генерации и специализация нейросетей
00:31:16 - Мультиагентные среды
00:36:15 - Написание промтов и правовые вопросы
00:46:16 - Регуляторные механизмы и вотермарки
00:50:07 - Диффузионные модели vs авторегрессионные
00:54:47 - Генерация видео (по состоянию на 2024 год)
00:59:49 - Важные задачи в GenAI
01:04:29 - Трудности разработки русскоязычных моделей
YouTube: https://youtu.be/4Cxk3gYuGo0?si=Wvi7sZqEEGzhN-RM
VK видео: https://vkvideo.ru/video-228552366_456239024
Знаете, что такое чистое счастье? Вот вы вывели формулу, проверили, она работает - это счастье. Вы написали код, запустили, он работает, проверили - правильно работает. Вот это и есть чистое счастье.
Никаких вопросов как на работе в духе «а я ли эту формулу сейчас вывел или это команда затащила вопреки моему косорукому участию?». Или «а правильно ли я реорганизовал подразделение, может только хуже сделал?».
Да, есть вопрос, а нужна ли была эта формула или этот код. Но обычно даже этот вопрос терзает на порядок меньше предыдущих.
Когда можешь измерить результат, когда видишь его своими глазами, когда получил его своими руками, когда результат получен логически строгими шагами - это запредельное счастье.
Поэтому, например, мне нравится преподавать вживую, а не только записывать лекции. Спросят что-нибудь, например попросят вывести формулу, на которую ты 5 лет болт кладешь и даже не думаешь разбираться, не знаешь как ответить, пошел - разобрался. Сначала сам. Получилось - восторг, если прям сразу как спросили получилось - вдвойне восторг. Не получилось - ищешь наводки. Не смог с наводками - ищешь ответ, разбираешь ответ. Немного с привкусом разочарования, но все равно счастлив, теперь же знаешь, как оно.
Когда такого счастья в жизни становится маловато, обязательно кто-нибудь из студентов подкинет :)
А если пост наберет 100 реакций, запощу несколько моих любимых вопросов и ответов с занятий в канал.
#преподавание
Продолжая тему культуры аппрувов и самостоятельности
Часто она идет вкупе с уважением к авторитетам, и на сей счет есть кейс, который каждый год (аж два) рассказываю студентам на модуле графовых нейронок в магистратуре физтеха.
Когда опубликовали идею attention, ее сразу же начали пытаться добавлять всюду – и стороной не обошли и графовые свертки.
Итак, 30 октября на архив выкладывают короткую статью Graph Attention Networks. Все бы ничего, но в авторах есть сам великий Yoshua Bengio 🥸!!!
И реализацию статьи добавляют в прекрасный Pytorch Geometric под именем GATConv.
Все бы ничего, но работает эта штука не то чтобы очень.
А все почему? Attention реализовали в виде линейного слоя после линейного слоя 😆😆😆😆. Да, без нелинейности между ними 😂😂😂 А чему учат на первом занятии по DL? Тому что два линейных слоя подряд – снова линейный слой!
Лишь спустя 4 😱 года — в 2021 — на архив выкладывают статью с аккуратным названием How Attentive are Graph Attention Networks?, где ни в коем случае не утверждается что мэтр с командой ошиблись.
Только посмотрите на образец дипломатичной формулировки:
However, in this paper we show that GAT computes a very limited kind of attention: the ranking of the attention scores is unconditioned on the query node. We formally define this restricted kind of attention as static attention and distinguish it from a strictly more expressive dynamic attention
Компенсации в топ-менеджменте (часть 3/3)
🏎 Чем обусловлены компенсации топов
Важно понимать, что топам платят приличные деньги не потому что они такие офигенные и самые гениальные люди на свете, а потому что у них нет и не может быть отговорок. Сам ты себе помешал или какие-то обстоятельства непреодолимой силы - никого не волнует.
Топ-менеджер берет ответственность за достижение результатов бизнеса, за это и получает свою компенсацию. В зависимости от степени успеха или провала, ее часть или вся сумма целиком может умножиться на ноль (или что-то от 0 до 1+).
Конечно, в минус компенсация не уйдет: в этом отличие топа от предпринимателя, и это объясняет, почему предприниматель все равно заработает значительно больше топов (если мы говорим об одной и той же компании, и она уже достаточно велика, в маленьком стартапе всякое бывает).
Однако топ-менеджмент это все равно крайне высокий уровень ответственности за бизнес, высокий уровень рисков, и другая вероятность "не вывезти" и покинуть корабль досрочно. Кроме того, желающих поработать на C-level всегда много, конкуренция высокая, и чтобы удерживаться даже год-полтора нужно не просто справляться, а не попасть в список "отстающих" на фоне коллег.
Легче всего с этим справляться, если у вас есть некоторая устойчивость к постоянному стрессу, внешней оценке и соревнованию с другими, и вы можете просто делать то, что считаете правильным для компании. Если же вы от подобного давления будете постоянно дергаться, работа в топах запомнится вам надолго)))
Конечно, все не так прям бескомпромиссно жестко. Желающих работать на C-level и правда много, а внушающих доверие CEO и совету директоров как правило меньше. Поэтому, если увольнять управленцев за любой просчет, никаких кадров не напасешься. Но и гладить по головке и заботиться о вашей мотивации уже, конечно, никто не будет.
Итого: внутренняя мотивация - это база, отвечать головой за результат - это база, уметь отбивать нападки недовольных оппонентов (например тем, что вы делаете то, что считаете нужным вы, а не они) - это тоже база, ну и уметь быстро принимать решения, за последствия которых вам отвечать - тоже, конечно же, база. Все это по-хорошему начинается уже с любого руководящего уровня, но в экзекьютивах достигает своего пика.
#c_level
Компенсации в топ-менеджменте (часть 1/3)
Сразу предупрежу: конкретные суммы я называть не буду, т.к. по себе или знакомым совершенно не заинтересован ничего разглашать, а в достоверности других источников не могу быть уверен. Кстати, это один из способов психологического давления в корпоративной среде - капать оппоненту на мозги (можно через друзей, чтобы не так очевидно) рассказами про гигантские вознаграждения его коллег, конечно же, в 99% случаев выдуманные. Так что не верьте всему.
Однако я расскажу, из каких частей состоит вознаграждение топов, как выплачивается, и на что это влияет. Думаю, что тем, кто этого не знал, будет все равно интересно. Что касается сумм, есть прекрасные журналы Forbes, РБК и другие им подобные, которые профессионально считают чужие деньги, в их материалах периодически встречаются исследования рынка.
💵 Зарплата
Есть три (ну ладно, четыре) части компенсации: зарплата, STI, LTI и всевозможные льготы. Первое нам всем итак знакомо, а по размеру могу сказать, что есть две школы мысли: первая - что у руководителя должна быть самая большая зарплата в его подразделении, вторая - что можно нанимать сотрудников на бОльшую зарплату, чем у тебя, если так уж рынок порешал. Я сторонник второй школы мысли, потому что в современных реалиях цена хороших CTO или CDS растет быстрее зарплат сидящих десятилетиями в одном месте корпоративных менеджеров. Кроме того, зарплата сильно разнится от компании к компании: большая группа компаний типа Сбера и какой-нибудь заметный игрок в своей нише, но развивающийся просто под продажу стратегу, - это конечно две разные истории.
🏆 Премия
STI или Short-Term Incentive - краткосрочное поощрение (дословно "стимул"). На западе так называют и квартальный, и полугодовой, и годовой бонус. У нас обычно также, но иногда могут быть заигрывания с годовой премией, как будто это уже "долгосрочная" мотивация. Например, часть годовой может расчитываться как-то стабильно и по KPI, а часть быть привязана к какому-то общему показателю бизнеса и косплеить бонус акциями. Но в случае топов обычно есть просто одна премия, которая платится раз в год, и она расчитывается и по вашим KPI, и по показателям компании. В целом как у всех сотрудников, с тем лишь отличием, что на грейдах ниже выплаты чаще - раз в квартал или раз в полгода.
Связано это с тем, что работа высоких грейдов и, в том числе, топов, оказывает долгосрочное влияние, и логично измерять результат по более долгому периоду времени. Также, если для низких грейдов премия может отсутствовать или быть в размере 1-2 месячных зарплат, у топов премия может составлять 50, 100 и более процентов годовой зарплаты. Объясняется это тем, что премию вы получаете только доработав год до конца, так что перекос годового дохода в сторону премии дает великолепный рычаг давления на вас и кратно растит вашу заинтересованность показывать чудеса проактивности и заинтересованности в общем деле.
В следующей части поговорим об LTI и прочих плюшках, а в комментариях пишите, о чем еще рассказать про C-level
#c_level