Moderately hot take: современный LLM-based AI engineering больше похож на времена до Imagenet moment, чем на эпоху расцвета диплернинга.
В эпоху до диплернинга (которую я застал краем глаза в контексте компьютерного зрения), в распоряжении инженера был набор стандартных инструментов, ни один из которых не был достаточно универсальным для end-to-end решения, и задачи решались набором костылей разной степени изящества. SIFT и другие ключевые алгоритмы уже придумали мудрецы в башне из слоновой кости, твоя задача - собрать из препроцессингов и эвристик что-то работающее для конкретной задачи и конкретного датасета. Кстати, тогда тоже были RAGи, и тоже работали так себе.
Во времена расцвета диплернинга, все больше задач стали решаться end-to-end, и потому ключевыми инструментами стали околоархитектурные изменения (включая знаменитый stack more layers) и, конечно, большие и чистые датасеты. Если предложить делать какой-нибудь adaptive histogram equalization перед инференсом какого-нибудь Resnet/Unet, в приличном обществе на тебя будут смотреть с опаской - пусть сеть сама это выучит, оставь свои древние штучки для аугментаций! Умение сделать кастомный лосс важнее умения придумать релевантную эвристику.
И вот с foundation моделями прошел полный оборот: большие модели делают умные GPU-rich ребята, соваться туда в подавляющем большинстве случаев бессмысленно, и надо снова придумывать пайплайны с эвристиками. Перебор разных фильтров в препроцессинге до сходимости был в той же степени хаком, как и идея добавлять wait в конец генерации; сейчас бы оно легло в парадигму test-time scaling и не считалось зазорным.
Ещё 2 за сегодня:
9/100. https://www.instagram.com/reel/DFpW-P0IIrz/
10/100. https://www.instagram.com/reel/DFp425kIS58/
Кстати, спасибо большое Игорю (t.me/seeallochnaya) с его Pro-подпиской за $200, попросил его закинуть в Deep Research агента от OpenAI порисерчить бенчмарки % досматриваемости тиктоков в моей нише за 2023-2024 годы, чтобы получить реалистичные прикидки на что стоит расчитывать на каком этапе видео / к чему стоит стремиться. Сравнив со своими графиками досматриваемости сразу стало понятно, где сейчас самое узкое место, где стоит проводить эксперименты в следующих итерациях
Всё-таки, чтобы попасть в top-5% нужно не только много практики, но и собирать как можно больше обратной связи из разных источников на свои итерации, делать back-propagation
Такой вот data-driven content marketing
8/100. https://www.instagram.com/reel/DFmxG5dIMks/
От Станиславского до «в душ, голая и без меня» один шаг
Итого за прошлую неделю выпущено 7 видосов:
Формат A: Стоковые видео + закадровый голос [en]
1/100. https://www.instagram.com/reel/DFXr5dACMPJ/
2/100. https://www.instagram.com/reel/DFbBxpIiMJS/
3/100. https://www.instagram.com/reel/DFcpBLZikYc/
Формат B: Знакомство вживую на RayBan очки [en]
4/100. https://www.instagram.com/reel/DFdFWmji1jG/
Формат C: Переписки на Twinby [ru]
5/100. https://www.instagram.com/reel/DFgDWSMI-j6/
6/100. https://www.instagram.com/reel/DFiJydpI0uG/
7/100. https://www.instagram.com/reel/DFkeDuMIBru/
Формат С лучше всего демонстрирует основной use-case продукта (к тому же интеграция в самые первые секунды, что важно с учётом что у большинства не будет 100%-ая досматриваемость). Его легче всего автоматизировать и выпускать большими партиями каждый день
Будем фокусироваться на нём + постараемся на этой неделе выпустить х2 больше роликов
Новый видос, шутки про вайлдберриз и гороскопы 🤝
https://www.instagram.com/reel/DFkeDuMIBru/
Друг сказал, ему понравился вайб, ритм в этом видео
Тоже стал ловить себя на мысли, что когда еду в такси или тренируюсь в зале, сохраняю треки, у которых ритм, текст, вайб подходят под следующие видосы, которые можно будет прикольно обыграть
И это занятно, в каком неожиданном месте находит себя слух, наработанный за годы тренировок танцам в подростковом возрасте (здесь рассказывал подробнее). Танцы – это ведь тоже "физическая" визуализация музыки, воплощение музыки
Ранее писал и говорил, что классно, что наработанный за годы навык работы с текстом нашёл себя здесь, в стартапе, который помогает в переписках. Философский кружок и эссе которые мы писали и критиковали друг у друга; написание задач для симулятора ML которые "бились об реальность" через студентов и непосредственно влияют на их скорость обучения; участие в написании книги; годы переписок в мессенджерах и на сайтах знакомств – всё это вырабатывало въедливое чувство текста, слов, букв и в настоящее время активно помогает совершенствовать продукт, качество AI-ответов в Vibe
Аналогично, с самого детства и до первых курсов вуза я много рисовал, включая акварель, акрил, у меня были выставки (в художку не ходил, поэтому навык рос и развивался на чистом энтузиазме), я рисовал портреты на заказ с 14 лет (буквально мой первый регулярный заработок). В более сознательном возрасте это вылилось в то, что у меня был свдиг в сторону визуального мышления (у меня в вузе был научник, который разделял математиков на "алгебраистов" и "геометров", одним проще разобраться в формуле, другой если не представит процесс визуально, не поймёт - я определённо отношусь к "геометрам"). В работе эта особенность находила себя в том, что я куда бы не пришёл, любой существующий или новый процесс, ML систему, дата пайплайн – визуализирую (Miro), чтобы самому разобраться, а затем эти драфт-визуализации коллеги закидывали в каждую презу проекта. Забавный сайд-эффект
Сейчас это визуальное мышление обнаружило себя в UI/UX дизайне. Опять же, я не проходил курсы, не изучал гайды (пока что), но уже наличие опыта работы с визуальным представлением чего либо выродилось в то, что меня и друзья, и совершенно незнакомые люди заваливают комплиментами по интерфейсу Вайба (хотя сам я вижу кучу косяков, которые надо в будущем исправить). Спрашивают, нет ли у меня дизайнера, а кто-то даже предлагает им написать iOS приложение
Буууум, новый формат, ещё и на русском
Показываю, как нужно переписываться на Twinby
https://www.instagram.com/reel/DFgDWSMI-j6/?igsh=Z3BkMW1mZzNxaHo3
Прочитал недавно заметку по совету своего друга Сергея
95%-ile isn't that good
Написал ее чел, который работает в Twitter Senior Staff Инженером (то есть Е7 - смотри серию разборов про левелы в Биг Техе)
До этого уровня он добрался за счет того, что нашел и пофиксил проблему, когда примерно 100 миллионов долларов в год тратилось на ресурсы без аллокации - то есть в никуда (если интересно - можем разобрать как он это сделал). Впрочем, еще задолго до этого он уже был среди авторов патента из Гугла по TPU - Neural Network Processor
Dan Luu, автор заметки, утверждает что достигнуть верхнего перцентиля в 95% это недостаточно хорошо, причем не просто быть 95% и выше в определенной деятельности среди всех людей в мире, а именно среди тех кто этим заниматеся.
Для этого необходимо выполнить лишь три пункта
1. Захотеть стать лучше
2. Проанализировать/собрать обратную связь
3. Воплотить это в жизнь через практику
Бабах, ты в 95% перцентиле
Проблема, понятное дело, лежит во втором пункте, особенно для сложного и неоднозначного вида деятельности, например публичных выступления
И в третьем, потому что люди не любят практиковаться и тренироваться, поэтому те кто заставляют себя, легко обходят всех прочих
At one of the first conferences she spoke at, the night before the conference, we talked to another speaker who mentioned that they hadn't finished their talk yet and only had fifteen minutes of material (for a forty minute talk). They were trying to figure out how to fill the rest of the time. That kind of preparation isn't unusual and the vast majority of talks prepared like that aren't great.
Most people consider doing 30 practice runs for a talk to be absurd, a totally obsessive amount of practice, but I think Gary Bernhardt has it right when he says that, if you're giving a 30-minute talk to a 300 person audience, that's 150 person-hours watching your talk, so it's not obviously unreasonable to spend 15 hours practicing (and 30 practice runs will probably be less than 15 hours since you can cut a number of the runs short and/or repeatedly practice problem sections)
This makes Leah's 30 practice runs an extraordinary amount of practice compared to most speakers, which resulted in a relatively good outcome even though we were using one of the worst possible techniques for improvement.
Еще один хороший совет - не отвлекаться или отвлекаться на заранее спланированный список дел
For example, I noticed how I'd get distracted for N minutes if I read something on the internet when I needed to wait for two minutes, so I made sure to keep a queue of useful work to fill dead time (and if I was working on something very latency sensitive where I didn't want to task switch, I'd do nothing until I was done waiting).
С этими наблюдениями сложно не согласиться
Попасть в 95% довольно легко и для этого не нужно особого таланта
К счастью немногие следуют этим советам, поэтому попасть в 95% довольно легко
Что если тех, на кого ты стремишься быть похож, от тебя отличает лишь отсутствие синдрома самозванца?
Читать полностью…Здесь можно почитать все отзывы подробнее: https://www.instagram.com/s/aGlnaGxpZ2h0OjE3ODc0Nzc4NDAxMjY3NDY3?igsh=MWNkaXA0Y2FheG05dA==
Читать полностью…5-step sequential design process by Elon Musk
1. Make your requirements less dumb
2. Remove all parts or processes you can
3. Optimize, simplify
4. Accelerate your feedback loop
5. FINALLY, automate
В разработке продукта и в контент маркетинге есть общая черта – в них обоих важен Retention
Если в продукте retention rate, % удержания говорит о Product-Market Fit, т.е. продукт "мэтчится" с нуждами какого-то сегмента аудитории (и считаем мы его по дням / неделям), то в контенте retention rate – это какая аудитории всё ещё смотрит ролик к N-ой секунде (здесь мы воюем ещё не за удовлетворение потребности, а только за внимание)
Аналогично, мы нацелены не на то, чтобы посмотрели все, это нереалистично, мы нацелены на то, чтобы была доля пользователей (и, ясно, чем выше, тем лучше), которая смотрит до конца. Тогда можно говорить про Content-Market Fit
Воскресная партейка в ГО с большим БО. Укатывает старого в ноль. Потренируюсь на этой недели, подучу правила.
Читать полностью…Лайфхак всем парням, которому я научился у своего бати, не важно, вы в отношениях или вы ца Вайба:
Когда куда-либо едете с женщиной/девушкой,
1. Открывайте ей дверь такси/машины, сами садитесь с другой стороны
2. Если нужно выходить и она тянется к ручке двери - «сиди, я открою», обходите машину, открываете, подаёте руку
Попробуйте, посмотрите на её реакцию. Спасибо скажете подпиской на Вайб
https://onelink.to/get-vibe
Короче, всё это очень бьётся с мыслью из книги "So Good They Can't Ignore You" от Cal Newport (автор знаменитого понятия Deep Work и одноименной книги). Я рекомендую эту книгу абсолютно всем, кто спрашивает меня "как найти себя?", "как найти своё призвание?". Я когда читал лет 5 назад, у меня была мысль, мол, как же мне повезло, что эта книга абсолютно бесполезна лично для меня, потому что её философия у меня уже была на подкорке. Для тех, кто ещё не нашёл своё призвание, тоже будет большим везением её прочитать сегодня, а не через год или через 5 лет, потому что она может сильно поменять восприятие мира, себя и своих навыков
В ней Cal пропагандирует простую мысль, что не нужно заниматься "поисками" себя и не нужно бояться "попасть не туда и заниматься не тем". Если ты будешь достаточно хорош в чем-либо, то или это и станет твоим призванием, или это будет твоим фундаментом/арсеналом в том, что станет. А ждать идеального момента / идеальной возможности / идеальной работы – обрекать себя на скучную и неинтересную тебе самому жизнь
В самой книги этой аналогии не было, но кажется в одном из интервью Cal её приводил (могу придумывать). Поиск призвания похож на поиск любви: ты не можешь пройти мимо большого количества девушек и сходу понять "о, это моя любовь". Это невозможно. Ты сначала общаешься, флиртуешь, вайбишь, у вас наступает секс, вы проводите больше времени вместе, углубляетесь друг в друга, влюбляетесь, переживаете разные приятные и неприятные моменты, положительно влияете на жизнь друг друга и только спустя годы ты можешь сделать вывод, что у вас любовь
Также невозможно и встретить призвание, ничем не занимаясь достаточно большое количество времени (тысячи часов минимум). Сначала ты чем-то занимаешься, пробуешь, в какой-то момент у тебя начинает получаться, это увлекает, становится игрой, хобби, затем тебе начинают за это платить, это превращается в профессию, ремесло, компетенцию, и только спустя годы, если ты не перейдёшь на что-то другое, ты почувствуешь, что это твоё призвание
Switching cost в контексте работы на мой взгляд переоценён. Нужно фокусироваться на подходе и мышлении, на качестве и количестве работы, которую ты привык делать. Чтобы за что бы ты не брался – ты стремился быть чемпионом в этом. С таким подходом ты сможешь сделать что угодно и освоить любой +1 навык, а уже накопленные навыки будут рано или поздно пригождаться в будущем. И ты никак не можешь предугадать, какие именно, когда и где
🇫🇷🥐 из Парижа, с любовью
новый видос: https://www.instagram.com/reel/DFiJydpI0uG/ 🫶🫶🫶
https://www.youtube.com/watch?v=nTr21kgCFF4
Важная и интересная мысль: трейд-оффа "качество vs скорость" не существует, это высосанный из пальца миф придуманный "медленными людьми" (которых большинство). Если ты запланировал что-то сделать за 60-90 дней, то уже к концу первой недели (первые 10% времени), у тебя уже должен быть собран сырой прототип (тестирующий core-гипотезу какой-то фичи или продукта), на который можно натравить коллег / бета-тестеров / ранних юзеров и на основе их фидбека итерироваться оставшиеся 90% времени, наращивая качество. В идеале (и данный подход этому способствует), у тебя должно болеть ровно в тех же местах, в каких болит у твоих пользователей. Если ты делаешь одно, а пользователи просят у тебя другое, вероятно, ты делаешь какую-то хуйню.
То, что обычно называют "качеством", это ты у себя в голове придумал оторванный от реальности и от пользователей Vision и гонишься за ним. У тебя есть страх и дискомфорт что если кто-то увидит твой продукт в котором не всё "идеально" (а откуда ты взял этот идеал?), то случится что-то супер страшное, это разрушит твоё эго, тебя будут закидывать тухлыми помидорами, поливать говном, хуй перестанет стоять и т.д. Перфекционизм (что с другой стороны, закрытость от обратной связи) - одна из форм прокрастинации. Ты сам знаешь, что тебе надо дать что-то в руки пользователей чтобы услышать первую критику... и откладываешь этот страшный момент.
Не делайте так. Не закрывайтесь в башне из слоновой кости от своих пользователей.
Я кстати в session выделил Vibe [content] в отдельный проект от Vibe [deep] и Vibe [shallow]
Мозг совсем иначе работает, чем когда пишешь код
Спасибо всем кто дал советы в лс по последним видосам и подсветил места, которые в следующих итерациях нужно улучшить
Я очень ценю и всегда открыт вашей обратной связи
@uberkinder
Новые видосы:
9/100: https://www.instagram.com/reel/DFcpBLZikYc/ (скрытые признаки, что она готова к свиданию)
10/100: https://www.instagram.com/reel/DFdFWmji1jG/ (знакомство в кафе с фитнес тренершей)
Кстати, всем лайфхак
Для работы с текстом (не кодом), можно тоже использовать Cursor.com и это намного удобнее чем канвас в чатгпт
Я скрипты для видосов (финальные варианты после редактуры) пишу в отдельную папочку. Туда же в каждый файлик можно писать метрики за 48-72 часа
Ты как и с кодом можешь переписывать/редачить/встпвлять фрагменты
+ можешь в какой то файлик выписывать выученные уроки / ошибки, чтоб это было в контексте
+ говорить мол возьми скрипт с такого видео и повтори такую то часть