bogdanisssimo | Unsorted

Telegram-канал bogdanisssimo - bogdanisssimo

3818

Subscribe to a channel

bogdanisssimo

Добавил онбординг в #adam

Кто хочет заценить,
1. Переходите в /channel/adamgame_bot
2. Жмите /start (язык должен быть выбран русский)
3. Делитесь впечатлениями в комментариях

Читать полностью…

bogdanisssimo

User Journey as Dating

По рекомендации нашего продакта в Симуляторе ML, Кати, оформил подписку на Epic Growth, смотрю видео про онбординг в Endel, приложения с генеративным звуком.

У Endel настолько хороший онбординг, что Я, человек, в жизни которого музыка занимает, мягко говоря, не первое место, сразу после онбординга взял подписку на год и стабильно пользуюсь уже порядка месяца каждый день. Вообще, у Endel куча классных находок в плане UI/UX, управления музыкой, переключением, которыми Я вдохновляюсь и которые хочется в будущем протестировать в adam.

Что интересного: вот смотрю Я на этот User Journey (путь пользователя от момента когда он узнал о продукте – и до момента когда делает повторные оплаты) и Меня не покидает метафора, которую впервые услышал в одной из лекций Y Combinator, How to Build Products Users Love:

• Знакомство с новыми пользователями – как дейтинг.
• Отношения с текущими пользователями – как брак.


Из этой метафоры вытекает множество продуктивных вопросов, которые можно задать к своему продукту, и получить множество идей для его улучшения.

Так, первое впечатление – это 90% успеха: на свидании ты раскрываешь себя, свою личность; в онбординге ты доносишь core value своего продукта. Даже если ты мега-интересная личность, но не умеешь показать это за 30-40 минут, ты не вызовешь влечения у противоположного пола. Так и если у тебя мега-полезный продукт, но ты не умеешь это доносить за несколько кликов, его не купят.

Что создаёт первое впечатление о продукте? – промо-материалы, страничка в соц.сетях, лендинг, регистрация, тарифы... первое сообщение, процесс создания аккаунта, UI/UX на входе, первая поддержка.

Что создаёт первое впечатление о тебе? – профиль на сайте знакомств или в Instagram, твой стиль, твоя первая фраза, то как ты пишешь, твой голос и жестикуляция, твои харизма и чувство юмора, истории, которые ты рассказываешь и т.д.

Как говорят во всё той же лекции, каждый элемент твоего продукта должен быть sexy. Что ж, будем в adam к этому двигаться. 😈

#adam

Читать полностью…

bogdanisssimo

Как выглядит анализ ошибок в adam. Меняется домен и технология, не меняются подходы: берёшь топ-N ошибок, смотришь глазками, находишь паттерны, подкручиваешь [модель], смотришь, стало ли лучше... и так по кругу.

В этой связи ещё один небольшой спонтанный квиз (особенно интересно мнение женской части аудитории):


Как думаете,
1. В каких местах или ситуациях пользователи чаще всего не знают, с чего начать диалог / познакомиться?
2. В каком моменте диалога пользователи чаще всего не знают, что ответить / как отреагировать?


P.S. Кто из коммьюнити чата, чур не подсказывать. 😈

#adam

Читать полностью…

bogdanisssimo

STYLE REVIEW

Главным инструментом для создания первого впечатления, особенно с противоположным полом, является стиль. Стиль – это буквально Visual System Prompt, сопровождающий тебя за руку в каждой коммуникации. Он рисует образ, задаёт планку, подсказывает, "о чем этот человек?" – до того как тот обронит и слово.

Удачный образ, это, как сказал бы Сунь Цзы, «победа в войне до начала войны». Ведь если ты проактивно не позаботишься о том, какое первое впечатление хочешь создать – оно будет будет создано автоматически, фантазией собеседника, и не к твоей выгоде.

Какие ключевые принципы Я стал держать в голове спустя годы (кстати, во многом благодаря Никите Небесному, у которого Я проходил обучение пару лет назад)?

1. Цельность. Самая частая проблема (и Моя долгие годы в том числе) – это восприятие образа как набора отдельных вещей. Не так важно какого бренда вещи вы носите, какого цвета и фасона, важна сочетаемость и гармония. Создают ли они цельный образ? Или распадаются на разрозненные фрагменты?

2. Качество и дороговизна. У многих есть заблуждение, что дорогим образ делают дорогие вещи. Это совсем не так. Если брендовая вещь не вплетается органично в остальной образ, это выглядит безвкусно и дешево (к вопросу о цельности). Чтобы выглядеть дорого, нужно носить чистую выглаженную одежду, аккуратную стрижку и маникюр, чистую обувь и завершающие образ аксессуары (речь не обязательно про часы, но, как минимум, про кольца и браслеты).

3. Контекст и аутентичность. Подходит ли твоя одежда твоей идентичности, твоему возрасту? Насколько стиль соответствует кругу общения и обстановке? Делает ли он тебя белой вороной? В каких-то ситуациях контрастировать с окружением допустимо и даже выгодно, в каких-то это вредно. Социальная интуиция подскажет, нужно ли.

В колабе с Никитой добавили оценку стиля в adam. 😈Обращает внимание на нюансы, за которые обычно цепляется только глаз стилиста с большой насмотренностью.

В комментарии присылайте фото своей повседневной одежды, проведем с адамом разбор. 😈

#adam

Читать полностью…

bogdanisssimo

Квиз на проверку эмпатии

Значит, есть такой клип с Джилленхолом, “Time to Dance”: https://youtu.be/pt9wnawn7xQ?si=cZ3vUUsAIQbWkJ3M

Вопрос: Почему он убивал? Какую мотивацию закладывал режиссёр главному герою?

Читать полностью…

bogdanisssimo

FITNESS AI

После Trial недели взял подписку на год. Понравилось. Это ровно то, о чем давно мечтал. UI/UX максимально вылизанные, сразу видно, сделано для людей. Это и не удивительно, стартап прошёл Y Combinator.

https://www.fitnessai.com

Core фича - адаптивные тренировки: приложение само понимает какие группы мышц ты давно не тренировал (но также можно выбрать желаемый сплит) и подбирает под них упражнения. Запоминает какие тебе не нравятся совсем (очень быстро и удобно заменить / убрать на другое), экстраполирует веса от похожих упражнений и многое другое.

Кто ходит в качалку – рекомендую, лучше не найдете.

Читать полностью…

bogdanisssimo

10 ПОЖЕЛАНИЙ

Всё меняется, всё течёт. Ничего не остаётся на месте.

– Гераклит Эфесский

2023 год стал во многом для Меня трансформационным. Я научился более чутко слышать людей и дальше смотреть. Я пробую себя в новых ролях и смотрю на знакомые вещи под новым углом. Меняются компании, меняются инструменты и цели. Не меняемся только Я и Мои друзья, с которыми мы через всё это проходим. На 2024 год у Меня амбициозные планы, с собой он принесёт ещё больше вызовов, чем 2023ий, но на их рост Я смотрю как на число блинов на штанге: растёт вес – растут мышцы.

В марте Я завёл этот блог, чтобы делиться своим опытом, боевыми заметками и праздными наблюдениями. Человек животное социальное, да у Меня не самая скучная жизнь, почему бы тем, что попробовал или узнал, не поделиться с другим, верно? Мне несложно, другим полезно. Тем более что личный блог даёт много побочных плюшек вроде нетворкинга и личного бренда, что ценные ресурсы.

Чтобы мы вместе с вами бодрее вошли в 2024 год, набросал 10 случайных уроков, которые Я или усвоил, или повторил за 2023.

Напишите в комментариях, какие 1-2 важных урока вы извлекли за 2023, а также чего вам больше хотелось бы видеть в этом блоге в 2024?

С наступающим всех 😈

Читать полностью…

bogdanisssimo

Пора вводить правило 34 для AI:
https://www.fitnessai.com

Читать полностью…

bogdanisssimo

90-DAY PLAN

Уделил 10 минут (остальные 20 потратил на саморазвитие), подготовил шаблон в Miro для квартального планирования, который любой из вас может взять на вооружение, наверняка кому-то пригодится. В углу написал легенду, в комментарии задавайте вопросы, если что-то непонятно – дополню.

https://miro.com/app/board/uXjVODg5odE=/?moveToWidget=3458764574208194942&cot=14

Ключевые идеи:
- разбивка по 3-4-5 направлениям (например, сферам жизни или проектам; про цветовую кодировку рассказывал здесь)
- в каждом направлении одна-две цели на квартал
- для каждой цели есть какие-то промежуточные майлстоуны (которые могут играть роль целей на месяц или на неделю)
- сплошная обводка для достигнутых целей, пунктиром для тех что In-Progress, полупрозрачные – те, что сейчас вне фокуса внимания (будущие цели)
+ граница того, что сейчас в фокусе

Вероятно, вы будете просматривать и актуализировать этот план раз в неделю, во время еженедельного планирования. Думаю, подходит как для персональных целей, так и для планирования развития продукта или компании.

А как вы организуете планы на квартал или на год?


#LifeOps

Читать полностью…

bogdanisssimo

Фреймворк понравился. Матчится с тем как Я о целях думаю в голове. Продлеваем ещё на квартал.

Читать полностью…

bogdanisssimo

Бытовой лайфхак для deep work. Всегда в одном из экранов открыты Todoist + Session (задачи + трекер времени).

Как писал ранее, когда ведёшь лог того, что ты делаешь, это проясняет, а что ты сейчас сделал или какой шаг планируешь сделать; помогает быстрее вовлечься (войти в поток), а также не отвлекаться на ерунду и видеть прогресс того, что уже сделал и попробовал. Когда видишь на глазах растущий лог, это само по себе стимулирует не прерывать "комбо".

#LifeOps

Читать полностью…

bogdanisssimo

Спасибо Борису, да, что-то такое есть в LangChain, жаль без статьи с метриками и экспериментами:

https://python.langchain.com/docs/modules/data_connection/retrievers/multi_vector#hypothetical-queries

Читать полностью…

bogdanisssimo

"HyDE пытается зацепиться за убегающий от него релевантный контекст с помощью двух гипотетических документов, а тот всё равно убегает"

Читать полностью…

bogdanisssimo

Недавно на Симуляторе ML мы презентовали чат-бота Аду, который помогает нашей команде сопровождения. А еще мы разрабатываем Co-Author — сервис, который помогает команде генерировать новые задачи. Быстро реализовать столько идей команде позволяет навык работы с LLM (т.е. большими языковыми моделями, подобными ChatGPT). А хотите расскажем про LLM подробнее?

21 декабря в 18:00 (по Москве) пройдёт вебинар, где Богдан Печёнкин, один из авторов Симулятора ML-инженера, поделится секретами построения успешного LLM-продукта.

В программе:
● Паттерны проектирования и построения таких систем (всё проще, чем кажется!);
● Разбор кейсов, где языковые модели ускорят, а где наоборот помешают разработке продукта;
● Навыки, необходимые для работы с LLM.

[Регистрация]

Читать полностью…

bogdanisssimo

Уже через 8 часов
В 18:00 по Москве


Приглашаю всех 😈

Читать полностью…

bogdanisssimo

„Совершенство достигнуто не тогда, когда нечего добавить, а тогда, когда нечего убрать.“

— Антуан де Сент-Экзюпери

Читать полностью…

bogdanisssimo

Нас уже 4500, а это самое время вновь задать вопросы, которые волнуют Богдана больше всего:

1. Расскажите, откуда вы узнали про этот блог?
2. Что вас сподвигло подписаться, что вам нравится?
3. О чём вам хотелось бы здесь прочитать? Или чего хотелось бы видеть больше?

Читать полностью…

bogdanisssimo

talking to users is the key

Читать полностью…

bogdanisssimo

NPS (Net Promoter Score)

Вчера посмотрел новое видео на канале Y Combinator, Consumer Startup Metrics. Метрики для B2C стартапов.

Две ключевые метрики:
- User Growth, % (рост продукта)
- NPS (довольные пользователи)

1. User Growth. Прирост числа пользователей в месяц. Считается хорошим ростом +15% месяц-к-месяцу. У нас в adam сейчас рост месяц к месяцу в диапазоне от +70% до +110% (если говорить про платных пользователей), но в первые месяцы, понятно, это ожидаемо итак.

2. NPS (Net Promoter Score). Вы наверняка встречали неоднократно опросы вида "Какая вероятность от 0 до 10, что вы порекомендуете наш сервис друзьям?". Вот это оно и есть. NPS крайне хорошо коррелирует с качеством продукта и, главное, с тем, как активно работает сарафанное радио.

NPS считается как разница в % между пользователями которые любят ваш продукт (и проголосовали 9 или 10 в озвученном опросе, их называют promoters) и теми, кого что-то серьезно не устраивает (проголосовали от 0 до 6 в опросе, их называют distractors). Довольные пользователи – это ваш коллективный Head of Marketing. Вообще, у любого крупного IT игрока органический трафик (новые пользователи привлечённые бесплатно) занимает 80% или больше, чем платный трафик.

Хорошим NPS считается +50 и выше.
У Tesla NPS, сколько бы вы думали? +97!

В adam на данный момент NPS в районе +24 (положительный, но ещё не на "вирусном" уровне). Судя по опросам, примерно 48% очень довольны ("loves"), 29% умеренно довольны ("likes") и ещё четверть пока неудовлетворены.

Очевидно, в следующие 2-3 месяца нужно сделать упор на том, чтобы желтых (нейтральных) из like превратить в love, перед тем как запускать полномасштабный маркетинг.

Ну и ключевой совет, который даётся в видео, keep it consistent – измерять NPS надо регулярно (например 1-2 раза в месяц) и в одной и той же форме (формат сбора сильно влияет на то, как люди голосуют, иначе риск попасть в ловушку, что вы сравниваете разные NPS).

P.S. А какие ключевые метрики у вас в продукте?

#adam

Читать полностью…

bogdanisssimo

AI Engineers be like:

Читать полностью…

bogdanisssimo

А если вы хотите сделать Богдану подарок на новый год, то лучший способ – это стать пользователем его AI стартапа, перейдя в t.me/adamgame_bot и применив промокод #ADAM2024 на скидку 24% 😎

(его достаточно отправить в бота сразу после онбординга; действует до 1 января включительно)

Читать полностью…

bogdanisssimo

https://www.youtube.com/watch?v=L0Hvuw0iqHY

Читать полностью…

bogdanisssimo

Наткнулся на старую заметку в Notion о том, что Я считаю своими сильными сторонами. Верхнеуровнево, список сводится к 3 пунктам: системность, эмпатия, любознательность.

Кто Меня знает какое-то время, что бы вы добавили или убрали и почему?

Читать полностью…

bogdanisssimo

Читаю подобные посты и ловлю себя на мысли, что очень многие вещи 3 месяца назад были сделаны очень грамотно, когда мы запускали @adamgame_bot

Вообще искренне благодарен всем нашим первым платным пользователям (которых уже 90!) за их поддержку, терпение, вовлеченность. Это сильно мотивирует.

Но впереди у нас ещё очень длинный путь и нужно не терять темп.

Stay tuned.

Читать полностью…

bogdanisssimo

Каждый день Я начинаю с персонального daily, который занимает 10 минут и во время которого Я планирую, что сделаю за день.

Для разбивки задач по приоритетам Я использую адаптированный MoSCoW фреймворк:

Must Do: 1-2 Top-Goals (часто требуют deep work, поэтому день начинается с них), и срочные задачи (с дедлайном сегодня). Сюда закладываем 4-6 часов.

Should Do: важные задачи, например те планы на неделю, которые не вошли сегодня в Must. Например, не-критичные баги или стратегия. Сюда ещё 2-4 часа.

Could Do: разная nice-to-have косметика, не требующая большой концентрации. Это ставим на конец дня, если останется время и желание. Сюда на сдачу с барского плеча ещё пару часов.

Won’t Do: сюда попадает разная неважная мелочь которую можно сделать за пару минут, либо could/should если их вытесняют задачи более высокого приоритета.

День считается успешным, если выполнены все Must. День считается супер успешным если ещё успел и все Should.

Все задачи оцениваются в начале дня и дублируются в календарь. Если что то занимает больше запланированного времени, то задачи более низкого приоритета служат буфером: так, Must вытесняет Should, Should вытесняет Could.

Самый сложный квест - придерживаться дисциплины не делать Should/Could, пока не сделаны Must (ведь наш мозг так любит между важным и срочным переключаться на понятное).

#LifeOps

Читать полностью…

bogdanisssimo

Через час и 15 минут начинаем:
https://youtube.com/live/rBiJ63cMRws

Читать полностью…

bogdanisssimo

Кстати, а кто-то пробовал в (полу-)автоматическом режиме нагенерить под каждый документ вопросы, ответы на которые можно найти в доке, и каждый вопрос положить в вектор, чтобы ссылались на один и тот же док? Либо может видел кто-то статью об этом?

HyQE

Читать полностью…

bogdanisssimo

HyDE (Hypothetical Document Embeddings)

Звучит прямо как название босса Hades из God Of War 3 (с англ., Аид). В принципе, клыки которыми тот разбрасывался, цепляясь за души, вполне рифмуются с содержанием подхода. Не удивлюсь, если авторы те ещё геймеры и вдохновлялись игрой при написании статьи.

HyDE это приём из серии Advanced RAG techniques, который позволяет качественно повысить покрытие нашего ретривера (алгоритма поиска релевантного контекста из базы знаний), выцепляя тот контекст, который обычный RAG почему-то не выцепил. Как работает обычный RAG (Retrieval Augmented Generation), Я описывал в этом посте.

Идея в чём? При стандартном RAG в качестве "ответов" служат документы из базы знаний. В качестве "запросов" служат вопросы от пользователей. Есть гипотеза, что эмбеддинг вопроса и эмбеддинг ответа – несколько из разного семейства. По аналогии, ключи и значения в механизме внимания трансформеров – это разные вектора.

Вместо этого, в HyDE вместо поиска по запросу мы сначала генерируем "гипотетические ответы", т.е. что было бы написано в "гипотетическом документе, содержащем ответ" (какой он был бы по форме и что примерно в нём написано) – получаем его эмбеддинг и по нему ищем. Таким образом, мы будем считать близость уже не между эмбеддингом запроса и эмбеддингом ответа, а между эмбеддингами ответов. Для генерации гипотетического документа используем любимую LLM, например, для удешевления костов и ускорения, GPT-3.5.

Важно. Это может дать буст вашему RAG, а может и не дать. Так, ребята из OpenAI на DevDay говорят, что когда работали с одним из клиентов, им удалось повысить покрытие с 45% до 98% за счёт разных техник, однако в том конкретном случае HyDE (наравне с файн-тюном эмбеддингов документов) оказался не в числе модифицкаций, повышающих точность. No Free Lunch Theorem: не узнаете, пока не попробуете на своём конкретном кейсе.

Оригинальная статья: https://arxiv.org/abs/2212.10496

#LLMOps

Читать полностью…

bogdanisssimo

https://youtu.be/J9f-mWOmHwU

Читать полностью…

bogdanisssimo

3. Ensemble with choice shuffle. Здесь начинается уже специфика бенчмарков, где на выходе ожидается вариант ответа, выбранный из заранее определённого списка. Если это не кейс вашего приложения, вам эта часть будет бесполезна. Проблема: как показала практика, порядок вариантов, из которых нужно выбирать, статистзначимо смещает выбор варианта при перезапуске генерации много-много раз. Чтобы это обойти, перемешиваем варианты, например, 5 раз и выбираем самый популярный (что требует 5 вызовов, вместо 1, Я ещё не думал в сторону, можно ли оптимизировать косты промпта здесь с помощью Моего любимого магического параметра n, но да ладно).

Вот и весь Medprompt. Даёт какие-то мощные приросты в точности и обгоняет fine-tuned модель от Google, Med-PaLM 2.

Мне в юзкейсах достаточно few-shot kNN + CoT + ещё разной магии, у Меня нет заранее предопределённых вариантов, поэтому нам choice shuffle не актуален. Шаблоны промптов с картинки можно покурить здесь, там ничего сложного. За ссылочки и помощь в разборе спасибо Игорю (@seeallochnaya).

P.S. Поделитесь, а какие из этих техник вы применяете у себя в LLM-продуктах? Мне и другим будет интересно узнать.

#LLMOps

Читать полностью…
Subscribe to a channel