Просьба всем, очень важно, кто не зарегистрирован на ProductHunt, зарегистрироваться https://www.producthunt.com/
(потому что голоса тех, кто не зареган за какой-то срок до дня запуска, не учитываются)
• 30,000+ пользователей
• Из них почти 8,000 iOS
Slow but steady growth 📈
Скачать Vibe: https://onelink.to/vibe-ai
3 подхода делать RAG, которым не учат AI-энджоеры с ютуба, но который сильно лучше работает на практике – по опыту моих друзей и меня
Стандартный подход к RAG подробно описан здесь: /channel/bogdanisssimo/195
Коротко, идея: мы хотим снабжать LLM нашим контекстом, чтобы она отвечала оглядываясь на него. Стандартный подход: нарезаем документы нашего контекста на чанки. Превращаем каждый чанк в эмбеддинг. На инференсе превращаем запрос пользователя в эмбеддинг, находим похожие документы. Кидаем в контекст. Звучит клёво и логично, но на практике добиться высокой точности бывает очень сложно
А как можно по-другому?
Идея #1. Хранить документы в PostgreSQL или другой не-векторной БД. Каждый документ размечается по некому набору полей (например, цена / локация / тип / время / другие параметры). Просить LLM-маршрутизатор выдать через SO параметры (или даже напрямую просить SQL, if you are brave enough), отфильтровать / отсортировать - подсунуть в контекст. Нет эмбеддингов - нет проблем. Retrieval есть? Есть.
Идея №2. Кидать все документы в контекст дешёвой и быстрой LLM-маршрутизатора, просить выделить релевантный запросу контекст для основной модели. Плюсы: подходит как для атомарных фактов (аля найти иголку в стоге сена), так и для верхнеуровневых выводов, когда нужно агрегировать некое знание сразу по большому числу документов. Снова, нет эмбеддингов - нет проблем. Мелкая LLM сильно лучше справляется с ретривалом, чем эмбеддер + косинусная близость. В большинстве юзкейсов не так много данных, чтобы бить по деньгам, тем более сейчас довольно дешёвое кеширование токенов у LLM-провайдеров.
Идея №3. Делаем или классический RAG, или один из перечисленных, но вместо слепого разбития на чанки по какому-то автоматизированному правилу, просим LLM сделать саммари и/или выделить ключевые идеи и/или выделить атомарные факты (желательно не скупиться по качеству модели, процедуру делаем 1 раз). У стандартного RAG проблема что большинство чанков (если вы будете их логировать и смотреть глазками) будет мусор, пустота, вода. А как известно, мусор на входе – мусор на выходе. После такой более въедливой обработки вы получите и на порядок меньше токенов, и в них будет сильно плотнее информация.
Делитесь постом если было полезно
Ваш @bogdanisssimo 🥰
Когда-то я увидел это у тебя и теперь дико кайфую от этих цифр 😅 Спасибо)
Читать полностью…Cursor - В С Ё? https://www.youtube.com/live/hhdpnbfH6NU
Читать полностью…На самом деле я просто удалил кнопку Skip / Later / Настроить позже / возможность свернуть
Температура покупки лида (с некоторыми оговорками) максимальна в момент скачивания
Если этим окном возможностей грамотно не распорядиться, момент пика любопытства (и соответственно максимальной сговорчивости пользователя) будет упущен. Если он не установит шорткат сейчас, скорее всего он не установит его никогда
Поэтому нужно проводить пользователя по одному флоу, не откладывая на «потом»
Кстати забыл сказать, вообще я раньше говорил, что в B2C агентским воркфлоу пока не место, но сегодня я сделал большое и важное обновление, которое откладывал в эту сторону, пересобрал core engine Вайба и ответы стали сильно целенаправленнее
Пробовать тут, с шорткатом тоже работает: https://apps.apple.com/ru/app/vibe-reply/id6553989941
В telegram боте апдейт тоже работает @VibeDatingBot
Очень умные дядьки обсуждают, какие социальные и психологические потрясения будут происходить в мире, где AGI возьмёт на себя всю рутинную работу (которая сводится к шаблонному "текст на входе – текст/артефакт/действие на выходе")
Какие роли останутся? Как учиться и чему учить детей? Что там по Worldcoin Сэма Альтмана? Как избежать протестов? Почему конкуренция с Китаем может привести к катастрофе? Как жить meaningful life в дивном новом мире?
https://www.youtube.com/watch?v=JMYQmGfTltY
Вообще, там как узкое место была "конверсия в триал", но похоже вспомогательный онбординг для шортката тьфу-тьфу-тьфу решил этот вопрос
Подольём больше трафика, посмотрим, сохранится ли 🎃
В принципе, это было бы логично:
• Короткий онбординг, который ясно показывает приложение в действии, сразу понятен его aha-момент (содержит UGC ролик на первой же странице: /channel/bogdanisssimo/1997)
• UX который пользователи ещё нигде не видели – сразу любопытство попробовать в бою самому
• Сначала происходит установка шортката – потом показывается paywall. Т.е. пользователь уже инвестировал время/усилия в приложение, настроил свой телефон под него, а тут... *тёмный паттерн* – надо сделать последнее несложное действие, кликнуть на кнопку подписки на пробный период, "подтвердить серьёзность намерений, что ты готов потенциально платить, если приложение тебе понравится"
Ну и paywall сам по себе аккуратный, премиальный, с motion-дизайном, блюрами, видео, необычными переходами
Посмотреть тут: https://apps.apple.com/ru/app/vibe-reply/id6553989941
Загадка Джокера, мини-челлендж на креативность
Приз победителю: бесплатная консультация со мной (обычная цена $300)
Вводные:
• Vibe – AI-приложение, которое подсказывает парням и девушкам, что написать по скриншоту переписки, сториз инстаграм, профилю на сайте знакомств
• В Vibe недавно появилась возможность делать скриншоты и получать по ним ответы, не открывая приложение, а получая уведомление по нажатию на Action Button, либо через двойной тап задней крышки iPhone (демонстрация работы здесь: /channel/bogdanisssimo/1997). Назовём это действие триггер
• Триггер запускает шорткат (быструю команду), которая либо А) делает новый скриншот (обнуляет контекст по старому), обрабатывает и выдаёт ответ по нему – либо Б) выдаёт следующий ответ по последнему скриншоту
• Ответы генерируются пачками, самый первый занимает 3-4 секунды, все последующие предполагаем доступны почти мгновенно. Когда у нас инициализирован контекст, мы больше не делаем скриншот (иначе это добавляло бы 1-2 секунды сверху ещё до обработки на нашей стороне, потому что скриншот делается на стороне iOS и хаки с хэшами картинки тут отпадают)
Проблема: в какие-то моменты пользователь нажимает кнопку несколько раз подряд и получает новые ответы; в какие-то моменты пользователь переключается на другое фото / другой профиль / другой диалог и хочет, чтобы при нажатии на кнопку скриншот делался заново
Базовое решение (сейчас в стоит эвристика умнее): "ждём 10 секунд после выдачи последнего ответа, если не было нажатия, сбрасываем контекст"
Задача: придумать простую эвристику/алгоритм для адаптивного определения момента, когда нужно сбросить контекст, а когда не нужно
Срок приёмки: до конца этой недели (до 18 мая)
Решения присылать @uberkinder с пометкой #эвристика
––
Решений прислано: 15
Принято к участию: 3
Отлично, 2/3 узнают для себя что-то новое
UGC = User Generated Content, контент созданный *пользователями*
Говорят, лучше 1 раз показать, чем 10 раз рассказать. Про приложение/товар тоже можно рассказывать, доносить смыслы, прогревать к потребности. А можно просто показать его реальное использование, aha-момент, после которого будет понятно, что оно и зачем оно. В широком смысле, UGC - любая демонстрация продукта в действии
UGC на самом деле могут создавать не только сами пользователи. Для этого могут быть заведены специальные люди из вашей команды, которые скриншотят/скринкастят приложение, либо даже UGC автоматизирован. Сейчас идут и дальше, подключают к бою AI-аватаров
(на скринах примеры фаундера arcads.ai, Romain Torres https://x.com/rom1trs)
Стоило ребятам запоститься в богданисссимо... и где они теперь?
Читать полностью…Вайб скачивает в среднем 100 человек на свои айфоны каждый день
Самые популярные страны за последние 28 дней:
1. Россия
2. США
3. Мексика
Чем разработка и внедрение AI продуктов отличается от других IT-продуктов
/channel/c3po_notes/317
Интересно, что один из разработчиков Codex рассказал как использует агента:
>Он запускает Codex ради новый фичи или рефакторинга
>Уходит делать кофе или в слак >Через какое-то время возвращается
>Смотрит сотни строк которые агент написал, как тесты прошли
>Сразу отправляет код в GitHub, то есть даже не скачивая код на свой компьютер
>Коллеги вычитывают Pull Request
То есть программисты будущего это как философы прошлого, думают словами и концепциями, но сами не кодят 🌝
Жалко этого добряка, из 2000 мэтчей 1 встреча звучит печальнее чем рассказы Хэмингуэя в 20 слов
А если не хочешь повторить его участь, ты знаешь какое приложение нужно скачать:
https://apps.apple.com/ru/app/vibe-reply/id6553989941
Шаг который на удивление отличается наибольшим падением - это переход с экрана триггера на экран инструкции по нему
У кого есть идеи, как лучше донести что это две большие кнопки и они нажимабельные
Или может ещё есть гипотезы что здесь может стрелять в ногу?
Прокликать онбординг самому: https://apps.apple.com/ru/app/vibe-reply/id6553989941
Доходимость до Paywall (уже после выкатки обновления 2.0, где появился онбординг)
до / после - разница +70%
кто угадает что поменял?
P.S. Здесь подробнее пост всех тулзов, которые использую для аналитики: /channel/bogdanisssimo/1914
Скоро с подписчиками выучим весь словарь пикап-терминов 😱😱😱
Читать полностью…Вот вам 2 UGC видоса 😏
В чём разница, напишите в комменты
Мальчик: устраивает эмоциональные качели девушке
Мужчина: начинает бизнес, устраивает эмоциональные качели себе
Количество запросов через shortcut уже 3 дня подряд перевешивает количество запросов через основное приложение. Как вам такой adoption?
https://apps.apple.com/ru/app/vibe-reply/id6553989941
Будни фаундера: выросла скорость - отвалилась персонализация, инсталы выросли - конверсия упала, конкурент вынюхивает кто у тебя делает контент и пытается переманить, сервер опять улетел в OOM от нагрузки, новые баги тут и там, несколько false positive банов по 18+ фильтру но всех разбанил, выкатил супер классную фичу на iOS - android пользователи ещё активнее спрашивают "когда android?"
Но стартапы это все равно весело, ни на что не променял бы 🤙