Делать стартап – лучший способ освоить System Design, если ты что-то не понимаешь, у тебя рано или поздно это выстрелит боттлнеком. Сегодня мы разобрались с географией серверов Telеgram и других апишек, в которые ходим, много нового узнали.
ping -c 10 api.telegram.org
ping -c 10 api.openai.com
«Художественная литература исчезла больше 100 лет назад, литература и писатели продолжали существовать, но повествование теперь не писали, а монтировали как набор цифровых образов»
– Лю Цысинь, «Вечная жизнь Смерти», 2010
Слушаю третью книгу трилогии, "Вечная жизнь Смерти". Первые 2 главы, а уже было 5-10 моментов, где Я или был на грани, или действительно прослезился, пока слушал: настолько глубокие, или романтические, или масштабные моменты описываются. И самое обидное, что никаким из этих моментов нельзя поделиться, не заспойлерив важные моменты из второй или первой книг...
Читать полностью…34% – на столько получилось сократить косты (на графике цена промпта/генерации на 1к запросов)
Весь фокус в следующем:
1. Есть такая либа https://github.com/aurelio-labs/semantic-router, Я ридми не читал и не заводил, но увидел в превью идею строить маршрутизатор (intent recognition) на эмбеддингах, Мне понравилась идея, пошёл пробовать
2. У Меня на входе текст и кратинки, для чисто текстовых запросов можно использовать обычные эмбеддинги, для картинок надо заводить CLIP (Я юзаю в serverless режиме).
CLIP маппит текст и картинки в одно пространство и в нем можно находить близость, следовательно, делать zero-shot классификацию (когда описываешь класс текстом).
3. Заменяем все вспомогательные ллм вызовы семантической маршрутизацией (а их где-то 1, где-то 2 шага) - и вуаля, оптимизируем и скорость (100ms vs 3-4s) – и косты (можем например на каждый интент даже держать несколько описаний и делать knn и экспериментировать с k / агрегацией)..
4. Но возникает проблема: сырой knn поверх CLIP "тупее", хуже разделяет интены, что делать? как его промптить? благо, CLIP хотя бы обучен на скраппенных данных с интернетов, телегу от инсты отличит
Используем подход DALLE/Sora: берем другую модель, которая генерит промпт для этой, на основе этого можно быстро сгенерить детасет (поверх достаточного числа картинок на разные интенты, особенно corner кейсы), заэмбеддить как примеры запросов, так и "окрестности" вокруг этих эмбеддингов в виде наших сгенеренных промптов, на основе этого обучаем логрег или двуслойную сетку и получаем нормальное быстрое разделение на интенты почти бесплатно
Конечно, некст степ - нормально честно зафайнтюнить, даже начиная с ViT, но пока текущее качество Меня устраивает и есть более важные задачи. Так-то, не одними LLM сыты.
#LLMOps
Последние 15 часов оптимизировал пайплайн, получилось сократить косты, по предварительным прикидкам, на ~30% (которые можно будет вложить в маркетинг)... вообще, провалидируем результаты по дашбордам в следующие дни
+ одновременно сократилось время до отправки ответа пользователю в ~2 раза, без ожидаемой просадки качества и с бонусным повышением надёжности (пользователи часто репортили баги в одном месте, увидим, как оно теперь)
В такие моменты ловишь дзен
Обратим внимание, что все бывшие тимлиды пет-проекта уже нашли работу в ML/AI, значит Симулятор даёт так много опыта, что хочешь не хочешь – безработным не останешься
Читать полностью…Любопытства ради скормил список Мной рекомендуемой литературы в Claude-3, попросил обратную связь, что он думает насчёт pre-train dataset'а Моей личности и что бы он Мне насоветовал.
Наговорил много наблюдений, с которыми трудно не согласиться. Из предложенного списка читал 1, 2, 3, 7, 8. Частью из них дополнил список.
#Books
Extropic: Добро пожаловать в Термодинамическое Будущее!
Вчера решил размять пальцы, набросать переводец на Хабр про один стартап, который занимается квантовыми компуктерами, успел поднять $14.1М в декабре и позавчера поделился первыми новостями касательно того, что они строят.
Целятся на много-много порядков сократить себестоимость и время вычислений для AI алгоритмов ближайшего будущего. Кто знает, быть может Сэму в итоге понадобятся циферки сильно меньше $7T на железо для AGI.
https://habr.com/ru/articles/800033/
You're welcome. Буду рад репостам! 🔥
Друг-продакт посоветовал Амплитуду https://amplitude.com/
Кто пользовался? Какие бонусы дало по сравнению с "DIY"?
Забавно как в этой трилогии или, для примера, в фильме «Прометей» расшифровка языка чужой цивилизации с другой планеты упоминается как какая-то рядовая операция. Вспоминаю какой большой акцент Игорь делал на том, как легко GPT-4 трансферит знания с языка на язык
Было бы интересно посмотреть эксперименты как LLM будущего будут расшифровать структуру языков (которых не было в интернетах) и понимать картину мира которую они несут…
Да и, думаю, с условной GPT-5 или GPT-6 можно будет просимулировать сильно отличную от нас цивилизацию на планете в другой звездной системе и прикинуть, какое у них бы выработалось отношение к миру, жизни, Вселенной и друг другу, как бы это отразилось на языке, как их концепты матчились бы с нашими
Созвонились с Катей, Катя – маркетолог уже 7 лет, была маркетологом в Dodo-пицца, делала запуски на десятки млн рублей (Мне б такие цифры), 4 года развивала своё маркетинговое агентство, обучила 350+ маркетологов
Недавно начала вести блог в Instagram: https://www.instagram.com/ekaterina_shp
Вообще, Катя это даже не про маркетинг – Катя это про рост твоего продукта в целом, всесторонний, глубокий. Она задаёт не стандартные вопросы по методичке, а всесторонне за считанные минуты изучает под лупой каждый шаг пользовательского экспириенса, задаёт вопросы по каждому касанию с пользователем, посвечивает самые важные бутылочные горлышки твоего стартапа.
После созвона с ней у тебя на руках вырастает понятный список шагов, что сделать сегодня вечером, на этой неделе, за этот месяц. Очень рекомендую с ней поработать и однозначно буду обращаться снова. Кому нужно нащупать, как наращивать аудиторию продукта – рекомендую.
Планирую написать пост(ы) на Хабре / VC / где-то ещё про наш стартап. Про что / про какие аспекты было бы интересно прочитать? Напишите свой топ-3
Хотим завируситься 😎
#VIBE
12.5% запросов в Адаме – это знакомства вживую…
…и наша долгосрочная цель – повышать этот процент.
Сайты знакомств – это безусловно популярная платформа для знакомств и общения, они соединяют десятки миллионов мужчин и женщин друг с другом. Но в Моей жизни, да и жизни Моих друзей, самые интересные знакомства и самые яркие истории любви происходили вживую. И мы хотим всё больше и больше «выводить» пользователей в оффлайн, в реальную жизнь, давать им real-time поддержку, а не помогать пылесосить сайты знакомств, сидя дома.
Рынок дейтинга простирается далеко за границы интернетов и Адам, как маленький дьяволенок на плече, помогает чувствовать себя чуточку увереннее даже при знакомствах в кафе, барах и торговых центрах: достаточно отправить ему фото, с кем хочешь познакомиться, и он подскажет оригинальную первую фразу под ваш контекст.
tinyurl.com/adamcopilot
P.S. И кстати, по промокоду #NIGHTGAME до конца недели можно получить скидку на 23% и добавить в свою жизнь больше необычных знакомств, как вживую, так и онлайн.
#adam
Мы в adam ищем быстро обучаемого человечка, который будет монтировать скринкасты / рилсы
Если им являетесь вы, либо у вас есть кто-то из знакомых,
Писать: @ramzes_kubinskiy
8 плотных кастдевов в Adam вечером субботы…
CustDev (Customer Development) – инструмент поиска точек роста посредством личного общения с пользователями, который зиждется на понимании потребностей, болей, предпочтений клиентов, их реального опыта.
Описан в книге «Спроси Маму» Роба Фитцпатрика.
Ключевая идея: не «продавать» свой vision или имеющийся продукт, и не задавать вопросы о гипотезах, – а спрашивать строго о том, что люди сейчас или в прошлом переживают, испытывают, с чем сталкиваются и т.д. Иначе есть риск набрать охапку «да-да» к которым ты сам подталкивал собеседника (как если рассказываешь идею маме, она всегда одобрит), взяться делать вещи, которые на самом деле никому не нужны, раскатить на пользователей / выкатить на рынок – а этим никто и не пользуется.
P.S. Прогнал стенограммы через Claude-3, вышло сносно. И ведь было славное время, когда продакт менеджеры делали такие агрегации выводов вручную…
#adam
Недостаток практического опыта – одна из основных проблем студентов при поиске работы. Для решения её решения мы сначала создали Симулятор ML, а потом усовершенствовали его, добавив секцию «Пет-проекты», где студенты придумывают и реализуют идеи, чтобы потом добавить их в портфолио.
Один из проектов уже хорошо знаком участникам телеграм-чата karpovꓸcourses – бот SpamKillerV1Bot">SpamKiller.
С запуска в июне прошлого года механика работы бота менялась и усложнялась, а скорость распознавания спама увеличивалась на глазах. Как это происходило – мы спросили у всех трёх студентов, кто выступал в роли тимлида на разных этапах развития: Эдуарда Полякова, Дмитрия Сиракова и Фёдора Соколова.
Системность и её корни
Был такой период полтора года назад, когда Я в формате 1:1 созванивался с некоторым количеством своих коллег, с кем напрямую не работал (или работал только над side-проектами), кто на 1-2 головы взобрался выше по карьерной лестнице и у кого хотел бы чему-то поучиться. Вопросы были примерно одинаковые у всех – а ответы у каждого свои.
Навскидку, список включал в себя (но не ограничивался):
- долгосрочные цели (+ на какой период планирует)
- главная мотивация в работе / персональная метрика успеха
- топ-5 сильных сторон, топ-5 зон роста
- доходы (если не секрет) + их эволюция + отношение к деньгам
- время на работу, вообще отношение к work / life balance
- как планирует день/неделю/месяц/квартал + приоритеты
- как оценивает время каждой задачи / этапов проекта
- личная система продуктивности: философия и инструменты
- личная политика в отношении соц.сетей / источников информации
Так и к какому выводу Я тогда пришёл? К такому, что никакой закономерности здесь нет и у каждого работает что-то совсем своё. Более того, ни у кого из них и близко не было такой дотошной системности как у Меня, которую Я считаю своей "пуповиной космонавта". Впрочем, Я честен с собой и считаю себя тем ещё раздолбаем, который точно ещё не реализовал свою системность на 100%. Но мы к этому обязательно придём!
Кроме этих вопросов части ребят (с кем теснее общался или имел совместные проекты) Я задавал дополнительные вопросы касательно себя, чтобы получить фидбек со стороны. Один из таких вопросов касался, в свою очередь, уже Моих сильных сторон. Ожидаемо, но один из ответов, которые Я получил, был "системность, въедливость (когда хочешь)".
___
Откуда здесь растут ноги? Долгое время в подсознании у Меня вертелся ответ в виде книжкек Фокус: Достижение приоритетных целей
Стивена Кови ("на что бы вы потратили дополнительный час времени, если бы в ваших сутках было 25 часов?"), которую Я прочитал классе в седьмом, а затем и более известной 7 навыков высокоэффективных людей
. На днях Я случайно задумался над этим вопросом снова и раскопал ещё более ранний evidence своей системности...
Мне тогда было лет 10, это было во второй из 3 школ, где Я учился. В этой школе большинство ребят были гопотой: слушали русский реп, решали все вопросы "стрелками" за школой, пили, курили, ругались матом. Было много задир и драк на переменках. Агрессивный внешняя среда вырабатывает внутреннюю организованность.
Я был как раз из тех 2-3 пай-мальчиков на весь класс. Меня часто провоцировали на драки и Я часто легко лез давать сдачу. Довольно рано, сразу после первых синяков, Меня отдали на карате (хотя и совсем в пиздючестве, успел походить на самбо). Помню как сейчас, только выучил первую связку на первом занятии (левая-правая-лоу кик), уже на следующий день применяю знания на практике, отпинал одного дылду, который задирался на переменке, по всему коридору. На его выражении лица читалось что-то на тему "теперь с ним шутки плохи".
Но настоящий ад для одноклассников начинался дальше. В детстве Я много играл в компьютерные игры, любил все эти прокачки персонажей в RPG, боёвки. Значит, сложил Я тогда 2+2 и решил завести, кто бы мог подумать, "дневник драк". В дневнике Я проранжировал на двух листах тетради всех своих одноклассников по уровню сложности: от самого чушпана до самого шкафа, и отмечал кружочками, когда и с кем у Меня стрелка/драка, кто победил и т.д. Ничего такой тайм-менеджмент, а?.
Конечно, цель была в случае чего дать отпор и "финальному боссу" – отсюда тебе и первые амбициозные цели! (хотя, помню, он был самый спокойным в классе и первый не лез, а сам Я драк не начинал – но и не то, чтобы активно избегал конфликтов, если кто-то бьёт первым / оскорбляет).
К тому моменту, когда Я "дошёл" до середины, об этом дневнике драк знал уже весь класс (включая девочек, учителей и родителей). У нас была традиция в школе, как и наверняка в любой другой, когда на день рождения именинник выходит к доске, ему дарят книжку, говорят пожелания...
В том году Мне учительница пожелала, чтобы Я больше таких дневников не заводил. 🙃
#CoolStory #Books
Эмбеддинги по тексту спасают от большого количества болей в заднем проходе: сокращают как косты, так и время до отправки ответа пользователю на стадиях маршрутизации. А какие есть хорошие эмбеддинги для картинок и кто / как / через что их использует? В идеале хотелось бы кидать по API.
Жоские ИИ ребята, поделитесь.