By Alexey Moiseenkov about startups, AI, ML and consumer product building. Opinions are my own. Only about tech.
Достаточно интересная работа вышла из недр OpenAI.
Обсуждают уязвимость LLMs к атакам, таким как внедрение подсказок и взломы, которые позволяют злоумышленникам переписывать оригинальные инструкции модели. Авторы утверждают, что одна из основных уязвимостей, лежащих в основе этих атак, заключается в том, что LLMs часто относят системные промты к тем же приоритетам, что и запрос от пользователей. Для решения этой предлагают иерархию инструкций, которая явно определяет, как модели должны вести себя, когда инструкции разного приоритета конфликтуют. Затем предлагается метод автоматизированной генерации данных для демонстрации этого иерархического поведения в следовании инструкциям, который обучает LLMs игнорировать инструкции с более низким приоритетом. После тестирования говорят становится лучше и меньше уязвимостей.
Ожидаемо господа из Perplexity нашли как же победить Google. Ну все просто, начать продавать enterprise solution.
В целом учитывая количество того, что компания делает:
- API
- поиск? Где прямым текстом говорится в интервью что победят через UX (еще делают своего поискового робота)
- enterprise solution, а-ля продай своим коллегам бота для поиска и чтобы данные запросов не утекли (корпоративный поисковый бизнес это что-то новое)
- подписки
- новости
- партнерки для дистрибуции своего поиска
Создается некое ощущение, что подняв тонну денег и став юникорном (наверное) понимания как построить растущий бизнес или продукт нет.
Фокуса нет. Да и фаундер постоянно фоткается с кучей крутых парней и дает интервью/подкасты. Моя ставка если не найдут что делать в этом году как основу их ждет медленная смерть. Убеждаюсь в который раз, что поднимать тонну денег до PMF (product market fit) затея не всегда самая лучшая. А вы что думаете?
Полезные UX паттерны. Часть номер «фиг знает какой». Как показать какой свитчер или настройку врубить - включить видео и оставить его в окне. Правда есть риск перекрытого окна, а управлять положением такого плеера нельзя (видео закроет свитчер включения например, это проблема).
Приложение авторов Zenly - amoamoamo
Иногда думаю какой же должен быть интрумент для дизайна современных приложений (UI/UX). Вообщем нашел ориентир и верю что к такому виду придет условная Figma годика через 3-5.
P. S. Игра Tiny Glade в Steam.
А как же AppStore ворует у разработчиков? И конские комиссии?
Ну а вообще это просто единственная viable (дающая возможность существовать) опция для такого продукта. Ну и следом USDT на TON доехал.
Не реклама. Мой хороший друг Юра, который недавно прошел YC и поднял 2М USD хочет провести эфир и все такое и поделиться мудростью разной о том как оно там сейчас в фандрейзе. У него длинная богатая история много с кем работал. В комменты занесу инфу - велкам.
Читать полностью…Ну ладно. Наткнулся на конкурс AI моделей (не тех которые LLM, а которые в Instagram или других соц сетях) - Miss AI. В интересное время живем. Так еще и создатели других таких моделей - судьи.
Напоминает конкурс промтов
Короче. Навеяло.
Или обсудим тему «деньги за совет». Этакая платная экспертиза. Где, ну я такой крутой, что мои советы стоят дохрена.
Я не то, чтобы не верю в такую штуку как плата за совет. Но только не в моменте пожалуй. Сам по себе совет не есть работа. Я считаю это как раздача социальных кредитов. То есть я помогу тебе советом, а ты мне потом тоже поможешь. По сути дела вы нарабатываете себе не только репутацию, но и опыт (ведь вам показывают ситуацию, рассказывают вводные). Плюс ваш кредитный скор в комьюнити растет.
Верю, в то что есть ну омегакрутые парни которым это все не надо. Но на моей практике такие ребята как партнеры из a16z, разные фаундеры единорогов легко соглашаются дать вам совет, посмотреть вашу идею. Пусть даже и напишут - херня (чаще даже не ответят после первого сообщения), но для вас это важно.
Поэтому продажа советов это для меня страшная фигня. Самоограничение и отчасти зазнайство. Консалтинг это работа на дистанции, но точно не разовый ответ на пару вопросов. Нет времени - откажись.
Но каждый пусть решает сам.
Сделать этот мир капельку лучше пусть даже советом это уже круто.
В западном твиттере хайпует новый Clubhouse от Навала Равиканта - AirChat.
Это приложение лента с дискуссиями, где вы набираете текст как аудио сообщение и потом еще происходит транскрипция. По сути есть как текстовое сообщение так и ваше аудио (такой опыт аудиокниги или подкаста).
Туда вновь залетела вся тусовка долины и сидит болтает (видимо поднакопилось что сказать с момента релиза клабхауса). Как всегда все через инвайты. В каких регионах доступно не знаю, инвайт идет через телефонный номер вроде. Кому надо - пишите в личку.
Все еще считаю в долгую аудио контент проигрывает видео. Тут правда решили схитрить и совместили с текстом и сохранили голос автора. Посмотрим.
Ссылка на апп
К новостям о длине контекста. Ну я ожидаю что скоро в сетку можно будет закидывать книги, ролики, фильмы, лучше прямо ссылкой, чтобы не париться. Потом это все завезут и на устройство (в этот момент сбрасывайте акции NVIDIA).
Не путайте с тем, что модель стала умнее или научилась понимать мир и все такое. Просто теперь та же техника на которой построен трансформер будет работать ну на очень длинной входной командой. Похоже так сделан последний релиз от Google.
Почитать paper
А тем временем Павел Дуров говорит нам о том, что у Telegram DAU/MAU ~1/2, что невероятно высокий показатель. А в совокупности с тем, что это messenger то и Retention должен быть на высоте. Одним словом грандиозный результат. Ждем превращения в бизнес.
Похожие показатели были у всех успешных consumer (social) компаний и их IPO было тоже очень сильное. Почти все делали рекламную модель (исключение наверное WeChat который начал делать superapp, но объяснение лежит скорее в его локальности).
Поэтому DSP, аукцион, discover etc. Ну либо мы будем наблюдать что-то новое. Сейчас движение идет ближе к стратегии Snap/Discord. А их будущее как бизнеса мне видится нестабильным.
Хотелось бы конечно daily time spent by user. Тут мы сразу бы узнали рекламный потенциал (и возможно необходимость делать feed как в том же WeChat).
Помните релиз программы AlphaGo от Deepmind, которая играла в Go лучше людей. До этого момента эта игра считалась самая вариативная и сложная настольная игра и выиграв у человека AI показал, что мол вот можно даже обучатся играть самой с собой и все равно быть лучше (то есть без датасета партий, а только с учетом правил, по сути партии генерились самой программой. Такая версия называлось AlphaZero) всех игроков.
Так вот то было в 2015-16 году. И есть эффект. Вы не поверите, но игроки а Go стали изобретательнее и лучше. После нескольких лет, слабейшие профессиональные игроки стали играть лучше, чем самые сильные игроки до релиза AI.
Это прекрасный пример тезису «AI поможет стать профессионалам лучше, нужно лишь желание развиваться и учиться новому».
Источник
Когда-то в моем канале было много дизайнов мемов от этого господина. А на самом деле он неплохие вещи предлагает.
Читать полностью…NASA восстановила связь с Вояджером-1, который сейчас находится на расстоянии 24 миллиарда километров где-то в открытом космосе, ему 46 лет.
В ноябре 2023 года сигнал от Вояджера превратился в неразборчивую последовательность. Ему стали посылать разные команды с Земли, в попытке запустить хоть какую-то программу (туда-обратно сигнал идет сейчас 45 часов.) 3 марта в полученных нечитаемых данных нашли выделяющуюся последовательность. Оказалось, что аппарат прислал полный дамп содержимого памяти.
После расшифровки стало ясно, что 3% памяти испорчено, вышла из строя одна из микросхем постоянной памяти, где хранилась часть программного кода. Инженеры перераспределили управляющий код по системной памяти, 18 апреля отправили новую прошивку, и с 20 апреля с Вояджера снова приходят осмысленные данные.
Вояджер были рассчитан на 5 лет работы к слову.
Команда стартаперов в радости!
P.S. Новость нашел в просторах интернета.
Решил собрать несколько ссылок на свои старые посты, кто так сказать не долистал.
Считаю плюс минус достойно внимания:
- про нетворкинг в твиттере
- про тиктоки для собак и кошек
- про то что я был первый официальный посетитель Apple Park
- про пуши в приложениях
- про mute
- мой драфт дека для ранней стадии consumer продукта
- про аналитику стартапов ранней стадии
- как выглядит апдейт для инвесторов - шаблон письма
- про паттерны быстрорастущих приложений
- про комьюнити немного
- почему я отказался от публичности
- про то что я бы делал иначе стартанув сейчас Prisma
- на кого подписан с колокольчиком в твиттере
Остальное вроде более менее свежее
И так к реально полезным изобретениям. Специальные писсуары для анализа урины в Китае.
Да да, вы приходите платите денежку и вам в телефон приходит полноценный анализ урины. Вот это я понимаю меры для оздоровления. Уверен, в целом мониторинг показателей мало кто ведет, а такие профилактические меры могут вполне повысить информированность населения. Оплата через WeChat QR код.
Источник
Ну кажись минус TikTok в США. Такие дела.
Палата представителей Конгресса США проголосовала за потенциальный запрет TikTok; теперь китайская ByteDance должна будет продать соцсеть или прекратить работу в стране.
Выпустили новую модельку от Meta AI - Llama3, по бенчам выходит лучшая в Open Source (хотя вроде посл Mistral нет там в сравнении).
Как попробую - расскажу впечталения.
Продукта пост. Я последние 10 лет так или иначе занимаюсь продуктом в роли какого-то там менеджера. Во всех своих компаниях я всегда был CEO и product manager (один единственный). Не всегда успешный, но всегда старался понять что же нужно людям по ту сторону экрана.
Помимо всего этого добра всегда увлекался таким продуктом как поиск. И вот сейчас идут попытки его переизобрести или хотя бы изменить сценарии. Ведь наконец-то ответ может быть сгенерирован на основе имеющейся информации. Но я не об этом.
На просторах СНГ(да я думаю и вне) всем известен Яндекс. Я там работал, начинал свою карьеру так сказать. И всегда считал их поиск прекрасным продуктом. Но недавно ребята представили Нейро. Для простоты это некий аналог Perplexity. И все бы ничего, если бы не продуктовое «смелое» решение разместить свитчер для переключения прямо под поисковой строкой. Почему это «не то»:
- Яндекс на протяжении уже лет 10 твердит «найдется все», «спроси у Яндекса», как бы приближая себя к глаголу Гуглить (just google it). Рекламы, ролики, маркетинг - все. И это было очень правильно. Есть западный крутой пример.
- Яндекс найдет. Но не тут то было. Они сами запустили себе конкурента и прямо в том же месте.
- и вот я простой пользователь и иду в яндекс и вижу две опции, так куда вводить свой запрос? Ведь оба отвечают на мои вопросы.
- когнитивный диссонанс при выборе сложноразличимых опций это беда. И я крайне удивлен что продакты этого решения не знают этого.
Причина скорее всего есть и кроется она в погоне за хайпом от западных коллег. Ведь мы тоже можем, так еще и круче. Ну и еще я догадываюсь что они не побоялись так сделать, потому что в основном туда будут литься запросы без дорогой рекламной выдачи (фактология и прочее).
Цена тренировки foundation моделей. Ну что ж ~200M USD за Google Gemini Ultra. И около 75M за gpt4.
И да compute официально кончился :) ждите как все это дело поедет на CPU.
Интересно сколько mistral стоит
Всех так драйвит менторить, помогать, искать смыслы, быть учителем. Ну в целом да.
Как там в поговорке - * не мешки ворочать.
Меня тоже драйвит поэтому я преподаю студентам если такая возможность есть. И отношусь к этому точно не как к заработку. Интересно сколько таких ребят, готовы помогать стартапам бесплатно и без акций. Риторический вопрос само собой.
Поговорим про нашумевший в определенных кругах релиз AI Pin by Humane. Помимо того, что название компании мне вообще даже немного противно, я удивлен тому как у людей работавших в корпорациях напрочь отсутствует понимание баланса между продуктом и фичами. А именно ребята заявлют просто тонну функций, создают архибольшие ожидания, качают маркетинг на полную (в стиле Apple и вдохновления). Но оказалось что это все производная 100М USD на борту от инвесторов.
Собрать крутой девайс можно, сделать его корпус классным и все такое. А вот замастерить продукт оказалось не под силу. И хватит уже крутить эту мысль что и первый iPhone был херней, потому что не был. Надо иногда признавать что ты делаешь хероту и принять всю критику.
На их месте я бы сделал лишь одну фичу и сделал бы ее ну очень круто, тем более она была с самого начала и это Live Translation. Ведь вот это правда удобно, те кто путешествует знает, особенно в Азии. Все остальное просто непонятная мне фигня, где любой телефон за 250 баксов справляется быстрее и лучше (так то этот пин стоит 700). И цена настолько кусается что значит расчет на взрослого потребителя, а не на gen Z с карманным баблом.
Ну и типичная ошибка запуска на скриншоте.
P.S. You have to be ten times better than second best. (c) Peter Thiel
Кризис венчурной индустрии. Зима! Никто не дает денег. А, ну да. https://www.axios.com/2024/04/15/andreessen-horowitz-7-billion-new-funds
Читать полностью…Это примерно я, когда использую «новый революционный девайс или софт с AI»
Читать полностью…Ты: платишь подписку за ChatGPT, Claude3 и все такое.
Я: использую помощника в приложении Shopify бесплатно.
P.S. Понимает даже с ошибками.
Одной строкой. Тут за пару дней много интересных релизов навыходило.
Google запустил Gemini 1.5 c очень большим контекстным окном (аж до ляма токенов, в примере там лекцию Jeff Dean загружают на 117к токенов) и возможностью залить видео/аудио.
Сегодня французы из Mistral дропнули новую версию модели. На рынке foundation моделей становится жарко и уже сложно сказать кто будет лидером в ближайшие месяцы, пока OpenAI ничего толком нового не запускает. Дропунли они в своем стиле просто оставив ссылку на торрент в Тви. MoE архитекутра
Известный всему миру эксперт в области AI Андрей Карпаты начинает писать свою библиотеку для обучения сетей на C. Подозреваю готовит нас к миру, где сетки будут обучаться внутри умных устройств дома - в холодильниках там.
Раскатилась новая версия GPT4-Turbo с Vision (можно сувать картинки) на размер контекста 128к токенов. Никакого подробного описания и изменений пока нет. Ждем тестов. А так посмтариваете вот сюда
Хотя чего я там про зарплаты говорил. Пф. Библиотекарь.
P.S. И не просто вот, а на удаленке. Wtf.
У китайцев частенько выходят интересные модели. В этот раз вполне достойный конкурент в области генерации портеров и фотографий людей.
https://cosmicman-cvpr2024.github.io/
А вы используете как-то сетки по генерации картинок? У меня все пока никак для себя применение найти не удалось.