Вышло что-то новое и очень мощное.
Моделька справляется по моим тестам с тем, что gpt4 не очень. Например пишет готовый код мини игр, которые сразу запускаются. Скорее всего релиз ждем официальный на днях. Потестить можно на chatbot arena, выбрать gpt2-chatbot
Память в ChatGPT, не думаю что увеличит их метрики сильно, пока не представляю даже если такие пользователи которым это очень надо. Доступно с 4 версии.
Читать полностью…Давно не было суботних постов. У нас тут поливает дождь целый день и я наткнулся на интеерсный документ авторства ЦРУ 1944 года (справедливости ради ЦРУ образовались в 1947 году из организации Office of Strategic Services, OSS, документ от них) - SIMPLE SABOTAGE FIELD MANUAL (прикладные рекомендации к саботажу). Документ приложил.
Так вот зацепил параграф: General Interference with Organizations and Production (или как правильно подрывать работу организаций и производства), который ну очень напоминает мне работу многих продуктовых команд и небольших бизнесов/стартапов. Оставлю лучшее, чуть чуть адаптировал текст под современные реалии :)
- Настаивайте на выполнении всего через "официальные каналы". Никогда не позволяйте принимать обходные пути для ускорения принятия решений.
- Делайте "речи". Говорите как можно чаще и очень долго. Проиллюстрируйте свои "точки зрения" длинными историями и рассказами из личного опыта. Не стесняйтесь вставлять несколько соответствующих "патриотических" комментариев.
- По возможности передавайте все вопросы комитетам для "дальнейшего изучения и рассмотрения". Пытайтесь сделать комитеты как можно больше - никогда не меньше пяти человек.
- Как можно чаще поднимайте нерелевантные вопросы.
- Торгуйтесь о точной формулировке сообщений, протоколов, резолюций.
- Ссылайтесь на вопросы, решенные на прошлой встрече, и попытайтесь вновь поставить под сомнение целесообразность этого решения.
- Призывайте к "осторожности". Будьте "неразумными" и призывайте своих коллег быть "разумными" и избегать поспешности, которая может привести к неловкостям или трудностям в будущем.
- Беспокойтесь о правомерности любого решения – поднимите вопрос о том, входит ли такое планируемое действие в юрисдикцию группы или может ли оно противоречить политике какого-либо вышестоящего звена.
Советы менеджерам в комментах :)
Китайская сеточка в конкуренцию OpenAI Sora. Не представляете какое количество инвесторов долины возбудились и сразу говорят, что мол видео подобраны, и это точно максимум на что она способна и все такое. Не привыкли видимо от каких-то no name китайцев получать конкуренцию, когда заливаешь ярды венчурных денег.
На скрине комментарий партнера a16z
Один из самых больших buyback на моей памяти от Google, первые дивиденды. Время шортить Nvidia. Ну а в целом, это очень сильный рыночный ход и уверенность в собственном бизнесе, когда ты тратишь 70% кэша компании на выкуп акций.
Читать полностью…Достаточно интересная работа вышла из недр OpenAI.
Обсуждают уязвимость LLMs к атакам, таким как внедрение подсказок и взломы, которые позволяют злоумышленникам переписывать оригинальные инструкции модели. Авторы утверждают, что одна из основных уязвимостей, лежащих в основе этих атак, заключается в том, что LLMs часто относят системные промты к тем же приоритетам, что и запрос от пользователей. Для решения этой предлагают иерархию инструкций, которая явно определяет, как модели должны вести себя, когда инструкции разного приоритета конфликтуют. Затем предлагается метод автоматизированной генерации данных для демонстрации этого иерархического поведения в следовании инструкциям, который обучает LLMs игнорировать инструкции с более низким приоритетом. После тестирования говорят становится лучше и меньше уязвимостей.
Ожидаемо господа из Perplexity нашли как же победить Google. Ну все просто, начать продавать enterprise solution.
В целом учитывая количество того, что компания делает:
- API
- поиск? Где прямым текстом говорится в интервью что победят через UX (еще делают своего поискового робота)
- enterprise solution, а-ля продай своим коллегам бота для поиска и чтобы данные запросов не утекли (корпоративный поисковый бизнес это что-то новое)
- подписки
- новости
- партнерки для дистрибуции своего поиска
Создается некое ощущение, что подняв тонну денег и став юникорном (наверное) понимания как построить растущий бизнес или продукт нет.
Фокуса нет. Да и фаундер постоянно фоткается с кучей крутых парней и дает интервью/подкасты. Моя ставка если не найдут что делать в этом году как основу их ждет медленная смерть. Убеждаюсь в который раз, что поднимать тонну денег до PMF (product market fit) затея не всегда самая лучшая. А вы что думаете?
Полезные UX паттерны. Часть номер «фиг знает какой». Как показать какой свитчер или настройку врубить - включить видео и оставить его в окне. Правда есть риск перекрытого окна, а управлять положением такого плеера нельзя (видео закроет свитчер включения например, это проблема).
Приложение авторов Zenly - amoamoamo
Иногда думаю какой же должен быть интрумент для дизайна современных приложений (UI/UX). Вообщем нашел ориентир и верю что к такому виду придет условная Figma годика через 3-5.
P. S. Игра Tiny Glade в Steam.
А как же AppStore ворует у разработчиков? И конские комиссии?
Ну а вообще это просто единственная viable (дающая возможность существовать) опция для такого продукта. Ну и следом USDT на TON доехал.
Не реклама. Мой хороший друг Юра, который недавно прошел YC и поднял 2М USD хочет провести эфир и все такое и поделиться мудростью разной о том как оно там сейчас в фандрейзе. У него длинная богатая история много с кем работал. В комменты занесу инфу - велкам.
Читать полностью…Ну ладно. Наткнулся на конкурс AI моделей (не тех которые LLM, а которые в Instagram или других соц сетях) - Miss AI. В интересное время живем. Так еще и создатели других таких моделей - судьи.
Напоминает конкурс промтов
Всем, кто делает игры или сервисы вокруг них думаю будет полезен такой список гейминг фондов и контактов соотв.
https://nextgengamingclub.com/#investors
В твиттере снова пожар. Или все технооптимисты столкнулись с сенатом штата калифорния, который сегодня запустил вот такую темку в паблик (а скоро наверное и на голосование).
Самый забавный параграф конечно этот:
"If not properly subject to human controls, future development in artificial intelligence may also have the potential to be used to create novel threats to public safety and security, including by enabling the creation and the proliferation of weapons of mass destruction, such as biological, chemical, and nuclear weapons"
Это прям вот сборка всех мемов про терминатора и скайнет.
Если кратко - open source и стартапы будут страдать и регулироваться ой как жестко.
Например там указаны примеры про автоматизацию звонков через AI и телефонные сервисы, камеры на светофорах и прочие модели которые можно для такого(фрод, кража личных данных итд) использовать надо будет так сказать проверить и компанию допустить.
Еще раз повторю, что мне кажется верным. Важна не архитектура модели (если разговор про качество, а не скорость), а датасет. Ничего больше на дистанции не важно. Выиграют данные, а не изощренные методы перестановки слоев и гиперпараметров местами, хотя и моментами кажется что это супер важно.
А если выигрывают данные, значит мы возвращаемся в дивный мир «у кого пользователи, тот и победил». Уверен ребята в OpenAI это крайне хорошо понимают и уже давно сообразили что Microsoft это хорошо.
Древний paper вам для подумать и старый пост на почитать
P.S. Я кстати буду рассказывать про in-context learning скоро небольшую презентацию. Это про то, что люди называют магией, reasoning и прочее, хотя в реальности похоже на Bayesian inference. Но феномен занятный. Вам интересно? (Сердечко в реакцию тогда)
Сегодня наткнулся на один из постов в канале знакомом про поиск COO в стартап. И решил поделиться некими мыслями про найм/поиск людей в команду.
Я когда-то на заре карьеры, еще работая в Яндексе, ездил на конференцию по дизайну (не спрашивайте зачем), и на ней были несколько тогда для меня значимых персон из раннего Facebook, которые достаточно развернуто рассказывали про свои принципы найма. Которые я чуть чуть дополнил и ниже изложу.
Если кратко то люди работают по 4 причинам. Эти причины можно отсортировать по важности для каждого кандидата.
4P = people, product, process, profit.
Пройдемся по каждой.
1/ People. Это тот самый случай, когда «поработайте со мной». Чаще всего сводится на самом деле к двум вещам. Либо друзья работают со своими друзьями (фан, легкость). Либо с очень сильными ребятами. Сила в этом случае должна измеряться недвусмысленно (количество экзитов, релизов, количество людей в команде, ARR, референсы, результаты в Хард скилах типа пэйперы, звездочки на гитхабе) и никак не абстрактными качествами, который каждый оценит по-своему(эмпатия, культура уважения, итд).
2/ Product. Главное что я делаю и для кого. Именно поэтому я в свое время хотел работать в Яндексе. Потому что продуктом который я делал пользовались миллионы людей в день. И мне было пофигу с кем и за сколько. Тут важно соотв продукта и человека. Легче всего в consumer, тяжелее всего в enterprise.
3/ Process. Это когда инженер идет туда где задачи посложнее. Или внутренняя мотивация лежит в области решения как можно более интересных задач с точки зрения hard skills. Поэтому у таких людей очень высокие требования к качеству того что вы делаете. И они любят четкость постановки задач и причин почему они тут нужны.
4/ Profit. Тут думаю все понятно. Деньги они и в Африке деньги. Важно думать про них на дистанции больше чем про в короткую.
И дальше накладываем все это на некую мелкую компанию или на стартап. И в случае стартапа шансы нанять любого есть:
- стартап это синоним роста и амбиций, если ваш проект не поднимает раунды и не растет как вне себя каждый квартал и вокруг вас не бродят слухи про новый единорог то будет тяжело
- стартап это опыт прежде всего и опыт направленный и очень амбициозный, чем выше цель тем легче привлечь людей
- ну трек рекорд основателей, тут вроде все понятно, если реферов на вас нет в сети или значимых релизов(экзитов) - шансы меньше
Цель компании часто лежит в том, чтобы помочь человеку прийти к его цели или найти ему эту цель.
Про найм писал еще тут и тут и даже так
Очень интересная статья про опыт работы с Sora от OpenAI, эта которая генерит видео по вашему запросу.
Все проблемы на лицо. И именно поэтому пока все это в глубокой альфе и до нормального продакшена видео это доберется боюсь не скоро. Но как тул для скетчей или быстрых роликов думаю достаточно скоро. Кстати говоря генерит оно пока максимум в 720p, но все равно долго и поэтому тестеры делают в 480p. Про консистентность же я говорю очень давно. Тут это будет критически важно.
NASA восстановила связь с Вояджером-1, который сейчас находится на расстоянии 24 миллиарда километров где-то в открытом космосе, ему 46 лет.
В ноябре 2023 года сигнал от Вояджера превратился в неразборчивую последовательность. Ему стали посылать разные команды с Земли, в попытке запустить хоть какую-то программу (туда-обратно сигнал идет сейчас 45 часов.) 3 марта в полученных нечитаемых данных нашли выделяющуюся последовательность. Оказалось, что аппарат прислал полный дамп содержимого памяти.
После расшифровки стало ясно, что 3% памяти испорчено, вышла из строя одна из микросхем постоянной памяти, где хранилась часть программного кода. Инженеры перераспределили управляющий код по системной памяти, 18 апреля отправили новую прошивку, и с 20 апреля с Вояджера снова приходят осмысленные данные.
Вояджер были рассчитан на 5 лет работы к слову.
Команда стартаперов в радости!
P.S. Новость нашел в просторах интернета.
Решил собрать несколько ссылок на свои старые посты, кто так сказать не долистал.
Считаю плюс минус достойно внимания:
- про нетворкинг в твиттере
- про тиктоки для собак и кошек
- про то что я был первый официальный посетитель Apple Park
- про пуши в приложениях
- про mute
- мой драфт дека для ранней стадии consumer продукта
- про аналитику стартапов ранней стадии
- как выглядит апдейт для инвесторов - шаблон письма
- про паттерны быстрорастущих приложений
- про комьюнити немного
- почему я отказался от публичности
- про то что я бы делал иначе стартанув сейчас Prisma
- на кого подписан с колокольчиком в твиттере
Остальное вроде более менее свежее
И так к реально полезным изобретениям. Специальные писсуары для анализа урины в Китае.
Да да, вы приходите платите денежку и вам в телефон приходит полноценный анализ урины. Вот это я понимаю меры для оздоровления. Уверен, в целом мониторинг показателей мало кто ведет, а такие профилактические меры могут вполне повысить информированность населения. Оплата через WeChat QR код.
Источник
Ну кажись минус TikTok в США. Такие дела.
Палата представителей Конгресса США проголосовала за потенциальный запрет TikTok; теперь китайская ByteDance должна будет продать соцсеть или прекратить работу в стране.
Выпустили новую модельку от Meta AI - Llama3, по бенчам выходит лучшая в Open Source (хотя вроде посл Mistral нет там в сравнении).
Как попробую - расскажу впечталения.
Продукта пост. Я последние 10 лет так или иначе занимаюсь продуктом в роли какого-то там менеджера. Во всех своих компаниях я всегда был CEO и product manager (один единственный). Не всегда успешный, но всегда старался понять что же нужно людям по ту сторону экрана.
Помимо всего этого добра всегда увлекался таким продуктом как поиск. И вот сейчас идут попытки его переизобрести или хотя бы изменить сценарии. Ведь наконец-то ответ может быть сгенерирован на основе имеющейся информации. Но я не об этом.
На просторах СНГ(да я думаю и вне) всем известен Яндекс. Я там работал, начинал свою карьеру так сказать. И всегда считал их поиск прекрасным продуктом. Но недавно ребята представили Нейро. Для простоты это некий аналог Perplexity. И все бы ничего, если бы не продуктовое «смелое» решение разместить свитчер для переключения прямо под поисковой строкой. Почему это «не то»:
- Яндекс на протяжении уже лет 10 твердит «найдется все», «спроси у Яндекса», как бы приближая себя к глаголу Гуглить (just google it). Рекламы, ролики, маркетинг - все. И это было очень правильно. Есть западный крутой пример.
- Яндекс найдет. Но не тут то было. Они сами запустили себе конкурента и прямо в том же месте.
- и вот я простой пользователь и иду в яндекс и вижу две опции, так куда вводить свой запрос? Ведь оба отвечают на мои вопросы.
- когнитивный диссонанс при выборе сложноразличимых опций это беда. И я крайне удивлен что продакты этого решения не знают этого.
Причина скорее всего есть и кроется она в погоне за хайпом от западных коллег. Ведь мы тоже можем, так еще и круче. Ну и еще я догадываюсь что они не побоялись так сделать, потому что в основном туда будут литься запросы без дорогой рекламной выдачи (фактология и прочее).
Цена тренировки foundation моделей. Ну что ж ~200M USD за Google Gemini Ultra. И около 75M за gpt4.
И да compute официально кончился :) ждите как все это дело поедет на CPU.
Интересно сколько mistral стоит
Всех так драйвит менторить, помогать, искать смыслы, быть учителем. Ну в целом да.
Как там в поговорке - * не мешки ворочать.
Меня тоже драйвит поэтому я преподаю студентам если такая возможность есть. И отношусь к этому точно не как к заработку. Интересно сколько таких ребят, готовы помогать стартапам бесплатно и без акций. Риторический вопрос само собой.
Поговорим про нашумевший в определенных кругах релиз AI Pin by Humane. Помимо того, что название компании мне вообще даже немного противно, я удивлен тому как у людей работавших в корпорациях напрочь отсутствует понимание баланса между продуктом и фичами. А именно ребята заявлют просто тонну функций, создают архибольшие ожидания, качают маркетинг на полную (в стиле Apple и вдохновления). Но оказалось что это все производная 100М USD на борту от инвесторов.
Собрать крутой девайс можно, сделать его корпус классным и все такое. А вот замастерить продукт оказалось не под силу. И хватит уже крутить эту мысль что и первый iPhone был херней, потому что не был. Надо иногда признавать что ты делаешь хероту и принять всю критику.
На их месте я бы сделал лишь одну фичу и сделал бы ее ну очень круто, тем более она была с самого начала и это Live Translation. Ведь вот это правда удобно, те кто путешествует знает, особенно в Азии. Все остальное просто непонятная мне фигня, где любой телефон за 250 баксов справляется быстрее и лучше (так то этот пин стоит 700). И цена настолько кусается что значит расчет на взрослого потребителя, а не на gen Z с карманным баблом.
Ну и типичная ошибка запуска на скриншоте.
P.S. You have to be ten times better than second best. (c) Peter Thiel