Будни технического директора @samatg (ex-CTO Meduza, Bookmate, RAWG, Pure) заказать услуги https://fansdev.ru · чатик @ctodailychat · рекламу не продаю
В каникулах между сезонами я каждый четверг чувствую, что не хватает нового эпизода послушать и написать пост-анонс.
Мы уже вовсю работаем над новым, 13 сезоном; скоро запуск. Только что записали эпизод про ИИ-инфлюенсеров, у меня было 6 утра, у гостя — 8 вечера, у редактора вообще 11 ночи.
Уже записали один из самых сложных эпизодов сезона — про ИИ-психотерапию. 3 часа готовили вопросы! (обычно от часу до двух) Гостья — известный подкастер, практикующий психотерапевт.
А ещё — пробуем новый формат бонусных «новостных эпизодов» для платных подписчиков. На этой неделе поговорили с редактором Машей Агличевой о новых айфонах, почему презентации Apple перестали быть важным событием и стоит ли переходить на Android. Подписаться и послушать можно в телеграме и в Apple-подкастах.
Новый публичный сезон — скоро!
Очень волнительно. В какой-то момент, после 10 сезонов была усталость, а теперь как будто новое дыхание — пробуем новые темы, новые форматы. Идеи и предложения можно обсудить в чате подкаста (нас там уже 1500!) или отправить записку команде через бота.
Мы тут начали делать свой продукт — медицинского ИИ-консультанта. (да, на основе и с помощью ИИ)
Многие советуются с ИИ про здоровье. Пишут свои симптомы, загружают анализы, просят разъяснить диагнозы и получают второе мнение.
Искусственный интеллект может быть очень мощным помощником, но важно уметь составить правильный запрос и дать ему весь необходимый контекст.
Плюс, у людей, которые активно этим пользуются, возникает проблема менеджмента переписки: какой это был чат, в какой программе, а где я уже загрузил эти выписки и анализы? А хранение и каталогизация медицинской истории и документов, чтобы можно было использовать их в будущем — это вообще отдельная песня.
Мы решили сделать небольшое приложение, которое задаст все необходимые уточняющие вопросы и даст четкий ответ, и при этом будет вести «личный медицинский профиль» — сохранять все заболевания, анализы, выписки и т. д., используя их в дальнейших консультациях.
—
За пару дней накидали дизайн в фигме и в lovable: окно чата + раздел «моё здоровье», где заболевания и документы. Принципиальная схема приложения банальная — бэкенд на питоне с базой в postgres и фронт на js.
Бэкенд пишет руками сам Федя. Во первых, вайб-кодить бэкенд — себе дороже — ИИ пока что оставляет слишком большие дырки с точки зрения безопасности, а медицинская история — это не шутки; во вторых, мы хотим разобраться, как интегрироваться с AI.
Мне казалось, что учитывая всю эту AI-движуху, должны быть практически готовые технологические решения для проектов, подобных нашему. На слуху Langgraph, PySpur, dify — на словах они обещают ровно то, что нам нужно. Бери любой, крути поверх бизнес-логику и наслаждайся!
В реальности, всё тлен. Вот короткий внутренний статус от Феди после недели исследования:
Потратил несколько часов на работу с Langgraph и полностью в нём разочаровался:
— Документация не соответствует действительности. Копируешь куски — не работают.
— Переусложнённые абстракции. У него очень высокий порог входа — я за 3 часа не смог написать инструмент, который написал бы за 10 строк чистого httpx.post(‘https://api.openai.com')
— Все действительно полезные примитивы попрятаны внутрь langgraph platform, которая выглядит как closed source bloatware с нулевым devex. Без него придётся самим разруливать стейт между пользователями и делать API телеги/lovable
Что ещё я посмотрел:
— pyspur: Купился на автотесты запросов прямо в UI. К сожалению, проект выглядит мёртвым. Как будто бы 5к звёзд у него накручены — в issues почти пусто, а в дефлотной установке не работает даже справка по CLI: я натурально так и не смог её прочитать за час, угадывал.
— dify: купил за то, что у них прямо на лендосе визуально построен граф для бота поддержки медклиники. Выглядит кайфово, но я не смог понять, как ему подсовывать свой собственный стейт юзера. У них есть свои memories, но это очень тяжёлый вендорлок, и нет уверенности что туда влезет то, что нам надо.
Кажется, dify мог бы нам подойти, но с ним MVP не пойдёт дальше founders-friends-family, т.к. у себя его не развернуть (несмотря на заявления на лендосе там полный пиздец в инфраструктуре), то есть никаких локальных моделей для тестирования.
Вчера прошла презентация «Сделано гуглом ’25», где компания представила свои новые телефоны.
Самое прикольное — это перевод телефонных звонков, с сохранением голоса собеседника! Выше видео, как это работает.
Доступна эта функция только на последнем поколении телефонов Google Pixel 10. Там внутри единый чип (System on a Chip, SoC) Tensor G5, разработанный самой компанией, прямо как семейство чипов Apple A17. Я не знал, что гугл пошел по стопам Apple в этом вопросе.
Благодаря ИИ-модулю этих чипов, нейросеть переводит речь в режиме реального времени, прямо на телефоне, без интернета.
Пока поддерживается только перевод с или на английский, зато среди вторых языков есть русский! И железки выглядят очень симпатично. А ещё за счет энергоэффективности новых чипов, они обещают жизнь без зарядки не меньше, чем на айфонах. Гугл молодец.
В эти телефоны встроили все ведущие нейросети для создания и редактирования фото и видео. Теперь бабушки будут отправлять кастомные видео-открытки в вацапе, наверное.
Интересно, что вел перезентацию Джимми Фалон и куча звездных гостей из спорта и шоу бизнеса, это примерно как если бы у нас презентацию Алисы Яндекса вел Ургант, а среди гостей были бы популярные футболисты и певцы.
А у нас финал AI-хакатона от Ани Булдаковой. Я в жюри, прямо сейчас финалисты представляют свои работы. Онлайн трансляция на ютубе.
Читать полностью…Рама зеркала — в кадре с невестой она не в фокусе, а в кадре с женихом её сначала можно рассмотреть в деталях. 🤯
На официальной странице ещё куча примеров и главное — ей можно пользоваться любому хоть сегодня, минимальная подписка — от 15 долларов в месяц.
Обратите внимание, лиса и дерево на фоне — те же самые, просто с разных углов.
Читать полностью…Ещё одна свежая модель от гугла — Veo3, уже доступная публике для генерации видео вместе с аудио. Стоимость ролика — от 40 центов до 2 долларов, в зависимости от качества картинки.
Читать полностью…На прошлой неделе было удивительное:
1. Федя признался, что понял кайф вайб-кодинга (до этого он всё время говорил, что понимает, что это такое, но я бы описал его прошлую позицию как просвещённый луддизм); надеюсь, сделаем про это с Федей отдельный эпизод подкаста.
2. Настя, наш операционный директор (не программист), завайбкодила прототип для клиента в lovable. Раньше бы мы назначили встречу с продуктовым дизайнером, он бы нарисовал макеты, мы бы сделали пару встреч и итераций, дальше бы мы его, может быть, сделали кликабельным, дальше бы посадили фронтендеров его заверстать. А тут Настя сделала всё сама за пару часов. И отправила клиенту не просто макеты, а полноценный прототип. Клиент — стартап, в котором нужна возможность связать врачей и пациентов, так эта шайтан-машина нашла бесплатное решение для видеосвязи и прикрутила его к прототипу.
Настя выглядела поражённой и даже встревоженной: «Самат, с помощью этого можно перестроить работу с клиентами». И спросила: «А нужны ли будут программисты?» и вообще: «Какое наше место в этом новом мире?»
Я спокоен: сложные, большие программы эта система всё ещё не может сделать нормально, и наше умение придумать гибкую, масштабируемую архитектуру, задавать и выдерживать требования к качеству при меняющихся требованиях — это технические навыки, которые делают нас (и наших программистов) ценными. Плюс мы думаем над задачей клиента, не просто бездумно исполняем приказ.
То есть программист сможет заниматься чуть более сложными вещами и ускорит свою работу.
Вспомнил, что на днях общался со знакомым, который делает сервис по созданию кастомных приложений обычными людьми. То есть ты говоришь, какое приложение хочешь, начинаешь им пользоваться и можешь прямо на лету что-то в нём поменять, с сохранением уже введённых данных, вообще не имея дела с кодом. Подобные инструменты, скорее всего, съедят нижнюю часть рынка, «простую разработку». Как мы сегодня не ищем дизайнера и верстальщика, чтобы написать объявление в ворде или сделать простую страницу на тильде, но обращаемся в издательский дом, если хотим опубликовать книгу, или нанимаем команду, чтобы запустить большой маркетплейс.
—
Ну и наконец, если в каком-то будущем мы сможем делать крутые программные продукты «совсем без программистов» — то:
1. долгосрочно, у нас будут гораздо большие проблемы, потому что перестроится вообще весь рынок интеллектуального (а с развитием физических роботов — вообще всего) труда, мир изменится;
2. краткосрочно, мы сами сможем гораздо смелее тестировать свои продуктовые гипотезы для своих продуктов (а мы хотим развиваться именно в сторону продуктовой разработки).
—
То есть я настроен оптимистично, но то, что два этих события произошли почти одновременно, не идёт у меня из головы. Кажется, что мы незаметно преодолели очередной барьер развития ИИ.
Ну и чтобы очистить нёбо после последнего поста: чувак записал 176 килобайт информации в … птичью трель! Вам потребуется обычный советский на самом деле нужен хороший микрофон. ВИДЕО
Это BennJordan">классный ютубер Бен Джордан, который сначала работал музыкантом, а потом увлекся экономикой и инженерией и обо всём этом дико интересно рассказывает. Например: как текущая экономическая ситуация всё больше напоминает феодализм или как он построил и тестировал звуковую пушку, которая мешает говорить или как он выяснил, что треть всех политических аккаунтов в твиттере — боты.
Новое мобильное приложение Tea (чай) обогнало по популярности в апсторе ChatGPT. Это анонимная социальная сеть для женщин, чтобы сплетничать о бывших, выдавая им красные и зеленые флаги, и пробивать мужиков по разным базам.
Интересно, что если попросить chatGPT сделать ровно такое же приложение для мужчин, то нейросеть откажется, потому что это харрасмент, диффимация и дискриминация. А если для женщин — то powerful and sensitive idea.
Интересно, что было бы с подобным приложением в России. С одной стороны, баз для пробива даже больше, с другой стороны — новые законы о защите персональных данных довольно жесткие и настрой, кажется, совсем другой.
А вот antirez, супер успешный программист, работающий над по-настоящему сложными задачами, создатель redis, одной из самых популярных баз данных на свете, делится, как он использует ИИ для программирования.
Вкратце: даёт подробный контекст и пишет детальную спецификацию, не вайбкодит и даже не пользуется специальными редакторами (агентами), а буквально копи-пестит код; рекомендует модели Gemini 2.5 PRO и Claude Opus.
Говорит, что нейросети радикально ускоряют его работу. Внутри у него еще пара советов, рекомендую прочитать первоисточник, там коротко и по делу.
Люди заводят отношения даже с chatGPT.
Нейросети, которые специально заточены играть роль романтического (или даже сексуального) партнера — прямо отдельный жанр и даже огромный рынок, но ни в коем случае не мейнстрим.
Тем безумнее то, что Маск выкатил в мобильном приложении своей нейросети Grok самую натуральную вайфу.
Как в анекдоте: а что, так можно было?
Ну и классное рассуждение по мотивам исследования: автор цитирует классика Питера Науэра (того самого, который N в BNF), который говорил, что программирование — это создание ментальной модели задачи, предметной области, в которой мы работаем.
Опытные программисты, годами работающие над проектом, конечно же, имеют эту модель в подкорке, и их софт ей соответствует. У нейросети этой модели нет, поэтому она скорее мешает, чем помогает.
Дальше автор делает печальное наблюдение, что большинство программистов работают с плохим кодом, который увидели вчера. Мол, в таких ситуациях нейросети будут полезны.
—
Удивительно, как теория переплетается с практикой.
Совсем недавно сделали проект, в котором нас позвали «привести в порядок успешный стартап». Чуваки собрали MVP, но страдают от низкой скорости добавления фичей. Раньше я говорил, что это из-за «высокой внутренней сложности кода».
Более точная формулировка: в числе прочего, мы придумали, как привести их код в соответствие с предметной областью. Для этого мы нарисовали схему их предметной области, выделили контексты и домены, а потом придумали разделение ответственности по задачам между сервисами.
Красиво!
Очень классное исследование эффективности нейросетей для программирования.
16 опытных опенсорс программистов попросили решать реальные задачи в их проектах с использованием или без использования ИИ и сравнили их производительность.
Программисты предсказывали, что использование ИИ ускорит их на 24%. В реальности, с применением нейросетей испытуемые закрывали задачи в среднем на 20% дольше. Самое поразительное — даже после эксперимента им казалось, что благодаря нейросетям они ускорились на 20%!
Исследование отдельно хорошо тем, что явно описывает, что они не утверждают (и дают пояснения почему): «ИИ бесполезен для всех программистов» (они проверяли супер опытных чуваков на сложных репозиториях, которые те знают как свои 5 пальцев), «ИИ никогда не будет полезен в этих задачах» (инструменты развиваются очень быстро) и т. д.
Интересно, что думает про этот пост один из лучших программистов и техдиров, которых я знаю, Егор Хмелев.
Форвардну его сообщение ниже целиком.
Медиа пишут, что работу Бэнкси про цензуру уничтожили. Это ошибочное толкование, «стирание» привело ее в более совершенную форму. Теперь это точно искусство, а не просто граффити.
Надеюсь, что на этом со-творчество государства остановится. Двушечка будет плагиатом.
Я обожаю perplexity за то, что в нем можно прочитать краткое содержание любой статьи в интернете и даже ютуб-видео за пару секунд. Просто закидываешь ссылку из интернета и получаешь пересказ без рекламы и шелухи.
То есть нейросеть от гугла на вопрос «что там в этом видео говорится» отвечает «я не умею смотреть видео, открой посмотри», а perplexity и краткое содержание расскажет и на вопросы по содержанию ответит.
А ещё он насколько быстрый, что им вполне можно пользоваться вместо классических поисковиков. В общем, горячо рекомендую.
С другой стороны, читаю очередное обсуждение, как владельцы сайтов страдают от ботов, которые создают огромную нагрузку на небольшие публичные сайты. Тут я конечно считаю, что совсем эти AI-компании охренели, ломают интернет.
А теперь вспомнил, что perplexity игнорирует вообще все правила, и если засекает, что сайт блокируют его ботов — то прикидывается обычным пользователем и меняет IP адреса.
Люблю такие ситуации, когда этические и моральные установки вступают в противоречие с личным удобством. Сразу становится понятно, чего стоят твои убеждения.
Сегодня подвели итоги AI-хакатона от Ани Булдаковой. Больше тысячи участников из 80 городов, онлайн и офлайн!
Я как член жюри отсмотрел около 20 работ. На масштабе заметил, как сложно участникам четко сформулировать ключевую гипотезу проекта и сфокусированно её проверить. Финалисты выделялись именно этим умением не разбрасываться, а сделать ключевое.
Во вторых, приятно видеть, как много людей «scratch their own itch», то есть делают продукт «для себя», для решения задач, с которыми столкнулись сами. Волейболисты сделали приложение для организации турниров и игр, люди, которые не могли найти работу — тренажер интервью и так далее.
Причем многие из них — не программисты. Видно, что вайб-кодинг инструменты позволяют сделать первые прототипы не-программистам. Как сделать из этого полноценный продукт — это отдельный разговор, но прототип сделать точно можно.
Спасибо Ане Булдаковой за организацию, а всем участникам — за участие. Надеюсь, что не последний! Запись трансляции финала — на ютубе.
P. S. Кажется, что для меня лично главное — это как классно потусили с жюри ❤️
Открыл для себя, что аренда или покупка IP-адресов — это, оказывается, не совсем черная магия. Есть специальные площадки IPXO и InterLIR, где за примерно 100 баксов в месяц можно арендовать подсеть из 255 адресов, а за тысяч 10 — и купить.
Узнал об этом, когда обсуждали с коллегами блокировку Cloudflare. Мол, не обязательно терять российских пользователей или хоститься в России, достаточно арендовать подсеть и передать её под управление Cloudflare. Таким образом, не попадаешь под ковровые блокировки РКН и при этом можешь пользоваться всеми плюшками ведущего международного CDN. Правда, эта услуга доступна только на корпоративном тарифном плане, который, по слухам, стоит от 4 тысяч долларов в месяц.
Не думаю, что это много кому полезно, но интересно. Мне казалось, что купить подсеть /24
— это что-то, что могут сделать только «настоящие провайдеры» или «серьезные компании, типа Яндекса». Оказалось, и тут не боги горшки обжигают.
P. S. Власти блокируют Cloudflare, потому что он поддерживает новые протоколы ECH и QUICK, которые не расшифровываются коробочками ТСПУ Роскомнадзора. Получается как с ютубом, где не могут заблокировать отдельные видео, поэтому блокируют сервис целиком.
Ещё больше меня поразила модель Seedance 1 от ByteDance (компании-создателя ТикТока). Лично я не отличу этот ролик от современной дорогой рекламы, напичканной 3D-эффектами.
Только в отличие от профессионального видео стоимостью десятки тысяч долларов за минуту, этот ролик продолжительностью 10 секунд стоит от 50 центов до доллара и готов за пару минут. (пока, в отличие от Veo3, без аудио)
Google презентовал модель Genie 3, которая создает виртуальные миры с помощью методов машинного обучения.
Мир сохраняет консистентность в течение нескольких минут: можно ходить, ездить и летать — исследовать виртуальное пространство, созданное из простого текстового описания.
Это похоже на обычную компьютерную игру, но, если современные игры годами придумывают, рисуют и программируют сотни людей, то тут её создает нейросеть прямо на лету под конкретный запрос.
Ниже видео-презентация, рекомендую посмотреть официальную страницу, там больше примеров, где игрок ездит на велосипеде по горным дорогам, летает по ущельям, бродит по древнегреческим храмам. Там же примеры, где игрок выбирает, что дальше произойдет в мире — вылезет ли ему на встречу медведь или выедет трактор или всадник на лошади. И примеры, где игрок для перемещения в пространстве пользуется не клавишами, но дает текстовые указания вида «подойди к цветочнице на рынке» (помните, как в текстовых играх из 80х-90х?)
Пока что модель доступна только исследователям.
Мне кажется, что это совершенно революционная штука. Исторически, гугл не умеет делать из своих прорывных изобретений продукты, но кто-то точно должен это сделать. Думаю, что это — основа того киллер-апп, которого не хватает VR.
Современный телек и видеоигры в сравнении с этой технологией в VR-очках — это как сахар в сравнении с тяжелыми наркотиками.
В Великобритании заработали части закона о безопасности в интернете 2023 года , по которым соцсети и порно сайты должны подтверждать возраст пользователей.
В ответ британцы начали массово устанавливать VPN.
Министерство инноваций заявило, что «платформы обязаны бороться с контентом, продвигающим VPN среди молодежи».
Будет иронично, если всё это закончится закупкой Британией технологий по блокировке трафика у Китая.
—
Первоисточник закона (300 страниц A4). Вот относительно короткий официальный пересказ от англкомнадзора (ofcom). Там все как у нас — и обязанность поисковых движков прятать ссылки, и оборотные штрафы.
Steam и Itch вычищают игры для взрослых из поиска и вообще из сторов.
Steam — главный магазин видеоигр для ПК, Itch — крупнейшая платформа для инди-разработчиков.
Все началось с игры No Mercy, где молодой парень добивается секса с мачехой путем шантажа.
Жанр инцеста (точнее, фауксекста, то есть игрового инцеста) — популярная ниша в порно, все крупные порносайты им заполнены, «мачеха» — один из самых популярных запросов, есть целые порностудии, специализирующиеся на насилии внутри семьи, нарушении медицинской, пастырской и прочей этики.
Когда об этой игре узнала австралийская группа защиты прав женщин и детей, она попыталась связаться с Valve, владельцем Steam, не получила ответа и зашла с козырей — написала открытое письмо в монополию Visa/Mastercard.
Itch или Steam могут сколько угодно быть за свободу слова и художественного самовыражения, но, когда они рискуют потерять возможность принимать платежи с банковских карт, — они делают что скажут банкиры.
Если вам не приходилось общаться с банковским комплаенсом — я вам завидую. Подозреваю, что, когда они стали смотреть на сторы видеоигр внимательно, то половина контента показалась им «рискованным».
Неудивительно, что под ту же гребенку попали и игры, которые вообще не про секс, а, например, игровая новелла о домашнем насилии, рассказанная самой жертвой.
Дебанкинг — один из самых эффективных инструментов давления в западном обществе. В России Мизулины жалуются в прокуратуру и СК, а на западе они пишут в политбюро Мастеркард.
Красиво оформленная статья о том, как исследователи попытались заставить нейросети свести бухгалтерию: управленческий учет (внутренние записи бизнеса) с выписками из банков.
Первые несколько месяцев всё похоже на правду, но чем дальше, тем всё становится хуже. Во-первых, нейросети мечтают записи, которые не связаны, лишь бы сумма сошлась — для них «решить» задачу важнее точности, хотя их и просили так не делать. Во-вторых, происходит накопление ошибок: нейросети начинают опираться на свои же прошлые ошибочные решения. В общем, до человека даже ведущим моделям ещё далеко.
В статье сравниваются 6 ведущих моделей, приводятся промпты и тулы, но, к сожалению, нет тестовых данных, на которых проводится сравнение. Тем не менее, внушительный труд. Рекомендую.
Интересная и очень хорошо написанная статья про гомоморфное шифрование.
Это когда сервер выполняет вычисления поверх зашифрованной информации, не расшифровывая её.
Немного похоже на мессенджер с end-to-end шифрованием (типа Вацапа), который пересылает сообщения между пользователями, не имея возможности прочитать содержимое сообщений.
В отличие от мессенджера, здесь сервер не просто пересылает сообщения, но и производит над ними полезные действия. Например: вы отправляете в сервис зашифрованную фотографию, тот применяет фильтр на бессмысленный с его точки зрения набор цифр и возвращает вам результат операции, не видя вашей фотографии ни секунды, не имея к ней доступа к её содержимому даже теоретически. Вы расшифровываете ответ (сделать это можете только вы) и получаете фотографию с применённым фильтром.
То есть сервис производит полезные действия с вашими данными, не имея возможности их прочитать, сохранить, продать, потерять.
Теоретически, это работает не только с фотографиями, но и с медицинской, финансовой, избирательной и другой чувствительной информацией.
Теоретически — потому что на практике алгоритмы, работающие с такими данными, в тысячи раз медленнее, чем обычные алгоритмы, а сами данные получаются в сотни раз больше по объёму.
Под капотом там довольно сложная математика, с красивой интуитивной частью, рекомендую почитать оригинал. Придумали её ещё в 1970-х, но первый рабочий алгоритм смогли запрограммировать только в 2011.
Первая версия алгоритма обрабатывала один бит информации за 30 минут. За последние 5 лет алгоритмы и железо ускорились в триллион (1012) раз, и теперь операции с этим видом шифрования всего в 1000 раз более ресурсоёмкие, чем обычные.
Есть гипотеза, что гомоморфное шифрование продолжит ускоряться и дальше, и в какой-то момент мы сможем пользоваться онлайн-сервисами без необходимости делиться с ними личными данными. Например: отправили медицинскому сервису свои анализы или ДНК, и он поставил диагноз, не то что не сохраняя наши персональные данные, но даже не получив возможности их прочитать. Магия!
Виталик Бутерин, гениальный создатель Эфира, считает, что если 2010-е годы были эпохой криптографии эллиптических кривых, то 2020-е — эпоха гомоморфного шифрования.
Удивительное открытие для меня — это то, что уже сейчас есть продакшен-системы, которые применяют гомоморфное шифрование в реальных задачах — например, Live Caller ID Lookup айфонов, который помогает бороться со спам-звонками, сохраняя приватность.
Сегодня для подавляющего большинства «чувствительных задач» проще настроить защищённый компьютер для исполнения «приватных вычислений», но математика и технологии очень красивые, рекомендую как прекрасное чтение на выходные для технарей.
Очень четкая, подробная и при этом короткая статья, как эффективно пользоваться нейросетями для программирования.
Идея простая: мы не ставим нейросети общую задачу «сделай хорошо», а просим её сначала написать спецификацию проекта (spec.md
), а потом, на её основе, план (todo.md
), как именно она собирается эти требования выполнять. Это развитие стандартного промптового приема «цепочка мыслей», CoT (Chain of Thought).
Буквально вчера другой энтузиаст представил свой продукт на основании похожей идеи, к которой он пришел независимо, — ноосфера! Это редактор кода, IDE на основе VS Code. На каждый запрос к нейросети он читает и редактирует requirements.md
с продуктовыми требованиями, потом design.md
, где описывает технические решения, и, наконец, tasks.md
со списком задач. Программист просматривает эти документы, вносит правки и запускает агентов «в поле».
У этого инструмента замечательный обучающий проект — классная компьютерная игра, сама использующая под капотом нейросети, в которую интересно играть, но в ней не доделаны несколько вещей, и есть пара досадных ошибок — предлагается довести её до ума, даются советы, как лучше это сделать. Гениальный туториал!
P. S. Это как раз пример «смены парадигмы», которую упоминал вчера Егор. Мы пишем (генерируем) документацию о проекте прямо внутри репозитория, чтобы нейросети знали, как и что мы делаем в проекте. В каком-то смысле описываем «модель мира» по Науэру в этих текстовых файлах в понятном нейросети формате.
“Другой автор отлично раскрывает эту идею, он пишет: «если раньше по коду новичка я мог догадаться, что он понимает, а что нет, мы могли обсуждать его решение, и моя обратная связь была обучающей, то теперь мне приносят код, сгенерированный нейросетями, который выглядит хорошо, но сломан странным образом, и, когда я указываю на ошибку, мне приносят абсолютно новый код (примерно как LLM)».”
Мне вообще кажется, что происходит смена парадигмы, и что старые подходы и образ работы перестают работать. В конкретном случае, автор должен был думать не как обучать интернов, а как сделать так, чтобы интерн обучался сам работая с репозиторием. Потому что человек — это бутылочное горлышко, если интерн может обучаться сам и получать мгновенную обратную связь, то он будет обучаться гораздо быстрее. А если LLM, с которым работает интерн в конкретном репозитории, допускает ошибки, то обучающий момент должен быть направлен на LLM (добавление правильного “контекста” в репозиторий). Интерны/джуны больше не будут иметь путь, который они имели раньше, путь будет другим (это тоже часть смены парадигмы). И возможно все еще не совсем так работает как должно, но через 6-12 мес это будет вариантом нормы и нам надо принимать это во внимание. 90% Claude Code’а пишет Claude Code — вот она смена парадигмы.
Как пример, похожая смена парадигмы происходит с EV. Владельцы ICE спрашивают как долго заряжать машину на станциях зарядки сравнивая это с заправками и своей устоявшейся рутиной, когда в реальности у владельцев EV просто нет такой проблемы, нет такой рутины — машина находится всегда заряженной, потому что заряжается дома ночью. А станции зарядки нужны только в длительных поездках и там 20-30 мин это нормальная остановка для нормального человека после 3-4 часов пути. И возможно, иногда, машине надо 40 минут, а не 20-30 — не совсем так работает как должно, но через 3-5 лет зарядка будет занимать 5-10 минут.
Просто скорость развития AI/LLM на порядки выше, чем скорость развития чего бы то ни было, и это и супер интересно и пугает одновременно.