47682
Авторский канал по ВАЙБ КОДИНГУ, сотрудничество: @nikwolve
/goal - сейчас лучшая команда в Codex, Claude Code и Hermes.
Но большинство используют её не так. Они пишут: «не допусти ошибок». И просто надеются.
Снизу показана структура промпта для реальной задачи: чтобы ранжировать неопределённости перед действием, убивать scope creep и закрывать все незакрытые циклы, которые обычно оставляют другие промпты./goal prompt [структура ниже]
GOAL:Читать полностью…
<один чёткий, измеримый результат; только одна задача>
CONTEXT:
<репозиторий / файлы / архитектура / текущее состояние>
<известные допущения, зависимости и релевантные предыдущие решения>
CONSTRAINTS:
<что нельзя изменять>
<обязательные стандарты / паттерны>
<запрещённые файлы / действия, если есть>
PRIORITY: (необязательно)
<наивысший приоритет>
<вторичный приоритет>
<третичный приоритет>
PLAN:
<сначала разобраться, потом действовать>
<перед нетривиальными изменениями пересказать своё понимание задачи>
<предпочитать минимально достаточные изменения вместо масштабных переписываний>
DONE WHEN:
<проверяемое состояние завершения>
<ожидаемое поведение сохранено или улучшено>
VERIFY:
<тесты / сборка / lint / typecheck / ручная валидация>
<указать, что не удалось проверить и почему>
<включить rollback-план или меры локализации для деструктивных либо high-risk изменений>
OUTPUT:
<краткое summary / документация / audit / результаты>
<изменённые файлы, ключевые решения, риски и дальнейшие шаги>
STOP RULES:
<останавливаться при неоднозначности или риске с высоким impact; не выдумывать архитектуру, поведение или требования>
<показывать неопределённости вместе с ранжированными вариантами с наибольшей уверенностью перед действием, а не задавать открытые уточняющие вопросы>
<не расширять scope после достижения цели>
Небольшой совет по OpenAI Codex:
Необязательно ограничиваться просмотром только одного трэда за раз.
Можно открыть сразу несколько полноценных окон параллельно и работать с несколькими задачами одновременно.
Команда /side позволяет форкнуть текущий диалог в отдельную ветку для временных уточнений или дополнительных вопросов, не засоряя основной контекст.
Также можно назначить хоткей для всплывающего окна Codex, чтобы быстро запускать новые задачи буквально в одно нажатие. 🫡
В Codex добавили импорт из Claude / Claude Code – можно в один клик перенести проекты, диалоги и продолжить работу с того же места
https://chatgpt.com/codex/switch-to-codex/
Как вам такое: Zenbu.js — фреймворк для хакерского/модифицируемого софта
Идея была в том, чтобы можно было редактировать используемые приложения прямо через код-агентов. Из этого вырос Zenbu.js
Zenbu.js позволяет собирать десктоп-приложения, которые пользователь может менять уже после установки. Это достигается за счёт:
- поставки приложения с исходным кодом
- встроенной системы плагинов для расширения логики
npx create-zenbu-app@latest
Слева - водяной знак, который GPT Image 2 встраивает в каждое сгенерированное изображение.
Справа - отпечаток SynthID, который Google встраивает в каждое изображение Nano Banana и Gemini.
Невидим для человеческого глаза. Добавляется во время генерации, а не постфактум. Спроектирован так, чтобы сохраняться после скриншотов, обрезки и сжатия.
Большинство юзеров не осознают, что их вывод помечается на уровне пикселей. Почти все крупные генераторы фоток маркируют контент, и эта метка сохраняется при любом дальнейшем распространении.
Это можно проверить самостоятельно. Content Credentials Verify обнаруживает C2PA-метаданные в изображениях OpenAI. Gemini определяет SynthID при прямой загрузке изображения.
btw: вот исследование, показывающее рабочий обход SynthID от Google на Nano Banana Pro
Думаю, для GPT скоро тоже сделают реверс-инжиниринг таких механизмов 😈
Сохраняем в коллекцию MCP-инструментов: CodexSaver
Он выносит низкорисковые задачи из Codex в DeepSeek, оставляя дорогим моделям только принятие решений. В тестах на пяти задачах средняя экономия составила 48%, задержка — около 6 секунд.
Microsoft выпустила waza — CLI-инструмент на Go для системной оценки качества Agent Skills.
Может быть полезен для повышения качества разработки агентов и построения бенчмарков.
исходники 🐀
Парень крашнул телевизор с помощью Claude Code
Понимая, что он работает на Linux, он попросил Claude подумать о типичных уязвимостях, которым могла бы быть подвержена обычная Linux-машина 2014 года, учитывая, что она доступна только из локальной сети.
Они протестировали несколько вариантов (например, Heartbleed) и в итоге нашли CVE-2012-5958 — баг в libupnp, C-библиотеке, которая есть почти в каждом Smart TV того времени.
Отправили один сетевой пакет с одним полем, где было на несколько байт больше, чем нужно, что привело к переполнению стекового буфера и падению телевизора.
Дальше пошла декомпиляция прошивки, попытка понять, что именно эти производители телевизоров могут видеть о пользователях через свои сомнительные рекламные программы.
Vizio в 2017 году был засужен FTC за тайное отслеживание всего, что смотрят люди, и продажу этих данных рекламодателям. 😕
Тимлид команды Google Gemini, Адди Османи собрал воркфлоу и стандарты разработки, накопленные старшими инженерами за много лет, в унифицированную библиотеку скиллов, позволяющую ИИ-агентам выполнять каждый этап написания кода по единым высоким стандартам.
Это можно рассматривать как снабжение ИИ операционным мануалом от опытных инженеров. 🤩
Самая вирусная функция Anthropic теперь с открытым исходным кодом.
Раньше возможности генерации интерфейсов у Anthropic существовали только внутри их продуктов.
CopilotKit выпустил Open Generative UI — реализацию артефактов Claude с открытым исходным кодом, которая работает в любом приложении.
Агент генерирует HTML и SVG во время выполнения, а CopilotKit передаёт результат по токенам в изолированный iframe внутри чат-интерфейса приложения.
Пользователь видит, как интерфейс собирается в реальном времени, а не после завершения ответа.
Песочница полностью изолирована: нет доступа к родительскому приложению, объектной модели документа и пользовательским данным. Даже при некорректной разметке или неожиданном JavaScript-коде утечек за пределы iframe не происходит.
Внутри система не выбирает из готовых компонентов. Каждый раз генерируется произвольная визуализация с нуля.
Выходные данные по умолчанию не ограничены, но поведение можно направлять через промпт-скрипты, которые задают правила визуальных форматов.
Например, такой слой инструкций может заставить агента формировать дашборд на Chart.js с корректными осями и адаптивной версткой или интерактивную 3D-модель с управлением вращением.
Видеодемонстрация показывает работу системы, а качество вывода формируется именно этим слоем инструкций.
Open Generative UI работает поверх AG-UI и совместим с LangGraph, CrewAI, Mastra, Google ADK, AWS Strands и другими системами.
Также поставляется отдельный сервер MCP (Model Context Protocol), который подключается к Claude Code, Cursor и другим MCP-совместимым клиентам.
Вся платформа построена поверх CopilotKit — фронтенд-фреймворка для агентов и генеративных интерфейсов с десятками тысяч звёзд на GitHub и SDK для React, Next.js, Angular и Vue.
Вот демка, можно потестить самому 😃
Коллекция сайтов с инструментами для DESIGN.md:
1. refero - база из 2000+ файлов DESIGN.md, расширенный конфиг-вывод, поддержка конфигурации под Tailwind версии 4, CSS-переменные и токены дизайна.
2. neuform - более сильная визуальная часть, удобнее для восприятия интерфейсов.
3. designmd - вставляешь URL — получаешь готовый DESIGN.md с токенами, типографикой и паттернами компонентов.
4. designmd supply - тоже самое. Принимается любой публичный домен
5. getdesign md - умеет принимать любой сайт и генерировать дизайн-спецификации и конфигурации.
6. design-md-chrome - расширение Chrome для быстрого использования прямо в браузере.
Я давно ждал новый агентский тулкит AWS, и наконец он вышел 🙉
Он даёт агентам ИИ инструменты, знания и guardrails для работы с сервисами AWS.
- 40+ скиллов
- 3 плагина агентов
- удалённый MCP-сервер, который агенты могут использовать, чтобы вызывать все 15 000+ API AWS, запускать скрипты, искать документацию, получать скиллы
https://github.com/aws/agent-toolkit-for-aws
Антропики заключили партнёрство с SpaceX, и теперь в их распоряжении весь дата-центр Colossus 1. Это 300 мегаватт или 220к видеокарт. 😎
Поэтому они повышают лимиты использования для Claude Code и Claude API.
Изменения уже вступили в силу:
1. Удвоили 5-часовые лимиты Claude Code для тарифов Pro, Max, Team и Enterprise с оплатой за пользователя
2. Убрали снижение лимитов в пиковые часы для Claude Code на тарифах Pro и Max
3. Существенно повысили лимиты по рейт-лимиту API для моделей Opus
Аналитики, для вас хорошие новости: OpenAI встроили ChatGPT прямо в Excel и Google Sheet
Теперь можно использовать GPT-5.5 для анализа неструктурированных данных, построения финансовых моделей, генерации формул, обновления таблиц и сборки трекера расходов. 🤭
Не так давно, представили агента, который автоматизировал команду постобучения в Hugging Face: ml-intern
Это реализация с открытым исходным кодом реального исследовательского цикла, которым ежедневно пользуются исследователи машинного обучения. Вы задаёте промпт, он изучает статьи, проходит по цепочкам цитирования, реализует идеи в изолированных средах с графическими ускорителями, итеративно дорабатывает и собирает модели с глубокой исследовательской базой под любой сценарий. Всё построено на экосистеме Hugging Face. 🤗
Он способен на нетривиальные вещи.
На днях, разрабы, вдохновившись nanochat от Andrej Karpathy, поставили ml-intern задачу обучить компактную модель со смесью экспертов со всеми архитектурными улучшениями DeepSeek v4. Для сквозной проверки он обучил модель со смесью экспертов на 100 млн параметров, пройдя как стадию предобучения, так и постобучения.
ml-intern автономно справился с рядом реальных задач на стыке исследований и инженерии:
> отладка переполнений при использовании гипер-соединений на малых масштабах
> выбор размерностей для уменьшения модели до ~100 млн параметров
> исправление имён параметров после применения компиляции графа вычислений в PyTorch для ускорения обучения
- вот сам код этой модели
- Base model: https://huggingface.co/cmpatino/nanowhale-100m-base
- Instruct Model: https://huggingface.co/cmpatino/nanowhale-100m
Как заставить Claude работать, пока задача не будет доведена до конца?
Claude Code помогает с этим несколькими способами, включая одну функцию, которую недавно зарелизили: /goal
Задаёте условие завершения — и Claude продолжает работать, пока оно не будет выполнено:
/goal all tests in test/auth pass and the lint step is clean
/loop, чтобы запускать Claude в цикле./schedule запускает Claude по расписанию.stop hook даёт программный контроль над тем, когда Claude разрешено завершить работу.auto mode, который можно включить через Shift + Tab в CLI или через селектор режимов в десктопной версии./goal
Читать полностью…
Новое в Claude Code: agent view – единый список всех ваших сессий
Теперь все активные агентские сессии видны на одном экране: что сейчас выполняется, что ждёт вашего ответа, а что уже завершено. На запрос агента можно ответить прямо из общего списка, без перехода в отдельную сессию.
Фича уже доступна на всех платных планах в формате research preview 👍
https://claude.com/blog/agent-view-in-claude-code
Превращаем агентов в дизайн-исследователей: Lazyweb
Собирает 250 тыс. экранов рабочих приложений, чтобы искать готовые паттерны и опираться на лучшие решения при создании интерфейсов.
Легко подключается к Claude, Codex или Cursor через MCP. Можно собирать референсы и вручную.
Доступен бесплатно и без лимитов. 😃
Безопасники, это для вас: Daybreak
Daybreak объединяет самые мощные модели OpenAI, Codex и партнёров по безопасности, чтобы ускорить процессы киберзащиты и обеспечить непрерывную защиту ПО.
- Находите и устраняйте уязвимости
- Разгружайте накопившийся бэклог безопасности
- Автоматизируйте обнаружение, валидацию и реагирование на угрозы
Исследователи нашли способ ускорить большие языковые модели в 8.5 раза? 🤓
Спекулятивное декодирование — довольно эффективный способ решить проблему узкого места одного токена в традиционном инференсе больших языковых моделей.
Сначала маленькая черновая модель генерирует несколько следующих токенов, затем большая модель проверяет их все сразу за один прямой проход.
Если токен на любой позиции оказывается неверным, сохраняется всё до него, после чего генерация продолжается с этой точки. Такой подход никогда не работает хуже обычного декодирования.
Но текущие черновые модели в спекулятивном декодировании всё ещё предсказывают токены по одному. Из-за этого сам этап черновой генерации становится узким местом, ограничивая ускорение в реальных сценариях примерно 2–3 разами.
DFlash — новая техника, которая заменяет авторегрессионную черновую модель на облегчённую блочную диффузионную модель, предсказывающую все токены параллельно за один проход.
Стоимость черновой генерации остаётся постоянной независимо от количества спекулятивно предсказываемых токенов.
Дополнительно черновая модель получает скрытые признаки из нескольких слоёв целевой модели, которые внедряются в каждый слой генерации черновика. Благодаря этому она делает заметно более точные предсказания по сравнению с моделью, работающей без такого контекста.
В демонстрации выше обычное декодирование работает со скоростью 48.5 токена в секунду. DFlash достигает 415 токенов в секунду на той же модели без какой-либо потери качества.
Техника уже интегрирована в vLLM, SGLang и Transformers, а модели для черновой генерации доступны на HuggingFace для Qwen3, Qwen3.5, Llama 3.1, Kimi-K2.5, gpt-oss и многих других моделей.
- репозиторий на GitHub
KV-кэширование — ещё одна обязательная техника для ускорения инференса больших языковых моделей. Вот об этом статья.
Дай любому ИИ-агенту полный контроль над файлами Office: OfficeCLI 🤩
Создан специально для ИИ-агентов. Позволяет работать с документами Word, Excel и PowerPoint без установки офисного пакета, прямо из терминала. Поддерживаются создание, чтение и изменение файлов, что удобно для автоматизации.
После установки , агенты по типу Claude Code и Cursor, могут обрабатывать офисные файлы автоматически.
Типовые сценарии:
- пакетное изменение Excel-файлов через скрипты
- генерация Word-документов
- обработка презентаций PPT
- автоматизация без ручного открытия файлов
Бесплатный, с открытым исходным кодом, один бинарный файл.
Появился новый подход для RAG, который:
- уменьшает размер корпуса данных в 40 раз;
- снижает количество токенов на запрос в 3 раза;
- повышает релевантность векторного поиска в 2.3 раза.
И всё это в open-source. Читать подробности 😈
Tencent выпустили полностью опенсорс модель перевода, которая, по заявлениям, превосходит Google Translate — и при этом запускается локально прямо на смартфоне. 🤩
Модель поддерживает:
- 33 языка;
- полностью офлайн-перевод;
- запуск прямо на устройстве без облака.
Размер модели всего около 440MB.
Для сжатия используется AngelSlim — внутренний тулкит Tencent для компрессии моделей. За счёт этого удалось сильно уменьшить размер и сохранить производительность.
Веса модели и GGUF-версии доступны на Hugging Face: Hy-MT1.5-1.8B-1.25bit
Также разработчики выложили Android-демо для тестирования локального перевода прямо на телефоне. Ссылка доступна на странице модели в Hugging Face.
🤨 Codex превратил браузер в свою основную рабочую среду.
OpenAI сегодня официально объявила, что Codex теперь нативно поддерживает расширения браузера Chrome, работая напрямую на macOS и Windows.
Получается, теперь он не только лучше управляет веб-страницами и приложениями, но и способен обрабатывать несколько вкладок параллельно в фоновом режиме, вообще не перехватывая управление окном браузера.
Это означает, что однотипные задачи в браузере, такие как: структурированная навигация по страницам, сложный ввод данных, проверки дашбордов, обновления в CRM и т.д. — Codex может выполнять самостоятельно: генерировать код, выполнять его и параллельно обрабатывать задачи в многопоточном режиме.
Расширение Chrome уже доступно для установки в приложении Codex (пока не поддерживается в ЕС и Великобритании, поддержка появится позже).
Как вам такое: унифицированная виртуальная файловая система для ИИ-агентов - Mirage
Разрабы переписали bash с нуля, чтобы cat, grep, head и пайпы работали поверх гетерогенных сервисов.
S3, Google Drive, Slack, Gmail, GitHub, Linear, Notion, Postgres, MongoDB, SSH и многое другое монтируются рядом как единая файловая система.
Bash-команды, которые уже знают ИИ-агенты, теперь работают с любыми форматами. cat, grep, head и wc умеют парсить .parquet, .csv, .json, .h5, даже .wav. Один пайп может связывать S3, Drive, GitHub, Slack и Linear с едиными Unix-семантиками на всём пути.
Workspace тоже версионируются. Можно делать снапшот, клон и откат всего окружения одним API-вызовом. Плюс двухслойный кэш для быстрых повторных чтений.
Можно встраивать в FastAPI, Express, браузерные приложения и агентные SDK.
исходники 🌟
Японский разработчик добился больших результатов для своего проекта, благодаря данному скиллу: Find Skills
Описываешь, что хочешь получить на выходе, и система автоматически подбирает лучшие скиллы из сотни доступных вариантов.
🙈🙈🙈
🔥 Три разных человека. Три разных проекта. Один и тот же подход.
— Юра взял «скучную» нишу с готовым спросом → сначала печальные $100/мес, через год уже ~$10K/мес
— Денис сделал Telegram-игру в одиночку на основе AI → ~ $1500 за 1,5 месяца после запуска
— Аня без кода запустила AI-бота для изучения английского → первые ~$200 уже в 1 месяц
Разные результаты. Разный масштаб. Но общие правила:
1. не придумывать «гениальную идею», а брать существующий спрос
2. делать простой MVP и быстро запускаться
3. докручивать монетизацию и продукт по факту использования
Ребята сделали всё без команды, без инвестиций, а самое главное — без ожидания «идеального момента». Да, не у всех получается сразу. И не у всех выходит на $10K. Но если системно идти по схеме выше — появляется первый доход с продукта, а дальше уже есть что масштабировать.
В комьюнити разбираем такие кейсы регулярно: @its_capitan. Что сработало, что нет, и почему.
Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqvJni4w
Появился curl.md — преобразование URL в Markdown для агентов. 👊
Добавляешь префикс curl.md/ к любому URL → получаешь Markdown, оптимизированный для агентных систем.
Что даёт:
- более плотный контекст
- меньше расход токенов
Пример:
npx curl.md developer.mozilla.org/docs/Web/API/Fetch_API/Using_Fetch
Конвертируем книги в скиллы для Claude
Появился book-to-skill — это скилл Claude Code, который автоматически извлекает данные из PDF или EPUB книг и генерирует структурированные файлы скиллов, включая резюме по главам, глоссарии и справочные таблицы по паттернам проектирования.
Основной скрипт extract.py поддерживает несколько тулов извлечения и автоматически выбирает оптимальный подход в зависимости от типа книги:
- для тех-книг используется Docling -- для сохранения таблиц и блоков кода;
- для книг с обычным текстом используется pdftotext для быстрого извлечения.
После генерации скилл вызывается через /skill-name, и Claude может напрямую отвечать на основе содержимого книги 🫡
Vercel представила deepsec — опенсорсный каркас для обеспечения безопасности при кодинге. 🦆
• упор на интерфейс командной строки
• масштабирование через песочницы
• подключаемые код агенты
• рассчитан на крупные репозитории
• можно использовать через AI Gateway или свою подписку
После нескольких месяцев успешного внутреннего использования они прогнали его на одних из самых крупных опенсорсных код базах.