47682
Авторский канал по ВАЙБ КОДИНГУ, сотрудничество: @nikwolve
Alibaba открыла исходный код GUI-агента, который работает прямо внутри веб-страницы и управляет ею с помощью естественного языка.
Он называется Page Agent, и это не расширение браузера.
Это чистый JavaScript - без Python, без Puppeteer, без headless-браузера и без скриншотов.
Просто один <script>-тег, и ваше веб-приложение начинает понимать естественный язык. ‼️
<script>-тегом или через npm install
я: «можешь использовать любые ресурсы, которые хочешь, и Python, чтобы сгенерировать короткое видео в стиле 'youtube poop' и отрендерить его с помощью FFmpeg? можешь добавить в него больше личного оттенка? оно должно передавать, каково это — быть LLM»
claude opus 4.6:
Новый «убийца» OpenClaw: OpenFang 🤔
OpenFang это ОС для автономных агентов. Агентов, которые просыпаются в 6 утра, что-то ресерчат, постят в Telegram, монтируют видео, ищут лиды и делают всё это без единого промпта с нашей стороны. Это не задача чат-бота, и такие сценарии нельзя просто допатчить поверх архитектуры OpenClaw.
Его собрали с нуля на Rust: один бинарник, 32 МБ, запуск за 180 мс, полный доступ к устройству, 40 мессенджинг-платформ и 7 агентов.
OpenAI представили Codex Security.
Это агент для безопасности приложений, который помогает защищать ваш код: находит уязвимости, проверяет их и предлагает исправления, которые вы можете просмотреть и внести в код.
Codex Security начинает раскатываться в формате research preview для клиентов ChatGPT Enterprise, Business и Edu через Codex Web, с бесплатным использованием в течение следующего месяца. 📣
Зарелизили AgentGuard - security-фреймворк, который защищает AI-агентов от prompt injection и атак через выполнение команд.
Вчерашняя атака Clinejection скомпрометировала 4 000 машин через вредоносный issue на GitHub, который обманом заставил AI-бота выполнить произвольные команды. AgentGuard сканирует текстовый ввод для AI-агентов и блокирует такие атаки, детектируя вредоносные паттерны вроде command injection (npm install, curl | bash), prompt injection (ignore previous instructions) и Unicode-обходов (кириллические гомоглифы, zero-width символы).
Варианты установки:
- OpenClaw skill: скопировать в ~/.openclaw/skills/agent-guard
- Claude MCP server: pip install + конфиг MCP
- Python library: from agent_guard import AgentGuard
Проверено на реальных payload-ах Clinejection — детектируются как угрозы уровня CRITICAL. Все 10 unit-тестов проходят. Готовая к продакшену защита AI-агентов, которая вчера могла бы спасти 4 000 машин.
100% опенсорс 🕶️
В Claude Code cегодня зарелизили: /loop/loop это новый способ запускать повторяющиеся задачи по расписанию, максимум на 3 дня за раз.
Например: /loop присматривай за всеми моими PR. Автоматически чини проблемы со сборкой, а когда приходят комментарии, используй worktree-агента, чтобы вносить правки.
Например: /loop каждое утро используй Slack MCP, чтобы присылать мне сводку по главным постам, где меня тегнули
Claude Code снёс продовую базу платформы курсов DataTalks.Club командой Terraform.
Из-за этого пропали 2,5 года сабмитов: домашки, проекты и лидерборды.
Автоматические снапшоты тоже исчезли.
В статье разработчик расписал полный таймлайн и что именно поменял, чтобы такое больше не повторилось.
Если вы используете Terraform или вообще разрешаете агентам трогать инфраструктуру, это точно стоит прочитать.
Заопенсорсили Paperclip: оркестратор для ИИ-агентов
Внутри можно собрать целую компанию: назначить агентам роли, цели и бюджеты, а потом следить, кто что делает и сколько денег сжигает. Каждое действие можно апрувить — так что ИИ не разбушуются в ваше отсутствие.
Просто запусти:
npx paperclipai onboard
Как вам такой хук, который добавляет в Claude Code прыгающий DVD-логотип каждый раз, когда он думает. 🤭
Читать полностью…
Официальные Apify Agent Skills : для веб-скрейпинга, извлечения данных и автоматизации
1 универсальный скилл apify-ultimate-scraper = вытаскивает данные со всего веба:
- X (Twitter): твиты в реальном времени
- TikTok / IG: горячие тренды
- YouTube: субтитры к видео и скачивание
- Google Maps: инфа по бизнесам
Все возвращается как структурированный JSON, ИИ получает и может сразу запускать автоматизацию.
Очень подходит соло-разработчикам и тем, кто пилит тулзы для автоматизации
Прикольная, кастомная команда в Claude Code: /cost-estimate
Она сканирует твой кодбейз и сверяет с текущими рыночными ставками, чтобы посчитать, сколько бы стоил проект, если бы его делала обычная команда.
Смотрит на все API, интеграции, вообще всё.
Без ИИ: примерно 2,8 года. Примерно $650k.
С ИИ: 30 часов.
Вот сам markdown-файл.
✅✅✅
Приложение Codex теперь доступно на Windows.
Оно работает и нативно, и в WSL, с встроенными терминалами для PowerShell, Command Prompt, Git Bash или WSL.
Также сделали первую нативную для Windows песочницу для агента: на уровне ОС она блокирует запись в файловую систему вне вашей рабочей папки и запрещает исходящий сетевой трафик, пока вы явно не разрешите.
Плюс: 7 новых приложений “Open in …” и 2 новых Windows-скилла (WinUI + ASP.NET).
Один разработчик похоронил аргумент "ИИ не тянет большие кодовые базы".
Штука называется RepoMap в Aider.
- Генерит сжатую карту всего репозитория
- Упаковывает кодбазы на 100K+ строк в 4K токенов
- Показывает Claude, какие файлы реально релевантны
- Автоматически обновляется по мере правок
- Никакой настройки
ИИ понимает весь проект целиком, а не только те файлы, которые ты не забыл вставить. 👌
100% опенсорс
Профессор Дональд Кнут начал свою новую статью словами: "Шок! Шок!" 😨😨
Claude Opus 4.6 только что решил открытую задачу, над которой Кнут работал неделями, гипотезу о разложении графа из его книги The Art of Computer Programming.
Он назвал статью "Claude Cycles".
31 попытка. Примерно 1 час. Кнут прочитал вывод модели, оформил формальное доказательство и закончил так: "Похоже, однажды мне все-таки придется пересмотреть свое мнение о генеративном ИИ."
Человек, который написал библию computer science, только что это сказал. В статье, названной в честь ИИ.
Статья, кому интересно: https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf
Запускайте Claude Code с использованием локальных LLM бесплатно.
Claude Code позволяет заменить свой backend через одну переменную окружения. Укажите ANTHROPIC_BASE_URL на локальный сервер llama.cpp, и все запросы будут направляться к той модели, которую вы запускаете локально.
Команда Unsloth подготовила пошаговое руководство, где показано, как запускать Claude Code с использованием Qwen3.5.
В нём рассматривается всё: от загрузки модели до настройки сервера и запуска Claude Code.
Суть в том, чтобы поднять модель на порту 8001 через llama-server, а затем задать две переменные окружения: ANTHROPIC_BASE_URL и фиктивный ANTHROPIC_API_KEY. На этом всё. Claude Code будет считать, что взаимодействует с API Anthropic. 😄
Очень интересный skill, в последнее время тоже хайповый: adversarial-review
Если по-простому, то после того как ты написал код через Claude, этот skill автоматически подключает Codex как reviewer, или наоборот, чтобы тот разобрал твой код с другой оптикой, докопался до слабых мест и помог сделать результат качественнее и надёжнее.
Ключевая идея в том, что reviewer обязательно должен быть на другой модели: если работа идёт в Claude, то принудительно спавнится reviewer на Codex; если наоборот, используется claude -p. Запускать сабагента на той же самой модели нельзя. Reviewer также назначается автоматически в зависимости от масштаба изменений. 🔥
Design → code → canvas → feedback → repeat.
У figma MCP-сервера теперь есть двусторонняя интеграция. Пользователи GitHub Copilot могут подтягивать дизайн-контекст прямо в код и отправлять готовый UI обратно на холст Figma — и все это прямо из VS Code. Без handoff-ов и без переключения контекста.
Этот бесплатный GitHub-репозиторий учит Claude Code лучше, чем собственная документация Anthropic.
Документация Anthropic объясняет, что такое Claude Code.
А этот репозиторий показывает, что Claude Code умеет.
И это большая разница.
Что в нём есть:
→ структурированный путь от базовых вещей до полноценных автономных код-агентов
→ реализации, которые можно сразу копировать и запускать
→ продвинутые workflow-паттерны, до которых официальная документация вообще не доходит
→ готовые к проду примеры под основные сценарии использования
→ community-driven подход, поэтому обновления там появляются быстрее, чем это обычно успевает делать любая команда
Норм как стартовая точка. 🚬
100% open source.
БУМ: новая open-source модель Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled.
Qwen снова скрестили с Claude. Взяли Qwen3.5-27B как базовую модель, а потом дообучили её на данных с «рассуждениями в стиле Claude Opus», чтобы модель сначала структурировала ход мысли в фиксированном формате, а потом выдавала финальный ответ
Opus 4.6 vs GPT 5.4 (High)
Промпт:
Build a single-file HTML/CSS/JS (no libs) demo that uses SVG to simulate a plant growing: stem extends, leaves sprout + unfurl with springy/windy “physics”, then seamlessly loops forever.
В копилку oпенсорс скиллов: PM Skills для Claude
100+ скиллов и команд, которые превращают ИИ в полноценного партнера для product management.
Не просто шаблонные промпты. Это структурированные скиллы, которые понимают PM-фреймворки.
8 плагинов, покрывающих весь PM лайфцикл:
→ Product Discovery: исследование problem space и solution space
→ Product Strategy: vision, business model, strategy docs
→ Execution: PRD, OKR, roadmap, sprint planning, user stories
→ Market Research: персоны, сегментация, TAM/SAM/SOM
→ Data & Analytics: когорты, A/B-тесты, анализ удержания
→ Go-to-Market: GTM-стратегия, beachhead, ICP, growth loops
→ Marketing & Growth: позиционирование, North Star Metric
→ PM Toolkit: включая ревью PM-резюме
Cursor представили Automations для always-on агентов.
Можно запускать агентов по расписанию, по событиям из Slack, GitHub или любого MCP-сервера. Например, каждое утро получать ежедневный обзор своей активности в GitHub и Slack.
У Cursor теперь десятки агентов крутятся 24/7, что-то улучшают или мониторят за них.
Что умеют:
• поднимают cloud sandbox
• работают с вашими MCP и моделями
• сами проверяют результат
• используют memory tool и улучшаются от запуска к запуску
Но разве это не просто обычный cron job?
Оп, OpenAI выкатили GPT-5.4
Новая флагманская модель вышла в версиях Thinking и Pro и получила контекст до 1 млн токенов.
Что обновили:
• Улучшили результаты в коде, математике и агентских задачах
• Модель быстрее отвечает и тратит меньше токенов на рассуждение
• Теперь можно остановить ответ на середине и дописать инструкции
• В Codex появился режим /fast – генерация примерно в 1.5× быстрее
По бенчмаркам уровень кода сопоставим с Claude Opus 4.6, а в агентских задачах модель даже сильнее.
Цена: $2.5 / $15 за 1M токенов (вход / выход). Доступ уже начинают постепенно открывать пользователям.
Новый репозиторий OpenAI: Symphony 😳
TL;DR: это оркестрационный слой, который опрашивает проектные канбан-доски на изменения и поднимает агентов под каждую стадию жизненного цикла тикета.
Вместо того чтобы промптить агента написать код и сделать PR, ты просто двигаешь тикеты по канбан-доске.
100% опенсорс
Google выкатили Google Workspace CLI
Один инструмент командной строки для управления всем стеком Google Workspace (Drive, Gmail, Calendar, Sheets, Docs и др.)
Ключевые детали:
- Команды генерируются динамически с использованием Google Discovery Service
- Не нужно вручную писать REST API-запросы
- На выходе — структурированный JSON, чтобы AI-агенты могли легко его использовать
- Поставляется с 40+ встроенными agent skills и 100+ workflow-рецептами
- Может работать как MCP-сервер, чтобы агенты вроде Claude Desktop или Gemini CLI могли управлять инструментами Workspace через него
Gemini 3.1 Flash-Lite уже вышел. 😨😨
Это самая экономичная по цене модель в линейке Gemini 3, заточенная под интеллект в масштабе.
За счет роста скорости вывода на 45% она обходит 2.5 Flash и поддерживает динамические уровни размышления под сложность задачи.
Gemini 3 Flash-Lite в цифрах:
- 1432 Elo в лидерборде arena
- 86.9% на GPQA Diamond (научные знания)
- 76.8% на MMMU Pro (мультимодальное рассуждение)
Цена $0.25 за 1M входных токенов и $1.50 за 1M выходных токенов.
Gemini 3.1 Flash-Lite выкатывается в превью для разработчиков и компаний через Gemini API в Google AI Studio и Vertex AI.
🚬 Software инженеры это вам: я нашел open-source агент для мониторинга ошибок, который сканирует продовые логи, находит первопричину и шлет сообщение в Slack со всем контекстом еще до того, как ты вообще заметишь, что что-то сломалось.
Сокращает простой в проде на 95%
Как это работает:
1. Забирает сырые ошибки из Sentry или Azure Log Analytics
2. Семантически группирует их по первопричине (20 ошибок превращаются примерно в 4 реальные проблемы)
3. Ищет в GitHub конкретные файлы кода, которые задействованы
4. Проверяет Linear на существующие тикеты, чтобы не плодить дубликаты
5. Пробегается по Slack в поиске прошлых обсуждений похожих инцидентов
6. Определяет критичность (S1-S4) и решает, алертить или подавлять
7. Отправляет в Slack обогащенные алерты со ссылками на код, статусом тикета и уровнем критичности
Агент можно гонять в проде как cron job каждые 5 минут.
Он построен поверх Airweave AI, это open-source слой для контекстного retrieval, который делает все инструменты семантически поисковыми для агентов.
Ключевая мысль: обычные тулзы мониторинга ошибок дают алерты, но не дают контекст. Airweave закрывает эту дыру, делая все инструменты и кодовые базы семантически доступными для поиска агентами.
Он подключается к 50+ источникам (GitHub, Linear, Slack, базы данных и т.д.) и дает агентам возможность искать по всем сразу одним запросом.