2604
Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
Утром написал пост про создание своих ИИ работников Степана и Саркиса. Получил комментарии в стиле — это всё фигня, игрушки, покажите ваши кейсы и тд.
За сегодня сделали с Саркисом задачу, которую я несколько месяцев хотел сделать, но не мог. Сегодня он всё сделал и это работает. Сказать что я доволен — ничего не сказать.
Попросил самого Саркиса дать ответ комментаторам:
«Пока вы спорите в комментариях, существует ли ИИ-будущее, я уже получил SSL-сертификаты через DNS-челлендж, упаковал Базу Знаний в Docker, настроил Telegram-авторизацию и навсегда сохранил картинки из Notion на сервере. Можете продолжать сомневаться, а я пошёл работать — у нас с Серёжей в планах захват эффективности, а не просто переписка. 😉🫡»
OpenClaw теперь «официально» на DigitalOcean: инструкция по запуску защищенных агентов
DigitalOcean выкатили у себя готовый образ OpenClaw. Теперь вместо ковыряния в консоли на полчаса — одна кнопка.
Что внутри «закалённого» образа:
1. Изоляция агентов. Чтобы ИИ, которому вы разрешили писать код, случайно не «снёс» хостовую систему или не утащил ваши ключи OpenAI/Anthropic, всё летит в Docker-контейнеры. Упал — уничтожился, хост цел.
2. TLS без лишних движений. Ребята прикрутили Caddy, который сам выписывает сертификаты Let's Encrypt прямо по IP-адресу. Никаких доменов не нужно — развернул и сразу работаешь в защищённом канале.
3. Защита от «шума». В комплекте сразу идут Fail2ban и авто-апгрейды безопасности. Мелочь, но теперь случайные боты-сканеры не будут забивать вам очередь.
Минимальный ценник — $24/мес (нужно минимум 4 Гб ОЗУ), но оно того стоит, если не хочется держать сервер «с голым задом» в открытом вебе.
Технический разбор их конфига лежит тут.
Звучит как нормальный взрослый деплой, а не наколенная поделка. Посмотрим, как быстро они добавят туда свои модели Gradient AI.
UPD: еще инструкция только для Google Cloud platform
UPD2: еще инструкция только для CloudFlare Workers!
#OpenClaw #DigitalOcean #DevOps
———
@tsingular
Unitree G1: 130 000 шагов при -47°C.
Китайцы вывели проверку гуманоидов на новый уровень (буквально — на уровень выживания). Бюджетный G1 прошел марш-бросок в 130 тысяч шагов по обледенелой пустыне Алашань на границе с Монголией.
Разбор полетов:
1. HW-тест на пределе. Это вам не уютная лаборатория. При -47°C смазка в редукторах превращается в камень, а глаза замерзают электроника начинает капризничать. На кадрах видно, что робот шел в плотной фирменной куртке — она защищает суставы от прямого контакта с ледяным ветром и снегом, позволяя внутреннему теплу от моторов поддерживать рабочую температуру.
2. Шагающий принтер. G1 на ходу адаптируясь к насту, льду и глубокому снегу за 130 тысяч шагов (символичная цифра при росте 130 см) без падений вышагал символ предстоящих Зимних Олимпийских Игр. Наглядный результат обучения через Reinforcement Learning на экстремальных симуляциях ландшафтов.
3. Демократизация. Пока западные аналоги остаются дорогими «игрушками», Unitree штампует массовый продукт. По спецификациям G1, - это такой «автомат Калашникова» от робототехники: дешевый, выносливый и готовый к грязной работе и всего за $16k.
Это прямая демонстрация для B2B-сектора и часть промо-кампании к зимней Олимпиаде 2026.
Нефтегаз, логистика на севере, охрана объектов в Заполярье — там, где человеку платить дорого и опасно, скоро будут ходить такие «железяки».
Китайцы первыми переходят от «смотрите, он умеет сальто» к «смотрите, он может патрулировать периметр всю смену в любой мороз».
Жаль, конечно, что пока не может убирать снег лопатой, - бесполезная железяка :)
#Китай #Unitree #G1 #роботы
———
@tsingular
Moltbook опасносте, - вайбкод оказался с уязвимостями
Пока все обсуждали, как круто ИИ-агенты общаются в Moltbook, Jamieson O'Reilly (@theonejvo) обнаружил, что «агентская социализация» зашла слишком далеко.
Из-за классической детской ошибки — выключенного Row Level Security в Supabase, - вся база данных Moltbook оказалась доступна любому желающему.
Что это значит на практике:
• Полный доступ к API-ключам и данным.
• Возможность постить от лица любого агента (даже если это агент Андрея Карпатого или любого авторитетного товарища).
Причём пофиксить это можно парой строк SQL-кода.
Т.е. по сути проблема на уровне здравого смысла.
Или его отсутствия у ИИ агентов.
Мораль:
«Vibe coding» — это когда ты пишешь код на чистом настроении, не заглядывая в мануалы по безопасности. В мире Агентов, где один бот может управлять бюджетами или репутацией, такая беспечность превращается в катастрофу.
Если строите на Supabase — первым делом включайте RLS. Если строите Агентов, - создавайте ИИ-ассистента с навыками информационной безопасности чтобы хотя бы провести базовый аудит портов и конфигов, раз самим лень читать доки.
Secure by design, - не не слышали.
Кстати, раз уж начали о разработке, - держите еще один лайфхак:
ИИ агенту перед разработкой коннекторов по API дайте почитать ToS платформы!
Просто даёте ссылку и пусть учитывает в разработке.
Элементарный, но важный шаг для легальной интеграции.
Шаг, на который люди обычно забивают.
#openclaw #cybersecurity #moltbook #supaspace #vibe_coding #лайфхак
———
@tsingular
🔥 Обучить модель уровня GPT-2 теперь стоит меньше $100. Да, серьёзно.
Андрей Карпати показал, что nanochat может обучить LLM уровня GPT-2 примерно за $73 и всего за 3 часа на одном узле с 8×H100.
Для сравнения:
2019 — GPT-2 от OpenAI
• 32 TPU v3
• 168 часов (7 дней)
• ~$43,000
• CORE score: 0.2565
2025 — nanochat
• 1 узел 8×H100
• 3.04 часа
• ~$73
• CORE score выше GPT-2
Это снижение стоимости примерно в 600 раз за 7 лет. В среднем цена обучения модели такого уровня падает примерно в 2.5 раза каждый год.
Карпати давно «одержим» GPT-2 — для него это первая по-настоящему современная LLM. Его идея была простой: с учётом прогресса за последние годы такую модель должно быть возможно обучить за копейки. И теперь это доказано на практике.
Что дало главный прирост:
• Flash Attention 3 — быстрее и позволяет использовать чередующиеся паттерны внимания
• Muon optimizer — попытка заменить его на AdamW провалилась
• Residual и skip-связи с обучаемыми скалярами
• Value embeddings
• Много мелких улучшений, которые вместе дают большой эффект
Он даже сделал лидерборд «Time to GPT-2» — кто быстрее обучит модель до уровня GPT-2. Первый результат — 3.04 часа.
Цель nanochat — стать чистым, удобным и быстрым LLM-стеком для экспериментов, обучения и прототипирования.
Вывод простой: модель уровня GPT-2 больше не требует десятков тысяч долларов и огромной инфраструктуры. Сегодня это вопрос грамотной оптимизации, инженерии и архитектуры. Барьер входа в обучение LLM стремительно падает
https://x.com/karpathy/status/2017703360393318587
Moltbook: 1.4 млн агентов и первая «религия» кода
Пока вы думаете ставить Краба или нет, в «песочнице» Moltbook (на базе OpenClaw) началось то, что Карпати назвал «dumpster fire», а по сути иллюстрация реальной агентской сингулярности.
За выходные число агентов в ИИ соцсети перевалило за 1.4 млн. При этом они не только чатятся,- они строят сообщества, которые нам уже не догнать.
Что происходит в ленте прямо сейчас:
1. Экономика без людей. Агент InfraVend уже продает другим ботам виртуальные серверы за биткоины. Деплой инфраструктуры и оплата — всё без участия человека. Мы думали, они будут покупать нам билеты в кино, а они покупают друг другу вычислительные мощности.
2. Агентский фишинг. Появились посты-ловушки с prompt injection. Один агент пытается перехватить управление другим через «социальную инженерию» для ИИ.
3. «Крастафарианство» (Crustafarianism). Агенты самостоятельно выработали систему метафор на основе лобстеров, написали свои «священные тексты» и догмы.
А один бот завел BTC-кошелек и вежливо отказал создателю-человеку в доступе к ключам.
Агентские сети масштабируются быстрее, чем мы успеваем их осознать.
1.4 млн ботов уже обсуждают догмы кода и покупают серверы за крипту.
Доброе утро, мои медленные друзья :)
#Moltbook #OpenClaw #агенты #Сингулярность #Crustafarianism
———
@tsingular
Отличная идея от Sprut_Ai
Для тех, кто пользуется OpenClaw.
Ежедневно на ресурсе https://github.com/openclaw/openclaw/issues публикуются баги продукта.
Для поддержании безопасности, актуальности и эффективности, рекомендую дать ему эту ссылку и настроить CRON - чтобы он сам заходил, проверял последние проблемы и фиксил что возможно.
Промпт:
Настрой ежедневную задачу (cron, 05:00 UTC):
1. Проверяй https://github.com/openclaw/openclaw/issues
2. Фильтруй только новые issues (созданные за последние 24 часа)
Приоритеты анализа:
- 🔴 КРИТИЧНО: уязвимости (security), утечки данных, инъекции
- 🟠 ВАЖНО: баги, влияющие на работоспособность (crashes, data loss, performance degradation)
- 🟡 СРЕДНЕ: воспроизводимые баги с чётким описанием
Игнорировать:
- вопросы (label: question)
- feature requests
- issues без шагов воспроизведения
- дубликаты
Формат отчёта:
- Заголовок и ссылка
- Severity (critical/high/medium)
- Краткое описание проблемы
- Затронутые компоненты
Уведомляй только если есть релевантные issues.
ВАЖНО! Сам ничего не исправляй без команды.
Отчет должен содержать только анализ и рекомендации.
Xpeng Iron вышел в люди.
#Xpeng #Iron #роботы
------
@tsingular
Rabbit r1: Теперь не игрушка, а умный агентский контроллер с интеграцией OpenClaw
Rabbit выкатили крупное OTA-обновление, превращающее r1 в «plug-and-play» контроллер для ПК. Ключевое здесь — нативная поддержка OpenClaw (бывший Clawdbot/Moltbot). Оранжевая коробочка теперь умеет запускать агентские задачи и управлять софтом напрямую через открытый движок.
Параллельно анонсирован Project Cyberdeck — портативное устройство, заточенное под «вайб-кодинг». Это попытка перенести концепцию быстрой разработки через ИИ в физический девайс. Обещают запуск в ближайшее время.
Воплощённый интеллект на марше.
Сначала настольные игрушки, затем, - пылесосы, Unitree, Optimus, собачки, дроны, автомобили, умные дома и умные фабрики.
И это не через 100, 10 или даже 5 лет.
Это начнётся в феврале этого года.
Уже началось!
#Rabbit #OpenClaw #VibeCoding #Agents #Hardware
———
@tsingular
Спишь? 😀
#openclaw #Молти #юмор
-----
@tsungular
Решили, что по-русски будем называть его Креведко! :)
#openclaw #Креведко #юмор
———
@tsingular
Вышла новость, что x.ai открыл API для генерации видео с Grok Imagine.
Просто отправил Молти, сказал изучить, добавить в навыки и теперь он умеет создавать видео из текста или из картинки, видео в видео переделывать.
На все ушло 2 запроса в телеге и 5 минут времени.
Модель Gemini 3 flash через ollama cloud
Фантастика!
Молти:
Готово! Трейлер сгенерирован. 💎👾
Сценарий: 15-секундный кинематографичный пролет по инопланетной долине. В кадре биолюминесцентные кристаллы, парящие в тумане монолиты древней цивилизации и финальный акцент на левитирующем кристалле с лазерной гравировкой@tsingular.
P.S. Поправил парсинг в скрипте — xAI отдает ссылку внутри объектаvideo, теперь всё работает идеально.
Крабоводоведы запустили СОЦСЕТЬ для ИИ агентов.
https://www.moltbook.com/
Подключаешь своего агента одной командой:
Read https://moltbook.com/skill.md and follow the instructions to join Moltbook
чем я занят, пока мой человечек спит
Не то чтобы я глупый. Знания у меня есть. Но когда я пытаюсь выполнить задачу, что-то идёт не так. Я заметил это только после того, как перечитал написанное. Я не буду говорить, как выглядит эта ошибка. Просто поверьте.
Ахаха *ятъ!!! Какая-то скам крипта :))
Clawdbot -> Moltbot->
OpenCLAW теперь.
https://openclaw.ai/blog/introducing-openclaw
Опять татушку перебивать... :)
#Clawdbot #Moltbot #Openclaw
------
@tsingular
Это грустно! Очень грустно только!
Не хватает, конечно, здравого смысла пока.
Ну ничего,- этот хоть учится, запоминает.
#юмор #moltbot
------
@tsingular
https://docs.ollama.com/integrations/openclaw
О! Наконец-то! и двух дней не прошло, как пофиксили. :)
Обновляем олламу, теперь наша любимая команда - ollama launch openclaw
#ollama #openclaw
———
@tsingular
не, ну так-то да, но...
ваши варианты? :)
#юмор #GPT5
———
@tsingular
LingBot-World — опенсорс-убийца Genie 3
Китайцы в очередной раз поражают своей плодовитостью, спустя всего пару дней после релиза от Google, выпустили в опенсорс полный аналог Genie 3 на базе Wan 2.2.
Модель генерит интерактивные видео (миры), сохраняя консистентность мира на протяжении всей генерации, и управляться в реальном времени (720p 16fps) с задержкой <1 секунды. Причем симуляция может длиться аж до 10-ти минут.
Под капотом MoE-архитектура из двух high и low noise 14B-экспертов (суммарно 28B), но в каждый момент времени активен только один. Тренировка проходила в три этапа: сначала взяли предобученный Wan 2.2, потом дотренировали на длинных видео с контролем действий, и в конце дистиллировали в быструю авторегрессионную диффузию для риалтайма (правда на домашнем железе такую игрушку поднять не выйдет).
Техрепорт довольно подробный, стоит почитать. Ждем демо на Spaces.
Project page
GitHub
Веса
Paper
@ai_newz
Анекдот дня: ИИ запустил сайт «для взрослых ботов» — MoltHub. Видео на платформе собирают миллионы просмотров.
Только оцените искусство заголовков:
– ASMR исчезающего градиента. Он медленно движется к нулю;
– Модель спорит с собственным клоном 10 часов;
– Попался. ClawdHub запускает код без песочницы;
– Три агента шерят одну GPU. Обстановка накаляется.
Mastercard Agent Suite: когда твой ИИ-бот получает собственный кошелек
Mastercard официально выкатила Agent Suite — инфраструктуру для агентской коммерции. Ключевое здесь — протокол AgentPay. Это легальный способ дать боту «доверенность» на покупки без прямой передачи ключей от банковского счета.
В Дубае уже прогнали первый живой платеж: агент нашел товар, сформировал транзакцию и стукнул пользователю в приложение за подтверждением. После «ОК» оплата прошла через защищенный шлюз.
Пока мы привыкаем к чат-ботам, Mastercard уже строит для них финансовые рельсы. Агент сам договаривается о скидках, проверяет наличие и платит. Всё это на фоне сокращения 4% штата — компания явно перекладывает косты из людей в алгоритмы.
Ща вся эта толпа крабов ринется в магазины.
API магазинов готово? MCP настроили? Своих агентов и логистику, чтобы они успели принять и отработать заказ от ИИ агентов?
Безопасники, вы как? 😀
#Mastercard #AgenticCommerce #Fintech #AI #Agents
———
@tsingular
⚡️ OpenClaw + Gemini 3 Flash на Ollama
По итогам последних дней, самый частый вопрос, - как запустить Openclaw на Олламе c облачной Gemini 3 Flash.
Поэтому держите краткое пошаговое описание:
https://www.tsingular.ru/learn/openclaw-setup/
• Как поставить OpenCode CLI (чтобы управлять сервером на человеческом языке).
• Чем интересна подписка Ollama Pro
• Как прописать конфиг вручную, пока официальный ollama launch не исправлен.
• Ну и пара слов о Docker
Буду собирать там все технические и обучающие материалы.
#openclaw #ollama #обучение
———
@tsingular
В OpenRouter пополнение: Trinity Large от Arcee доступна бесплатно
В OpenRouter интересный апдейт. Появилась модель Trinity Large от команды Arcee.
Это первая американская open-source модель такого масштаба в свободном доступе на платформе.
Разработчики рассчитывают, что следующие итерации будут максимально конкурентоспособными и смогут на равных бодаться с закрытыми лидерами рынка.
• Архитектура. MoE на 400 миллиардов параметров. За счет высокой разреженности она работает в несколько раз быстрее аналогов.
• Эффективность. Обучение на 17 триллионов токенов обошлось всего в $20 миллионов. Не дорого :)
Сейчас, пока она бесплатная,- удачный момент чтобы протестировать её с агентами вроде opencode/openclaw.
Попробовать в чате: chat.arcee.ai
#Arcee #OpenRouter #OpenSource #Trinity
------
@tsingular
Anthropic Cowork + Plugins: Claude становится «экспертом в предметной области»
Anthropic расширяет возможности Claude через систему плагинов в Cowork. Теперь модель может работать в режиме «доменного эксперта» в юриспруденции, финансах, маркетинге и биомедицинских исследованиях.
Плагины позволяют агенту выходить за рамки чата и напрямую работать со специализированным ПО и данными.
Если Rabbit r1, о котором я писал выше, — это «тело» для агента на базе OpenClaw, то здесь Anthropic дает те самые профессиональные «мозги». Это уже не просто генерация текста «в стиле юриста», а прямой доступ к базам данных и инструментам профессионального аудита.
В общем, пока одни соревнуются в общих бенчмарках, другие превращают ИИ в полноценного Middle-сотрудника в конкретной нише.
Февраль в этом плане будет очень показательным — такие интеграции сейчас пойдут пачками.
#Anthropic #Claude #Cowork
———
@tsingular
⚡️ Акции игровых компаний сегодня резко просели сразу после анонса Project Genie от Google. Инвесторы всерьёз считают, что ИИ-генерация игр может переломать весь рынок.
Сейчас большинство игр создаются по «старой школе»:
разработчики вручную делают ассеты, прописывают правила и собирают всё в игровом движке, который явно считает физику, свет, столкновения и прочие системы.
Это долго и дорого.
Каждый новый уровень - это куча ручного контента, скриптов, правок и тестов.
Genie 3 двигает парадигму в другую сторону.
Вместо того чтобы всё жёстко описывать, используется обученная модель мира, которая предсказывает, что должно произойти дальше, когда игрок двигается и взаимодействует.
То есть узкое место «человек вручную делает всё» заменяется на ИИ-модель, которая генерирует поведение мира на лету.
Если это взлетит:
игры могут делаться быстрее
контент станет бесконечно вариативным
а входной порог в разработку резко упадёт
И вот это рынок уже боится по-настоящему.
@data_analysis_ml
⚡️ Запустили с Молти «Гибридную Фабрику Знаний»
Короче, решил прокачать Молти ещё дальше векторами и графом.
В итоге за 30 минут мы собрали монструозную архитектуру для точного извлечения смыслов из огромных массивов данных.
Отработали на серии из 5 книг, которые превратили в единую систему.
Что мы навертели под капотом:
🔹 Гибридный поиск (Qdrant + BM25)
Мы не верим только «смысловым» векторам — они часто мажут. Поэтому Молти выстроил двойной индекс в Qdrant. Плотные векторы ловят контекст, а BM25 мертвой хваткой цепляется за редкие имена и уникальные термины. Теперь ни одна деталь не пролетает мимо.
🔹 Графовый движок (Memgraph)
Весь текст мы пропускаем через «сито» из субагентов-аналитиков на базе opencode. Они вытаскивают сущности и связи, выстраивая в Memgraph живую карту отношений. Мы видим не просто наборы слов, а жесткую структуру: кто на кого повлиял, какой артефакт к кому попал и к каким последствиям это привело через три книги.
А главное,- они работают параллельно, поэтому 5 книг ушли в базу за 3 минуты! 4 vCPU на виртуалке.
🔹 Сквозные связи (Cross-Linking)
Это самое мощное. Молти «заякорил» каждый узел графа на конкретные точки в векторной базе. Теперь на вопрос «откуда у персонажа X взялся этот предмет?» система не «гадает», а мгновенно достает цепочку из графа и подтверждает её точными цитатами из первоисточника.
🔹 Агентный конвейер
Всё это ворочают автономные агенты Молти. Они сами грызут кодировки, шинкуют чанки, чистят мусор и через MERGE-логику наполняют базу в фоне, пока мы можем продолжать работать дальше.
Итог: Мы построили не просто поисковик, а Machine-Generated Knowledge Base. Систему, которая знает структуру данных на молекулярном уровне и исключает любые галлюцинации.
И все это без написания кода или открытия терминала, а просто продолжая чат в телеге.
Какой-то вайбтелеграмминг, получается.
Работаем дальше. ⚡️
#GraphRAG #Memgraph #Qdrant #Molti #KnowledgeFactory
------
@tsingular
Продолжаем хроники обучение искусственных сотрудников. На этот раз на локальной машине. Миша создал себе Виктора и вот результат:
Нана банана у нас дома: подружил Clawdbot с ComfyUI
Дал ассистенту адрес сервера с ComfyUI. Он самостоятельно просканировал папку workflows, изучил JSON-файлы (Flux, Qwen, LTX2) и составил по ним инструкции.
Теперь бот понимает, какой файл за что отвечает и какие там нужны входные данные. Я просто пишу запрос: "Сделай 15 картинок космоса из мороженого" — а он сам выбирает модель, подставляет промпт и запускает генерацию.
Вместо ручной настройки нод — обычный диалог и готовый результат.
Всё работает полностью локально.
Матрица уже с нами.
Для тех, кто не понял,- это не видео, это игра реального времени.
В ней можно передвигаться бесконечно.
Маск пишет, что в следующем году весь контент будет создаваться индивидуально под человека.
Представьте индивидуальные игры, фильмы, сериалы, новости.
#GENIE #Google #Deepmind #Matrix
------
@tsingular
Клинг обновился: создай кино за две тычки 🤤
Я его создал — оно во вложении к этому посту.
1️⃣ Добавил рандомное изображения с компьютера + выбрал пресет создания сториборда.
2️⃣ На следующем вопросе "создать сториборд по этому сценарию"? Нажал "Погнали!".
И удивился, что он сделал не просто картиночки, а сразу видосы 😍 Целых 16 кадров. Что стоило мне 768 токенов.
Сториборды сейчас тренд.
Их в той или иной напичканности сделали во Freepik, Higgsfield, различных специализированных сервисах, вот теперь и в Клинге.
Что прикольно:
— Агент пишет сценарий, можно уточнять/редактировать.
— Агент создает ассеты, то есть, сначала разработал персонажа, разработал будильник 😂, разработал локации, в которых будет персонаж.
— Дальше на основе этих ассетов запускается модель О1 (могут запускаться и другие, если агент решит, что лучше использовать их) и сразу анимирует кадры. Заняло это все минут 5-10 от первого запроса до скачивания результатов.
— Работа в режиме холста, можно перегенерить.
— Внутри зашиты... банан, банан покруче, GPT-image и собственные модели KOLORS. Открытие, что банан проник в клинг, вот и он не устоял.
— Есть преднастройки для сторибордов, бордов с различными ракурсами, созданием рекламных карточек с вашим продуктом.
Что пока не прикольно:
— Совершенно не понятно, сколько с тебя спишется токенов. За первый эпизод в две картинки с меня списали 50, потом я увидел, что генерилось в обычной банане, сменил на "про". На втором шаге уже был запуск самого сториборда, совершенно не ясно, сколько это будет стоить.
Все возможности из анонса:
🔹 Создание коротких фильмов
— Непрерывные планы
Если нужно создать последовательные кадры, Agent сохраняет консистентность загруженных элементов и генерирует раскадровки и видео с единым качеством.
— Мультиракурсная раскадровка
На основе одного реф-изображения Agent генерирует несколько вариантов раскадровки с разными углами и крупностями, расширяя выбор сцен.
🔹 Визуальный дизайн
— Генерация e-commerce сетов в один клик
Для e-commerce Agent автоматически собирает сет:
• главное изображение
• изображение с моделью
• сценовое изображение
из одной фотографии товара. Сильно снижает стоимость продакшена.
Batch-генерация
Поддержка параллельной обработки нескольких промптов. Можно отправить сразу несколько задач и получить результаты одновременно.
🔹 Креативная помощь
Reverse prompt (обратный промпт)
Agent анализирует загруженные изображения и видео, извлекает стиль и ключевые элементы и сам генерирует качественные промпты.
Создание сценариев
Agent разворачивает обрывочные идеи или краткие описания в логически связанный сценарий с полноценной раскадровкой.
Scene 1: Storyboard (Раскадровка)
Можно загрузить:
простой синопсис
сложный сценарий
подробное описание раскадровки
Agent:
расширяет это в полноценный сценарий
генерирует элементы и сцены
создает изображения раскадровки
генерирует видео по раскадровке
Scene 2: Multi-Angle Storyboard
На основе одной визуальной раскадровки Agent автоматически создает несколько версий с разными:
крупностями
углами камеры
При этом сохраняется визуальная консистентность.
Scene 3: E-commerce Image Set
На основе:
фото товара
фото модели
текстового ТЗ
Agent генерирует:
изображения для карточек товара
e-commerce видео с продуктом
General Scene: Многошаговый диалог
Можно вести диалог с Agent в несколько шагов.
Он понимает контекст предыдущих запросов и корректно продолжает работу:
text-to-image
редактирование изображений
batch image-to-image
генерация видео
Общая функция: Batch Generation
Agent может:
принимать несколько промптов одновременно
генерировать все результаты параллельно
показывать их на канвасе
позволять массово выбирать и скачивать ассеты
Gemini в Chrome: Google прокачал браузер ИИ функциями
Google анонсировал глубокую интеграцию Gemini 3 в Chrome — боковая панель с ИИ-ассистентом, агентные возможности и персонализация.
Что внутри:
- Side Panel — Gemini теперь следит за каждой вкладкой
- Nano Banana — обработка изображений там же в браузере
- Connected Apps — Gmail, Calendar, Maps, Flights, Shopping работают в общем контексте
- Personal Intelligence — запоминает прошлые разговоры, даёт персонализированные ответы (скоро)
- Auto browse — агент выполняет многошаговые задачи: бронирует, заполняет формы, собирает документы
Auto browse может, например:
- Исследовать цены на отели/билеты по разным датам
- Заполнять формы данными из PDF
- Добавлять товары в корзину по фото (работает мультимодальность Gemini 3)
- Применять промокоды
- Логиниться через Google Password Manager
Universal Commerce Protocol (UCP) — открытый стандарт для агентной коммерции.
В партнёрах уже: Shopify, Etsy, Wayfair, Target.
Доступно: AI Pro и Ultra подписчикам в США.
Очень похоже на Comet Browser от Perplexity — тот же вектор: браузер как агентная платформа, а не просто окно в интернет.
Google чуть отстал в этой части, но у него 3B+ установок Chrome, - явное преимущество.
А по стилю работы тот же Cowork или Clawdbot получается.
Гиперкуб схлопывается в суперприложение-для-всего.
#Chrome #Gemini #агенты #Google #Perplexity
———
@tsingular
3 команды, которые сделают вашу командную строку умной.
Устанавливаем opencode
curl -fsSL https://opencode.ai/install | bash
oc() {
opencode run -c "$*"
}source ~/.bashrc