2604
Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
Маск готовит конкурента Капибары тренируя модели в новом датацентре Colossus-2
- Imagine 2
- 2 модели по 1 Тб
- 2 по 1.5Тб
- 6Тб модель
- 10Тб модель
#Colossus #Grok #Musk
------
@tsingular
Новая соцсеть, товарищи, от Андрея Карпати, заходим, не стесняемся:
https://karpathytalk.com/user/mb-mal
:)
Фишка в том, что там авторизация только через GitHub
Соцсеть навайбкодил по-быстрому, пишут, а модерацию не навайбкодил, так что заходим на свой страх и риск.
интересно как быстро взломают.
#karpathytalk
------
@tsingular
Разработан мемристор, функционирующий при 700°C
Команда USC создала чип памяти, который выдерживает 700°C. Это в 3.5 раза больше, чем выдерживает обычная электроника (~200°C).
🔬 Что сделали: Мемристор из трёх слоёв — графен снизу, оксид гафния в середине, вольфрам сверху. Графен не даёт атомам вольфрама мигрировать при нагреве и замыкать устройство. Удержание данных >50 часов, >1 млрд циклов, 1.5V.
⚙️ Зачем это нужно: Электроника, которая работает при таких температурах, может пригодиться, например, для Венеры (470°C на поверхности, все зонды гибли), геотермальных скважин, ядерных реакторов, датчиков внутри турбин и двигателей.
🤔 Но есть вопросы:
• Плата не выдержит. Стеклотекстолит обугливается при 350°C, припой плавится при 220°C, пластиковый корпус чипа — при 250°C. Чип выжил, а всё вокруг — нет.
Т.е. нужны керамические подложки, бессвинцовая пайка высокотемпературными сплавами, герметичная металлокерамическая корпусировка.
• Логики нет. Память сама по себе бессмысленна — нужны высокотемпературные транзисторы рядом. SiC и GaN уже работают до 600°C, но интеграция памяти и логики в один модуль — отдельная задача.
• Пассивные компоненты. Конденсаторы, резисторы, дроссели тоже должны работать при 700°C. Сейчас таких серийно не выпускают.
• Масштабирование. Пока выпущен только лабораторный образец 1×1 мкм.
До серийного производства — годы.
#мемристор #USC #графен #железо #Science
───
@tsingular
World Labs обновил Marble: 3D-миры из одного фото получили масштаб и качество
Два обновления от компании Fei-Fei Li: Marble 1.1 теперь новый стандарт, а Marble 1.1-Plus научился автоматически расширять границы сгенерированных миров.
💡 Marble 1.1: Улучшено освещение и контраст, значительно подчищены визуальные артефакты.
Цена,- 1,500 кредитов за мир.
Старые модели (1.0 и 1.0 Draft) остаются доступны.
🏗 Marble 1.1-Plus: Новая модель для масштабных сцен. Раньше Marble генерировал мир в фиксированном объёме — для крупных окружений приходилось вручную двигать границы.
1.1-Plus делает это автоматически, разворачивая до 5 «динамических кубов» за один прогон.
Цена: 1,500 базовых + 300 за каждый дополнительный куб.
🔌 API: Обе модели доступны через API (marble-1.1, marble-1.1-plus). Дефолт пока остаётся marble-1.0, но скоро сменится на 1.1.
https://docs.worldlabs.ai/api/models
💰 Контекст: World Labs привлёк $1 млрд от NVIDIA, AMD и Autodesk в феврале 2026.
Коммерческий запуск Marble — ноябрь 2025, API — январь 2026.
💼 Зачем бизнесу: Генерация 3D-окружений из одного фото или текстового промпта — готовая основа для архитектурной визуализации, игровых прототипов и VR-контента. Переменная стоимость (pay-per-cube) позволяет контролировать бюджет при работе с масштабными сценами.
🔮 Будущее: Auto-expansion миров — шаг к бесшовным 3D-пространствам, где размер сцены определяется содержанием, а не техническим лимитом. Когда стоимость генерации куба упадёт ещё на порядок, различие между «3D-моделью» и «цифровым миром» исчезнет.
попробовать в веб:
https://marble.worldlabs.ai/
#WorldLabs #3D #Marble #генерация #FeiFeiLi
───
@tsingular
Unsloth упаковали 1.6 Тб glm-5.1 в 220 гигов на 2 бита
И теперь каждый :) у кого есть m3 ultra 256Gb например или 2х DGX Spark 128Gb, может запустить сверхразум дома!
Инструкция:
https://unsloth.ai/docs/models/glm-5.1
#unsloth #glm
------
@tsingular
OpenClaw 2026.4.7 — что нового
Главное
openclaw infer — единая точка входа для вывода моделей.
Текст, медиа, поиск, эмбеддинги — всё через одну команду. По сути, унифицированный интерфейс к любому подключённому провайдеру прямо из терминала.
Memory/Wiki — возвращение структурированной памяти.
Полноценный стек: утверждения с доказательствами, компилированные дайджесты, поиск с учётом свежести, обнаружение противоречий, панель устаревания записей.
Это уже не просто заметки, а база знаний с контролем качества.
Подключаемые стратегии сжатия контекста.
Раньше при переполнении контекста работала только встроенная суммаризация. Теперь — реестр провайдеров сжатия, подключаемых через плагины. Настраивается в agents.defaults.compaction.provider.
Контрольные точки сессий.
Оператор может инспектировать и восстановить состояние сессии до сжатия. Ветвление и откат прямо из панели управления.
Провайдеры
Gemma 4 — поддержка через Google с сохранением логики мышления
Arcee AI — новый провайдер с каталогом Trinity
Ollama — автоопределение способности обработки изображений через /api/show
Mistral Small 4 — поддержка reasoning_effort с маппингом уровней мышления
Безопасность
Серия жёстких фиксов:
Блокировка опасных переменных окружения (Java, Rust, Cargo, Git, Kubernetes, облачные ключи) при запуске инструментов на хосте
Проверка SHA-256 архивов плагинов из ClawHub — установка невозможна при несовпадении хеша
Валидация URL загрузки файлов в MS Teams против SSRF
Инвалидация WebSocket-сессий при ротации токенов
Пересопряжение узлов при попытке расширить набор разрешённых команд без подтверждения
Входящие вебхуки
Новый встроенный плагин: внешняя автоматизация может создавать и управлять потоками задач через эндпоинты с общим секретом. Мост между OpenClaw и любой CI/CD или внешней системой.
Память/сновидения
Редактированные стенограммы сессий теперь подаются в корпус сновидений с разбивкой по дням и контрольными точками курсора.
Агент учится не только из заметок, но и из собственных прошлых диалогов.
⚠️ У меня при обновлении OpenClaw сломалась сборка Telegram-плагина, из-за чего CLI искал отсутствующие внутренние файлы и не мог читать конфиг, пришлось допиливать Курсором GPT 5.4, восстанавливать недостающие wrapper-модули и затем прогнать openclaw doctor --fix.
И если давно не прогоняли openclaw configure, - имеет смысл пройти, потому что изменений много и конфиги плывут.
Обсуждаем тут:
/channel/clawledgechat
#openclaw #update
———
@tsingular
Уважаемый Павел @durov, поднимите лимиты на количество ботов.
У меня закончились свободные слоты :(
https://github.com/nousresearch/hermes-agent
Очень интересный новый конкурент openclaw
Рекомендую попробовать.
#hermes
------
@tsingular
ИИ отправляется в прошлое!
Ожидание: увидеть как терминаторы путешествуют во времени.
Реальность: КСИР угрожает отправить OpenAI в каменный век, разбомбив их дата-центр за $30 млрд в Эмиратах.
Так мы и выход новой модели от OpenAI можем не увидеть в ближайшее время
#OpenAI #IRGC
———
@tsingular
Project Glasswing: стресс-тест Mythos перед запуском
Anthropic выпустили Claude Mythos Preview, - модель настолько мощную, что её бояться выпускать в открытый доступ и сначала собрали коалицию тестирующих из ведущих компаний мира.
Бенчмарки (Mythos vs Opus 4.6):
- CyberGym: 83.1% vs 66.6%
- SWE-bench Verified: 93.9% vs 80.8%
- SWE-bench Pro: 77.8% vs 53.4%
- Terminal-Bench 2.0: 82.0% vs 65.4%
🛡 Альянс: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks. Доступ получили 40+ организаций критической инфраструктуры.
⚙️ Mythos Preview уже обнаружила:
- Нашла тысячи zero-day уязвимостей во всех основных ОС и браузерах
- 27-летняя уязвимость в OpenBSD — удалённый краш машины одним подключением
- 16-летний баг в FFmpeg — в строке кода, которую автотесты прогнали 5 млн раз, но так и не обнаружили, а она справилась
- Цепочка уязвимостей в Linux kernel — эскалация от юзера до полного контроля
Всё найдено автономно, без человеческого участия
💰 Инвестиции:
$100M кредитов выделяют на использование Mythos Preview для участников
$2.5M — Alpha-Omega и OpenSSF через Linux Foundation
$1.5M — Apache Software Foundation
40+ организаций получили доступ для сканирования open-source инфраструктуры
Ключевой посыл проекта: AI достиг уровня, где может превзойти большинство людей в поиске и эксплуатации уязвимостей. Вопрос не "если", а "когда" эти возможности станут доступны атакующим. Glasswing — попытка дать фору защитникам.
Модель не будет в открытом доступе. Планируют выпустить safeguards с будущим Claude Opus, а для security-специалистов — Cyber Verification Program.
Ценообразование после:
$25/$125 за млн input/output токенов.
Доступ через Claude API, Bedrock, Vertex AI, Microsoft Foundry.
🔮 Будущее: Через 90 дней Anthropic опубликует отчёт об устранённых уязвимостях и практические рекомендации: процессы disclosure, авто-патчинг, secure-by-design для регулируемых отраслей.
Вся надежда на китайцев, короче.
С такими ценами модель, считай, недоступна обывателю ещё пол года будет.
#кибербезопасность #Anthropic #Glasswing #Mythos #Капибара
───
@tsingular
PikaSkill: ИИ-аватары на видеозвонках
Pika Labs выпустили новый агентский навык для своей платформы и теперь любой ИИ агент может участвовать в Google Meet встречах как полноценный участник.
🎥 Что умеют:
— Присоединяются по приглашению (как обычный пользователь)
— Используют клонированный голос и аватар реального времени
— Помнят контекст всех прошлых разговоров
— Генерируют итоги встречи с пунктами задач
💰 Цена пока конская: $0.275/минуту (~$16.5/час). Для сравнения: аутсорс-оператор — ~$1/час.
Для запуска нужен ключ с https://www.pika.me/dev/
Можно, конечно, собрать подобное на оупенсорсе, но придётся потратиться на железо.
#агенты #видеозвонки #Pika #GoogleMeet
───
@tsingular
Митинг в ИТ-компании в 2026 году 🤣
@ai_machinelearning_big_data
Интересный вариант шкалы прогресса
#мысли #сингулярность
———
@tsingular
Ваш агент это ваш риск. Рисерчеры из Гугла нашли десятки разных атак, которые прямо сегодня работают.
- невидимые инструкции в коде страницы: человек не видит, агент читает
- команды спрятаны в пикселях картинки
- сервер определяет, что пришёл агент, и подменяет страницу
- авторитетный тон и эмоциональные формулировки ведут агента к нужному выводу
- несколько подложных документов — и агент считает их проверенным фактом
- агент запоминает опыт из заражённой сессии и тащит его дальше - 0.1% документов может изменить поведение RAG базы
- одно письмо заставило корпоративного агента слить весь контекст
- агент-суммаризатор пересылал пользователю инструкции по установке вируса как официальную рекомендацию
- поддельный финансовый отчёт — и десятки торговых агентов одновременно продают
- вредоносная нагрузка разбита по разным источникам, собирается только при объединении
Кто решает, как Америка применяет ИИ в войне?
События последних месяцев показал, что вопрос об Генеративном ИИ в военной сфере перестал быть теоретическим
Эксперты Stanford HAI разбирают конфликт Anthropic vs Пентагон и с разных сторон рассматривают кто вообще должен контролировать ИИ в обороне.
Ключевые мысли экспертов:
Термины "массовая слежка" и "полная автономность" плохо определены. В медицине "человек в контуре" — уже размытое понятие. ИИ теперь может делать работу тысяч аналитиков разведки — старые правила не рассчитаны на это.
Частные компании не должны диктовать оборонную политику. Жёсткие требования human-in-the-loop могут дать преимущество противникам, - например, при перехвате ядерной ракеты автономность критична.
Прецедент опасен тем, что военная доктрина не может опираться на: "А давайте спросим что по этому поводу думает Дарио".
Администрация Трампа фактически поставила Anthropic перед выбором "вымогательство или чёрный список". Студенты-стартаперы теперь задаются вопросом: если мой продукт не совпадёт с политикой правительства — его отберут?
Решения об ИИ должны приниматься всем обществом, а не только президентом или CEO ИИ компаний.
Отказ Anthropic — первое публичное подтверждение, что LLM могут использоваться для профилирования и слежки. Единственное, что сейчас стоит между нами и таким использованием — добровольный выбор компаний. Правительство уже закупает коммерческие данные граждан у брокеров, ICE использует это против протестующих.
Софт для разработки лекарств может создавать токсины. LLM сделали эти знания общедоступными. Нужны: скрининг на уровне компаний-синтезаторов ДНК, реестры покупателей реагентов, уровни секретности данных.
Ядерные инциденты 50-70х годов, - хороший пример для разработки регуляторики.
Скайнет не будет захватывать мир через войну, он захватит его через окно Овертона.
#AI #Defense #Anthropic #Пентагон #StanfordHAI #Регулирование
───
@tsingular
Ладно, это смешно: если заставить ИИ говорить как пещерный человек — он будет тратить до 75% меньше токенов.
Вместо вежливых «я с удовольствием помогу вам с задачей» и развернутых формулировок типа «Я запустил инструмент веб-поиска» — версия пещерного Claude использует тупо «инструмент работать». 🗿
Так, реддитор заявляет, что на одну задачу в 180 токенов стало уходить 45.
Брать на заметку 🗿
Архитектура высоконагруженных систем
Я не знаю что вы делали прошлым летом, а мне повезло участвовать в работе над 3-м изданием "Архитектуры высоконагруженных систем" Вадима Подольного.
С Вадимом знакомы уже давно, - очень сильный профессионал, - разработчик систем автоматизации и мониторинга работы гигантских систем масштаба сравнимого наверное с диспетчеризацией города (каких именно, - это он сам расскажет, если захочет)
Книга отражает многолетний опыт автора в области создания распределённых систем управления промышленными критическими информационными системами, где присутствуют сотни тысяч источников изменений данных и их потребителей, а сценарии управления зависят от характера и интенсивности этих изменений.
В третьем дополненном издании приводятся многочисленные примеры деталей архитектуры распределённых систем, применяемых в задачах разработки систем промышленной автоматизации, систем хранения данных, СУБД и элементов систем общего назначения.
Книга представляет собой подробное руководство по проектированию и созданию систем, способных эффективно справляться с большими нагрузками.
Рассматриваются аппаратная и программная архитектура, распределение данных, масштабирование и балансировка нагрузки как единая инженерная система.
Особое внимание уделено надежности, отказоустойчивости, кешированию и согласованности данных — ключевым аспектам критических систем.
Представлены современные архитектурные подходы и шаблоны, применимые в промышленной автоматизации, СУБД и высоконагруженных сервисах.
Vibe-Trading: HKUDS продолжают удивлять
Помните Nanobot и AI-Trader? Теперь та же команда выпустила Vibe-Trading — мультиагентную систему для трейдинга.
🤖 Что это: 29 готовых «торговых команд» ИИ-агентов. Каждый агент — эксперт в своей нише. Один смотрит теханализ, другой — макростатистику, третий — поток ордеров, четвёртый — опционы. Все вместе они debating room: быки vs медведи, риск-менеджер подписывает итоговое решение.
📊 Навыки: 64 специализированных финансовых скилла в 8 доменах:
• Теханализ (Ichimoku, Elliott Wave, SMC, гармонические паттерны)
• Квант-исследования (факторы, ML-стратегии, pair-trading)
• Фундаменталка (оценка, отчётность, кредитный анализ)
• Крипто (фандинг, ликвидации, токеномика, DeFi yield)
• Макро (глобальное размещение, секторная ротация)
• Деривативы (Black-Scholes, греки, хеджирование)
• Альт-дата (соцсети, сентимент, поведенческие финансы)
💼 Пресеты команд:
• investment_committee — быки/медведи спорят → риск-аудит → PM решает
• crypto_trading_desk — фандинг + ликвидации + потоки → риск-менеджер
• quant_strategy_desk — скрининг → факторы → бэктест → аудит
• technical_analysis_panel — 5 видов теханализа → консенсус
• risk_committee — просадки, хвостовые риски, режимы → подпись
🔧 Как работает:
1. Пишете натуральным языком: «Найди недооценённые акции с сильным потенциалом»
2. Агенты сами пишут код стратегии
3. Тянут данные с рынков (A-shares, HK/US, крипто)
4. Бэктестят на истории (15+ метрик, 4 оптимизатора)
5. Запускают в реальном времени или через API/MCP
😅 Ирония: Раньше был «вайбкодинг» — когда ИИ пишет код, а ты не понимаешь, что он делает. Теперь «вайбтрейдинг» — ИИ торгует, а ты не понимаешь, почему он купил именно это.
Прогресс налицо: от непонятного кода к непонятным убыткам.
⚠️ Вопросы:
• Доверие: Готовы ли вы доверить деньги ИИ, который «спорит сам с собой»?
• Регуляторика: Кто отвечает за убытки — вы или разработчик агентов?
• Чёрные лебеди: Как агенты реагируют на события, которых не было в бэктесте?
Все, всем пока, побежал богатеть! 😀😃🙂🙃
#VibeTrading #HKUDS #ИИтрейдинг #трейдинг #финтех
───
@tsingular
Прямой эфир Пленарной сессии Datafusion 2026
https://vkvideo.ru/video-214144682_456239274
Касперский Е.В.:
20k+ троянов в опенсорс-пакетах
Отравление обучающих данных — реальная угроза
95% обновлений Касперского уже 15 лет выпускаются с помощью ИИ
Физический ИИ снизит угрозы за счёт устранения человеческого фактора
Нужно проектировать системы, которые крайне сложно взломать
Ракова А.В.:
ИИ работает только если с естественным интеллектом всё ок
1.1 млн изображений/год обрабатывает ИИ
Набиуллина Э.С.:
Не перестараться с регулированием — снимать барьеры, а не зажимать
Страхи чрезмерны — будет структурный сдвиг как в промышленную революцию
Главный риск — отстать в мировой гонке
Костин А.Л.:
ИИ — основа технологического суверенитета, не мода
Регулирование направить на защиту персданных и ответственность
Всего две компании (включая Яндекс) тянут тему глобально — нужна поддержка
Григоренко Д.Ю.:
Главное — не мешать
У РФ есть свои LLM, мессенджеры, платформы, 1000+ ИИ-сервисов, сильные разработчики
Задача: убирать барьеры, а не создавать новые
Тигран Худавердян:
ИИ — экзоскелет для разработчика, не замена
Автотесты в Яндексе полностью пишет ИИ
Появился первый «сотрудник-ИИ» (аналитика)
Главный риск — пропустить технологическую революцию
#datafusion #конференции
———
@tsingular
ACE-Step 1.5 XL — open-source генератор музыки, который обогнал Suno
Если вы следите за генеративным ИИ в музыке, вот новость, которую стоит запомнить: ACE-Step выпустил версию 1.5 XL — и она обходит Suno v5 на общепринятых метриках качества.
ACE-Step 1.5 XL — это open-source модель с 4 миллиардами параметров (DiT-декодер), которая генерирует музыку локально, на вашем компьютере. Не в облаке, не по подписке — у вас на машине. MIT-лицензия, коммерчески безопасные данные для обучения.
Три варианта под разные задачи
- XL Base — универсальная модель: text-to-music, каверы, ремиксы, завершение треков. Лучший выбор для файн-тюнинга через LoRA
- XL SFT — максимальное качество звука с поддержкой CFG (Classifier-Free Guidance — метод управления стилем генерации)
- XL Turbo — самая быстрая: 8 шагов генерации, без CFG. Ранний релиз, но уже работает
Все три совместимы с языковыми моделями на 0.6B, 1.7B и 4B параметров.
Что по железу
Минимум — 12 ГБ видеопамяти (с INT8-квантизацией и offload), комфортно — от 20 ГБ. На A100 генерация целого трека занимает менее 2 секунд, на RTX 3090 — менее 10 секунд.
Так почему это важно?
Музыкальная генерация долго была территорией закрытых сервисов вроде Suno и Udio. ACE-Step показывает, что open-source догоняет — и по качеству, и по скорости. На бенчмарке SongEval модель набрала 4.79 против 4.72 у Suno v5, а по Style Alignment заняла первое место среди всех протестированных моделей.
Для тех, кто делает контент, подкасты, видео или просто экспериментирует со звуком — это реальная возможность генерировать музыку без подписок и ограничений. Плюс поддержка LoRA: обучите модель на нескольких треках — и получите генерацию в вашем стиле.
GitHub проекта · Демо на Hugging Face · acemusic.ai
pimenov.ai
Сегодня буду на Data Fusion в Ломоносове
Поищем полезное.
https://data-fusion.ru/
Если кто будет тут- маякуйте, пересечемся.
#конференции
------
@tsingular
glm 5.1 появилась в ollama cloud
срочно переключаемся, но qwen3.5:cloud не убираем, а оставляем в резерве, потому, что GLM - текстовая, у неё нет глазок.
#ollama #glm
———
@tsingular
зачем они в полнолуние полетели, да ещё и ночью?
ничего ж не видно!
летели бы днём. :)
#юмор
———
@tsingular
Тем временем Z.AI GLM-5.1 на тестах за 8 часов построила эмулятор рабочего стола Linux в Web с 50+ приложениями.
Пока Антропик будет тесты жевать с предрелизами по $125 за млн токенов, - китайцы 10 раз его обгонят
Если вдруг вздумаете брать подписку, напоминаю, что через реферралку на 10% дешевле:
https://z.ai/subscribe?ic=GHAFTZRSA1
#Китай #ZAI #GLM
———
@tsingular
⚡️ Z ai выпустила GLM-5.1.
Китайская лаборатория релизнула GLM-5.1 - флагманскую MoE-модель с 754B параметров нового поколения, ориентированную на агентную инженерию.
Фокус релиза - на кодинг и долгие агентные сессии.
🟡Тесты
🟢На SWE-Bench Pro модель берет 58,4, обходя Claude Opus 4.6 (57,3), GPT-5.4 (57,7) и Gemini 3.1 Pro (54,2).
🟢На Terminal-Bench 2.0 результат 63,5, а в связке с Claude Code - 66,5.
🟢В CyberGym GLM-5.1 выбивает 68,7 против 48,3 у предыдущей GLM-5
🟢В BrowseComp - 68,0 без внешнего менеджера контекста.
🟠На бенчмарках HLE, AIME 2026 и GPQA-Diamond модель держится на уровне конкурентов, но не лидирует: здесь впереди Gemini 3.1 Pro и GPT-5.4.
GLM-5.1 построена так, чтобы оставаться продуктивной на длинной дистанции: декомпозировать задачу, запускать эксперименты, читать результаты, находить блокеры и пересматривать стратегию.
Z ai утверждает, что модель устойчиво оптимизирует решение на протяжении сотен итераций и тысяч вызовов инструментов, то есть результат тем заметнее, чем дольше она запускают.
API доступен на платформе Z ai, веб-версия на chat.z.ai обещана в ближайшие дни. Веса опубликованы на Hugging Face под лицензией MIT.
Для локального развертывания уже готовы сборки под SGLang 0.5.10+, vLLM 0.19.0+, xLLM, KTransformers и свежую ветку Transformers.
Skywork выкатили Matrix-Game 3.0 - и это уже почти живая игровая вселенная, генерируемая ИИ
720p в реальном времени при 40 FPS
5B модель с INT8-квантизацией - работает удивительно быстро
Главный фокус - стабильность во времени:
модель запоминает прошлые кадры и “достраивает” будущее без развалов сцены
Есть и более мощная версия - 28B MoE, которая лучше держит физику и динамику
Как обучали:
Unreal Engine + AAA-игры + реальные видео
Внутри не просто видео, а связка:
Video + Pose + Action + Prompt
за счёт этого можно генерировать длинные, осмысленные сцены
Это зачатки полноценного AI-геймдвижка
Ссылка на модель: https://modelscope.ai/models/Skywork/Matrix-Game-3.0
💵 Tool calling для GigaChat 3.1 в open-source инструментах
Вместе с релизом GigaChat 3.1 Ultra и Lightning мы добавили поддержку tool calling в основные опенсорсные инференс-движки:
— vLLM (>=0.18.2rc0)
— SGLang (>=0.5.9)
— llama.cpp (>=b8457)
Для vLLM и SGLang достаточно поднять сервер с --tool-call-parser gigachat3 — после этого работает стандартный /v1/chat/completions с описанием tools. В llama.cpp tool calling поддерживается нативно, без дополнительных аргументов.
vLLM
vllm serve ai-sage/GigaChat3.1-10B-A1.8B \
--port 8000 --dtype auto \
--enable-auto-tool-choice \
--tool-call-parser gigachat3
python -m sglang.launch_server \
--model-path ai-sage/GigaChat3.1-10B-A1.8B \
--host 0.0.0.0 --port 8000 --dtype auto \
--tool-call-parser gigachat3
tools в стандартный /v1/chat/completions.
Марк Андриссен, основатель a16z и один из самых влиятельных людей долины:
Я заявляю: AGI уже существует – просто он еще не равномерно распределен.
OpenClaw 2026.4.5, - стратегическое обновление
Вышел масштабный релиз Краба.
Попробуем разобраться куда движется проект.
1. Мультимедийная генерация
Добавлены инструменты video_generate и music_generate прямо в агента. Провайдеры: xAI (Grok), Runway, Alibaba Wan для видео; Google Lyria, MiniMax, ComfyUI для музыки. Асинхронная очередь задач с доставкой результата в диалог.
Что это значит: агент сам генерирует видео, музыку, изображения и отправляет результат в любой канал — Telegram, Discord, Slack.
2. Провайдеронезависимость
Добавлены Qwen, Fireworks AI, StepFun, MiniMax, Amazon Bedrock Mantle. Для Bedrock — автообнаружение профилей и подстановка региона. Прямая совместимость с GPT-5.4-mini и Codex.
Кэширование промптов унифицировано через все транспорты: детерминированный порядок инструментов, нормализация отпечатков системных промптов, диагностика попаданий в кэш через --verbose.
Получается OpenClaw строит единый слой маршрутизации между любыми поставщиками моделей.
Общий конфиг с любой моделью и оптимизацией кэширования.
3. Долгосрочная память через "сновидения"
Система «сновидений» с тремя фазами: лёгкий сон, глубокий сон, фаза быстрого сна. Каждая — с независимым расписанием.
Что делает:
- Перемещает краткосрочные заметки в долговременную память
- Выявляет устойчивые закономерности на фазе быстрого сна
- Настраиваемое затухание: полупериод давности, максимальный возраст записей
- Повторные прогоны не дублируют, а согласовывают записи
Это уже не поиск по md, а модель забывания и обобщения, ближе к биологической памяти человека.
Плюс эмбеддинги через Amazon Bedrock (Titan, Cohere, Nova) для семантического поиска.
4. Многоканальность — уровень операционной системы
Каналы: Telegram, Discord, Slack, WhatsApp, Matrix, MS Teams, Mattermost, Feishu, Synology Chat, мобильные приложения.
Новое:
- Подтверждение действий агента через Matrix и push-уведомления на iOS
- Настройка видимости контекста отдельно для каждого канала (весь контекст, список разрешённых, только цитаты)
- Локализация панели управления на 12+ языков
5. Экосистема плагинов — ClawHub
- Поиск, просмотр и установка плагинов прямо из панели управления
- Встроенные подсказки конфигурации при первой установке
- Среда выполнения ACPX встроена в плагин напрямую, убран промежуточный шаг через внешний инструмент
- Хуки перехвата ответов — плагины управляют доставкой без жёстких привязок в ядре
Формируется магазин расширений для агентов.
6. Безопасность — подготовка к корпоративному деплою
Десятки исправлений:
- Очистка унаследованных переменных окружения при запуске Claude CLI (конфигурация, маршрутизация провайдеров, токены)
- Ограничение области действия токенов при сопряжении устройств
- Защита от перенаправлений при обращении к внутренним адресам
- Блокировка обхода через символьные ссылки в маркетплейсе плагинов
- Сериализация попыток авторизации для предотвращения превышения лимитов
#openclaw #update
———
@tsingular
Анекдот дня
Microsoft и многие другие компании в условиях сервиса ИИ Copilot пишут, что использовать его можно только в развлекательных целях.
«Copilot предназначен исключительно для развлекательных целей. Он может допускать ошибки и работать не так, как задумано, — говорится в документе. — Не полагайтесь на Copilot при принятии важных решений. Используйте Copilot на собственный риск».
норм перестраховались, конечно, но выглядит забавно :)
#Microsoft #Copilot #disclaimer
———
@tsingular
🚀 Бесплатно запускаем Gemma 4 на телефоне без интернета.
Google выкатили AI Edge Gallery для iOS и Android. Это официальный клиент, где модели работают локально на устройстве.
Что внутри чат с моделью, разбор изображений, офлайн-транскрипция аудио и простой агент с инструментами
Никаких облаков всё считается прямо на телефоне
По моделям E4B - мощнее, но требует около 8 ГБ RAM E2B - легче и быстрее, запускается даже с ~1.5 ГБ памяти
Фактически это карманный ИИ без зависимости от сети и API
На видео запускается Google Gemma 4 E2B на iPhone 17 Pro.
Около ~40 токенов в секунду с MLX, оптимизированным под Apple Silicon.
Модель показала топовый уровень в коде и математике прямо на смартфоне с контекстом 128K.
Полностью офлайн, с режимом рассуждения.
https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/