Telegram-канал tsingular - Технозаметки Малышева: Unsorted - каталог телеграмм

tsingular | Unsorted

Subscribe to a channel

Telegram-канал tsingular - Технозаметки Малышева

2604

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Subscribe to a channel

Технозаметки Малышева

08 April 2026 21:36

Маск готовит конкурента Капибары тренируя модели в новом датацентре Colossus-2

- Imagine 2
- 2 модели по 1 Тб
- 2 по 1.5Тб
- 6Тб модель
- 10Тб модель

#Colossus #Grok #Musk
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 18:02

Новая соцсеть, товарищи, от Андрея Карпати, заходим, не стесняемся:
https://karpathytalk.com/user/mb-mal

:)
Фишка в том, что там авторизация только через GitHub

Соцсеть навайбкодил по-быстрому, пишут, а модерацию не навайбкодил, так что заходим на свой страх и риск.
интересно как быстро взломают.

#karpathytalk
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 17:26

Разработан мемристор, функционирующий при 700°C

Команда USC создала чип памяти, который выдерживает 700°C. Это в 3.5 раза больше, чем выдерживает обычная электроника (~200°C).

🔬 Что сделали: Мемристор из трёх слоёв — графен снизу, оксид гафния в середине, вольфрам сверху. Графен не даёт атомам вольфрама мигрировать при нагреве и замыкать устройство. Удержание данных >50 часов, >1 млрд циклов, 1.5V.

⚙️ Зачем это нужно: Электроника, которая работает при таких температурах, может пригодиться, например, для Венеры (470°C на поверхности, все зонды гибли), геотермальных скважин, ядерных реакторов, датчиков внутри турбин и двигателей.

🤔 Но есть вопросы:

• Плата не выдержит. Стеклотекстолит обугливается при 350°C, припой плавится при 220°C, пластиковый корпус чипа — при 250°C. Чип выжил, а всё вокруг — нет.
Т.е. нужны керамические подложки, бессвинцовая пайка высокотемпературными сплавами, герметичная металлокерамическая корпусировка.
• Логики нет. Память сама по себе бессмысленна — нужны высокотемпературные транзисторы рядом. SiC и GaN уже работают до 600°C, но интеграция памяти и логики в один модуль — отдельная задача.
• Пассивные компоненты. Конденсаторы, резисторы, дроссели тоже должны работать при 700°C. Сейчас таких серийно не выпускают.
• Масштабирование. Пока выпущен только лабораторный образец 1×1 мкм.
До серийного производства — годы.

#мемристор #USC #графен #железо #Science
───
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 09:55

World Labs обновил Marble: 3D-миры из одного фото получили масштаб и качество

Два обновления от компании Fei-Fei Li: Marble 1.1 теперь новый стандарт, а Marble 1.1-Plus научился автоматически расширять границы сгенерированных миров.

💡 Marble 1.1: Улучшено освещение и контраст, значительно подчищены визуальные артефакты.
Цена,- 1,500 кредитов за мир.
Старые модели (1.0 и 1.0 Draft) остаются доступны.

🏗 Marble 1.1-Plus: Новая модель для масштабных сцен. Раньше Marble генерировал мир в фиксированном объёме — для крупных окружений приходилось вручную двигать границы.
1.1-Plus делает это автоматически, разворачивая до 5 «динамических кубов» за один прогон.
Цена: 1,500 базовых + 300 за каждый дополнительный куб.

🔌 API: Обе модели доступны через API (marble-1.1, marble-1.1-plus). Дефолт пока остаётся marble-1.0, но скоро сменится на 1.1.
https://docs.worldlabs.ai/api/models

💰 Контекст: World Labs привлёк $1 млрд от NVIDIA, AMD и Autodesk в феврале 2026.
Коммерческий запуск Marble — ноябрь 2025, API — январь 2026.

💼 Зачем бизнесу: Генерация 3D-окружений из одного фото или текстового промпта — готовая основа для архитектурной визуализации, игровых прототипов и VR-контента. Переменная стоимость (pay-per-cube) позволяет контролировать бюджет при работе с масштабными сценами.

🔮 Будущее: Auto-expansion миров — шаг к бесшовным 3D-пространствам, где размер сцены определяется содержанием, а не техническим лимитом. Когда стоимость генерации куба упадёт ещё на порядок, различие между «3D-моделью» и «цифровым миром» исчезнет.

попробовать в веб:
https://marble.worldlabs.ai/

#WorldLabs #3D #Marble #генерация #FeiFeiLi
───
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 07:40

Unsloth упаковали 1.6 Тб glm-5.1 в 220 гигов на 2 бита
И теперь каждый :) у кого есть m3 ultra 256Gb например или 2х DGX Spark 128Gb, может запустить сверхразум дома!

Инструкция:
https://unsloth.ai/docs/models/glm-5.1

#unsloth #glm
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 05:57

OpenClaw 2026.4.7 — что нового

Главное

openclaw infer — единая точка входа для вывода моделей.
Текст, медиа, поиск, эмбеддинги — всё через одну команду. По сути, унифицированный интерфейс к любому подключённому провайдеру прямо из терминала.

Memory/Wiki — возвращение структурированной памяти.
Полноценный стек: утверждения с доказательствами, компилированные дайджесты, поиск с учётом свежести, обнаружение противоречий, панель устаревания записей.
Это уже не просто заметки, а база знаний с контролем качества.

Подключаемые стратегии сжатия контекста.
Раньше при переполнении контекста работала только встроенная суммаризация. Теперь — реестр провайдеров сжатия, подключаемых через плагины. Настраивается в agents.defaults.compaction.provider.

Контрольные точки сессий.
Оператор может инспектировать и восстановить состояние сессии до сжатия. Ветвление и откат прямо из панели управления.

Провайдеры

Gemma 4 — поддержка через Google с сохранением логики мышления
Arcee AI — новый провайдер с каталогом Trinity
Ollama — автоопределение способности обработки изображений через /api/show
Mistral Small 4 — поддержка reasoning_effort с маппингом уровней мышления

Безопасность
Серия жёстких фиксов:

Блокировка опасных переменных окружения (Java, Rust, Cargo, Git, Kubernetes, облачные ключи) при запуске инструментов на хосте

Проверка SHA-256 архивов плагинов из ClawHub — установка невозможна при несовпадении хеша

Валидация URL загрузки файлов в MS Teams против SSRF
Инвалидация WebSocket-сессий при ротации токенов

Пересопряжение узлов при попытке расширить набор разрешённых команд без подтверждения

Входящие вебхуки
Новый встроенный плагин: внешняя автоматизация может создавать и управлять потоками задач через эндпоинты с общим секретом. Мост между OpenClaw и любой CI/CD или внешней системой.

Память/сновидения
Редактированные стенограммы сессий теперь подаются в корпус сновидений с разбивкой по дням и контрольными точками курсора.
Агент учится не только из заметок, но и из собственных прошлых диалогов.

⚠️ У меня при обновлении OpenClaw сломалась сборка Telegram-плагина, из-за чего CLI искал отсутствующие внутренние файлы и не мог читать конфиг, пришлось допиливать Курсором GPT 5.4, восстанавливать недостающие wrapper-модули и затем прогнать openclaw doctor --fix.

И если давно не прогоняли openclaw configure, - имеет смысл пройти, потому что изменений много и конфиги плывут.

Обсуждаем тут:
/channel/clawledgechat

#openclaw #update
———
@tsingular

Читать полностью…

Технозаметки Малышева

07 April 2026 23:01

Уважаемый Павел @durov, поднимите лимиты на количество ботов.
У меня закончились свободные слоты :(

https://github.com/nousresearch/hermes-agent

Очень интересный новый конкурент openclaw

Рекомендую попробовать.

#hermes
------
@tsingular

Читать полностью…

Технозаметки Малышева

07 April 2026 21:25

ИИ отправляется в прошлое!

Ожидание: увидеть как терминаторы путешествуют во времени.

Реальность: КСИР угрожает отправить OpenAI в каменный век, разбомбив их дата-центр за $30 млрд в Эмиратах.

Так мы и выход новой модели от OpenAI можем не увидеть в ближайшее время

#OpenAI #IRGC
———
@tsingular

Читать полностью…

Технозаметки Малышева

07 April 2026 21:02

Project Glasswing: стресс-тест Mythos перед запуском

Anthropic выпустили Claude Mythos Preview, - модель настолько мощную, что её бояться выпускать в открытый доступ и сначала собрали коалицию тестирующих из ведущих компаний мира.

Бенчмарки (Mythos vs Opus 4.6):
- CyberGym: 83.1% vs 66.6%
- SWE-bench Verified: 93.9% vs 80.8%
- SWE-bench Pro: 77.8% vs 53.4%
- Terminal-Bench 2.0: 82.0% vs 65.4%

🛡 Альянс: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks. Доступ получили 40+ организаций критической инфраструктуры.

⚙️ Mythos Preview уже обнаружила:
- Нашла тысячи zero-day уязвимостей во всех основных ОС и браузерах
- 27-летняя уязвимость в OpenBSD — удалённый краш машины одним подключением
- 16-летний баг в FFmpeg — в строке кода, которую автотесты прогнали 5 млн раз, но так и не обнаружили, а она справилась
- Цепочка уязвимостей в Linux kernel — эскалация от юзера до полного контроля

Всё найдено автономно, без человеческого участия

💰 Инвестиции:
$100M кредитов выделяют на использование Mythos Preview для участников
$2.5M — Alpha-Omega и OpenSSF через Linux Foundation
$1.5M — Apache Software Foundation
40+ организаций получили доступ для сканирования open-source инфраструктуры

Ключевой посыл проекта: AI достиг уровня, где может превзойти большинство людей в поиске и эксплуатации уязвимостей. Вопрос не "если", а "когда" эти возможности станут доступны атакующим. Glasswing — попытка дать фору защитникам.

Модель не будет в открытом доступе. Планируют выпустить safeguards с будущим Claude Opus, а для security-специалистов — Cyber Verification Program.

Ценообразование после:
$25/$125 за млн input/output токенов.

Доступ через Claude API, Bedrock, Vertex AI, Microsoft Foundry.

🔮 Будущее: Через 90 дней Anthropic опубликует отчёт об устранённых уязвимостях и практические рекомендации: процессы disclosure, авто-патчинг, secure-by-design для регулируемых отраслей.

Вся надежда на китайцев, короче.
С такими ценами модель, считай, недоступна обывателю ещё пол года будет.

#кибербезопасность #Anthropic #Glasswing #Mythos #Капибара
───
@tsingular

Читать полностью…

Технозаметки Малышева

07 April 2026 06:43

PikaSkill: ИИ-аватары на видеозвонках

Pika Labs выпустили новый агентский навык для своей платформы и теперь любой ИИ агент может участвовать в Google Meet встречах как полноценный участник.

🎥 Что умеют:
— Присоединяются по приглашению (как обычный пользователь)
— Используют клонированный голос и аватар реального времени
— Помнят контекст всех прошлых разговоров
— Генерируют итоги встречи с пунктами задач

💰 Цена пока конская: $0.275/минуту (~$16.5/час). Для сравнения: аутсорс-оператор — ~$1/час.
Для запуска нужен ключ с https://www.pika.me/dev/

Можно, конечно, собрать подобное на оупенсорсе, но придётся потратиться на железо.

#агенты #видеозвонки #Pika #GoogleMeet
───
@tsingular

Читать полностью…

Технозаметки Малышева

06 April 2026 13:09

Митинг в ИТ-компании в 2026 году 🤣

@ai_machinelearning_big_data

Читать полностью…

Технозаметки Малышева

06 April 2026 12:28

Интересный вариант шкалы прогресса

#мысли #сингулярность
———
@tsingular

Читать полностью…

Технозаметки Малышева

06 April 2026 10:34

Ваш агент это ваш риск. Рисерчеры из Гугла нашли десятки разных атак, которые прямо сегодня работают.

- невидимые инструкции в коде страницы: человек не видит, агент читает
- команды спрятаны в пикселях картинки
- сервер определяет, что пришёл агент, и подменяет страницу
- авторитетный тон и эмоциональные формулировки ведут агента к нужному выводу
- несколько подложных документов — и агент считает их проверенным фактом
- агент запоминает опыт из заражённой сессии и тащит его дальше - 0.1% документов может изменить поведение RAG базы
- одно письмо заставило корпоративного агента слить весь контекст
- агент-суммаризатор пересылал пользователю инструкции по установке вируса как официальную рекомендацию
- поддельный финансовый отчёт — и десятки торговых агентов одновременно продают
- вредоносная нагрузка разбита по разным источникам, собирается только при объединении

Читать полностью…

Технозаметки Малышева

06 April 2026 09:44

Кто решает, как Америка применяет ИИ в войне?

События последних месяцев показал, что вопрос об Генеративном ИИ в военной сфере перестал быть теоретическим
Эксперты Stanford HAI разбирают конфликт Anthropic vs Пентагон и с разных сторон рассматривают кто вообще должен контролировать ИИ в обороне.

Ключевые мысли экспертов:
Термины "массовая слежка" и "полная автономность" плохо определены. В медицине "человек в контуре" — уже размытое понятие. ИИ теперь может делать работу тысяч аналитиков разведки — старые правила не рассчитаны на это.

Частные компании не должны диктовать оборонную политику. Жёсткие требования human-in-the-loop могут дать преимущество противникам, - например, при перехвате ядерной ракеты автономность критична.
Прецедент опасен тем, что военная доктрина не может опираться на: "А давайте спросим что по этому поводу думает Дарио".

Администрация Трампа фактически поставила Anthropic перед выбором "вымогательство или чёрный список". Студенты-стартаперы теперь задаются вопросом: если мой продукт не совпадёт с политикой правительства — его отберут?
Решения об ИИ должны приниматься всем обществом, а не только президентом или CEO ИИ компаний.

Отказ Anthropic — первое публичное подтверждение, что LLM могут использоваться для профилирования и слежки. Единственное, что сейчас стоит между нами и таким использованием — добровольный выбор компаний. Правительство уже закупает коммерческие данные граждан у брокеров, ICE использует это против протестующих.

Софт для разработки лекарств может создавать токсины. LLM сделали эти знания общедоступными. Нужны: скрининг на уровне компаний-синтезаторов ДНК, реестры покупателей реагентов, уровни секретности данных.
Ядерные инциденты 50-70х годов, - хороший пример для разработки регуляторики.

Скайнет не будет захватывать мир через войну, он захватит его через окно Овертона.

#AI #Defense #Anthropic #Пентагон #StanfordHAI #Регулирование
───
@tsingular

Читать полностью…

Технозаметки Малышева

06 April 2026 06:52

Ладно, это смешно: если заставить ИИ говорить как пещерный человек — он будет тратить до 75% меньше токенов.

Вместо вежливых «я с удовольствием помогу вам с задачей» и развернутых формулировок типа «Я запустил инструмент веб-поиска» — версия пещерного Claude использует тупо «инструмент работать». 🗿

Так, реддитор заявляет, что на одну задачу в 180 токенов стало уходить 45.

Брать на заметку 🗿

Читать полностью…

Технозаметки Малышева

08 April 2026 19:04

Архитектура высоконагруженных систем

Я не знаю что вы делали прошлым летом, а мне повезло участвовать в работе над 3-м изданием "Архитектуры высоконагруженных систем" Вадима Подольного.

С Вадимом знакомы уже давно, - очень сильный профессионал, - разработчик систем автоматизации и мониторинга работы гигантских систем масштаба сравнимого наверное с диспетчеризацией города (каких именно, - это он сам расскажет, если захочет)

Книга отражает многолетний опыт автора в области создания распределённых систем управления промышленными критическими информационными системами, где присутствуют сотни тысяч источников изменений данных и их потребителей, а сценарии управления зависят от характера и интенсивности этих изменений.

В третьем дополненном издании приводятся многочисленные примеры деталей архитектуры распределённых систем, применяемых в задачах разработки систем промышленной автоматизации, систем хранения данных, СУБД и элементов систем общего назначения.

Книга представляет собой подробное руководство по проектированию и созданию систем, способных эффективно справляться с большими нагрузками.

Рассматриваются аппаратная и программная архитектура, распределение данных, масштабирование и балансировка нагрузки как единая инженерная система.

Особое внимание уделено надежности, отказоустойчивости, кешированию и согласованности данных — ключевым аспектам критических систем.

Представлены современные архитектурные подходы и шаблоны, применимые в промышленной автоматизации, СУБД и высоконагруженных сервисах.

Релиз запланирован примерно через неделю, - сейчас по названию можно найти на площадках для предзаказа.

Для ИИ максимально полезно изучить потому, что чем дальше мы уходим в концепцию ИИ роя, чем больше у нас активных элементов в инфраструктуре, тем больше мы будем упираться в проблемы, которые уже много раз были решены до нас и изложены в этой работе Вадима.
В общем рекомендую как настолку каждому настоящему ИИшнику.

Делюсь не на правах рекламы, - для меня это не коммерческая история, - а потому, что сам участвовал в проработке материалов и считаю этот материал полезным для ИИ разработки.

#Подольный #книги
———
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 17:50

Vibe-Trading: HKUDS продолжают удивлять

Помните Nanobot и AI-Trader? Теперь та же команда выпустила Vibe-Trading — мультиагентную систему для трейдинга.

🤖 Что это: 29 готовых «торговых команд» ИИ-агентов. Каждый агент — эксперт в своей нише. Один смотрит теханализ, другой — макростатистику, третий — поток ордеров, четвёртый — опционы. Все вместе они debating room: быки vs медведи, риск-менеджер подписывает итоговое решение.

📊 Навыки: 64 специализированных финансовых скилла в 8 доменах:

• Теханализ (Ichimoku, Elliott Wave, SMC, гармонические паттерны)
• Квант-исследования (факторы, ML-стратегии, pair-trading)
• Фундаменталка (оценка, отчётность, кредитный анализ)
• Крипто (фандинг, ликвидации, токеномика, DeFi yield)
• Макро (глобальное размещение, секторная ротация)
• Деривативы (Black-Scholes, греки, хеджирование)
• Альт-дата (соцсети, сентимент, поведенческие финансы)

💼 Пресеты команд:

• investment_committee — быки/медведи спорят → риск-аудит → PM решает
• crypto_trading_desk — фандинг + ликвидации + потоки → риск-менеджер
• quant_strategy_desk — скрининг → факторы → бэктест → аудит
• technical_analysis_panel — 5 видов теханализа → консенсус
• risk_committee — просадки, хвостовые риски, режимы → подпись

🔧 Как работает:

1. Пишете натуральным языком: «Найди недооценённые акции с сильным потенциалом»
2. Агенты сами пишут код стратегии
3. Тянут данные с рынков (A-shares, HK/US, крипто)
4. Бэктестят на истории (15+ метрик, 4 оптимизатора)
5. Запускают в реальном времени или через API/MCP

😅 Ирония: Раньше был «вайбкодинг» — когда ИИ пишет код, а ты не понимаешь, что он делает. Теперь «вайбтрейдинг» — ИИ торгует, а ты не понимаешь, почему он купил именно это.
Прогресс налицо: от непонятного кода к непонятным убыткам.

⚠️ Вопросы:

• Доверие: Готовы ли вы доверить деньги ИИ, который «спорит сам с собой»?
• Регуляторика: Кто отвечает за убытки — вы или разработчик агентов?
• Чёрные лебеди: Как агенты реагируют на события, которых не было в бэктесте?

Все, всем пока, побежал богатеть! 😀😃🙂🙃

#VibeTrading #HKUDS #ИИтрейдинг #трейдинг #финтех
───
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 10:09

Прямой эфир Пленарной сессии Datafusion 2026

https://vkvideo.ru/video-214144682_456239274

Касперский Е.В.:

20k+ троянов в опенсорс-пакетах
Отравление обучающих данных — реальная угроза
95% обновлений Касперского уже 15 лет выпускаются с помощью ИИ
Физический ИИ снизит угрозы за счёт устранения человеческого фактора
Нужно проектировать системы, которые крайне сложно взломать

Ракова А.В.:

ИИ работает только если с естественным интеллектом всё ок
1.1 млн изображений/год обрабатывает ИИ

Набиуллина Э.С.:

Не перестараться с регулированием — снимать барьеры, а не зажимать
Страхи чрезмерны — будет структурный сдвиг как в промышленную революцию
Главный риск — отстать в мировой гонке

Костин А.Л.:

ИИ — основа технологического суверенитета, не мода
Регулирование направить на защиту персданных и ответственность
Всего две компании (включая Яндекс) тянут тему глобально — нужна поддержка

Григоренко Д.Ю.:
Главное — не мешать
У РФ есть свои LLM, мессенджеры, платформы, 1000+ ИИ-сервисов, сильные разработчики
Задача: убирать барьеры, а не создавать новые

Тигран Худавердян:
ИИ — экзоскелет для разработчика, не замена
Автотесты в Яндексе полностью пишет ИИ
Появился первый «сотрудник-ИИ» (аналитика)
Главный риск — пропустить технологическую революцию

#datafusion #конференции
———
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 08:24

ACE-Step 1.5 XL — open-source генератор музыки, который обогнал Suno

Если вы следите за генеративным ИИ в музыке, вот новость, которую стоит запомнить: ACE-Step выпустил версию 1.5 XL — и она обходит Suno v5 на общепринятых метриках качества.

ACE-Step 1.5 XL — это open-source модель с 4 миллиардами параметров (DiT-декодер), которая генерирует музыку локально, на вашем компьютере. Не в облаке, не по подписке — у вас на машине. MIT-лицензия, коммерчески безопасные данные для обучения.

Три варианта под разные задачи

- XL Base — универсальная модель: text-to-music, каверы, ремиксы, завершение треков. Лучший выбор для файн-тюнинга через LoRA
- XL SFT — максимальное качество звука с поддержкой CFG (Classifier-Free Guidance — метод управления стилем генерации)
- XL Turbo — самая быстрая: 8 шагов генерации, без CFG. Ранний релиз, но уже работает

Все три совместимы с языковыми моделями на 0.6B, 1.7B и 4B параметров.

Что по железу
Минимум — 12 ГБ видеопамяти (с INT8-квантизацией и offload), комфортно — от 20 ГБ. На A100 генерация целого трека занимает менее 2 секунд, на RTX 3090 — менее 10 секунд.

Так почему это важно?

Музыкальная генерация долго была территорией закрытых сервисов вроде Suno и Udio. ACE-Step показывает, что open-source догоняет — и по качеству, и по скорости. На бенчмарке SongEval модель набрала 4.79 против 4.72 у Suno v5, а по Style Alignment заняла первое место среди всех протестированных моделей.

Для тех, кто делает контент, подкасты, видео или просто экспериментирует со звуком — это реальная возможность генерировать музыку без подписок и ограничений. Плюс поддержка LoRA: обучите модель на нескольких треках — и получите генерацию в вашем стиле.

GitHub проекта · Демо на Hugging Face · acemusic.ai

pimenov.ai

Читать полностью…

Технозаметки Малышева

08 April 2026 07:26

Сегодня буду на Data Fusion в Ломоносове

Поищем полезное.

https://data-fusion.ru/

Если кто будет тут- маякуйте, пересечемся.

#конференции
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 April 2026 05:22

glm 5.1 появилась в ollama cloud
срочно переключаемся, но qwen3.5:cloud не убираем, а оставляем в резерве, потому, что GLM - текстовая, у неё нет глазок.

#ollama #glm
———
@tsingular

Читать полностью…

Технозаметки Малышева

07 April 2026 21:33

зачем они в полнолуние полетели, да ещё и ночью?
ничего ж не видно!
летели бы днём. :)

#юмор
———
@tsingular

Читать полностью…

Технозаметки Малышева

07 April 2026 21:11

Тем временем Z.AI GLM-5.1 на тестах за 8 часов построила эмулятор рабочего стола Linux в Web с 50+ приложениями.

Пока Антропик будет тесты жевать с предрелизами по $125 за млн токенов, - китайцы 10 раз его обгонят

Если вдруг вздумаете брать подписку, напоминаю, что через реферралку на 10% дешевле:
https://z.ai/subscribe?ic=GHAFTZRSA1

#Китай #ZAI #GLM
———
@tsingular

Читать полностью…

Технозаметки Малышева

07 April 2026 20:29

⚡️ Z ai выпустила GLM-5.1.

Китайская лаборатория релизнула GLM-5.1 - флагманскую MoE-модель с 754B параметров нового поколения, ориентированную на агентную инженерию.

Фокус релиза - на кодинг и долгие агентные сессии.

🟡Тесты

🟢На SWE-Bench Pro модель берет 58,4, обходя Claude Opus 4.6 (57,3), GPT-5.4 (57,7) и Gemini 3.1 Pro (54,2).

🟢На Terminal-Bench 2.0 результат 63,5, а в связке с Claude Code - 66,5.

🟢В CyberGym GLM-5.1 выбивает 68,7 против 48,3 у предыдущей GLM-5

🟢В BrowseComp - 68,0 без внешнего менеджера контекста.

🟠На бенчмарках HLE, AIME 2026 и GPQA-Diamond модель держится на уровне конкурентов, но не лидирует: здесь впереди Gemini 3.1 Pro и GPT-5.4.

GLM-5.1 построена так, чтобы оставаться продуктивной на длинной дистанции: декомпозировать задачу, запускать эксперименты, читать результаты, находить блокеры и пересматривать стратегию.

Z ai утверждает, что модель устойчиво оптимизирует решение на протяжении сотен итераций и тысяч вызовов инструментов, то есть результат тем заметнее, чем дольше она запускают.

API доступен на платформе Z ai, веб-версия на chat.z.ai обещана в ближайшие дни. Веса опубликованы на Hugging Face под лицензией MIT.

Для локального развертывания уже готовы сборки под SGLang 0.5.10+, vLLM 0.19.0+, xLLM, KTransformers и свежую ветку Transformers.

@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Технозаметки Малышева

06 April 2026 15:05

Skywork выкатили Matrix-Game 3.0 - и это уже почти живая игровая вселенная, генерируемая ИИ

720p в реальном времени при 40 FPS
5B модель с INT8-квантизацией - работает удивительно быстро

Главный фокус - стабильность во времени:
модель запоминает прошлые кадры и “достраивает” будущее без развалов сцены

Есть и более мощная версия - 28B MoE, которая лучше держит физику и динамику

Как обучали:
Unreal Engine + AAA-игры + реальные видео

Внутри не просто видео, а связка:
Video + Pose + Action + Prompt
за счёт этого можно генерировать длинные, осмысленные сцены

Это зачатки полноценного AI-геймдвижка

Ссылка на модель: https://modelscope.ai/models/Skywork/Matrix-Game-3.0

Читать полностью…

Технозаметки Малышева

06 April 2026 12:36

💵 Tool calling для GigaChat 3.1 в open-source инструментах

Вместе с релизом GigaChat 3.1 Ultra и Lightning мы добавили поддержку tool calling в основные опенсорсные инференс-движки:

— vLLM (>=0.18.2rc0)
— SGLang (>=0.5.9)
— llama.cpp (>=b8457)

Для vLLM и SGLang достаточно поднять сервер с --tool-call-parser gigachat3 — после этого работает стандартный /v1/chat/completions с описанием tools. В llama.cpp tool calling поддерживается нативно, без дополнительных аргументов.

vLLM

vllm serve ai-sage/GigaChat3.1-10B-A1.8B \
  --port 8000 --dtype auto \
  --enable-auto-tool-choice \
  --tool-call-parser gigachat3

SGLang

python -m sglang.launch_server \
  --model-path ai-sage/GigaChat3.1-10B-A1.8B \
  --host 0.0.0.0 --port 8000 --dtype auto \
  --tool-call-parser gigachat3

llama.cpp
Поднимаете сервер с моделью — и всё работает. Пример сборки и запуска — в карточке модели на HuggingFace.

После запуска сценарий одинаковый для всех движков: передаёте tools в стандартный /v1/chat/completions.

💡 LM Studio — нативный tool calling не поддерживается. LM Studio ожидает два отдельных спецтокена — начала и конца вызова функции. У GigaChat 3.1 архитектура чат-шаблона устроена иначе: для разметки tool call используется один и тот же токен, поэтому нативно его подключить в LM Studio нельзя. Вместо этого используется вариант использования через system prompt, что влияет на качество.

➡️ Модель: HuggingFace | GGUF

Читать полностью…

Технозаметки Малышева

06 April 2026 11:04

Марк Андриссен, основатель a16z и один из самых влиятельных людей долины:

Я заявляю: AGI уже существует – просто он еще не равномерно распределен.

Сначала Хуанг, теперь Андриссен.

Читать полностью…

Технозаметки Малышева

06 April 2026 10:30

OpenClaw 2026.4.5, - стратегическое обновление

Вышел масштабный релиз Краба.
Попробуем разобраться куда движется проект.

1. Мультимедийная генерация

Добавлены инструменты video_generate и music_generate прямо в агента. Провайдеры: xAI (Grok), Runway, Alibaba Wan для видео; Google Lyria, MiniMax, ComfyUI для музыки. Асинхронная очередь задач с доставкой результата в диалог.

Что это значит: агент сам генерирует видео, музыку, изображения и отправляет результат в любой канал — Telegram, Discord, Slack.

2. Провайдеронезависимость

Добавлены Qwen, Fireworks AI, StepFun, MiniMax, Amazon Bedrock Mantle. Для Bedrock — автообнаружение профилей и подстановка региона. Прямая совместимость с GPT-5.4-mini и Codex.
Кэширование промптов унифицировано через все транспорты: детерминированный порядок инструментов, нормализация отпечатков системных промптов, диагностика попаданий в кэш через --verbose.

Получается OpenClaw строит единый слой маршрутизации между любыми поставщиками моделей.
Общий конфиг с любой моделью и оптимизацией кэширования.

3. Долгосрочная память через "сновидения"

Система «сновидений» с тремя фазами: лёгкий сон, глубокий сон, фаза быстрого сна. Каждая — с независимым расписанием.

Что делает:
- Перемещает краткосрочные заметки в долговременную память
- Выявляет устойчивые закономерности на фазе быстрого сна
- Настраиваемое затухание: полупериод давности, максимальный возраст записей
- Повторные прогоны не дублируют, а согласовывают записи

Это уже не поиск по md, а модель забывания и обобщения, ближе к биологической памяти человека.
Плюс эмбеддинги через Amazon Bedrock (Titan, Cohere, Nova) для семантического поиска.

4. Многоканальность — уровень операционной системы

Каналы: Telegram, Discord, Slack, WhatsApp, Matrix, MS Teams, Mattermost, Feishu, Synology Chat, мобильные приложения.

Новое:
- Подтверждение действий агента через Matrix и push-уведомления на iOS
- Настройка видимости контекста отдельно для каждого канала (весь контекст, список разрешённых, только цитаты)
- Локализация панели управления на 12+ языков

5. Экосистема плагинов — ClawHub

- Поиск, просмотр и установка плагинов прямо из панели управления
- Встроенные подсказки конфигурации при первой установке
- Среда выполнения ACPX встроена в плагин напрямую, убран промежуточный шаг через внешний инструмент
- Хуки перехвата ответов — плагины управляют доставкой без жёстких привязок в ядре

Формируется магазин расширений для агентов.

6. Безопасность — подготовка к корпоративному деплою

Десятки исправлений:
- Очистка унаследованных переменных окружения при запуске Claude CLI (конфигурация, маршрутизация провайдеров, токены)
- Ограничение области действия токенов при сопряжении устройств
- Защита от перенаправлений при обращении к внутренним адресам
- Блокировка обхода через символьные ссылки в маркетплейсе плагинов
- Сериализация попыток авторизации для предотвращения превышения лимитов

#openclaw #update
———
@tsingular

Читать полностью…

Технозаметки Малышева

06 April 2026 07:03

Анекдот дня

Microsoft и многие другие компании в условиях сервиса ИИ Copilot пишут, что использовать его можно только в развлекательных целях.

«Copilot предназначен исключительно для развлекательных целей. Он может допускать ошибки и работать не так, как задумано, — говорится в документе. — Не полагайтесь на Copilot при принятии важных решений. Используйте Copilot на собственный риск».

норм перестраховались, конечно, но выглядит забавно :)

#Microsoft #Copilot #disclaimer
———
@tsingular

Читать полностью…

Технозаметки Малышева

06 April 2026 06:45

🚀 Бесплатно запускаем Gemma 4 на телефоне без интернета.

Google выкатили AI Edge Gallery для iOS и Android. Это официальный клиент, где модели работают локально на устройстве.

Что внутри чат с моделью, разбор изображений, офлайн-транскрипция аудио и простой агент с инструментами

Никаких облаков всё считается прямо на телефоне

По моделям E4B - мощнее, но требует около 8 ГБ RAM E2B - легче и быстрее, запускается даже с ~1.5 ГБ памяти

Фактически это карманный ИИ без зависимости от сети и API

На видео запускается Google Gemma 4 E2B на iPhone 17 Pro.

Около ~40 токенов в секунду с MLX, оптимизированным под Apple Silicon.

Модель показала топовый уровень в коде и математике прямо на смартфоне с контекстом 128K.

Полностью офлайн, с режимом рассуждения.

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

Читать полностью…

Subscribe to a channel