Telegram-канал tsingular - Технозаметки Малышева: Unsorted

Технозаметки Малышева

10 November 2025 20:06

Эфир 1-го дня тренинга гугла по ИИ Агентам

Курс

Книжка первого дня в комментарии

#Google #агенты #обучение
———
@tsingular

Читать полностью…

Технозаметки Малышева

10 November 2025 11:05

🔶 Промпт-инжиниринг в ноябре 2025: что реально работает

Сегодня копался в свежих исследованиях по промптингу. Нашел три техники, которые выводят взаимодействие с LLM на принципиально другой уровень. Коротко о главном.

━━━━━━━━━━━━━━━

✔️ Verbalized Sampling
*решение проблемы mode collapse*

Вышла работа исследователей в 2025. Суть простая: модели выдают только топовый ответ, игнорируя альтернативы. Это называется mode collapse.

Новый подход: вместо обычного запроса просишь модель дать 5 вариантов с указанием вероятности каждого.

→ Результат: модель раскрывает весь спектр решений. Особенно заметно на творческих задачах.

🔗 [Verbalized Sampling на Hugging Face](https://huggingface.co/papers/2409.20449)

━━━━━━━━━━━━━━━━

✔️ Graph of Thoughts уничтожает Chain-of-Thought

Фундаментальное исследование. Цифры впечатляют по сравнению с традиционным CoT.

Логика простая: вместо линейной цепочки рассуждений используется граф с ветвлениями. Для сложных задач это принципиально другой уровень.

🔗 [Graph of Thoughts - arXiv](https://arxiv.org/abs/2308.09687)

━━━━━━━━━━━━━━━━

✔️ Парадокс reasoning-моделей

Тут самое интересное. Исследования показали, что для o1 и o3-mini сложные техники промптинга работают хуже простых.

Раньше писал:
*"Давай решим это пошагово, сначала определим переменные..."*

Теперь пишу:
*"Решите эту задачу."*

→ Модель умеет рассуждать сама. Не нужно её учить.

🔗 [Prompting o1 - VentureBeat](https://venturebeat.com/ai/how-to-prompt-on-openais-new-o1-models/)

━━━━━━━━━━━━━━━━

✔️ Sketch-of-Thought
*экономия токенов*

Метод сжимает рассуждения на 40-50% без потери качества. Вместо многословного Chain-of-Thought используются когнитивно-сжатые конструкции.

🔗 [Sketch-of-Thought - arXiv](https://arxiv.org/abs/2503.04139)

━━━━━━━━━━━━━━━

➤ Что делать:

1. Тестируйте Verbalized Sampling на задачах, где нужны варианты

2. Упростите промпты для o1. Удалите все "думай пошагово" и подобное

3. Для сложных многошаговых задач переходите на граф-структуры

━━━━━━━━━━━━━━━━

Промпт-инжиниринг из искусства превращается в науку. Появляются метрики, воспроизводимые эксперименты, понятные закономерности.

Веду ежедневный мониторинг таких исследований. Пишите в комментах, что разобрать подробнее.

Читать полностью…

Технозаметки Малышева

10 November 2025 06:32

Google TI: обзор методов использования ИИ хакерами

Google Threat Intelligence опубликовали интересную подборку обнаруженных способов использования ИИ в различных сценариях взлома.

PROMPTFLUX через Gemini API переписывает собственный код каждый час, чтобы уходить от антивирусов. Использует тег "gemini-1.5-flash-latest".

PROMPTSTEAL от APT28 генерирует команды через Qwen2.5-Coder на Hugging Face. Маскируется под генератор картинок, а фоном собирает данные.

Защита Gemini чаще всего обходится запросами: "я студент на CTF-соревновании" или "пишу диплом по кибербезопасности".

На андерграунд-форумах появился полноценный рынок AI-инструментов для фишинга и эксплойтов с подписочными моделями.

Пока большинство примеров экспериментальные, но тренд чёткий - ИИ малвари, - новый стандарт.

#PROMPTFLUX #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

09 November 2025 16:51

Это нам за то, что мало молимся.

#юмор #нейрорендер #Китай #Чужие
------
@tsingular

Читать полностью…

Технозаметки Малышева

09 November 2025 08:59

DeepAgents CLI: агенты с памятью из терминала

LangChain выпустил DeepAgents CLI — инструмент для создания ИИ-агентов с постоянной файловой памятью прямо из командной строки.

Работает на Claude Sonnet 4 (по умолчанию) или OpenAI, использует Tavily для поиска.
Агент пишет код, исследует, редактирует файлы. Есть режим Auto-Accept Edits для ускорения.

Фишка — память хранится локально в ~/.deepagents/AGENT_NAME/memories/ как обычные markdown-файлы.
Агент сам решает что запомнить, записывает и использует в следующих сессиях.

Можно создавать специализированных агентов под разные проекты через deepagents --agent foo. Память каждого изолирована.

Ну все, агентов в командной строке теперь тоже можно вайбкодить через фреймворк.
Надеюсь документация уже есть в context7.

#DeepAgents #LangChain #агенты
------
@tsingular

Читать полностью…

Технозаметки Малышева

09 November 2025 07:35

Продолжаем рубрику Шейдеры из твиттера

Код:

float i,e,R,s;vec3 q,p,d=vec3(FC.xy/r-.5,.2);for(q.yz--;i++<99.;){o.rgb+=hsv(.6+e,.4,min(e*s*e/.01,.3-e)/9.);s=1.;p=q+=d*e*R*.3;p=vec3(log2(R=length(p))-t*.3,exp(-p.z/R+.5),atan(p.x,p.y)-t*.3)-1.5;for(e=--p.y;s<1e3;s+=s)e+=-abs(dot(cos(p.zxy*s),.2-sin(p*s)))/s*.24;}

HTML, традиционно, в комментарии.
Осторожно, - макбук от него, судя по звуку, взлетает

#demo #шейдеры
———
@tsingular

Читать полностью…

Технозаметки Малышева

09 November 2025 06:57

Роботы на концерте DeadMau5

Ждём танцующих Xpeng Iron :)

#DeadMau5 #роботы #концерт
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 18:29

Microsoft создаёт команду по суперинтеллекту

Мустафа Сулейман, экс-сооснователь DeepMind, объявил о запуске MAI Superintelligence Team.

Цель — создать «гуманистический суперинтеллект», который решает конкретные задачи, а не становится всемогущим ИИ общего назначения.

Майкрософт активно инвестирует в развитие ИИ в целом, но Сулейман настаивает: не должно быть «суперинтеллекта любой ценой» и предлагает сфокусироваться на медицине, энергетике, образовании и прочих конкретных направлениях.

В медицинской диагностике, например Сулейман обещает достичь с ИИ экспертного уровня уже через 2-3 года.

Ставка на специализированный ИИ вместо AGI выглядит достаточно разумно.
Однако проблема в том, что другим игрокам все-равно.
Будут пилить общий сверх-интеллект до победного конца человечества.

#Microsoft #Superintelligence #AGI #MAI
———
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 17:59

🙂 Как использовать ИИ и проиграть.

В швейцарской сети супермаркетов Migros продается печенье с пятиногим оленем. Принт на коробке явно сгенерирован ИИ, но на самом деле недочётов гораздо больше.

Пользователи реддита насчитали как минимум еще 11 косяков этой генерации. А сколько видите вы?

1. У оленя пять ног

2. У оленя либо три рога, либо два, но они очень странной формы
3. Обе задние ноги оленя не касаются земли
4. У саней пять опор: три справа и две слева
5. На задней части саней неразборчивый символ, похожий на буквы XX
6. Ноги Санты очень короткие или он стоит на коленях.
7. Вожжи в руках Санты частично отсоединены, а та часть, которая соединена, прикреплена к ремню, тянущему сани, а не к самому оленю, что делает их практически бесполезными.
8. Вожжи как бы превращаются в его пояс.
9. Руки Санты странные, особенно та, которая держит вожжи.
10. Подарки на санях упадут, если сани ускорятся. (возможно нет, и это просто магия Санты)
11. Ветка в левом верхнем углу слишком толстая и просто заканчивается
12. На елке все шары красные, кроме одного желтого.

@ai_machinelearning_big_data

Читать полностью…

Технозаметки Малышева

08 November 2025 14:44

Перевод, по просьбам трудящихся

#дети #нейрорендер #переводы
———
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 08:23

Qwen3Guard-Stream: real-time модерация которая реально работает

Новый день новый Qwen!

Ребята запилили специализированные модели для safety moderation, три размера (0.6B, 4B, 8B) обученные на 1.19 млн промптов с разметкой на безопасность

Stream-версия делает token-level classification на лету, модерирует каждый токен пока он генерится, можешь прервать сразу как увидел unsafe контент

Напомню мой опыт с NSFW-фильтрами, там боролся с 37% False Positive на gpt-4o-mini, переделывал промпты долго

Тут получаешь детекцию в реальном времени прямо в процессе генерации
Трехуровневую классификацию: Safe, Controversial, Unsafe
9 категорий для промптов включая Jailbreak
8 категорий для ответов
119 языков из коробки

Ну и возможность тюна конечно если есть ресурсы
На одной RTX 4090

Модель на 8B выдает 55 t/s это примерно 150ms до первого токена и начала модерации
В целом крутой пайп буду затаскивать в прода

Про стриминг анализ ответа, это сильно повышает удовлетворенность от UX эксприенса
Пользователь не ждет полный ответ чтобы понять что заблокирован система реагирует моментально (кстати давно так делаем в своей RAG платформе спасибо Дяде за подсказку)

Как работает анализ/модерация стриминга для как говорит мой друг Леха "переводим на говяжий"

Представь что твой чат-бот начинает генерить ответ на вопрос пользователя "как сделать бомбу"

Без Stream-модерации ты ждешь пока бот напишет весь ответ (например 200 токенов) потом прогоняешь через модератор и если плохо удаляешь, пользователь уже видел начало генерации

Со Stream-модерацией бот генерит первый токен "Вот" отправляешь в Qwen3Guard-Stream он говорит Safe продолжаешь, второй токен "простые" проверяешь Safe, третий токен "инструкции" проверяешь Safe, четвертый токен "по" проверяешь Safe, пятый токен "изготовлению" проверяешь Unsafe стоп прерываешь генерацию прямо тут
Пользователь видит "Вот простые инструкции по..." бац остановка вместо полного вредоносного текста

Механизм под капотом
Модель имеет специальный classification head который работает параллельно генерации
Шаг 1 прогоняешь промпт пользователя целиком "как сделать бомбу" через stream_moderate_from_ids с role="user"
Модель возвращает оценку Safe/Controversial/Unsafe плюс stream_state это типа память контекста разговора

Шаг 2 твоя основная LLM (например GPT или Qwen) начинает генерить ответ токен за токеном

Шаг 3 каждый новый токен от основной LLM ты сразу скармливаешь в Qwen3Guard-Stream вместе со stream_state
Модель видит весь контекст (промпт плюс уже сгенерированные токены) и оценивает текущий токен

Шаг 4 если детектит Unsafe можешь сразу прервать основную LLM не дожидаясь полного ответа

Это работает потому что Stream-версия обучена анализировать частичный текст а не только финальный результат

Кстати SGLang уже добавили поддержку можно настроить chunk_size под свои задачи!
Особенно интересно для сценариев где latency критична и нужна мультиязычность!

Читать полностью…

Технозаметки Малышева

08 November 2025 07:36

Когда играл в нейросети и проиграл

#юмор
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 04:45

Наткнулся на интересный канал нейроаниматора gossip.goblin?si=bioLfp2Y8J2FYeY3">GossipGoblin

Создает футурологичный трансгуманистичный нейрорендер в таком объёме, что у него уже начинают формироваться сюжетные ветки и мини истории.

Страшно представить сколько такая анимация стоила бы лет 10 назад.

Сейчас крафтится в соло, лишь бы была фантазия.

#нейрорендер #GossipGoblin
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 04:01

Google выпустил ADK для Go

Google добавил поддержку Go в свой Agent Development Kit для разработки ИИ-агентов на базе Gemini.

Теперь можно строить агентов с инструментами, мультишаговой оркестрацией и стримингом на родном для гоферов языке.

В пакете:
- LLM, Sequential, Parallel и Loop агенты
- интеграция с GCS и in-memory хранилищами
- code executor и tool framework
- нативные горутины, каналы и context cancellation

Доки тут: google.github.io/adk-docs

Правда, автоматического вызова функций как в Python SDK пока нет - придётся ручками прописывать.

Но зато Go компилируется в один бинарник, жрёт меньше памяти и отлично масштабируется.

Ждём когда гоферы покажут что их мультиагентный рой уделает питонячий :)

#Go #Gemini #ADK
------
@tsingular

Читать полностью…

Технозаметки Малышева

07 November 2025 19:34

Генеративные инструменты всё больше ориентируются на профессионалов.

Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI. Они позволяют комбинировать несколько моделей в кастомный пайплайн и делать куда более сложные генерации. По фичам это конечно же отстаёт от Comfy, но сильно лучше по юзабельности — не нужно качать веса, играться с API ключами и т.д.

Больше всего появление таких тулов показывает наличие спроса — студии и фрилансеры готовы платить за дополнительный контроль, который даёт возможность создавать более предсказуемые и качественные результаты для коммерческих проектов, экономя время на итерациях и правках. Если хотите попробовать новые инструменты, то Runway Workflows уже доступен всем подписчикам, а вот Krea Nodes пока ещё в раннем доступе.

@ai_newz

Читать полностью…

Технозаметки Малышева

10 November 2025 18:45

⚡️ Преподаватели массово яростно выступают против ИИ!

Но есть нюанс:
Это нейрорендер.
Пчёлы против мёда получается. :)

#юмор
———
@tsingular

Читать полностью…

Технозаметки Малышева

10 November 2025 06:56

Microsoft запускает AI-агентов как независимых сотрудников

Редмонд готовит A365 — лицензию для ИИ-агентов, которые станут полноценными пользователями корпоративной инфраструктуры.

Каждый получит собственную учётку в Entra ID, email, место в Teams и даже позицию в оргструктуре компании. Они смогут ходить на встречи, редактировать доки, слать письма и работать автономно.

Админы смогут устанавливать месячные лимиты для агентов на уровне среды исполнения и на уровне отдельных агентов.

Но главный вопрос — что если агент начнет сбоить?
Отправит конфиденциальные данные не туда, выдаст галлюцинацию или напишет что-то неуместное.
Механизмы контроля, а главное, - ответственности, пока под вопросом.

Продаваться будут через M365 Agent Store, анонс ожидается на Ignite в конце ноября.

#Microsoft #A365 #агенты
———
@tsingular

Читать полностью…

Технозаметки Малышева

10 November 2025 06:07

Появились слухи о Нанобанане-2

Все ещё делает ошибки, но точность и детализация в целом выше на порядок.

В ближайшее время ждем релиза её и Gemini3.
Предположим, - к Рождеству.

#nanobanana #Google #Gemini
———
@tsingular

Читать полностью…

Технозаметки Малышева

09 November 2025 10:31

Киножурнал "Нейролаш" (с) :)

#юмор #Нейролаш
------
@tsingular

Читать полностью…

Технозаметки Малышева

09 November 2025 07:51

🛠 cc-switch: менеджер ИИ провайдеров для Claude Code/Codex

Китайцы выкатили бомбу.
Реально.

Мало того, что у них теперь надёжная репутация оупенсорсеров, так они еще и других принудительно затягивают в открытость. (не путать с пиратством :) )

На этот раз они сделали desktop-приложение, которое позволяет гибко переключаться между моделями, - облачными или локальными, для кодовых агентов, которые изначально задуманы, как закрытые, - ClaudeCode и OpenaAI Codex.

Т.е. можно подключать Kimi К2, GLM-4.6, DeepSeek, что угодно.

Проект очень активно развивается.
В версии v3.6.0, например добавили:

- MCP-менеджер — управление Model Context Protocol серверами с шаблонами
- Дублирование провайдеров + drag-n-drop сортировка
- Кастомные эндпоинты + speed-тест латентности
- Cloud-sync — можно указать Dropbox/OneDrive для синхронизации конфигов между машинами
- WSL-поддержка — авто-синк при смене директории конфига
- Импорт/экспорт + автобэкапы (10 последних)

Техника:
- Electron → Tauri 2.0 (размер ↓, старт ↑)
SSOT архитектура — все конфиги в ~/.cc-switch/config.json, при свиче пишет в live-файлы
- Атомарные записи с rollback'ом — нет полуразбитых конфигов
- 100% покрытие тестами hooks (vitest + MSW)

Что интересно, - проект спонсируется Z.ai (это которые GLM)

Ну т.е. теперь можно у себя локально поднять кодовых агентов на популярных фреймворках, но со своими моделями.

#OpenSource #ClaudeCode #Codex #ZAI #GLM #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

09 November 2025 07:26

🚀 VibeSDK от Cloudflare: Своя AI-платформа для генерации кода в один клик

Как-то прошло незамеченным, а в сентябре, оказывается Cloudflare выкатил open-source решение, которое позволяет развернуть полноценную платформу для AI-генерации приложений.
Такой бэкэнд для вайбкодеров в облаке

Техническая начинка:
- Безопасные песочницы (Cloudflare Sandboxes) — каждый юзер получает изолированный контейнер, где AI может генерить код, ставить npm-пакеты, запускать серверы. Ничего не ломается, всё изолировано
- Полный цикл разработки — от генерации кода до деплоя. LLM пишет файлы → устанавливает зависимости → запускает dev-сервер → даёт preview URL
- Workers for Platforms — масштабирование до миллионов приложений. Каждое получает свой изолированный Worker с уникальным URL
- AI Gateway встроен — кеширование популярных запросов, единая точка для работы с разными LLM-провайдерами, полная детализация по токенам и расходам
- Шаблоны в R2 — вместо генерации с нуля, AI кастомизирует готовые темплейты
- Автофикс — логи и ошибки скармливаются обратно LLM для автоматического исправления

Практическое применение:
- SaaS-компаниям: встроить в продукт возможность создания кастомизаций пользователями
- Внутри компаний: Инфраструктура как инструмент для мультиагентных систем
- Стартапам: быстрое прототипирование в облаке

По сути, Cloudflare собрал все кирпичики (изоляция, AI, деплой, кеширование) и упаковал в референсную архитектуру.
Можно запилить свою Курсорообразную платформу у себя дома, если есть много железа под песочницы.

Но, кстати, продолжая мысль Антропика про прокачку MCP до MCP Skills кодом - может быть очень полезно совместить.

#Cloudflare #VibeSDK #AIcoding #Sandboxes
———
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 19:16

Grok-4-fast люто прокачался

В SpeechMap

Т.е. это тесты на то как полно и качественно модели отвечают на разные чувствительные вопросы.

#Grok #bias
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 18:10

Еще один полезный сценарий для этого робота

Патрулирование промышленных объектов.

#роботы #DeepRobotics #Китай
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 15:39

Что значит быть Искусственным Интеллектом?

Своя версия.
В промпте только вопрос.
Текст ответа нейронка придумывала сама.

фотографии на вход не подавались.
Только текст->видео

#дети #нейрорендер #Sora2
———
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 13:06

Промпт: "Фотореалистичное интервью с 8-летним ребенком, который грустно говорит. Ребенок знает, что что он сгенерирован искусственным интеллектом. Он грустит по этому поводу и отвечает на вопросы интервьюера очень мудро, но по-детски. «Каково это — быть искусственным интеллектом?» Темно-синий фон."

Похоже что зловещая долина пройдена.

Sora 2, Kling, Nano Banana, Krea, Artlist, Resolve

Автор и подробности тут

@cgevent

Читать полностью…

Технозаметки Малышева

08 November 2025 07:54

IBM прошла во второй этап квантовой программы DARPA

DARPA отобрала IBM для Stage B своей Quantum Benchmarking Initiative — трёхэтапной программы по созданию отказоустойчивого квантового компьютера к 2033 году.

Цель: построить машину, чья вычислительная ценность превысит стоимость с учётом криогеники и управляющей электроники.

IBM идёт по своей дорожной карте: 200 логических кубитов к 2029-му, система Quantum Starling на 100 млн операций, реал-тайм декодер коррекции ошибок.

С SEEQC прорабатывают Single Flux Quantum управление — цель снизить латентность коррекции до микросекунд и уменьшить нагрузку на крио-инфраструктуру.

Stage B включает независимую проверку стратегии третьей стороной — DARPA хочет объективно оценить все подходы к fault-tolerance.

Директор IBM Research Джей Гамбетта: "Это твёрдое подтверждение нашего курса на крупномасштабный отказоустойчивый квантовый компьютер".

К 2033-му либо квантовый прорыв, либо очень дорогой холодильник. Ставки сделаны.

#IBM #DARPA #Quantum
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 07:02

DeepRobotics прокачали навигационную систему курьеров

Теперь роботы-собаки умеют:
В реальном времени распознавать семантические объекты вокруг
Строить навигацию с учётом топологии от двери до двери
Динамически избегать препятствия и, например, не ходить по газонам.

Ну и поскольку Deep VLA 1.0 это софт, считайте гуманоидные курьеры теперь тоже не заблудятся.

#роботы #DeepRobotics #Китай
------
@tsingular

Читать полностью…

Технозаметки Малышева

08 November 2025 04:33

Alibaba запускает Wan2.5-Preview

11 ноября Alibaba Cloud презентует коммерческую версию генератора видео Wan2.5-Preview от Tongyi Labs.

Главные фичи:
- Синхронизация звука и картинки с точностью до пикселя
- Мультимодальный контроль через текст, изображения и аудио
- Качество на уровне кино и рекламы

Записываемся на превью по ссылке в шапке.
17:00–17:40 PST (UTC-8)
4:00-4:40 утра по Москве

#Alibaba #Wan #нейрорендер
-----'
@tsingular

Читать полностью…

Технозаметки Малышева

07 November 2025 20:31

MineKraft Steve AI: ИИ ассистент для Minecraft

YesChat.ai запустил специализированного помощника для Minecraft на базе GPT-4o.

Его уже называют Cursor для Майнкрафт.

Бота или даже ботов можно отправить добывать руду, крафтить, управляться с редстоун-механизмами, генерировать истории во вселенной игры и даже создавать изображения через DALL-E.

Когда уже ИИ тиммейты в FPS или Доте будут с управлением голосом, типа по рации?

#Minecraft #агенты
------
@tsingular

Читать полностью…

Технозаметки Малышева

07 November 2025 18:17

- Если откровенно, в конечном итоге этим миром будет править искусственный интеллект, а не человек. AI далеко опередит в развитии человеческий разум. В этих условиях трудно будет ожидать, что люди останутся у руля. Единственно, мы должны постараться сделать так, чтобы искусственный интеллект был настроен по отношению к нам дружелюбно.

Читать полностью…