2604
Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
Что значит быть Искусственным Интеллектом?
Своя версия.
В промпте только вопрос.
Текст ответа нейронка придумывала сама.
фотографии на вход не подавались.
Только текст->видео
#дети #нейрорендер #Sora2
———
@tsingular
Промпт: "Фотореалистичное интервью с 8-летним ребенком, который грустно говорит. Ребенок знает, что что он сгенерирован искусственным интеллектом. Он грустит по этому поводу и отвечает на вопросы интервьюера очень мудро, но по-детски. «Каково это — быть искусственным интеллектом?» Темно-синий фон."
Похоже что зловещая долина пройдена.
Sora 2, Kling, Nano Banana, Krea, Artlist, Resolve
Автор и подробности тут
@cgevent
IBM прошла во второй этап квантовой программы DARPA
DARPA отобрала IBM для Stage B своей Quantum Benchmarking Initiative — трёхэтапной программы по созданию отказоустойчивого квантового компьютера к 2033 году.
Цель: построить машину, чья вычислительная ценность превысит стоимость с учётом криогеники и управляющей электроники.
IBM идёт по своей дорожной карте: 200 логических кубитов к 2029-му, система Quantum Starling на 100 млн операций, реал-тайм декодер коррекции ошибок.
С SEEQC прорабатывают Single Flux Quantum управление — цель снизить латентность коррекции до микросекунд и уменьшить нагрузку на крио-инфраструктуру.
Stage B включает независимую проверку стратегии третьей стороной — DARPA хочет объективно оценить все подходы к fault-tolerance.
Директор IBM Research Джей Гамбетта: "Это твёрдое подтверждение нашего курса на крупномасштабный отказоустойчивый квантовый компьютер".
К 2033-му либо квантовый прорыв, либо очень дорогой холодильник. Ставки сделаны.
#IBM #DARPA #Quantum
------
@tsingular
DeepRobotics прокачали навигационную систему курьеров
Теперь роботы-собаки умеют:
В реальном времени распознавать семантические объекты вокруг
Строить навигацию с учётом топологии от двери до двери
Динамически избегать препятствия и, например, не ходить по газонам.
Ну и поскольку Deep VLA 1.0 это софт, считайте гуманоидные курьеры теперь тоже не заблудятся.
#роботы #DeepRobotics #Китай
------
@tsingular
Alibaba запускает Wan2.5-Preview
11 ноября Alibaba Cloud презентует коммерческую версию генератора видео Wan2.5-Preview от Tongyi Labs.
Главные фичи:
- Синхронизация звука и картинки с точностью до пикселя
- Мультимодальный контроль через текст, изображения и аудио
- Качество на уровне кино и рекламы
Записываемся на превью по ссылке в шапке.
17:00–17:40 PST (UTC-8)
4:00-4:40 утра по Москве
#Alibaba #Wan #нейрорендер
-----'
@tsingular
MineKraft Steve AI: ИИ ассистент для Minecraft
YesChat.ai запустил специализированного помощника для Minecraft на базе GPT-4o.
Его уже называют Cursor для Майнкрафт.
Бота или даже ботов можно отправить добывать руду, крафтить, управляться с редстоун-механизмами, генерировать истории во вселенной игры и даже создавать изображения через DALL-E.
Когда уже ИИ тиммейты в FPS или Доте будут с управлением голосом, типа по рации?
#Minecraft #агенты
------
@tsingular
- Если откровенно, в конечном итоге этим миром будет править искусственный интеллект, а не человек. AI далеко опередит в развитии человеческий разум. В этих условиях трудно будет ожидать, что люди останутся у руля. Единственно, мы должны постараться сделать так, чтобы искусственный интеллект был настроен по отношению к нам дружелюбно.
Читать полностью…
Казахстан и OpenAI: 165 тысяч лицензий для учителей
Правительство Казахстана подписало меморандум с OpenAI о внедрении ИИ в образование.
Компания будет предоставлять казахстанским педагогам не менее 165 тысяч лицензий ежегодно в течение трёх лет.
Кевин Миллс, глава образовательных программ OpenAI, предложил интегрировать ChatGPT в университеты страны.
Инициатива входит в национальную стратегию развития ИИ в образовании на 2025-2029 годы.
Казахстан установил собственные стандарты для использования искусственного интеллекта в учебных заведениях с фокусом на этику и приватность.
Интересно, как модели справятся с казахским.
Хотелось бы такую новость прочитать про ГигаЧат, например.
#OpenAI #Казахстан
------
@tsingular
Роботы не видят зеркала как препятствия.
С витринами скорее всего та же история.
Подумайте дважды прежде чем брать домой.
#Unitree #зеркала
------
@tsingular
MiniMax Music 2.0: новый ИИ-композитор
MiniMax выкатил Music 2.0 — генератор музыки с реалистичным вокалом в разных стилях: поп, джаз, блюз, рок, фолк. Умеет делать дуэты и a cappella.
Генерирует полноценные 5-минутные композиции с контролем отдельных инструментов. Качество на профессиональном уровне.
Под капотом — MOE-архитектура с Linear Attention, которая обрабатывает до 100 000 токенов. Это позволяет держать когерентность структуры на длинных треках без зацикливания.
Китайцы пытаются догнать Suno
Интересная попытка, но в русский пока не очень.
Пример в комменте
#MiniMax #Music
———
@tsingular
Cursor мощно обновился и зарезилил 2.0 версию
🤖 Агенты и модели
- Composer - новая агентная модель кодирования, в 4 раза быстрее аналогов
- Мультиагенты - до 8 агентов работают параллельно над одним промптом в изолированных копиях кодовой базы
- Новый интерфейс управления агентами с боковой панелью
🌐 Браузер
- Полноценный релиз встроенного браузера для агентов ( тут же получается и Оператор встроенный и он видит структуру разрабатываемого сайта )
- Поддержка для Enterprise-команд
- Инструменты выбора элементов и передачи DOM-информации агентам
🛡 Безопасность
- Песочница для терминалов - по умолчанию на macOS
- Изоляция команд с доступом только к рабочему пространству
👥 Командная работа
- Team Commands - централизованное управление командами и правилами для всей команды
- Возможность делиться промптами через deeplinks
- Облачное распространение хуков для Enterprise
🎙 Новые функции
- Голосовой режим - управление агентом голосом!!! Истинный вайбкодинг!
- План в фоновом режиме - создание и выполнение планов разными моделями
- Параллельное планирование с несколькими сценариями
#Cursor
———
@tsingular
На Reddit в топе сейчас ветка, где люди рассказывают, как они потеряли работу из-за ИИ — внутри реально тысячи историй.
Кто-то пишет, что их отдел просто закрыли после внедрения нейросетей:
«Теперь отчёты и слайды делает ChatGPT — зачем им я».
«Мы не закрылись — нас заменили».
От Иронова до наших дней
Google бахнул убийцу очередной пачки стартапов продукт Pomelli для создания маркетинговых кампаний для брендов.
Речь идет про создание бренд-контента в произвольных масштабах.
Вы даете на вход веб-сайт компании, Pomelli это все пережевывает и выдает наружу пакован брендированного контента, который уже объединен замыслом некой рекламной кампании.
Чего не написано в телеграмчиках, так это то, что создание этого пакована (то есть маркетинговой кампании) можно промптить самому (либо соглашацца на варианты ИИ), а полученные материалы можно править не только в фотошопе, но и Нанабананой.
Все это отсылает меня в докембрий, когда появился лебедевский генератор логотипов - Николай Иронов. Подумайте, какой путь мы прошли: теперь вы даже можете ничего не писать, а просто вонзить свой веб-сайт на вход, и получите все для смм и маркетинга.
А сайт вам сделал кто? Правильно, ИИ.
А промпт для генерации сайта написал кто? Правильно, ну .. вы поняли.
Закончим тем, что маркетинг компанию для вас тоже будет делать какой-нибудь ИИ-агент по типа Мануса, и все, что вам остается, это спать и есть еду в голову.
А оно как-то там само..
https://labs.google.com/pomelli/ (впн штаты)
@cgevent
Кондуктор, нажми на тормоза!
Астроном Avi Loeb утверждает, что объект 3I/Atlas только что выполнил невероятный маневр, активно сбросив скорость с помощью гравитационного поля Солнца
Чуда не случилось, отменяем предзаказы.
Оказалось что этот робот,- дистанционно управляемый дрон.
Так же как и в этом решении.
Т.е. там за консолью какой-то, вероятно, филлипинец, в VR.
▪︎ Безопасники вышли из чата, громко матерясь на безопасном.
#NEO #роботы #fail
------
@tsingular
Перевод, по просьбам трудящихся
#дети #нейрорендер #переводы
———
@tsingular
Qwen3Guard-Stream: real-time модерация которая реально работает
Новый день новый Qwen!
Ребята запилили специализированные модели для safety moderation, три размера (0.6B, 4B, 8B) обученные на 1.19 млн промптов с разметкой на безопасность
Stream-версия делает token-level classification на лету, модерирует каждый токен пока он генерится, можешь прервать сразу как увидел unsafe контент
Напомню мой опыт с NSFW-фильтрами, там боролся с 37% False Positive на gpt-4o-mini, переделывал промпты долго
Тут получаешь детекцию в реальном времени прямо в процессе генерации
Трехуровневую классификацию: Safe, Controversial, Unsafe
9 категорий для промптов включая Jailbreak
8 категорий для ответов
119 языков из коробки
Ну и возможность тюна конечно если есть ресурсы
На одной RTX 4090
Модель на 8B выдает 55 t/s это примерно 150ms до первого токена и начала модерации
В целом крутой пайп буду затаскивать в прода
Про стриминг анализ ответа, это сильно повышает удовлетворенность от UX эксприенса
Пользователь не ждет полный ответ чтобы понять что заблокирован система реагирует моментально (кстати давно так делаем в своей RAG платформе спасибо Дяде за подсказку)
Как работает анализ/модерация стриминга для как говорит мой друг Леха "переводим на говяжий"
Представь что твой чат-бот начинает генерить ответ на вопрос пользователя "как сделать бомбу"
Без Stream-модерации ты ждешь пока бот напишет весь ответ (например 200 токенов) потом прогоняешь через модератор и если плохо удаляешь, пользователь уже видел начало генерации
Со Stream-модерацией бот генерит первый токен "Вот" отправляешь в Qwen3Guard-Stream он говорит Safe продолжаешь, второй токен "простые" проверяешь Safe, третий токен "инструкции" проверяешь Safe, четвертый токен "по" проверяешь Safe, пятый токен "изготовлению" проверяешь Unsafe стоп прерываешь генерацию прямо тут
Пользователь видит "Вот простые инструкции по..." бац остановка вместо полного вредоносного текста
Механизм под капотом
Модель имеет специальный classification head который работает параллельно генерации
Шаг 1 прогоняешь промпт пользователя целиком "как сделать бомбу" через stream_moderate_from_ids с role="user"
Модель возвращает оценку Safe/Controversial/Unsafe плюс stream_state это типа память контекста разговора
Шаг 2 твоя основная LLM (например GPT или Qwen) начинает генерить ответ токен за токеном
Шаг 3 каждый новый токен от основной LLM ты сразу скармливаешь в Qwen3Guard-Stream вместе со stream_state
Модель видит весь контекст (промпт плюс уже сгенерированные токены) и оценивает текущий токен
Шаг 4 если детектит Unsafe можешь сразу прервать основную LLM не дожидаясь полного ответа
Это работает потому что Stream-версия обучена анализировать частичный текст а не только финальный результат
Кстати SGLang уже добавили поддержку можно настроить chunk_size под свои задачи!
Особенно интересно для сценариев где latency критична и нужна мультиязычность!
Когда играл в нейросети и проиграл
#юмор
------
@tsingular
Наткнулся на интересный канал нейроаниматора gossip.goblin?si=bioLfp2Y8J2FYeY3">GossipGoblin
Создает футурологичный трансгуманистичный нейрорендер в таком объёме, что у него уже начинают формироваться сюжетные ветки и мини истории.
Страшно представить сколько такая анимация стоила бы лет 10 назад.
Сейчас крафтится в соло, лишь бы была фантазия.
#нейрорендер #GossipGoblin
------
@tsingular
Google выпустил ADK для Go
Google добавил поддержку Go в свой Agent Development Kit для разработки ИИ-агентов на базе Gemini.
Теперь можно строить агентов с инструментами, мультишаговой оркестрацией и стримингом на родном для гоферов языке.
В пакете:
- LLM, Sequential, Parallel и Loop агенты
- интеграция с GCS и in-memory хранилищами
- code executor и tool framework
- нативные горутины, каналы и context cancellation
Доки тут: google.github.io/adk-docs
Правда, автоматического вызова функций как в Python SDK пока нет - придётся ручками прописывать.
Но зато Go компилируется в один бинарник, жрёт меньше памяти и отлично масштабируется.
Ждём когда гоферы покажут что их мультиагентный рой уделает питонячий :)
#Go #Gemini #ADK
------
@tsingular
Генеративные инструменты всё больше ориентируются на профессионалов.
Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI. Они позволяют комбинировать несколько моделей в кастомный пайплайн и делать куда более сложные генерации. По фичам это конечно же отстаёт от Comfy, но сильно лучше по юзабельности — не нужно качать веса, играться с API ключами и т.д.
Больше всего появление таких тулов показывает наличие спроса — студии и фрилансеры готовы платить за дополнительный контроль, который даёт возможность создавать более предсказуемые и качественные результаты для коммерческих проектов, экономя время на итерациях и правках. Если хотите попробовать новые инструменты, то Runway Workflows уже доступен всем подписчикам, а вот Krea Nodes пока ещё в раннем доступе.
@ai_newz
Ещё про открытый Кими К2:
поставляется в нарезке INT4.
Т.е. "Сжато так сильно, что работать не должно, но каким-то чудом работает"
#Kimi #юмор
------
@tsingular
Битрикс24 знатно прокачал ИИ
Новый релиз, - Космос теперь умеет:
🌠 AI-агенты - в чате выполняют задачи по запросу. Можно создавать свои.
🌠 Аудио Задачи - общаетесь с командой в Битрикс24, а AI всё оформляет: распознаёт и ставит задачу по голосовым и кружкам, назначает ответственного, указывает крайний срок, добавляет чек-листы и фиксирует результат.
🌠 Задачи с чатом - сообщения, голосовые, файлы, все тут же фиксируется в задаче.
🌠 Мессенджер AI - теперь в мессенджере можно записывать видеокружки, делать расшифровку и распознавать эмоции в голосовых и видео с помощью BitrixGPT.
🌠 BitrixGPT 5 с размышляющей моделью - перед ответом строит цепочку рассуждений и проверяет вывод. Предлагает варианты, аргументирует, прогнозирует результат.
🌠Агент Марта - выполняет команды внутри портала, помогает с настройками и ответами на вопросы, переводит на службу поддержки по тех.вопросам, подключается к внешним сервисам по MCP.
🌠MCP - почта, календари, 1С и другие IT-системы теперь доступны через MCP. Агент Марта может так же их подключать по запросу.
🌠CRM AI - AI автоматически заполняет CRM после разговора с клиентом, создает автоматические задачи из звонков и обрабатывает нерелевантные звонки.
Очень крутой релиз. Майкрософт Копайлот, мне кажется, нервно курит.
#Битрикс24
———
@tsingular
Компьютерная наука,- это не про науку и не про компьютеры
Интересная мысль из лекций MIT
Eleven Labs в этот раз очень не очень перевёл, но смысл понятен.
Когда область новая,- очень легко спутать суть того, что вы делаете с инструментами, которые вы используете.
Лучше слушать в оригинале.
#Computer #Science #MIT
------
@tsingular
Jetson ONE
$128K
Тут недавно споры были про мир летающих машин после фейквидео с Маском.
Ну так похоже основано то оно на реальном прогрессе.
Погоняли бы на таких?
#дроны #flyingcars
------
@tsingular
OpenAI выпустила открытые модели модерации gpt-oss-safeguard
OpenAI совместно с некоммерческой организацией ROOST запустили gpt-oss-safeguard - opensource модели с рассуждениями для классификации и модерации контента.
Уже доступны на ollama в двух размерах: 20B и 120B параметров под лицензией Apache 2.0
Фишка - «bring your own policies»: можно подать несколько политик модерации одновременно, и модель разберётся со всеми сразу. Проверено на внутренних датасетах OpenAI, на публичном moderation dataset 2022 года и на ToxicChat.
В модель-карте описали «deliberative alignment» - обучение отказу от токсичного контента через рассуждения. Есть риски переобучения на бенчмарках, предложили динамическую оценку и темпоральное разделение данных.
#OpenAI #ROOST #ollama #guardrails
------
@tsingular
⚡️Павел Дуров анонсировал «Какун» — приватную блокчейн-сеть для ИИ, в которую можно будет встраивать любые нейронки без передачи данных бигтехам.
Что именно готовят в Телеге:
• Дуров давно хотел внедрить ИИ прямо в Telegram, но не намерен сливать данные пользователей Google, OpenAI и прочим корпорациям — нынешние нейросети выгружают всё создателям.
• Поэтому Telegram запускает свою анонимную блокчейн-сеть под TON, где нейронки будут работать напрямую в цепочке, без утечек.
• Полная ПРИВАТНОСТЬ и децентрализация — никаких следов на серверах бигтехов.
• Интегрировать туда можно будет любые ИИ-агенты, даже кастомные.
Что такое Интеллект: новая книга про эволюцию, вычисления и мышление
Блэйз Агуэра-и-Аркас из Google Research выпустил книгу, где подробно разбирает что есть Интеллект естественный и почему ИИ, - это настоящий Интеллект, а не просто перемножение матриц и Т9.
Центральный тезис - любые задачи, формулируемые естественным языком, и есть, по сути,- предсказание следующего слова .
Автор предлагает радикальные определения:
- Жизнь — самоизменяющееся вычислительное состояние материи
- Интеллект — способность моделировать и влиять на будущее
Выводы: каждый живой организм — компьютер/вычислитель. Каждый мыслящий компьютер борется за выживание, - следовательно живой, даже если искусственный.
В книге около 100 разделов, от кибернетики до нейробиологии.
Они последовательно освещают не только ИИ, но и феномен живого через единую концепцию.
В книге много интерактивных вставок, поэтому читать её правильнее на сайте.
Скачивать в статичный формат не очень интересно будет.
#Blaise #Книги
———
@tsingular
- заняться продажей роботов
- закосплеить Оби-Вана
- ходить по стендам конкурентов и посетителям говорить:
- Это не те дроиды, которых вы ищете.
#юмор #дроиды #роботы
------
@tsingular
GitHub Agent HQ: единая платформа для всех ИИ-агентов
GitHub запускает Agent HQ — централизованную платформу для управления агентами от Anthropic, OpenAI, Google, Cognition и xAI прямо в рабочем процессе.
Вместо десятка подписок — один Copilot Pro+ ($39/месяц) с доступом ко всем моделям, включая Claude Opus 4 и OpenAI o3.
Мission control позволяет назначать задачи нескольким агентам параллельно из VS Code, CLI или мобилки.
Нововведения:
- Plan Mode — агент задаёт уточняющие вопросы перед началом работы
- AGENTS.md файлы для кастомизации поведения в репозитории
- GitHub MCP Registry с интеграциями Stripe, Figma, Sentry в один клик
- Code Quality с автоматическим ревью от агента до вас
- Control plane для энтерпрайза с политиками безопасности и аудитом
Первым доступен OpenAI Codex в VS Code Insiders. Остальные агенты подтянутся до конца года.
Как на Ютубе скоро не останется контента от людей, так и GitHub скоро будет состоять, в основном, из кода от агентов, которые на нем же и будут хоститься.
Людям нужен новый гитхаб, куда пускать будут только по паспорту.
#GitHub #AgentHQ
------
@tsingular