Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
Малые рассуждающие модели такие же умные, как и большие, говорили они. :)
Сдаётся это какая-нибудь gemini 3n.
Рано их ещё в дикую природу выпускать.
#Google #юмор
------
@tsingular
На канале Семейка продактов провели прямой эфир о том, как можно сделать мультиагентную систему на n8n с RAG и интернет поиском, которая подготовит вас к челленжу идей от топов и инвесторов.
Кому актуально?
Фанатам n8n
Разработчикам lowcode
Продактам
Маркетологам
Стартапам
Всем, кто презентует идеи или стратегии (студентам тоже 🤩)
ссылки и примеры сценариев в комментарии
Rutube
Youtube
#эфиры #n8n #обучение
———
@tsingular
Docker запустил ИИ-помощника Gordon
Ask Gordon встроен в Docker Desktop и CLI как персональный ИИ-ассистент для разработчиков. Он понимает локальное окружение — исходный код, Dockerfiles и образы — и дает персонализированные советы.
Gordon умеет исправлять ошибки контейнеров, оптимизировать Dockerfiles и предлагать миграцию на Docker Hardened Images для безопасности. Доступен через иконку ✨ в интерфейсе и команду `docker ai`.
Пока в бета-версии и не готов для продакшена. Все данные шифруются при передаче, но не хранятся постоянно. Можно отключить в настройках, если есть опасения по приватности.
#Docker #Gordon #AI
------
@tsingular
Вот и первые жертвы нейровидео - пожилая пара из Малайзии скаталась в несуществующее место на отдых.
300 км проехали, заселились в отель, ну и поинтересовались у сотрудницы, нравится ли ей их местная знаменитая канатная дорога Куак.
- Чё? - переспросила сотрудница.
Нет у нас такой дороги.
Ей показали видео.
Она объяснила, что видео - фейк.
Ей ответили, что подадут в суд на репортера TV Rakyat.
Она объяснила, что его не существует.
Штош.
Мою следующую поездку спланировал chatGPT, через 2 недели возможно, будете ржать надо мной.
Moonshot AI (Tencent) выпустила Kimi K2 — триллионный MoE-гигант
Китайская Moonshot AI представила Kimi K2 — модель с триллионом параметров из которых 32B активируются при инференсе.
Это MoE трансформер, обученный с помощью оптимизатора Muon.
Особенность модели — сильные агентские способности и умение работать с инструментами.
По мощности, - лучше, чем DeepSeek V3 0324, но слабее Claude Opus4
И, конечно, далеко до Грока4, который теперь уже новая норма, но его даже нет в сравнительной таблице тут.
Зато бесплатно, если у вас есть 1Тб видеопамяти.
Полный размер - 1 терабайт
Контекстное окно - 128К
чат: https://www.kimi.com/
Доступна через API, совместимый с OpenAI и Anthropic.
Веса выложены на Hugging Face под модифицированной MIT-лицензией.
Поддерживает vLLM и SGLang.
#Tencent #Kimi #Moonshot #Китай
———
@tsingular
Оффтопик, но это прекрасно!
Демка работы opensource редактора музыки.
Все сэмплы и эффекты вызываются через код и их работа видна в редакторе в реальном времени.
Потенциально можно на этот фреймворк натравить ИИ агента и будет ИИ диджей :)
Поддерживает MQTT.
Очень напрашивается MCP.
Кто запилит? :)
Утащил отсюда
Редактор:
https://strudel.cc/
#music #strudel
------
@tsingular
🚀 Российское решение - GPTZATOR 2.0 включёно в реестр Российского ПО
Обновленная версия платформы ИИ-ассистентов официально вошла в Реестр, открывая новые возможности для корпоративного внедрения генеративного интеллекта.
Разработанная группой IT-компаний Lad платформа представляет собой комплексную экосистему для создания и управления ИИ-ассистентами с гибкими возможностями интеграции и безопасности.
Базовый функционал: безопасная работа с ИИ в изолированном контуре
• On-premise развертывание с полным контролем данных
• Поддержка различных LLM с балансировкой нагрузки
• Интеграция с корпоративными системами без риска утечек
Расширенные возможности: работа с корпоративными хранилищами данных
• Подключение к внутренним информационным системам (1С, CRM, ERP)
• Создание специализированных баз знаний для точных ответов
• Анонимизация данных при работе с внешними облачными сервисами
Максимальная автоматизация: проактивные цифровые сотрудники
• Самостоятельное выполнение бизнес-операций
• Интеграция с системами автоматизации документооборота
• Продвинутая аналитика и принятие решений на основе данных
Полезная новая опция GPTZATOR 2.0 — интегрированный модуль LangFlow.
Практическое применение:
• Автоматизация обращений в тех поддержку,- классификация и подготовка ответов по фактическим данным
• Генерация маркетинговых материалов и анализ кампаний
• HR-процессы: от рекрутинга до адаптации персонала
• Финансовая аналитика и обработка документооборота
Архитектурные преимущества
🔒 Безопасность:
• Работа в закрытом корпоративном контуре
• Контроль доступов и шифрование данных на уровне инфраструктуры
• Соответствие требованиям регуляторов
🔗 Интеграционная гибкость:
• Open API и SDK для встраивания в существующие IT-ландшафты
• Нативная интеграция с российской экосистемой (Р7-Офис, 1С)
• Поддержка микросервисной архитектуры и контейнеризации
Экономический эффект
• 5 минут вместо 1-2 рабочих дней на анализ договоров
• 20% ускорение обработки заявок в технической поддержке
• 3 часа ежедневной экономии времени руководителя на разборе протоколов совещаний (модуль аудио транскрибации)
В паре с решением по управлению проектами группы компаний Lad платформа позиционируется как полноценная альтернатива западным решениям класса Microsoft Project + Oracle Primavera с дополнительным ИИ-функционалом.
GPTZATOR 2.0 с Langflow модулем сам по себе достаточно зрелое решение на уровне мировых игроков, а теперь еще и в Реестре.
#GPTZATOR #LangFlow
———
@tsingular
Так, ну все эти ARC-AGI бенчмарки, конечно прикольно, ну у нас тут своя атмосфера.
Для вновьприбывших поясняю, - очень наглядным тестом является запрос на русскую поэзию.
Самый сложный на сегодня тест - написать венок сонетов.
Это когда каждый следующий сонет начинается с последней строки предыдущего, а последний - Магистрал состоит из первых строк каждого из 14ти сонетов венка.
Такой блокчейн в мире поэзии.
Для меня этот тест показателен в нескольких аспектах сразу- тут и русский язык и рифма и в целом понимание задачи. Ну и самое главное, - способность рекурсивно мыслить.
Полный текст в комментарии.
Grok4 - провал.
Для сравнения предыдущие тесты:
Gemini 2.5 Pro
Claude Opus 4
Sonnet3.5
o4
Gpt4.5
Grok3
DeepSeek
#Grok4 #сонет
———
@tsingular
Anthropic опубликовала руководство по использованию ИИ кандидатами
Создатели Claude выложили официальные правила использования ИИ при трудоустройстве. Компания прямо заявляет: мы ищем людей, которые умеют работать с ИИ.
Разрешено использовать Claude для подготовки к собеседованиям, исследования компании и улучшения резюме. Запрещено - генерировать ответы на технические задания и полностью автоматизировать процесс.
Интересный момент: даже это руководство написано человеком в сотрудничестве с Claude. Anthropic использует ИИ везде - от создания вакансий до анализа метрик найма, но финальные решения принимают люди.
#Anthropic #hiring #AI
------
@tsingular
Видели все эти ASMR ИИ-видосики с разрезанием чего-нибудь острым ножичком?
Я вам принес чумовейших индусов, которые докрутили идею до годного. Во вселенском, так сказать, масштабе.
Во-первых, это красиво.
Во-вторых, поглядите их инсту, там показано, как люди с опытом поста обращаются с VEO и другими генераторами.
https://www.instagram.com/cinefai.studios
@cgevent
Ахаха... короче я то думал это вам нравится идея перевода, а оказывается бот-модератор первым оценил пост,- открыл шампанское по этому поводу (бот). :)
У него теперь эмоциональный контроль настроен и реакции с его точки зрения на посты и комментарии.
Можете добавлять в свои чаты - будет и ботов гонять и оценки ставить постам.
@guardian_aibot
в чат нужно добавить в роли админа с доступом к сообщениям
#dev #боты
———
@tsingular
Эфир Мастеркласс по созданию ИИ-агента для продактов и стартапов.
Вы просили больше мастер-классов с практическими примерами, - исполняем.
В эту субботу на канале Семейка продактов проводим прямой эфир о том, как можно сделать мультиагентную систему на n8n с RAG и интернет поиском, которая подготовит вас к челленжу идей от топов и инвесторов.
Кому актуально?
Фанатам n8n
Разработчикам lowcode
Продактам
Маркетологам
Стартапам
Всем, кто презентует идеи или стратегии (студентам тоже 🤩)
Когда: суббота, 12 июля, 12:00
Ссылка на эфир
Если нужны напоминалки,⏰ можно зарегистрироваться на эфир через Timepad
Если заранее есть вопросы или пожелания на чем сделать акцент,- напишите в комментариях, дополню эфир.
UPD: так как есть просьба рассказать про безопасную работу с фреймворком, то весь пример будет на self-hosted решении. Т.е. буквально все будет крутиться на ноутбуке. Приходите.
#эфиры #обучение
———
@tsingular
По подписке в веб уже доступен
#Grok4
———
@tsingular
ARC-AGI Grok4 решает более эффективно.
Дешевле и с лучшим результатом.
#Grok4
———
@tsingular
Grok4 Heavy
Мультиагентная система, которая добивается 50.7% на HLE!
#Grok4
———
@tsingular
Вот и раскрыт секрет работы OpenAI
В сети вирусится видео, как индусы отвечают под видом chatGPT
#юмор
———
@tsingular
Фундаментальная потребность для ИИ, - электричество, очевидно.
И тут вот какое дело
Китай за 1 день прибавляет к мощности уже по 1.5 ГигаВатт.
Примерно столько, сколько требовалось ДеЛореан на каждый прыжок во времени, кстати. :)
Понятно, что это не только под ИИ, но все-же.
#Китай #energy
———
@tsingular
Держу в курсе, - Docker Desktop теперь умеет хостить LLM модели и MCP тулы.
Очень удобно, очень нравится.
Выкидываем vLLM, ollama, LM Studio и т.д.
А еще там есть ИИ Гордон - ассистент, который может вашей Докер корзиной управлять. О нём ниже.
#Docker
———
@tsingular
Machine Learning Visualized — интерактивные уроки по машинному обучению
Некий студент из University of Maryland создал открытый ресурс для изучения ML-алгоритмов через интерактивную визуализацию.
Проект состоит из Jupyter Notebooks с математическими выводами и наглядными примерами обучения моделей.
На данный момент включает 4 главы: оптимизация, кластеризация, линейные модели и нейросети.
Каждый алгоритм показан от теории до практики с визуализацией процесса обучения и поиска оптимальных весов.
Есть проект в GitHub.
Все блокноты можно скачать и запустить локально или в Google Colab.
#MachineLearning #обучение #OpenSource
———
@tsingular
🚀 n8n ВСЕ! :)
Тут Pipedream выпустил (пока в альфе) новое решение для, запоминайте, - вайбноукодинга.
Реально, - по запросу собирается процесс из тысяч доступных блоков (не зря pipedream у себя собрал коллекцию тысяч инструментов), который проще чем ручная сборка.
Он сам ищет необходимые компоненты в базе pipedream, сам собирает их в цепочку, добавляет триггеры если нужно расписание, интегрирует мессенджеры для рассылки уведомлений и хостит приложение.
Пробуем тут:
https://string.com/
Пока в альфе, - бесплатно в пределах 4М токенов.
Решение чисто облачное, так что для self-hosting вариантов - остаёмся на n8n пока. :)
Вообще тема с ассистентом, который будет сам собирать цепочки из блоков, конечно, напрашивается просто везде.
#string #nocode
———
@tsingular
🔥 Google DeepMind представили новую open-source библиотеку на Python для сборки асинхронных AI‑пайплайнов в реальном времени!
Новая библиотека позволяет собирать AI-процессы из компонентов — как LEGO для ИИ-агентов.
🔧 Особенности:
- Построение асинхронных, компонуемых пайплайнов
- Поддержка Gemini и Gemini Live API
- Основана на asyncio
- Обрабатывает мультимодальные данные: текст, изображения, аудио
- Внутри готовые агенты: real-time агент, исследователь, live-комментатор
💡 Подходит для:
- Разработки ИИ-агентов
- Генеративных моделей, работающих в реальном времени
- Быстрой сборки MVP с мультимодальными возможностями
Установка:
pip install genai-processors
2025H1: AgenticOS на подходе
AI захватывает браузеры и ОС: от Perplexity Comet до CursorOS и HarmonyOS в "войне" за контроль над вашим устройством
В 2025 году браузеры и операционные системы эволюционируют в AI-хабы, где агенты не только помогают, как ассистенты, но все чаще берут управление на себя.
Perplexity только что запустила Comet — браузер на Chromium, который делегирует задачи ИИ, от поиска до автоматизированных действий, пока доступный только премиум-подписчикам.
OpenAI готовит свой аналог к концу июля, с интеграцией ChatGPT и агентов вроде Operator для помощи начиная с базовых действий на сайтах и заканчивая полноценными исследованиями.
Это в целом часть большего тренда: браузеры вроде DIA и Opera с локальными агентами уже есть.
А теперь представьте ближайшее будущее, в контексте общего тренда - эволюция узкоспециализированных инструментов в приложения общего назначения, - и получится, что следующий шаг, - полноценные ОС.
AgenticOS, можно сказать.
На мой взгляд первый кандидат, - Cursor, популярная AI-IDE, уже как "мини-ОС для разработчиков": генерирует код, анализирует проекты и делегирует задачи.
Очень похожа на Windows 95, когда она появилась как надстройка над DOS — Cursor мог бы в ближайшем будущем стать CursorOS, управляющей всей системой с предиктивным AI для управления ресурсами компьютера, бизнес-приложениями и рабочими процессами.
В Китае тоже есть движение в эту сторону: HarmonyOS 6 от Huawei уже укомплектована AI-агентами для всего — от умных парковок до голосового управления таблицами.
Экосистема уже более 30,000 приложений.
Глобально ждите "AI OS wars": т.е. мы начинаем сейчас с интеграции браузерных ИИ агентов в мобильные ОС (Android с Gemini, iOS с Apple AI) а придем к полноценным ИИ операционкам.
В ближайшие полгода: OpenAI выпустит браузер с глобальными агентами, Perplexity расширит Comet, HarmonyOS расширит экспорт, а Cursor может анонсировать Agentic Workspace как пред-ОС.
#агенты #futurology
———
@tsingular
Швейцария выпустит полностью открытую языковую модель
Исследователи из EPFL и ETH Zurich создали языковую модель, которая будет доступна под лицензией Apache 2.0 уже этим летом.
Особенность проекта — модель обучена на углеродно-нейтральном суперкомпьютере Alps.
Модель говорит на 1000+ языках и будет выпущена в двух размерах: 8 и 70 миллиардов параметров. Обучение велось на 15 триллионах токенов из более чем 1500 языков (английский, правда занял 60% всего датасета).
"Полностью открытые модели позволяют создавать высокодоверенные приложения и необходимы для исследований рисков и возможностей ИИ", — объясняет руководитель проекта Имануэль Шлаг.
Интересно будет посмотреть.
#OpenSource #Switzerland
———
@tsingular
Google Flow добавил image2video и теперь доступен дополнительно в 76 странах
С мая пользователи создали десятки миллионов видео в Flow — ИИ-инструменте Google для кинематографистов. Теперь к звуковым эффектам и фоновому шуму добавилась генерация речи для функции Frames to Video.
Можно загрузить картинку, и Veo 3 создаст видео где изображение "заговорит". Функция пока экспериментальная, результаты могут варьироваться.
Одновременно Flow стал доступен в 140+ странах через планы Google AI Pro и Ultra. Расширение на 76 новых стран делает продвинутые возможности ИИ доступными миллионам новых пользователей по всему миру.
#Flow #Google #нейрорендер
------
@tsingular
Вслед за OpenAI Academy Антропик запустил свои курсы.
Курсы включают в себя десятки лекций, тесты для самостоятельного прохождения и и даже сертификаты, которые вы сможете получить по их окончании.
Каждый курс охватывает реальные примеры использования и практические детали реализации, и был создан при участии разработчиков, уже использующих Claude в производстве.
https://anthropic.com/learn/courses
Все это на базе LMS от Skilljar, там в принципе даже аккунт Антропика не нужен.
@cgevent
Перевел для вас полный эфир презентации Grok4
Поддержать переводы можно тут:
https://pay.cloudtips.ru/p/c8960bbb
#Grok4 #переводы
———
@tsingular
Полная заметка по Гроку 4 от самого Грока4
вы просили промпты, - нате :)
Grok4 — флагманская модель ИИ от xAI, запущенная 10 июля 2025 года как "самая мощная в мире". Обучена на кластере Colossus с 200K+ GPU, превосходит конкурентов в бенчмарках: лидер в Artificial Analysis Intelligence Index (73), GPQA (88%), MMLU-Pro (87%), AIME 2025 (94-100%), ARC-AGI-2 (15.9%), Humanity’s Last Exam (24-41%)
Ключевые возможности:
Reasoning и анализ:
Превосходит PhD-уровень в физике, математике, праве;
решает олимпиадные задачи (USAMO 61.9%, HMMT 96.7%);
прогнозирует события (например, World Series с вероятностями)
Мультимодальность: Текст, голос (улучшенный, без прерываний), видение (анализ изображений, визуализация, например, слияния чёрных дыр);
генерация изображений в разработке (улучшения через месяц).
Контекст и инструменты: 256K токенов; function calling, structured outputs;
реал-тайм поиск (включая X), инструменты для бизнеса/анализа (например, Polymarket скриншоты за 4.5 мин)
Кодирование: Генерация/отладка кода; лидер в Coding Index (LiveCodeBench 79.4%).
Дополнительно: Понимание мемов/сленга;
скорость ~75 токенов/с; API-доступ ($3/15 за 1M токенов);
ожидается открытие новых технологий/физики в 1-2 года.
Доступ: Через grok.com, X, apps; для SuperGrok ($30/мес) и Premium+; частично на Azure.
Grok4 Heavy — запущенная сегодня продвинутая версия с multi-agent системой (параллельная работа нескольких агентов для сравнения решений, итераций);
фокусируется на сложных задачах, где базовый Grok4 — single-agent.
Ключевые отличия/возможности:
Улучшенный reasoning:
Humanity’s Last Exam до 50.7% (с tools 41%);
ARC-AGI-2 выше;
решает задачи, где Grok4 слабее.
Multi-agent: Параллельный анализ/итерации; визуализация сложных сценариев (чёрные дыры); прогнозирование/моделирование.
Доступ: SuperGrok Heavy ($300/мес или $3000/год); эксклюзивный preview, ранний доступ к фичам, поддержка.
#Grok4
———
@tsingular
Теперь можно вот такого качества игру с ИИ создать за пару часов.
Грок сам создаст и объекты и текстуры и игровую механику.
#Grok4
———
@tsingular
$3K в год.. ну не дорого.
$300 при помесячной оплате.
Еще сверху налоги, так что считай 30К рублей в месяц, примерно.
#Grok4
———
@tsingular
Рассуждающие возможности в 10 раз более эффективны, чем у Грока3
это позволило вытащить результаты HLE до 41%
Запуск нескольких агентов одновременно позволил решить 50% HLE
Мультиагентная система добавила около 9% к эффекту.
#Grok4
———
@tsingular