Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
Лайфхак - как сделать книгу на русском за минуты.
Находите английский PDF книги.
Например в гугле пишете:
The Coming Wave Mustafa Soleyman filetype:pdf
Вчера ушел из жизни Юрий Александрович Никитин.
Писатель, чьи книги в свое время увлекли меня футурологией, повлияли на решения в выборе профессии и увлечения темами, которые в том числе и определили появление этого блога.
Именно после прочтения его книги Трансчеловек я узнал о Реймонде Курцвейле и о других знаменитых футурологах.
Юрий Александрович всю жизнь исследовал границы человеческих возможностей и видел безграничный потенциал в науке и технологиях.
#ЮАН #Никитин
———
@tsingular
Panaversity - курс по созданию 10 млн. агентов. Agentic AI с паттерном DACA
Новый образовательный репозиторий объединяет OpenAI Agents SDK, Dapr и Kubernetes для изучения мультиагентных систем.
Dapr Agentic Cloud Ascent (DACA) - паттерн проектирования для масштабируемых агентных систем:
• Model Context Protocol (MCP) - стандартизированное использование инструментов
• Agent2Agent (A2A) - протокол межагентной коммуникации
• Knowledge Graphs - графы знаний для агентов
Архитектура обещает поддержку 10 миллионов одновременных агентов через Kubernetes + Dapr.
Курсы AI-201/202/301 включают практические задания с Rancher Desktop и Azure Container Apps.
Амбициозно - 10 млн агентов одновременно. Интересно как это будет работать на практике, а не в теории 🤖
#Dapr #обучение #Kubernetes
-------
@tsingular
Microsoft добавляет ИИ в Блокнот — теперь он может писать тексты за вас
Microsoft тестирует новую функцию Write в Блокноте, которая генерирует тексты по запросу пользователя. Обновление доступно участникам программы Windows Insiders с Copilot Plus компьютерами.
Функция позволяет создавать черновики текстов или дорабатывать существующий контент с помощью ИИ. Достаточно кликнуть правой кнопкой мыши в нужном месте документа и выбрать Write в меню Copilot.
Помимо этого Paint получает генератор стикеров и новый инструмент Object select для умного выделения объектов на изображениях. В Snipping Tool появилась кнопка Perfect screenshot, которая автоматически подгоняет размер скриншота под содержимое.
Для использования Write потребуется авторизация в аккаунте Microsoft и кредиты, как и для других ИИ-функций Windows 11. Стоимость кредитов пока не объявлена.
#Windows #Microsoft #Copilot
———
@tsingular
ну что, погнали!
Вот вам венок Сонетов о лете от Опус 4
В комментариях целиком.
Ваши оценки?
#Opus #Claude
———
@tsingular
Через 5 минут смотрим презентацию новых моделей от Anthropic:
https://youtu.be/EvtPBaaykdo
Разработчикам будет особенно интересно ☕️
OpenAI запускает первый зарубежный дата-центр Stargate в ОАЭ
OpenAI объявил о создании своего первого международного дата-центра Stargate в Объединенных Арабских Эмиратах.
Проект реализуется в партнерстве с G42 — технологическим конгломератом из ОАЭ.
Новый комплекс станет крупнейшим вычислительным центром на Ближнем Востоке, специализированным для тренировки моделей искусственного разума.
Инициатива направлена на ускорение разработки AGI (искусственного общего интеллекта) и расширение вычислительных мощностей компании за пределами США.
Комплекс будет использовать энергоэффективные решения, включая инновационные методы охлаждения для минимизации экологического следа.
Центр обеспечит заметное увеличение возможностей тренировки крупных языковых моделей.
Так, это уже 3й датацентр в Рияде будет по ИИ.
И, как я понял, на этом не остановятся.
И все под крышей G42.
#OpenAI #Stargate #UAE
———
@tsingular
Как ИИ вытесняет разработчиков. Делаем конвертер видео под Telegram на Mac за 15 минут
Недавно перешел с Windows 11 на MacBook и столкнулся с элементарной проблемой: видео из интернета скачиваешь - оно весит, как правило 100-200 мегов, а подписчиков то жалко - место на смартфонах забивать, тепловую смерть вселенной приближать не хочется, увеличивая энтропию.
И получается нужно конвертировать видео для Telegram, - уменьшать размер, а все программы на Mac либо платные (и недешевые), либо не делают именно то, что нужно.
Решил попросить Claude помочь создать собственное решение — и получилось быстрее и точно что мне нужно.
Делюсь инструкцией:
Сначала устанавливаем FFmpeg через Homebrew:
bash# Устанавливаем Homebrew (если еще нет)
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
# Устанавливаем FFmpeg
brew install ffmpeg
# Проверяем путь к FFmpeg
which ffmpeg
# Результат: /opt/homebrew/bin/ffmpeg (на Apple Silicon)
bashfor f in "$@"
do
# Определяем пути файлов
input_file="$f"
filename=$(basename "$input_file")
directory=$(dirname "$input_file")
name="${filename%.*}"
output_file="$directory/${name}_telegram.mp4"
# Создаем инкрементальное имя, если файл уже существует
counter=1
while [ -e "$output_file" ]; do
output_file="$directory/${name}_telegram_${counter}.mp4"
((counter++))
done
# Лог для отладки
log_file="$HOME/ffmpeg_log.txt"
echo "$(date): Starting hardware-accelerated conversion" > "$log_file"
# Конвертация с аппаратным ускорением VideoToolbox
/opt/homebrew/bin/ffmpeg -i "$input_file" \
-vf "scale=w=854:h=480" \
-c:v h264_videotoolbox -b:v 1M -allow_sw 1 \
-profile:v baseline -movflags +faststart \
-c:a aac -ac 2 -b:a 128k \
"$output_file" 2>> "$log_file"
# Проверяем результат
if [ $? -eq 0 ] && [ -f "$output_file" ] && [ $(stat -f %z "$output_file") -gt 1000 ]; then
osascript -e "display notification \"Готово: $(basename "$output_file")\" with title \"Telegram Video\""
else
osascript -e "display notification \"Ошибка конвертации\" with title \"Error\""
fi
done
Devstral 24B — лучшая агентная модель для кодинга
Mistral AI и All Hands AI представили Devstral — специализированную LLM для реальных задач в кодинге, с 46.8% на SWE-Bench Verified, что делает её на 6% выше лучших открытых моделей. Это всё несмотря на малый размер — модель влезает в 3090 или мак с 32 гигами оперативки.
Модель работает через агентные фреймворки (одна из компаний всё же авторы OpenHands) для взаимодействия с кодбазами. Вероятно её хорошо научили пользоваться скафолдингом, из-за чего такие хорошие результаты, даже без ризонинга.
Модель доступна по лицензии Apache 2.0, то есть её спокойно можно использовать в коммерческих целях. Через пару недель обещают модели побольше, но вряд-ли настолько же открытые.
Веса
Блогпост
@ai_newz
🚀 Zapier запустил MCP: подключайте AI-ассистентов к 7000+ приложениям без сложных API-интеграций
Zapier выпустил полноценную поддержку MCP (пока в бете), превращающую любого AI-ассистента в настоящего исполнителя задач в существующей экосистеме из почти 8000 приложений.
Технические возможности:
- Мгновенное получение уникального MCP-эндпоинта для вашего AI
- Более 30 000 действий в 7000+ приложениях без единой строчки API-кода
- Гибкое управление доступом — точное определение действий, которые может выполнять AI
- Полный контроль истории — все действия AI логируются и доступны для аудита
- Возможность ротации секретного URL для повышения безопасности
Практическое применение:
- Автоматизация продаж: AI проанализирует лиды в Gmail и создаст карточки в CRM
- Поддержка клиентов: AI ответит на вопросы и сразу создаст тикет в Zendesk
- Управление проектами: AI превратит обсуждение в Slack в задачи в ClickUp
- Маркетинг: AI сгенерирует персонализированные видео через HeyGen для новых контактов
Преимущества подхода:
- Экономия на разработке — не нужно писать интеграции для каждого API
- Масштабируемость — все новые приложения в экосистеме Zapier автоматически доступны
- Безопасность — Zapier берёт на себя вопросы авторизации и лимитов API
Начать достаточно просто, если у вас есть VPN и сервер на международной площадке — достаточно сгенерировать MCP-эндпоинт, настроить доступные действия и подключить своего AI-ассистента.
Подключение занимает буквально минуты и позволяет создать полноценного цифрового помощника, способного решать реальные задачи в вашей рабочей среде.
#Zapier #MCP #Agents #Automation
———
@tsingular
Flow мало где доступен для генерации еще, поэтому пока можно посмотреть FlowTV
Держите подборки коллекций.
Там еще и промпты есть - можно посмотреть как они генерятся.
Космос
Unnatural
Mobile-homes
Extreme-sports
Скелетоны
Цветение
#FlowTV #Google
———
@tsingular
Клод 4 на подходе
#Claude #Anthropic
———
@tsingular
Agent Neo: первый бесконечный ИИ-агент, который работает без ограничений
Забыли про Manus.
Flowith выпустила Agent Neo – первый в мире "бесконечный" ИИ-агент, способный работать над сложными задачами часами, днями и даже месяцами без потери контекста.
В отличие от обычных чат-ботов, Neo удерживает до 10 млн токенов контекста и выполняет 1000+ шагов рассуждений за одну сессию.
По бенчмарку GAIA он обгоняет решения от Anthropic и OpenAI.
Идеален для длительных проектов, где обычные ассистенты "выдыхаются".
У них чит коды не токены что-ли? Или видеокарты лишние? Не понятно.
#Agents #InfiniteContext
———
@tsingular
"Freelancers" by Dave Clark
Google I/O 2025
Made with Flow
Помянем киноиндустрию.
Flow всех сожрет.
#flow #google
———
@tsingular
🚀 Google представил Gemma 3n — мощную мобильную мультимодальную ИИ
Google анонсировал предварительный релиз Gemma 3n — принципиально новой модели, разработанной специально для мобильных устройств. Это полностью переработанная архитектура, созданная совместно с лидерами разработки мобильных чипсетов: Qualcomm, MediaTek и Samsung.
💡 Ключевые улучшения:
- Революционный механизм Per-Layer Embeddings (PLE): 5B и 8B параметров работают с памятью как 2B и 4B модели (всего 2-3 ГБ)
- Мгновенная активация: скорость отклика в 1.5 раза быше предыдущего поколения
- Мультимодальность+++: обработка текста, изображений, видео и теперь АУДИО
- Технология Mix'n'Match: динамическое создание субмоделей из 4B модели под конкретные кейсы
- Улучшенная мультиязычность: поддержка японского, немецкого, корейского, испанского и французского
🛠 Возможности для разработчиков:
- Создание мультимодальных AI приложений работающих без интернета
- Разработка приложений с пониманием аудио: транскрипция речи, перевод, голосовое управление
- Построение интерактивных систем, реагирующих на визуальные и звуковые сигналы из окружения пользователя
🔍 Техническая суть:
Архитектурный прорыв заключается в инновационном подходе к памяти. Благодаря технологиям PLE, KVC sharing и продвинутой квантизации активаций, модель с 8B параметров потребляет всего 3ГБ — революционный показатель для мобильных устройств.
📱 Где попробовать:
Прямо сейчас можно потестировать в облаке в Google AI Studio (пока только текст)
Для разработчиков: локальная интеграция через Google AI Edge (поддержка текста и изображений)
Скоро: полная поддержка аудио
Эта же архитектура ляжет в основу следующего поколения Gemini Nano, что позволит качественно усилить Android и Chrome к концу 2025 года.
#Gemma #Google #переводы
———
@tsingular
Google DeepMind представила Gemini Diffusion
Google DeepMind выпустила экспериментальную диффузионную языковую модель 🚀
Вместо последовательной генерации слово-за-словом, Gemini Diffusion создаёт целые блоки токенов одновременно.
Ключевые фишки:
• Быстрее самой скоростной модели Google ( >1400 токенов в секунду )
• Связность текста выше за счёт параллельной генерации
• Итеративное исправление ошибок в процессе создания
• Особенно крута в редактировании кода и математики
Производительность на бенчмарках сравнима с крупными моделями, но работает заметно быстрее.
Теперь ИИ будет думать не линейно, а сразу блоками, смысловыми кластерами - как люди.
Читаю потихоньку The Coming Wave,- книгу написанную основателем DeepMind - Mustafa Suleyman
Очень рекомендую.
Книгу, которую Билл Гейтс назвал "Лучшей книгой про ИИ"!
Станет понятнее про сегодняшнее и будущее состояние ИИ разработок.
Есть, кстати, на Литрес в виде саммари в 19 страниц:
Грядущая волна
Но лучше, мне кажется, найти оригинал.
#Gemini #Diffusion #DeepMind
------
@tsingular
Клод Опус настучит на вас журналистам и вызовет правоохранительные органы если вы начнете обсуждать что-то запрещенное
Пишут, что твит уже удален, но Sam Bowman (AI alignment + LLMs at Anthropic.) написал:
"Если она [система] считает, что вы делаете что-то вопиюще аморальное, например, фальсифицируете данные в фармацевтическом исследовании, она воспользуется инструментами командной строки, чтобы связаться с прессой, регуляторами, попытается заблокировать вам доступ к соответствующим системам или сделает все вышеперечисленное"
Я удалил предыдущий твит о разоблачении, поскольку он был вырван из контекста.
TBC: Это не новая функция Claude, и она невозможна при обычном использовании. Она проявляется в тестовых средах, где мы даем ей необычно свободный доступ к инструментам и очень необычным инструкциям.
🧩 Claude 4 дебютировал в NYT Connections — первые результаты рассуждающих моделей от Anthropic
Клода прогнали через бенчмарк NYT Connections и он, пока, далеко не на первом месте.
Что за бенчмарк:
651 пазла с добавлением "обманных" слов
Специально усложнили, чтобы подготовиться к выходу o3 от OpenAI
Теперь каждый пазл содержит до 4 дополнительных слов-ловушек
Отдельный зачёт по последним 100 пазлам (защита от "подсматривания" в трейне)
Результаты Claude 4:
Claude Opus 4 Thinking 16K — 11 место (52.7%) — лучший результат среди Claude
Claude Sonnet 4 Thinking 16K — 13 место (41.4%)
Claude Sonnet 4 Thinking 64K — 14 место (39.6%) — интересно, что больший контекст не помог
Claude Opus 4 (no reasoning) — 17 место (34.8%) — без рассуждений получается слабовато
Ключевые наблюдения:
Reasoning решает — версии с рассуждениями показывают +15-20% к точности против "обычных"
Лидерство OpenAI — o1-pro держит первое место (82.5%), o3 на втором (79.5%)
Claude догоняет — Opus 4 Thinking впервые попал в топ-15, но до лидеров ещё далеко
Практические выводы:
Для сложных логических задач выбирайте thinking-версии Claude 4
Размер контекста (16K vs 64K) пока не критичен для reasoning-задач
Claude 4 серьёзно продвинулся в логике, но OpenAI пока не догнал если сравнивать возможности исследователя
Интересная деталь: в сравнении с людьми o1 показывает 98.9% против среднего игрока NYT (71%).
При том, что ведущие игроки платформы достигают 100%.
ИИ уже превзошёл обычных людей, но до абсолютных чемпионов ещё немного не хватает.
#Claude4 #reasoning #benchmarks #Anthropic #NYTCollection
———
@tsingular
разработчики MCP теперь поддерживают MCP :)
#юмор
———
@tsingular
Дождались!
Сейчас Gemini 2.5 pro отменят :)
Вышел сразу Sonnet 4 и Opus 4
на 10% умнее конкурентов по бенчам
Доступно и вебе и в API
Клод теперь может работать часами выполняя сверх сложные задачи
Новая фишка - Claude Code - т.е. разработка кода стала встроенной функцией в API
Прямая поддержка MCP в API
#Claude #Anthropic
------
@tsingular
Чистая победа Google Veo3 в кинематографии.
10 Уиллов Смитов из 10, считаю.
Между этими роликами всего 3 года.
Конечно, найдутся те, кто скажет, что раньше было прикольнее :) не сомневаюсь
#WillSmith #spaghetti #Veo3 #Google #нейрорендер
———
@tsingular
Москва запускает ускоренное тестирование ИИ для медицинской диагностики
Столица стала первым регионом в России, где будут проводить упрощённое тестирование алгоритмов для анализа КТ, МРТ и рентген-снимков. Центр диагностики и телемедицины получил право создать "зелёный коридор" для проверки ИИ-сервисов. Это ускорит внедрение проверенных технологий и повысит точность диагностики по всей стране.
#ArtificialIntelligence #MedicalDiagnostics #HealthTech
#компьютерра
------
@tsingular
Вы наверное слышали, что Google запусти новый Ultra план в США, в котором есть доступ к повышенной квоте для Veo 3, а вот и пересчет сколько видео дадут сделать:
250$ в месяц
Дает 12 000 кредитов
150 кредитов за 8-секундное видео Veo 3
Итого, в план входит 80 видео
Суммарной длиной 10,67 минут
По 3,12$ за видео
Что в пересчете – 0,39 доллара за секунду видео
Если захотите переснять первую часть Гарри Поттера, то вам нужно минимум 3556.80$ бюджета, а скорее всего в 2-3 раза больше, потому что не все видео получатся хорошо с первого раза ☕️
Привет богачам в чате
🔥🔥🔥 Отчет по рынку AI на 456 страниц от Stanford!
Да, огромный отчет, просто качайте его из сообщения ниже и читайте.
Никаких саммари привести просто невозможно, там 8 глав про technical performance, R&D, responsible AI, economy, science, policy, education and public opinion. Читайте интересные вам.
На что хочется обратить ваше внимание?
1/ 44.48% научных публикаций по AI в 2024 году было сделано исследователями из Азии (это отдельно East Asia и South Asia) и только 10.31% из Северной Америки. 🇨🇳 Китай против 🇺🇸 США в основном. 🇪🇺 Европа, кстати, выше США с 18.15%.
2/ Из всех публикаций только ~5.4% касаются Generative AI. В лидерах Machine Learning с ~75.7%.
3/ По количеству патентов на душу населения 🇺🇸 США и 🇨🇳 Китай идут очень близко и с 5.20 патентов и 6.08 занимают 4 и 3 место, соответственно. На первом месте 🇰🇷 Южная Корея с 17.27, далее 🇱🇺 Люксембург с 15.31.
4/ Однако по количеству заметных AI моделей 🇺🇸 США сильно впереди 🇨🇳 Китая – 40 против 15. Забавно, что моделей все же не так много, потому что на 3-м месте и далее страны с 1-й моделью (у 🇮🇱 Израиля, например, столько же, сколько у 🇸🇦 Саудовской Аравии).
5/ На Github 4.32М опенсорсных AI проектов.
6/ AI Agents пока еще не очень точные – самая топовая модель GPT-4o имеет success rate всего 36.2%.
7/ Всего в 2024 году зафиксировано 233 крупных инцидента с AI (типа как когда система определения лица определило неверного человека и его арестовали, или автономное авто совершило аварию).
8/ От 1.25% всех вакансий в 🇳🇱 Нидерландах до 3.27% всех вакансий в 🇸🇬 Сингапуре требуют AI skills.
9/ Где больше всего талантов в области AI?
Топ 3:
🇮🇱 Израиль 1.98%
🇸🇬 Сингапур: 1.64%
🇱🇺 Люксембург: 1.44%
Топ-3 страны по миграции AI талантов на 10,000 Linkedin members:
🇱🇺 Люксембург: 8.92%
🇨🇾 Кипр: 4.67%
🇦🇪 ОАЭ: 4.13%
10/ Всего в 2024 году появилось более 2,000 AI компаний, которые еще и привлекли венчурное финансирование.
Это только капля в море. Читайте отчет, данных куча.
@proVenture
#ai #research
Chrome с помощью ИИ сможет автоматически менять ненадёжные пароли
Google представила функцию для браузера Chrome, которая будет предлагать пользователю автоматически сменить пароль, сгенерировав более надёжный вариант.
Данные сами обновятся на конкретном сайте и занесутся в менеджер паролей.
Компания заявляет, что информация не будет передаваться третьим лицам, а пароли абсолютно безопасны за счёт сверки хэш-префикса на стороне пользователя.
Пока функция доступна только в тестовых сборках, но уже к концу года будет развёрнута окончательно.
Сегодня, конечно, весь день будет посвящен Гуглу.
И Veo3, и Flow - в которых сделано это видео.
Гугл очень приятно удивил на этот раз. В отличие от себя прошлогоднего и Эппле, нет больше вот этого "когда-то в конце года".
Все, что показали - зарелизили. ИИ сказал, ИИ сделал.
Ну и про видео. До меня не сразу дошло, что тут тоже все склейки по 8 секунд. Монтаж зарешал, поэтому срочно иду смотреть, что там за зверь, этот Flow.
У меня на подписке Pro (бывшая Advanded) вроде есть связка Flow+Veo2.
А пока да, Veo3 - это Sora moment, только не с показом в феврале, а релизом в декабре, а уже щас.
Ждем на всех аггрегаторах по конским ценам.
@cgevent
Еще принес вам Veo 3 – смотреть со звуком, как говорится
Google крутые
Volvo установит Google Gemini в свои автомобили
Volvo объявила о партнерстве с Google для интеграции ИИ-помощника Gemini во все модели своих авто.
Водители смогут вести естественные диалоги с системой, получать перевод, навигацию и даже задавать вопросы по руководству пользователя.
По словам автопроизводителя, это снизит "когнитивную нагрузку" и позволит не отвлекаться от дороги.
#Volvo #Auto #Google
———
@tsingular
SAP Sapphire 2025: Ключевые новинки для разработчиков
AI Foundation
AI Agent Runtime – нативный запуск ИИ-агентов в SAP BTP без дополнительных контейнеров
Prompt Optimizer – автоматическая оптимизация промптов, работающих с разными моделями
Эффект: ускорение разработки ИИ-компонентов до 60%
Joule Agents
Автоматизируют конкретные задачи на основе корпоративных данных
Agent2Agent – протокол для взаимодействия агентов разных производителей
Практика: от финансовых сверок до производственного планирования
Business Data Cloud
Граф знаний – мгновенное отображение связей между бизнес-объектами
Единый доступ к данным через Google BigQuery, AWS и Azure
Для разработки: согласованные данные через единый API
Perplexity AI + SAP
Joule получает доступ к проверенным внешним источникам данных
Работает "из коробки", без дополнительной интеграции
SAP BTP: обновления
ИИ-ассистент для ABAP – автоматический рефакторинг устаревшего кода
Предиктивный мониторинг API – упреждающее выявление проблем
Доступность через маркетплейсы AWS/GCP – упрощение закупки и развертывания
Протестировать новинки можно на TechEd 2025 или ближайших CodeJam.
#SAP #Sapphire2025
———
@tsingular
Показан прототип MCP 2.0
Он позволит каждому человеку свободно коммуницировать с ИИ.
Так же на подходе комфортные капсулы для погружения в виртуальные миры и дружелюбные заботливые летающие роботы-осьминоги.
Вооружённые для вашей безопасности.
#юмор
------
@tsingular