ai_newz | Unsorted

Telegram-канал ai_newz - эйай ньюз

73698

Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением. В свободное время работаю как Staff Research Scientist в Meta Generative AI в Швейцарии. Aвтор: @asanakoy PR: @ssnowysnow

Subscribe to a channel

эйай ньюз

Пара мыслей про уход Яна Лекуна из Meta

Вы уже наверное слышали, что мой друг Ян ЛеKун, один из крёстных отцов AI и Chief AI Scientist в Meta, объявил, что уходит мз компании после 12 лет, и доработает только до конца декабря.

As many of you have heard through rumors or recent media articles, I am planning to leave Meta after 12 years: 5 years as founding director of FAIR and 7 years as Chief AI Scientist.

The impact of FAIR on the company, on the field of AI, on the tech community, and on the wider world has been spectacular. The creation of FAIR is my proudest non-technical accomplishment.

I am creating a startup company to continue the Advanced Machine Intelligence research program (AMI) I have been pursuing over the last several years with colleagues at FAIR, at NYU, and beyond. The goal of the startup is to bring about the next big revolution in AI: systems that understand the physical world, have persistent memory, can reason, and can plan complex action sequences.

I am extremely grateful to Mark Zuckerberg, Andrew Bosworth, Chris Cox, and Mike Schroepfer for their support of FAIR, and for their support of the AMI program over the last few years. Because of their continued interest and support, Meta will be a partner of the new company.

As I envision it, AMI will have far-ranging applications in many sectors of the economy, some of which overlap with Meta’s commercial interests, but many of which do not. Pursuing the goal of AMI in an independent entity is a way to maximize its broad impact.

I will give some more details about the new company when the time comes. In the meantime, I’m sticking around Meta until the end of the year.


Официально, он уходит, чтобы основать свой стартап, где он будет строить World Models и продолжать свой давний крестовый поход против нынешнего тренда на LLM.

По мнению Яна, настоящий интеллект — это не просто предсказание следующего слова. Моделям нужна настоящая связи с физическим миром, AI системы должны понимать физический мир, иметь постоянную память, уметь рассуждать и планировать сложные цепочки действий. Это и есть его концепция World Models. Простой пример: eсли бы у нас была "модель мира" (World Model), то мы могли бы научить системы уверенно предсказывать, что произойдёт дальше в физическом мире – например роборука заранее бы могла предсказать, что произойдет если столкнуть кружку со стола.

Что-то подобное, кстати, пытается построить и Фей-Фей Ли в своём стартапе - но пока это на очень ранней стадии и ничего умного, кроме как генерации 3D пространств там нет.

--

В последние месяцы в Meta наметился явный конфликт видений. С одной стороны — Марк, который загорелся идеей AGI и требует от команд быстрых продуктовых результатов в гонке с OpenAI. С другой — Ян, который критикует нынешние LLM и считает, что до настоящего AGI ещё очень далеко. На этом фоне Цукерберг купил продуктово-ориентированных лидера Александра Ванга, вместе с половиной Scalе AI, что только усилило расхождение. Да и это унизительно для ЛеКуна - репортить Алексу, которые мнение ЛеКуна ни во что не ставит. Я больше писал об этом здесь, где так же предсказал уход ЛеКуна.

Meta, будет строить новые LLM, пытаясь догнать GPT, а ЛеКун, освободившись от корпоративного давления, займётся тем, во что верит сам.

Это не просто уход топ-менеджера (а Ян и не был менеджером). Ян был талисманом FAIR, лицом которого всегда можно было светануть, чтобы показать насколько крутые люди работают над ресерчем в Мете – это была репутационнная история как минимум. Жаль что эта эпоха закончилась.

Что ж, будем следать за тем что выдаст Ян ЛеКун в ближайшее время!

@ai_newz

Читать полностью…

эйай ньюз

500+ промптов для Nano Banana Pro

Я не очень люблю копировать промпты из библиотек, но может кому-то они будут полезны хотя бы для вдохновения. Это набор промптов для Nano Banana Pro, юзкейсов которой можно придумать очень много.

Nano Banana Pro более разговорная, чем стандартный Flux, SD или Midjourney - то есть лучше промптить ее полноценными предложениями, как и видно из примеров.

> Сайт с промптами, там же сейчас можно и бесплатно погенерить с ней.

@ai_newz

Читать полностью…

эйай ньюз

Нейродайджест за неделю (#96)

LLM
- Claude Opus 4.5 — Anthropic выпустили новую SOTA-модель для кодинга, которая обходит всех конкурентов. При этом цена за токен упала в 3 раза, что для Anthropic нехарактерно.
- DeepResearch для шоппинга — OpenAI сделали тюн GPT-5 mini, который интерактивно ищет товары, а пользователь направляет поиск в реальном времени.

Генеративные модели
- FLUX.2 — Black Forest Labs выпустили прямого конкурента Nano Banana Pro для консистентного редактирования изображений. Веса Dev-версии уже на 🤗.
- Загадочный Whisper Thunder — На Artificial Analysis Leaderboard появился новый SOTA-видеогенератор.

Прочее
- Как генерить презентации? — Большой гайд по AI-инструментам. Топ-3: Gamma, Manus и Genspark. Бонусом — пара креативных идей.
- Интервью с Ильёй Суцкевером — Эпоха "масштабируем всё предобучением" заканчивается, а будущее — за AI-учениками, которые дообучаются в реальном мире.
- Техрепорт FLUX.1 Kontext — Разбор того, как модель работает с референсами.
- TPU v7 дешевле GB300 — Диаграмма от SemiAnalysis показывает, что для Google тренировка на новых TPU в два раза дешевле, чем на чипах Nvidia.

> Читать дайджест #95

#дайджест
@ai_newz

Читать полностью…

эйай ньюз

Новое поколение синтеза речи в ГигаЧате

Разрабочики команды синтеза речи в Сбере запустили новое поколение голосового режима Гигачата. Голоса теперь собираются не из «универсального диктора», а из специализированных моделей: Freespeech для живого общения, голоса операторов колл-центров, подкастная и классическая дикторская подача. В результате ассистент говорит ближе к человеку, а не к автоответчику — со вздохами и с более естественной интонацией.

Технически это полностью свой стек: GigaChat 3b в роли языковой модели, кастомный токенизатор звука и авторегрессионный синтез вместо диффузий. Команда отдельно поработала над токенизацией речи, системными промптами для стиля голоса, учетом длинного контекста и клонированием — за счёт этого новый синтез сильно обгоняет прошлое поколение по внутренним метрикам качества и естественности. На фоне конкурентов типа Алисы упор идёт не на «дикторский» голос, а на живость и выразительность речи.

Статья на хабре

@ai_newz

Читать полностью…

эйай ньюз

Как генерить презентации?

Продолжение рубрики с обзором AI продуктов. Я рассматривал инструменты с точки зрения человека, которому нужно время от времени сделать презу на скорую руку. Он не разбирается в дизайне, но хочет, чтобы было красиво и бесплатно. Думаю, для профи топ будет примерно таким же, особенно учитывая возможность экспорта в PPTX.

Сначала про пайплайн. Во всех этих инструментах есть функция "превратить документ в презентацию", но работает она непредсказуемо и часто плохо.

Лучше так: сначала готовим текст для слайдов в Gemini (или в локальной LLM, если боитесь, что Google украдёт ваши гениальные идеи), получаем чёткие bullet-points, и уже с этим текстом идём в генераторы.

Gamma
Самый надёжный и удобный. Есть разные режимы обработки текста, в том числе "оставить как есть" и "сократить" (при этом он не переписывает, а именно вырезает ненужное, сохраняя авторский стиль). Шаблоны красивые, палитр много, а главное — удобный интерфейс для ручной доработки. За раз делает до 10 слайдов, но остальные можно легко догенерить при редактировании. Есть даже агент для массовой обработки презентации по промпту. Лимиты щедрые.

Manus
Интересен тем, что бэкэнд у него на HTML, что даёт больше возможностей для инфографики. Хорошо работает с таблицами и визуализацией данных. Он всё же напортачил местами с вёрсткой, но это исправляется одной кнопкой regenerate (там это называется smart optimize). Genspark в этом плане постабильнее. Минусы: мало своих шаблонов (хотя Neon Cyberpunk симпатичный), но можно загрузить свой. Есть экспорт в Google Slides c некоторыми ограничениями, лимиты очень щедрые.

Genspark
В целом, всё то же, что и у Manus, но с более гибким редактором. Тоже отлично работает с визуализацией данных, но шаблонов совсем мало. Третье место только потому, что у него нет неонового 😂. К тому же, без подписки нет нормального экспорта (а делать скриншоты — это не наш метод).

Chronicle
Очень красивые и стильные шаблоны, хоть их и мало. Картинки сам не расставит и даже в инфографику не умеет. Но шаблоны настолько стильные, что его нельзя пропускать. Идеально для минималистичных, чисто текстовых презентаций.

Остальные (пока сыроваты, но следить стоит):
- Snapdeck: Делает очень прикольные схемы, диаграммы и таблицы. Хорош в визуальном повествовании, но сыроват — нужно руками фиксить отступы. Кстати, бесплатных токенов хватило только на 12 слайдов.
- Figma: Редактирует только промптом, при этом токенов хватает лишь на пару запросов. Пока неюзабельна из-за багов в коде презентации и невозможности экспорта в PDF/PPTX.

Бонус!
Napkin: Это не генератор презентаций, но он интересно визуализирует данные. Это именно то, чего не хватает Chronicle, но по стилю они несовместимы, а жаль — была бы идеальная синергия.

PS: NotebookLM
Чуть не забыл! Весь тот же текст презы можно залить в NotebookLM и попросить его сделать видео с вашей презентацией. Получаются сходу хорошие слайды. Работает на русском, есть разные стили. Важно добавить правильный промпт, например, present this pitch deck like a founder, чтобы он именно *презентовал*, а не объяснял содержимое. Плюс сразу готовый текст, а то и сам питч. Подойдёт для вдохновения.

PPS: Для креативных маньяков
Все слайды потом можно прогнать через Nano Banana Pro и дико стилизовать. После того как я увидел презу от NotebookLM в стиле аниме (там есть такой шаблон), захотелось по приколу весь свой питч-дек перегенирить в стиле Attack on Titans.


Итог: Gamma — лучший универсальный инструмент. Manus и Genspark — для тех, кому важна визуализация данных. Остальные пока сыроваты, но следить за ними точно стоит.

@ai_newz

Читать полностью…

эйай ньюз

Нейродайджест за неделю (#95)

LLM
- Heretic — Автоматическое снятие цензуры с LLM. Софт находит и подавляет направления отказа в пространстве активаций модели. Работает с Llama, Qwen, Gemma и др.
- Grok 4.1 — Апдейт посттрейна с упором на эмоциональный интеллект и creative writing. Идёт в instruct- и reasoning-вариантах, но бенчмарки, видимо, не сильно изменились.
- Gemini 3 Pro — SOTA по всем бенчам, на 20% дороже 2.5 Pro, но на голову превосходит предыдущий фронтир.

Генеративные модели
- Gemini 3 Pro Image — Новая версия Nano Banana с приставкой Pro на базе Gemini 3 Pro. Умеет размышлять при генерации, искать в интернете, генерировать серии кадров и поддерживает 4К.

Прочее
- Зарплаты L5 в биг-техе — Ищем лучший офер. График распределения TC для Senior-ролей в США. Meta лидирует по медиане, Amazon — по апсайду.
- Про положение OpenAI — Ждём ответ от Сэма Альтмана на последние мощные релизы от Google.

> Читать дайджест #94

#дайджест
@ai_newz

Читать полностью…

эйай ньюз

Менеджер и директор — это разные роли, которые требуют своего майндсета и навыков. Стратоплан запускает два бесплатных проекта, чтобы помочь сделать этот переход.

Ключевой вызов для менеджера — переключиться из майндсета исполнителя в майндсет руководителя. Если вы становитесь директором, перед вами новая реальность: решения принимаете вы, и нужно не просто реагировать на проблемы, а стратегически смотреть в будущее.

Разобраться в этих ролях помогут на бесплатных интенсивах:
- Менеджер:101 — здесь разберут, из чего на самом деле состоит роль управленца и как действовать в непростых ситуациях. (17-18 ноября).
- Директор:101 — на этом интенсиве научат стратегическому мышлению и принятию решений. (19-20 ноября).

Оба интенсива пройдут с 16:00 до 19:00 (GMT+3). Общая Q&A сессия — 21 ноября.

На выходе участники получат инструменты для работы, сертификат для LinkedIn и материалы от школы, признанной лучшей для руководителей в 2024 году по результатам исследования Devcrowd.

Участие в обоих проектах бесплатное.

Пройти регистрацию на Менеджер:101
Пройти регистрацию на Директор:101

#промо

Читать полностью…

эйай ньюз

Embodied Avatar — пора вспомнить Живую Сталь

Unitree показали собственную систему телеуправления роботами. В отличие от большинства подобных систем она позволяет управлять всем телом, а не только верхней частью робота. Выглядит она как довольно лёгкий экзоскелет, который цепляется поверх одежды.

Кроме аппаратного захвата движений, компания экспериментируют с повторением движений прямо с видео, причём в реальном времени с очень небольшой задержкой. При обучении моделей из видео можно получать огромное количество данных для обучения базовой модели, которую потом будут тюнить на данных с полноценных систем телеуправления.

@ai_newz

Читать полностью…

эйай ньюз

Давно пользуюсь встроенным в Telegram криптокошельком @Wallet. В нем довольно продуманная система, которая абстрагирует работу с блокчейнами: поддерживает основные сети (TON, Ethereum, Tron, Solana), а USDT из разных сетей автоматом сводятся в один баланс.

Использую Wallet для быстрых платежей и трансграничных переводов — доллары можно отправлять прямо из чата, и человек получает USDT без всей этой возни с адресами и QR-кодами. Причём после этого деньги можно вывести в фиат через встроенный P2P. Всё работает внутри Telegram, не нужно прыгать между приложениями.

А теперь челы запустили токенизированные акции и фонды (Stocks & ETFs). Прямо в Wallet можно купить, продать или даже подарить токенизированные акции Google (GOOGLX), Nvidia (NVDAX), Tesla (TSLAX) и десятков других. Вход — от 1 USDT.

Прикольно, что торговля доступна 24/5 (с понедельника по пятницу), а некоторые акции приносят дивиденды.

В честь запуска они обнулили комиссию на сделки с акциями до 1 января 2026 года и запустили розыгрыш: если купить акций на $100 и продержать их 14 дней, можно получить бонус до $100 в акциях.

Пока банки строят "суперапы", Дуров тихо сделал финансовый хаб на базе мессенджера, которым и так пользуется полмира.

#приПоддержке @wallet

Читать полностью…

эйай ньюз

Claude Code получил веб версию

Работает это примерно так же как и у веб версии Codex — агенту выдают виртуалку, где он может выполнять заданные ему таски и потом коммитить результаты на гитхаб. Доступ к интернету можно ограничивать через кастомные вайтлисты, но для экстремалов сделали возможность убрать ограничения на домены (только не жалуйтесь потом на промпт инъекции).

По сравнению с Codex он стартует быстрее, но интерфейс менее отполирован. Пока что это превью, причём достаточно сырое. У меня, к примеру, из коробки не заработал Cargo (менеджер пакетов для Rust), потому что в дефолтный вайтлист добавили не все необходимые ему домены.

Кроме этого возможность контролировать облачный Claude Code добавили в iOS приложение. Хочется такой же функционал для контроля локального инстанса Claude Code/Codex. Превью облачного Claude Code уже доступно всем Pro и Max подписчикам.

https://claude.ai/code

@ai_newz

Читать полностью…

эйай ньюз

Tinker — первый продукт Thinking Machines

Становится понятно на что Мира Мурати привлекла два миллиарда. Tinker это облачное API для файнтюна LLM направленное на ресёрчеров. Оно берёт берёт на себя менеджмент инфраструктуры, при этом оставляет контроль над данными и алгоритмами.

Выглядит это так: пользователям дают крайне простой интерфейс в виде forward_backward, sample, optim_step и ещё парочки функций для сохранения/загрузки тюнов. Остальное (трейнинг луп, энвайроменты и т.д.) можно спокойно запускать у себя на ноутбуке.

Пока что тренировать можно только LoRA, поддержку полноценного файнтюна тоже обещают, но она будет чуть позже, плюс явно дороже. Судя по ресёрчу Thinking Machines, LoRA не отличаются по качеству от полноценных файнтюнов на небольших. Но у LoRA есть большое преимущество по эффективности — для их тренировки нужно на 30% меньше флопс, кроме этого использование LoRA даёт дополнительную экономию при тренировке большого количества за раз.

Из моделей пока доступны последние версии Llama 3 (кроме 405B) и Qwen 3, для части из них даже доступны Base модели. Пока что доступ по вейтлисту. В первое время сервис будет бесплатным, ввести оплату обещают уже в ближайшие недели.

Блогпост

@ai_newz

Читать полностью…

эйай ньюз

Claude Sonnet 4.5

GPT-5 Codex уже побыла лучшей моделью для кодинга уже целых две недели, так что пришло время для нового лидера. Клода ещё больше прокачали в кодинге и агентных тасках, где видно достаточно сильный прирост по бенчам. Цену сохранили прежнюю, Anthropic всё ещё упорно отказывается сбрасывать цены, в отличие от всех конкурентов.

По заявлениям Anthropic, новый Sonnet может автономно работать над задачей до 30 часов, предыдущий рекорд — 7 часов. Я не уверен как именно это измеряют, поэтому конкретно к этой части отношусь скептично.

Вместе с моделью обновили Claude Code до версии 2.0. Теперь Claude Code делает чекпоинты кодбазы перед каждым изменением, так что их можно легко откатить. Кроме этого обновили интерфейс и сделали расширение для VS Code. И наконец-то добавили возможность видеть оставшиеся лимиты использования моделей.

@ai_newz

Читать полностью…

эйай ньюз

Нейродайджест за неделю (#86)

LLM
- ASML инвестирует $1.5 миллиарда в Mistral — Европа встаёт с колен. Оценка компании теперь ~$14 миллиардов, что делает её самой дорогой AI-компанией в Европе.
- Облачный интерпретатор кода в Claude — Anthropic без лишнего шума добавили возможность исполнять Python и Node.js в сендбоксе. Доступно подписчикам Max, Team и Enterprise.
- Qwen 3 Next — Очень эффективные гибридные MoE-модельки (Instruct и Reasoning). На порядок быстрее Qwen 3 32B на больших контекстах при меньших затратах на обучение.
- Vikhr Borealis — Первая русскоязычная открытая audio LLM. Архитектурно это Whisper + Qwen, бьёт Whisper'ы на русском.

Генеративные модели
- Ebsynth v2 — Классический texture-synthesis + optical flow инструмент для видео вернулся. В комбинации с Nano Banana выглядит впечатляюще, хорошая тулза для нейро- и обычных киноделов.
- Вертикальные видео в VEO 3 — RIP ленты соцсетей. Google наконец-то добавил генерацию вертикальных видео.

Прочее
- Воскресное включение из Цюриха — Как отдыхают нормальные пацаны.

> Читать дайджест #85

#дайджест
@ai_newz

Читать полностью…

эйай ньюз

Воскресное. Сделал прямое включение, чтобы показать вам, как отдыхают нормальные пацаны в Цюрихе.

Я сегодня тоже взял выходной вечер (даже не день) – всю неделю пахал.

Знатоки, это же Midnight Club?

@ai_newz

Читать полностью…

эйай ньюз

Anthropic привлекли ещё $13 миллиардов

После раунда оценка компании — 183 миллиарда долларов. В этот раз инвестиции идут от традиционных инвесторов, а не гиперскейлеров вроде Google/Amazon. Антропики всё ещё бешено растут — компания анонсировала, что проецируемая выручка превысила 5 миллиардов долларов в год. Кстати, в июле почти треть всей выручки шла всего от двух клиентов компании — Anysphere (Cursor) и Microsoft (GitHub Copilot), вряд-ли с тех пор что-то сильно изменилось.

Где-то в камере плачет Сэм Бэнкман-Фрид

@ai_newz

Читать полностью…

эйай ньюз

Привет, фаундеры в чате есть? Как вы искали себе Executive Assistant и как собеседовали? Буду благодарен советам.

Меня как CEO начала засасывать админ работа в нашем стартапе, и кажется пора найти человека, который смог бы меня разгрузить в этих делах.

Ниже последуюет сама вакансия - вдруг кто-то сможет пореферить идеального кандидата.

---

🚀 Executive Assistant (Remote, Europe — Preferably Poland)
Join GenPeach.ai, an early-stage European AI startup (ex-Meta founders, backed by investors from DeepMind, Microsoft AI, Meta & OpenAI).

We’re building next-gen generative AI models for realistic image & video creation — and we need an EA to keep our fast, technical team running smoothly.

You will:
• Manage CEO calendar, inbox & comms
• Coordinate travel, meetings & logistics
• Support hiring, onboarding & people ops
• Handle docs, contracts & knowledge management
• Assist with investor updates & research
• Help run operations, tools & automations

We offer:
• Competitive salary
• Path to Chief of Staff
• Flexible hours, fully remote (EU time)
• Work with elite AI team
• Rapid learning & real impact
• Team meetings/offsites across Europe

Requirements:
• English B2+/ C1 (strong written & verbal communication).
• Excellent organization, time management, and attention to detail.
• Comfortable working in a fast-paced, changing startup environment.
• Proactive, independent, and reliable — able to anticipate needs.
• Tech-savvy; quick to learn tools like Airtable, Jira, Slack, Zapier/Make.
Bonus: Experience as an EA or in operations at a startup/tech company.

🔗 More info: link
📩 Apply: artsiom@genpeach.ai (please send an email with the tag “[EA job application]” in the subject)

@ai_newz

Читать полностью…

эйай ньюз

Большинство окончательно зациклилось на промтах

В то же время сильные личности совершают эволюционный скачок в жизни и бизнесе, используя более системный подход

Подробно об этом сквозь призму реальной практики и личных инсайтов:

🧬🔑 Тревога как Трамплин в ИИ

P.S. Доступ к статье бесплатный, но открыт до 10 декабря - успейте зафиксировать ключевые тезисы ✍️

#промо

Читать полностью…

эйай ньюз

Илья дал большое интервью:
https://www.youtube.com/watch?v=aR20FWCCjAs

Вот главное:

– Сейчас модели выглядят намного умнее на тестах, чем в реальных задачах: они переобучены на эвалы и плохо обобщают, особенно в сложных многошаговых сценариях

– Главный технический барьер к AGI - ненадёжное обобщение и низкая «человеческая» обучаемость; простое масштабирование предобучения и RL это не решит

– Эпоха «масштабируем всё предобучением» заканчивается: данные конечны, RL жрёт много вычислений; начинается новая «эпоха исследований» с поиском новых рецептов обучения (в т.ч. ценностные функции, архитектур моделей, другие виды RL и т.п.).

– Будущее AGI видится как система, которая учится как человек: один и тот же базовый разум может быстро осваивать разные профессии, постоянно дообучаясь в реальном мире, а не «готовый мозг, который знает всё из коробки»

– Массовое распространение таких АИ-учеников по экономике почти неизбежно приведёт к очень быстрому росту производительности и ВВП; скорость будет сильно зависеть от регулирования в разных странах

– Скорее всего появится много сверхсильных АИ от разных компаний, специализирующихся по нишам (право, медицина, R&D и т.д.), а не один «богоподобный» монополист-суперинтеллект (аниме Пантеон смотрели? Пора если нет)

– Основной риск - огромная мощь: если сделать чрезвычайно сильного целеустремлённого агента, даже с «хорошей» целью, результат может сильно не понравиться людям; желательно ограничивать максимальную мощность единичных систем

– В качестве цели для первых суперинтеллектов он рассматривает «заботу о чувствующих существах» (в т.ч. о самом АИ) как более реалистичную и устойчивую, чем «забота только о людях», но признаёт, что это не идеальное решение

– Он ожидает постепенный, но всё более заметный показ мощных АИ обществу: по мере роста реальной силы моделей компании и государства станут намного более параноидальны и начнут активно координироваться по безопасности и регулированию

– Краткосрочный «хороший» сценарий - универсальный высокий доход и то, что АИ делает почти всю работу; долгосрочно это нестабильно, потому что люди выпадают из активного участия в принятии решений

– Один из возможных (ему самому не очень нравящийся) способов долгосрочной стабилизации - частичное слияние людей с АИ через продвинутые нейроинтерфейсы, чтобы люди разделяли понимание с системами и оставались в контуре управления

– Оценка горизонта: до АИ, который учится как человек и может стать базой для суперинтеллекта, примерно 5-20 лет; текущий «чистый масштабинг» в какой-то момент упрётся в потолок

– SSI (его АИ лаба) он описывает как «чисто исследовательскую» компанию с другим техническим подходом к обобщению и безопасности, которая не ставит ставку на простое наращивание масштаба текущих архитектур, и ожидает, что в итоге крупные игроки всё равно сойдутся в общих стратегиях по безопасному выводу суперинтеллекта в мир

Читать полностью…

эйай ньюз

OpenAI сделали DeepResearch для шоппинга

С высоты птичьего полёта shopping research это тот же Deep Research — система задает уточняющие вопросы, после чего прочёсывает интернет и выдаёт результаты. Главное отличие — во время поиска shopping research работает интерактивно: показывает найденные товары в реальном времени, а пользователь отмечает что ему нравится, а что нет, таким образом направляя поиск.

Внутри — тюн GPT-5 mini, который научили шоппингу. Говорят что она в подборе товаров лучше чем GPT-5 Thinking, но я всё равно надеюсь что версия с большой моделью не заставит себя долго ждать.

Функцию уже раскатывают на телефонах и в вебе на всех зарегистрированных пользователей ChatGPT. Причём перед праздниками лимитов практически нет, даже для бесплатных пользователей.

@ai_newz

Читать полностью…

эйай ньюз

Сбер выкатил сразу четыре ключевые линейки в полный MIT-опенсорс.

Флагман — GigaChat Ultra-Preview, новая MoE-модель, собранная под русский язык и натренированная полностью с нуля. Ultra Preview уже обходит DeepSeek V3.1 на русском бенчмарке MERA, поддерживает длинный контекст до 128к токенов — и она все еще не закончила свое обучение.
GitHub | HuggingFace | GitVerse
Читайте подробную статью на Хабре от команды

Рядом выходит Lightning — более лёгкая MoE модель, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам.
Она не уступает лучшим опенсорс-моделям своего класса, держит планку на русском выше аналогов и выдаёт сверхбыстрый инференс, благодаря чему модель можно использовать там, где Ultra избыточна, а скорость критична. Плюс стабильная маршрутизация экспертов, а еще приятный бонус в виде поддержки 256к контекста.
GitHub | Hugging Face | GitVerse

Новая линейка моделей генерации картинок и видео Kandinsky 5.0 Video Pro, и версия Lite (Video Lite и Image Lite), выпущенная в октябре — нативно понимают русские промпты, культурный код и нормально пишут кириллицу. Флагманская Video Pro сравнялась с Veo 3 по качеству и обогнала Wan 2.2-A14B. А ещё подъехал K-VAE 1.0, сейчас это один из лучших опенсорсных энкодеров для сжатия визуального контента и база для обучения генеративных моделей.
GitHub | GitVerse | Hugging Face | Технический репорт

В аудионаправлении выходит GigaAM-v3 — новое поколение распознавания речи, показывающее −50% WER к Whisper-large-v3 и закрывающее все открытые решения на русском языке.
GitHub | HuggingFace | GitVerse

Все модели от текста до видео можно ставить в свой контур, доучивать под задачи и использовать коммерчески. По сути, это первый полностью открытый «большой набор» под русский язык, который позволяет строить полноценные ИИ-системы без зависимости от зарубежных моделей и ограничений.

@ai_newz

Читать полностью…

эйай ньюз

Нейродайджест за неделю (#94)

LLM
- GPT 5.1 — Большой упор на пользователей, которым не понравилась личность GPT-5. Модель стала дружелюбнее, лучше следует инструкциям, а Thinking-версия теперь эффективнее распределяет ресурсы.

Генеративные модели
- Обновление Flow — Google продолжает прокачивать Veo. Появился контроль над камерой и видео-инпейнт (Insert) в уже готовых генерациях.
- Тизер nano-banana2 — В X тизерят новую версию. По слухам, будет генерить в 4к и использовать Gemini 3.0 как текстовый энкодер.

Прочее
- SIMA 2 — Апгрейд AI-агента для игр от Google DeepMind. Может рассуждать о целях, играть в незнакомые игры и самообучаться. Серьёзный шаг к универсальным ИИ-агентам.

> Читать дайджест #93

#дайджест
@ai_newz

Читать полностью…

эйай ньюз

Нейродайджест за неделю (#93)

LLM
- Kimi K2 Thinking — Новая модель от Moonshot, крайне сильные бенчи, может выполнять сотни последовательных тул-колов.

Генеративные модели

- Нодовые редакторы — Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI, для большего контроля над генерацией. Закос на про-тулы.

Прочее
- Google Opal — Google раскатали клон n8n с визуальным редактором на кучу стран. Пока сырой и ограничен экосистемой, но хороший способ вкатиться в "нодовую культуру" или сплести бесконечную паутину из нод gemini.
- Embodied Avatar — Unitree показали систему телеуправления роботами. Позволяет управлять всем телом робота через лёгкий экзоскелет или даже повторять движения с видео в реальном времени.

Личное
- Прямое включение из Сан-Франциско — AI-тусовка очень плотная, каждому фаундеру стоит проводить здесь минимум 2-3 недели каждый квартал.

> Читать дайджест #92

#дайджест
@ai_newz

Читать полностью…

эйай ньюз

Cursor 2.0 — собственная агентная модель и новые способы программировать

Добавили новый интерфейс для управления несколькими агентами сразу, агенты теперь могут использовать браузер. При этом агентами не обязательно управлять текстом — в редакторе появился официальный голосовой режим. Попрошу заметить что с релиза 1.0 не прошло и полугода (как думаете, когда выйдет 3.0?).

Но самое интересное — собственная модель, под названием Composer. Основной упор у модели на интерактивность — большинство запросов модель решает меньше чем за 30 секунд. Выходит это у них через использование 200 токенов в секунду, но в придачу её тренируют использовать параллельные тулколы и . При этом, не смотря на скорость, модель крайне сильная — отстаёт лишь от Sonnet 4.5 и GPT-5 на внутренних тестах Cursor.

Свои модели это критически важно, ведь Codex и Claude Code за счёт вертикальной интеграции могут давать сильно лучше условия использования и тренировать модельку на лучшую работу с её обвязкой. Выйдет ли у них так вертикально интегрироваться — очень большой вопрос. С одной стороны у Cursor куча данных от юзеров множества моделей ну и этот релиз выглядит многообещающе, с другой стороны из компании на днях ушёл один из четырёх основателей, а у конкурентов оценка измеряется в сотнях миллиардов или даже триллионах долларов.

@ai_newz

Читать полностью…

эйай ньюз

ChatGPT Atlas — ИИ браузер от OpenAI

OpenAI сделали свой браузер, прорыва не случилось — просто взяли Chromium и интегрировали туда все свои AI фичи. Добавили возможность чатится со своими вкладками и помощник для написания текста в любом текстовом поле.

Agent Mode теперь работает не только где-то там в облаке, но и в локальных вкладках со всеми доступами юзера (интересно как это работает внутри и насколько сильно будет жрать батарею). Поиск по истории браузера, где можно описать страницу и браузер сможет её найти — это первое использование памяти ChatGPT, посмотрев на которое мне не захотелось сразу его выключить.

По дефолту на данных из браузера тренировка проводится не будет, но можно opt-in. Браузер уже доступен всем пользователям на маках, Agent Mode дают только платным подписчикам. На другие платформы обещают завезти позже.

https://chatgpt.com/atlas

@ai_newz

Читать полностью…

эйай ньюз

Нейродайджест за неделю (#90)
Юбилейный

LLM
- OpenAI DevDay — мини-приложения в ChatGPT. Плюс AgentKit (аналог n8n) и ChatKit для интерфейса. В API добавили GPT-5 Pro с конским ценником ($15/$120) и мини-версии других моделей.
- Nvidia инвестирует в xAI — вложит $2 миллиарда, но не напрямую, а через SPV, которая закупит GPU для кластера Colossus 2 и будет сдавать их в аренду.
- Сколько генерят нейронки —Gemini обрабатывает 1.3 квадриллиона токенов в месяц, а API OpenAI — более 250 триллионов.

Генеративные модели
- Sora 2 в API — Sora 2 и Pro теперь доступны в API по адекватной цене: 10 центов/сек за обычную версию. Pro-версия дороже, но с 1080p и длиной до 15 секунд.

> Читать дайджест #89

#дайджест
@ai_newz

Читать полностью…

эйай ньюз

А вот и генерации Sora 2 от людей. Очень хорошая физика, и пальцы не плывут.

Видно что в трейн закинули все, до чего могли дотянуться, включая копирайтные мультики и игры.

Очень интересно сколько там параметров (уверен, что это монстр жуткого размера) и на скольких GPU параллельно гоняется каждый запрос.

@ai_newz

Читать полностью…

эйай ньюз

Just AI Agent Platform

Все говорят о внедрении AI-агентов, но в реальности энтерпрайз сталкивается с хаосом: разрозненные инструменты, сложные интеграции и проблемы с безопасностью.

Just AI запускает Agent Platform — первую в РФ единую платформу enterprise-уровня для создания, управления и масштабирования AI-агентов и мультиагентных систем.

Платформа решает проблему разрозненных инструментов, объединяя всё в одной среде, где можно создавать агентов как в no-code/low-code редакторе для простых задач, так и в pro-code режиме для кастомных проектов с глубокой интеграцией без риска неожиданных ограничений.

Ключевая фишка — объединение фронт- и бэк-процессов. Например, один агент может принять запрос в Telegram, а другой — выполнить действие в CRM, и всё это в едином контуре без длительных интеграций и дополнительных лицензий. Платформа заявлена как LLM-agnostic, с поддержкой моделей от OpenAI, Anthropic и Gemini, и имеет готовые интеграции с 30+ каналами.

Для крупных компаний важна возможность развёртывания on-premise, и она здесь есть, наряду со встроенными FinOps-инструментами для контроля расходов.

Тестим здесь.

#промо

Читать полностью…

эйай ньюз

Vikhr Borealis - первая русскоязычная открытая audio llm

Мы долго и не очень успешно развивали свой tts - Salt, от него исторически осталось довольно много данных и наработок, мы решили - чо бы не сварить asr + llm как модно?

Ну и сварили. Архитектурно - whisper + qwen, учили на 7к часов аудио только адаптер+llm, сейчас работает только в ASR режиме, позже возможно довезем инструктивный режим. Так же выйдет бенчмарк для русского asr, он пока в доработке.
Блог так же выйдет, там будут небольшие аблейшены по данным

Модель в данный момент бьет whisperы на русском и на части бенчей лучше чем gigam.

Модель
Сolab поиграться

Читать полностью…

эйай ньюз

Oasis 2.0

Через почти год после первой версии Oasis, нейронной версии Minecraft, выходит вторая версия. Главное отличие — теперь оно работает поверх оригинальной игры через video to video модель, а не end to end симуляцию. Это сразу решает целый класс проблем с консистентностью мира и симуляции, но гибкости как у Genie 3 такой модели не видать.

Доступно демо в двух форматах — онлайн в браузере и как мод для Minecraft, так что можно попробовать стилизовать свои миры. Работает в 1080p и 30 FPS.

oasis2.decart.ai/demo

@ai_newz

Читать полностью…

эйай ньюз

Великие здания не стоят на зыбком фундаменте.

Как и устойчивые управленческие решения редко принимаются без фундаментальных знаний о менеджменте.

Для этого Стратоплан запускает «Management Foundation» — бесплатный интенсив, который поможет построить управленческую базу и определиться, действительно ли это ваш путь.

Что в программе:

— Ассессмент: для определения сильных и слабых зон руководителя.
— Эфиры с кейсами и разговоры с практиками: разбор реальных кейсов и сложных тем с с теми, кто преуспел в управлении
— Практичные лонгриды: полезное управленческое чтиво с инструментами и инсайтами от опытных руководителей

Бесплатная регистрация на Management Foundation:
https://stratoplan-school.com/foundation/ainews

📅 Когда: 1–19 сентября 2025, участие бесплатное.

Спойлер👇

В программе разберут три ключевые темы:

— «Я менеджер: что это значит на практике» — про ловушки первых шагов в менеджменте
— «Почему с вами никто не договаривается» — про ошибки, которые мешают переговорам.
— «Менеджер в системе без самой системы» — как не жить в пожарном режиме и успевать главное.


Среди спикеров и авторов (помимо Стратоплана) — представители известных Telegram-каналов: «Тимлид Очевидность», «Кода Кода», «Чужими руками», «System Design & Highload», «LinkedIn & Career» и другие...

📏 Старт проекта Стратоплана «Foundation» — 1 сентября здесь.

#промо

Читать полностью…
Subscribe to a channel