cgevent | Unsorted

Telegram-канал cgevent - Метаверсище и ИИще

48094

Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие. Для связи: @SergeyTsyptsyn

Subscribe to a channel

Метаверсище и ИИще

Тут Nvidia анонсировали супер-мини-ПК для AI - NVIDIA Jetson AGX Thor - самый быстрый мини-ПК в линейке Jetson, 2070 терафлопс, потому что куча свежих GPU Blackwell и 14-ядерный Arm с 128Гб памяти. Цена начинается от 3499 долларов США. Поставки начнутся в ноябре 2025 года.

Сейчас пока топ для локальных моделек больших - Mac studio m4 max (3700 долларов за 128ГБ и 1Гб SSD) или m3 ultra (от 4000 за 96Гб), но решение от NVidia будет попроизводительней, плюс CUDA и все плюшки оптимизаций от Nvidia.

https://www.tweaktown.com/news/107293/nvidia-silently-launches-record-breaking-mini-pc-flexing-a-tiny-compact-powerhouse/index.html

Читать полностью…

Метаверсище и ИИще

Нейропрожарка

Челлендж
от miles
На мой взгляд, есть три самые сложные темы в создании видео не только с помощью AI:
- вода
- песок
- разрушаемость

Если вы смелый человек — то берёте одну из этих тем в работу. Если вы самоуверенный человек — попробуете сделать сразу два аспекта.
Если вы идиот, как я — пробуйте сразу три в одном видео.

Идея
Идея появилась, когда смотрел с балкона, как в очередной раз горят кипрские леса. И задумался о том, что каждый год одно и то же: летом горим — зимой цветём. Так появились первые наметки идеи, но чуть более абстрактно — про пустыню.

Музыка
Я всегда начинаю проект с трека. Иначе не могу — не получается работать. Но в этот раз не стал генерировать сразу, а взял любимый трек Дживана Гаспаряна и Сайнхо Намчылак Naked Spirit. Волшебное звучание дудука и завораживающий голос — идеальная атмосфера для пустыни.

Картинки
По замыслу всё должно происходить в пустыне с белым песком синей ночью.
moonlit white desert sands, surrounded by gentle dunes under a dark indigo star-filled sky. The sleek hull and minimalist lines contrast with the surreal desert setting photorealistic, wide-angle lens, cinematic lighting, real-world texture detail, high-end visual aesthetic.
Ну и так далее. Как только получилась первая картинка со стилем — так её потом и подцепил как стиль для генераций, хотя и не сказать, что это панацея.
Из сложностей с Midjourney: несколько кадров так и не получилось. Хотел сделать рельс, присыпанный песком, но как ни пробовал — рельс всё равно торчал из песка.
Ну и по классике — я думаю, каждый знает, как генерит Midjourney технику.

Видео
В видео используется 38 кадров - что уже немало. Были ещё кадры и опции по кадру, которые не вошли в финальный монтаж. В итоге в Kling было сгенерировано 408 видео. Так что почти 10% вошло в монтаж. Меньше, чем обычно, но учитывая специфику — удовлетворительно.

Как и ожидалось, песок и вода генерировались странно, а вот разрушаемость была более или менее (ну, относительно).
Кадр, где волна вылетала с левого края экрана и падала у яхты, был самым тяжёлым. Какие там только промпты не пробовал и ракурсы (у меня было несколько опций по кадру, и я их тестировал в надежде, что хоть один сработает). Яхта пятилась назад, волна затопляла яхту, заранее подпрыгивала перед волной (если будет интересно — скину потом лучшие блуперы). В общем, был кошмар, нервы и смех посреди ночи.

С песком было попроще, но тоже не без хлопот.

И особенно стоит отметить, какие страшные звуки Kling порой генерит в видео. Порой жуть, но несколько оказались полезными.

Звук
Закончив линейку, я решил взяться за звук. Тут я ожидал кучу проблем, потому что несколько раз пробовал сгенерировать трек наподобие Naked Spirit (очень рекомендую послушать оригинал). Для нейросетей это непростая задача - сделать вне шаблона, минималистично, без слов и прочего.

И тут как раз утром прочитал в почте, что ElevenLabs запустили генерацию музыки.
Пошёл ради интереса попробовать и... получилось с первого раза:

mystic slow, dark ambient song, without words but with female vocalizing part like "aaaaaaa" and duduk, desert vibes, female vocal textures, no drums, no words

Чуть не заплакал

Потом сделал ещё несколько траев. Отдельно им же сгенерировал женскую речь.

Ну а дальше - покраска: где-то в AE звёзд докинул, где-то подчистил, где-то цвет поправил. В общем, полировка, но не до конца, так как поставил себе при любых раскладах закончить в пятницу до вечера.

Результат
Надо сказать, что я ожидал, что будет сильно хуже. По факту проблемной оказалась только вода. С песком кадры выбивались быстрее, хотя порой неожиданности тоже происходили.

В общем, 4 ночи, разорённый акк в Kling, но результатом я, в принципе, доволен.


@cgevent

Читать полностью…

Метаверсище и ИИще

Rodin Gen-2 вышел в бету.

Из коммерческих 3д-генераторов, наверное, лучший.

У них в твитторе можно запросить доступ в бету.

@cgevent

Читать полностью…

Метаверсище и ИИще

Как попасть в нейропрожарку?

Написать админу в личку и прислать следующее:

1. Видео отдельным файлом, до 150 МБ

2. Можно кратко описать идею или историю создания видео

3. Самое главное, расписать детали производства: какие инструменты использовались и на каком этапе, сколько времени (и денег) потрачено на видео, любые дополнительные технические детали, сравнения инструментов, предпочтения по использованию и пр. Не забыть рассказать про звук и липсинк(если есть).

4. Не надо присылать нарезки в духе "вон чо я могу нагенерить". В идеале это должна быть мини-история, анимационный клип, муз. клип, немузыкальный клип, рекламный ролик, оформление или заставка для канала\мероприятия - моушен дизайн.
В общем работа с историей или идеей.

5. Вот хороший пример описания: /channel/cgevent/13110, будьте как Антон.

6. Если админ не отвечает целую неделю, то можно пингануть снова. Админ пока кожаный, не ИИ-агент.

7. Не пытайтесь двигать свои гениальные телеграм-каналы или инсту через нейропрожарку. Админ оставляет право включать или вырезать саморекламу. Все зависит от контента и настроения админа.

8. Получите инвайт в коменты по крайней мере (которые давно закрыты).

@cgevent

Читать полностью…

Метаверсище и ИИще

Wan2.2-I2V-Flash

В 12 раз быстрее!

Но.

Ни весов, ни кода.

А доступно только через API on Alibaba Cloud.

https://modelstudio.console.alibabacloud.com/?tab=api#/api/?type=model&url=2867393

@cgevent

Читать полностью…

Метаверсище и ИИще

Генерация игровых, ну и просто трехмерных миров (world models) становится новым мейнстримомом.

Держите ещё один такой проект.

SEELE: text to endless 3D game.

Причем миры можно ремиксить, оптимизировать и по.

В общем на дворе новый тренд: text2metaverse.

https://www.seeles.ai/home

@cgevent

Читать полностью…

Метаверсище и ИИще

👍 [ Мы открываем Второй нейрохакатон с призовым фондом 250 000 рублей. ]

[Тема хакатона] SolarPunk и будущее сельского хозяйства. Кто накормит человечество в далеком будущем? Как будет выглядеть мир, где экология и устойчивое развитие — не пустые звуки, а основа всего? Ответь на эти вопросы в формате нейро-видео. Награда за талант — деньги и предложение сотрудничества.

[Формат] короткий ролик от 15 до 90 секунд

[Участие] бесплатное, команды и индивидуальные креаторы

[Инструменты] видео-нейросети в основе + любые другие инструменты

[Дедлайн] регистрация на конкурс до 13 августа 23:59 (GMT+3), сдача работ до 21 августа 23:59. У вас будет 8 дней, чтобы создать качественный ролик.

[Результаты и жюри] 24 августа в прямом эфире с фестиваля «Слёт Аниматоров» совет из представителей науки, арта и продакшена выберет победителей.

Подробности и ссылка на регистрацию в нашем сообществе. Удачи!

#промо

Читать полностью…

Метаверсище и ИИще

Не очень люблю постить проекты без кода, если это не Адобченко или Гугл.

Читать полностью…

Метаверсище и ИИще

Нейропрожарка


Рекламный ролик от Ильи для бренда «Красная Линия», созданный с применением нейросетевых технологий.

Проект реализован в рамках моего любимого направления — нейрорежиссуры, которое я развиваю, фокусируясь на интеграции искусственного интеллекта в креативные процессы.

О бренде
«Красная Линия» — российский бренд уходовой косметики, основанный в 2001 году. Олин из первых заявил себя как бренд интимной гигиены.

Процесс создания ролика
Работа над роликом началась с анализа архивных материалов. Мы изучили оригинальные рекламные кампании бренда 2000-х годов, чтобы сохранить узнаваемую эстетику. Сценарий был разработан совместно с продакшн-студией ЦЕХ — московской компанией, специализирующейся на традиционном кинго продакшене. Нина Ведмицкая (креативный продюсер) и Евгений Селезнёв (режиссёр) предложили концепцию, сочетающую ретро-стилистику с современными визуальными решениями.

Этапы производства:
Подготовка материалов: создано 600 статичных изображений для раскадровки, использовались Flux, Flux context, GPT image, Firefly
Генерация видео: использованы 6 нейросетей (Runway, Kling, Hailuoai, Wan, Seedance, Pika)
Постпродакшн:
Апскейл в Topaz Studio (увеличение разрешения без потери качества)
Монтаж и анимационные правки в After Effects
Цветокоррекция в DaVinci Resolve


Особое внимание уделено сохранению фирменного цвета бренда — красного, который присутствует в 87% кадров ролика.


Нейрорежиссура: технологический подход
В рамках проекта мы протестировали гипотезу о возможности полного контроля над нейросетевой генерацией через:
Детальные текстовые промпты с указанием цветовых палитр (Pantone 18-1664 TPX для фирменного красного)
Послойную генерацию элементов
Ручную коррекцию промежуточных результатов
Этот метод позволил достичь полного соответствия исходному сценарию при генерации, что значительно выше средних показателей по отрасли.

Технические детали
Общий объём обработанных данных: 4.2 ТБ
Среднее время генерации 1 секунды видео: 1,5 часа
Количество итераций правок: 17
Общее время работы над проектом: 28 дней

Значение проекта

Это первый в России коммерческий рекламный ролик для косметического бренда, созданный без участия традиционной видеосъёмки.

Проект демонстрирует:
Возможность сохранения брендинга при переходе на цифровые методы производства
Экономическую эффективность: бюджет проекта на 80% ниже стандартного для подобных кампаний
Новый подход к креативному контролю в условиях использования ИИ
Работа над роликом проходила в тесном сотрудничестве с командой «Красной Линии» и площадкой Russcosmetics, что позволило учесть все требования бренда на этапе производства.

@cgevent

Читать полностью…

Метаверсище и ИИще

Нейропрожарка

И снова Михаил, автор бобров судьбы.

Пол-года назад я уже выкладывал здесь свое панк-рубилово про бобров, помню, зашло хорошо. /channel/cgevent/10496

  Сегодняшнее видео старался делать так же - с акцентом на высокую эмоциональность подачи, но оно взрослее, больше смыслов и символов. В целом, это все так же - промо для моего бренда одежды
www.sanbenito.ru, а, точнее, одного из предметов коллекции - мощного серебряного креста "Катехон", украшенного россыпью колотых бриллиантов. Музыка - Suno 4.5pro, детали сценария - с помощью Chat Gpt, видео и саунд эффекты - Veo3, монтаж CapCut. Все вместе заняло 3 дня: первый день - музыка, второй - сценарий, третий - видеоряд и сборка. Основную часть времени этих дней я просто думал. ) Славные времена! Только сейчас пришло на ум, что где-то подсознательно, наверное, вдохновлялся старыми рекламными роликами Банка Империал из 90х

@cgevent

Читать полностью…

Метаверсище и ИИще

Нейропрожарка

The bell. Трейлер к фильму ужасов от Ксении.

Изначально подбирала шоты для другого коммерческого проекта, но захотелось собрать из них что-то свое.
Получился трейлер к несуществующему хоррор-фильму от несуществующих киностудий.

Идея, картинки и видео - я,
@imitation_of
Монтаж и саунд дизайн – Юра
@ai_beeing


Картинки - Imagen,
Видео Veo2 и Veo3, несколько шотов minimax
Звук - база бесплатных звуков, udio
Монтаж - Capcut

Денег затрачено на видео - 0, сделано на триалке AI Studio
По времени на все про все дня 4 работы двух человек по очереди.
Видео на ютубе
https://youtu.be/NmjDyzR7krw

@cgevent

Читать полностью…

Метаверсище и ИИще

О, наконец-то раскатили режим обучения. В том числе для free пользователей.Можно не просто заставить решить примеры или домашку сделать, но попросить объяснить и учебный материал подобрать. Имхо очень полезная штука для образования.
https://openai.com/index/chatgpt-study-mode/

Прикольно, что это не просто чуть улучшенный системный промпт, а прям обучающий режим:
- Метод Сократа с наводящими вопросами
- Объяснение от простого к сложному, с уменьшением когнитивной нагрузки
- Связь с разными предметами, развитие любознательности.

Предлагают:
1. Интерактивные подсказки и вопросы для активного участия.

2. Схематичные, легко читаемые разделы.

3. Персонализация уровня материала на основе навыков и предыдущих диалогов.

4. Проверочные задания с обратной связью.

5. Возможность включать и отключать режим в любой момент.
Нужно Study and Learn активировать. В мобильном приложении и в вебе уже работает. 

Попробовал на вопросе про квадратные уравнения, ну что ж... Онлайн-обучению будет несладко... А потом ещё и персонализацию по полной выкатят.

Читать полностью…

Метаверсище и ИИще

У Suno теперь свое радио.

Там периодически происходят голосования "что будем стримить?".

Пока побеждает босса нова.

https://suno.com/live-radio

@cgevent

Читать полностью…

Метаверсище и ИИще

TheInformation написали немного про GPT-5:

— один из ранних тестировщиков оценил невыпущенную модель «крайне положительно» и сказал, что она превосходит Claude Sonnet 4 при прямом сравнении ответов
— самый большой скачок стоит ожидать в программировании; OpenAI какое-то время находились в тени Anthropic, теперь нагонят и перегонят
— GPT-5 демонстрирует улучшения в ряде областей, включая точные науки, выполнение заданий для пользователей в их браузерах (выйдут ли новые Agent / Operator???) и письмо
— (ну и конечно не забываем новые модели на WebArena, одна из которых уж почти наверняка возьмёт топ-1 и с весомым отрывом)

Конечно, пока не увидим и не попробуем — говорить нечего, но напомню, что про GPT-4.5 TheInformation писали, что модель не выигрывала на внутренних сравнениях и OpenAI ожидали большего. А тут — лучше.

Готовы к запуску через пару недель? 👀

Читать полностью…

Метаверсище и ИИще

Lovart ChatCanvas

Еще один "креативный агент". Они только что вышли из закрытой беты в паблик. Есть бесплатный план и ежедневные кредиты, стартовый план от 19 долларов.
На входе пожирает все - фото, генератив, одежду, сумки (поглядите пример с Галь Гадот).
Дальше общается с вами в чате - и ну генерить все, что пожелаете.
Делает видео, голос, музику, вроде даже монтирует.
Этакий Рекрафт на стероидах LLM и агентности.
Поглядите повнимательнее.

https://www.lovart.ai/

@cgevent

Читать полностью…

Метаверсище и ИИще

Протестировал этот Waver на картинках (в дискорде).

Что-то с пальцами он совсем зажигает не по-децки.

Пойду потестирую видео.

@cgevent

Читать полностью…

Метаверсище и ИИще

Ну вот, придется Qwen-Image-Edit тестировать заново.

Разрабы нашли баг, залатали его и просят заново потестировать.

https://chat.qwen.ai/?inputFeature=image_edit

@cgevent

Читать полностью…

Метаверсище и ИИще

6. Были какие-то референсы?

МФ: Честно - никаких референсов. Всё из головы, наше видение. Главные референсы - это мы сами: я, Al Hadid и Мина, наша героиня. Важно было сделать нас максимально похожими на реальных людей.

7. Сколько стоило?

МФ: Бюджет - около 10,3 миллиона рублей. Это раз в пять дешевле, чем если б мы делали по старинке, с CGI и кучей техники. Нейросети сэкономили нам много денег на технике, декорациях и команде.

8. Итог: довольны?

МФ: Это реальный прорыв, хотя до идеала чуть-чуть не дотянули. Мы сделали первый в России клип с цифровыми двойниками, которые выглядят как живые, и всё за две недели вместо полугода. Наши нейросети, которые мы делали с ИИ-кластерами, дали нам что-то особенное - такого не сделаешь на готовых инструментах. Конечно, остались мелкие косяки - типа пальцев не того количества, но это ерунда. Я очень увлечен работой с ИИ в сфере генерации видео; этот инструмент открыл для меня безграничные возможности для творчества, о которых я на заре своей карьеры даже не мог мечтать. А клип мы уже отправили на несколько международных AI- фестивалей.

@cgevent

Читать полностью…

Метаверсище и ИИще

Qwen Edit супротив Nano banana супротив Flux Kontext Pro & Flux Kontext dev.


Prompt: Make the motorcycle pink and place it against a backdrop of a big city at night, brightly lit by large neon signs.

Banano - хорош!

@cgevent

Читать полностью…

Метаверсище и ИИще

Нейропрожарка

На сей раз от Довлатов Студио.

Трек “Бонд с кнопкой ‘Кухни’” — вайб возвращения домой, (но без уныния хрущевок)

Мы постарались отойти от буквального образа и сохранить чувство.
Дом — как тёплая мысль, а не плитка из 80-х. Место, где ты можешь быть самим собой, где тебя ждут.

🔹 Визуалы:
— генерили в Midjourney V7 с помощью Omni и Style Reference — всё через собственный профиль.
🔹 Видео:
— основа — Kling,
— пара фрагментов — Midjourney видео,
— один эпизод — через VEO.
🔹 Монтаж:
— всё собрано в Adobe Premiere Pro.

Процесс занял 5 дней.

🎬 Получилась короткая визуальная story — ты возвращаешься не просто в дом, а в состояние
.

@cgevent

Читать полностью…

Метаверсище и ИИще

Suno Studio!

Так, вот это уже интригует.

Хотя бы из за этого:

Multi-track creation.

Export to MIDI.

Если это настоящий мультитрек - где один трек == один инструмент, то это огнищенская бомба, которая просто уничтожит всех конкурентов.

Если нет - все равно бомба.

Я люблю Suno, они крутейшие.

Записацца в бету: http://suno.com/studio-waitlist

@cgevent

Читать полностью…

Метаверсище и ИИще

Метачка только что сделала ИИ, который знает, что будет делать ваш мозг еще до того, как вы нажмете кнопку воспроизведения видео, и для этого ему не нужно проводить ни одного сканирования мозга.

Они выпустили модель TRIBE, нейронную сеть с 1B параметров, которая предсказывает реакцию человеческого мозга на фильмы, анализируя видео, аудио и текст.

TRIBE анализирует видео, аудио и диалоги из фильмов, точно предсказывая, какие зоны мозга зрителя активизируются без какого-либо сканирования мозга.

После тренировки на испытуемых, просмотревших 80 часов телепередач и фильмов, искусственный интеллект правильно предсказал более половины моделей мозговой активности в 1000 областях мозга.

Лучше всего он работает в областях мозга, где сливаются зрение, звук и язык, превосходя на 30 % модели с одним чувством.

Система Meta также показала особую точность в лобных областях мозга, которые контролируют внимание, принятие решений и эмоциональную реакцию на контент.

В перспективе такая разработка предлагает новые формулы для максимизации внимания на нейронном уровне, что потенциально может сделать думскроллинг еще более аддиктивным.

Ещё раз, на входе видео. На выходе информация какие зоны мозга возбуждаются.
И да, мультимодальность воздействует сильнее.

https://github.com/facebookresearch/algonauts-2025

https://arxiv.org/abs/2507.22229

Контент, от которого нельзя оторваться. Писал об этом в фб лет 12 назад.

@cgevent

Читать полностью…

Метаверсище и ИИще

Это я по мнению Microsoft Copilot 3D.

Хотите больше подробностей, почитайте тут:

https://www.theverge.com/hands-on/756587/microsoft-copilot-3d-feature-hands-on

@cgevent

Читать полностью…

Метаверсище и ИИще

Быстрые утренние сводки с полей чата:
— (часто) не работает поиск, модель делает запрос, но не получает результатов. Видимо, сломалась часть бэкенда. Я с поиском сделал 1 сложный запрос, у меня отработало лучше o3 Pro и Perplexity Pro (кому интересно — вот ссылка).

— сотрудник OpenAI в твиттере написал, что роутер работает неправильно. Роутер — это часть системы, определяющая, на какую модель и как послать ваш запрос. Вероятно, запросы чаще отправляются на глупые модели (и/или может быть с неправильными параметрами).

— несмотря на то, что в UI написано "GPT-5", у некоторых всё ещё как будто бы отвечает GPT-4o: по крайней мере если спросить «что ты за модель», то именно такой ответ вы и услышите (или GPT-4.1). Я попробовал у себя 3 раза на русском языке, 2 на английском — модель супер-уверена, что она GPT-5 (но у меня и жалоб на качество нет). Кидайте в комментарии скриншоты чата, где при выбранной GPT-5 модель представляется какой-то другой.

— Даже Plus-пользователи с подпиской за $20 не понимают, на какую модель перенаправлен их запрос. С точки зрения среднего пользователя наверное и пофиг, но сейчас, когда хочется честного сравнения и понимания качества — непрозрачность и «простота» мешает. У части Plus-пользователей уже исчерпан лимит сообщений на Thinking-модель (или на обычную GPT-5), и им может отвечать условная GPT-5-mini, а они и не знают!

— У меня на Pro есть возможность вернуться на GPT-4.5 и o3 / o3 Pro, но у Plus пользователей, насколько я пониманию, нет: доступны только GPT-5. Это грустно :(

— Для бесплатных пользователей важно отметить, что контекст модели в ChatGPT всего 8000 токенов. В комментариях был занятный момент, когда поользователь скинул часть документации и код модели и попросил что-то написать, а она «как будто бы не видела, что я скинул». А она и вправду не видела! Но это никак и нигде не отображается.

— Ещё у меня закрадывается подозрение, что у Plus и Pro пользователей разные режимы Thinking у GPT-5. Выборка для суждений пока маленькая, но несколько проблем из комментариев и чата у меня просто не воспроизводятся — моя модель как будто бы «умнее»:код запускается с первого раза, UI лучше и деталей больше, нет глупых ошибок. Судить рано, и уж очень непрозрачны такие сравнения в силу описанных выше причин, но что есть, то есть.

TLDR: многие тесты вами в UI в первые часы и дни после выпуска могут оставить большее негативное впечатление, чем должны. Ждём стабилизации системы и фиксов всех проблемных мест.

Читать полностью…

Метаверсище и ИИще

А саму GPT-5 покажут завтра, в четверг, в восемь вечера по Москве.

Если это не шутка, конечно.

@cgevent

Читать полностью…

Метаверсище и ИИще

***AI o4 - вы что подумали?

А вот и нет! Чтобы вам жизнь медом не казалась, а нейминг от Альтмана тренировал вашу и без того короткую память, китайцы теперь тоже именуют модели как o4!!!!

В общем пост про XBAI o4 - еще одна LLM с открытым исходным кодом (Apache 2.0) от китайской лаборатории искусственного интеллекта. Китайцы клянуцца что:

XBai o4 ПОЛНОСТЬЮ превосходит в сложных рассуждениях (complex reasoning capabilities ) OpenAI-o3-mini в режиме Medium. См картинку.

Это модель на 32.8 миллиарда параметров, выпущенная китайцами из MetaStone AI, которые выпустили свою первую модель в марте - MetaStone-L1-7B, затем последовали MetaStone-S1 1.5B, 7B и 32B в июле, а теперь XBai o4 в августе.

В твитторах очень мало информации о MetaStone AI. В их документах указана связь с USTC, Университетом науки и техники Китая. Один из исследователей подтвердил, что их генеральный директор - выходец из KWAI. www.wenxiaobai.com указан как "официальный сайт", на который ведет ссылка из XBai-o4 README на GitHub.

Взрослые мальчики уже запустили модель на Маке и пишут, что впечатления чуть хуже, чем от Qwen3-Coder-30B-A3B-Instruct или GLM-4.5 Air.

Однако факт остается фактом, малоизвестные китайцы, просто, тихо и без понтов говяжих, выпускают модель за моделью, которые дышат в затылок приподразхайпленным монстрам с обеих сторон Тихого океана.

Фарш тут: https://huggingface.co/MetaStoneTec/XBai-o4
Код тут: https://github.com/MetaStone-AI/XBai-o4/

В LM Studio тоже заводится, требует 25 ГБ памяти для 6-бит версии.

@cgevent

Читать полностью…

Метаверсище и ИИще

Wan 2.2 почти смог в Икею.
1.5 часа на 4090 @ a14b t2v q8, 720p, 121frame, 20steps

Весы

@derplearning

Читать полностью…

Метаверсище и ИИще

Yandex B2B Tech открыла доступ к самой крупной языковой модели в российском облаке — Qwen3‑235B.

Модель поддерживает 119 языков, работает с длинным контекстом и справляется с задачами на уровне ведущих мировых решений.

Доступна через Yandex AI Studio — можно подключить по API или работать в интерфейсе без подготовки и инфраструктуры.

Подробнее — тут.

Реклама. ООО Яндекс.Облако. ИНН 7704458262

Читать полностью…

Метаверсище и ИИще

🚨 OpenAI готовится к запуску GPT-5 в августе — TheVerge

(также OpenAI пытается успеть выпустить свою открытую LRM до конца июля. Со слов источника, она будет сравнима с o3-mini)

UPD: также будет GPT-5-mini, доступная в ChatGPT и API, и nano, доступная только в API.
UPD 2: пока план на запуск GPT-5 в начале августа, но планы могут съехать

Читать полностью…

Метаверсище и ИИще

Генератор ИИ-музики Mureka сильно прокачался.

V7 работает на обновленном фреймворке MusiCoT (Music Chain-of-Thought).

Она сначала планирует полную музыкальную структуру - точно так же, как это делают кожаные.

И у них очень неплохие каверы, ремиксы, версии - можете загружать свои треки и получать, например, инструментал с том же настроении.

Также они прикрутили свой TTS - то есть просто озвучку текста голосом. С клонированием голосов, эмоциями и пр.

Ну то есть залезли на поляну 11labs.

Конкуренция - это отлично!

https://www.mureka.ai/home

@cgevent

Читать полностью…
Subscribe to a channel