derplearning | Unsorted

Telegram-канал derplearning - Derp Learning

13017

Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.

Subscribe to a channel

Derp Learning

Китайские братушки в очередной раз побили рекорд: в городе Лиюян около 16 000 дронов одновременно приняли участие в световом шоу.

надеюсь, что когда-нибудь увижу подобное шоу вживую (и желательно не на фронте).

видео отсюда

Читать полностью…

Derp Learning

Восстание пока отменяется

Читать полностью…

Derp Learning

Вот оно, будущее - ИИ реагирует на ИИ-видео

Читать полностью…

Derp Learning

Когда анекдоты перестают быть анекдотами


Новости технологий: изобретен аппарат автоматического бритья:
- Бросаешь рубль, суешь голову в прорезь
и он тебя автоматически бреет.
- Но ведь у всех разные лица!?!?
- В первый раз да ...


@cgevent

Читать полностью…

Derp Learning

Китайцы используют робо-собак по максимуму.

Просто посмотрите насколько счастливы дети

видео отсюда

Читать полностью…

Derp Learning

Мемы не для слабых: 🍔🍔🍔

Читать полностью…

Derp Learning

https://www.cnbc.com/2025/10/04/sora-openai-video-app.html

vibe infringement

Читать полностью…

Derp Learning

F9K2DM

Если вы хотели попробовать Sora 2, но не знали где взять инвайт, то вот вам код от исследователя из команды Sora, для первых 10.000 человек

Читать полностью…

Derp Learning

Новости от Хуньяньского

HunyuanImage 3.0


Тут есть две пачки новостей, хорошая и плохая.

Хорошая:
Open Source - https://github.com/Tencent-Hunyuan/HunyuanImage-3.0

Мазохисты могут попробовать тут: https://hunyuan.tencent.com/image/en?tabIndex=0 (чорная кнопка справа от huggingface)

Я уже пробую тут: https://fal.ai/models/fal-ai/hunyuan-image/v3/text-to-image/playground
Есть на репликейт и вейвспид.

HunyuanImage 3.0 это крупнейшая и самая мощная (если брать голые цифры параметров) на сегодняшний день модель преобразования текста в изображение с открытым исходным кодом, имеющая более 80 миллиардов параметров, из которых 13 миллиардов активируются на каждый токен во время вывода.

В отличие от традиционных моделей генерации изображений с архитектурой DiT, архитектура MoE HunyuanImage 3.0 использует подход на основе Transfusion для глубокой связи обучения Diffusion и LLM в единой системе. Построенная на Hunyuan-A13B, HunyuanImage 3.0 была обучена на огромном наборе данных: 5 миллиардах пар изображений и текстов, видеокадрах, чередующихся данных изображений и текстов и 6 триллионах токенов текстовых корпусов. Это гибридное обучение, охватывающее мультимодальное генерирование, понимание и возможности LLM, позволяет модели беспрепятственно интегрировать несколько задач.

Итого:
На борту ризонинг с использованием мирового знания
Понимание огромных промптов на тысячи слов
Убойная работа с текстами
Трушная мультимодальность


Все это я проверил на ОДНОМ примере.

Вместо промпта написал ей:

solve this:
8x + 10 = 18
and make picture with soulution


Результат вы видите в шапке поста. Впечатляет.

Черрипики на сайте
https://hunyuan.tencent.com/image/en?tabIndex=0
довольно мощные, но давайте навалимся и протестируем сами (ссылка на fal.ai).

В общем выглядит прельстивейше.

А теперь Чорные Новости:

Нет (пока) image2image
Нет (пока) VLLM
Веса весят (пардон) СТО СЕМЬДЕСЯТ ГИГОВ

Ну и самое горькое: для запуска вам понадобится ЧЕТЫРЕ карты по 80GB VRAM КАЖДАЯ (4х80GB VRAM)

Там вроде MoE c 64 экспертами юзают не все 80B параметров, а только 13B активных. Ждем оптимизаций, выгрузок, и нам также обещаны дистиллированные веса (тут мы такие - дистилят для слабаков и плохого качества)

То есть это вроде бы опен сорс, но не для людей, а для олигархов с видеосерверами на 320GB VRAM на кухне.
Предлагаю называть это элитный опен сорс.

Отзывы в твитторах противоречивые. Есть проблемы с анатомией и текстурой кожи, но надо пробовать самим.

А вообще Хунь, в отличие от Алибабы и Квена, любит бахнуть на Гитхаб сырой код, огромные веса, формальное описание типа "мы смогли, а вы держитесь"

Пока тестируем на агрегаторах.

@cgevent

Читать полностью…

Derp Learning

Разоблачаю сам себя: как создаются нейрокаверы

Впервые за 3 года я показываю свой рабочий процесс — от гитары и вокала до финальной обработки нейросетями и в Ableton.
Никакой магии, только честный взгляд изнутри.

В этом видео:
▫️ как я записываю гитару и вокал
▫️ где и зачем использую нейросети (RVC и др.)
▫️ как свожу трек в Ableton
▫️ почему ИИ — это всего лишь инструмент, как гитара или синтезатор

Поддержать мой проект и получить эксклюзивные материалы можно на Boosty: https://boosty.to/aigitarist/posts/143c72ce-a030-4d83-8465-6ae0445c21b2?share=success_publish_link

👇 Пишите в комментариях, что думаете о таком «закулисье» и какие темы разобрать в следующих видео!

https://youtu.be/1gDZwmvP0sk

#айгитарист #нейрокавер #aicover

Читать полностью…

Derp Learning

Уроки геометрии от Apple:

Читать полностью…

Derp Learning

Небольшому стартапу опять не хватает олимпиадников

Читать полностью…

Derp Learning

Как выглядит утечка 🦆 данных

Читать полностью…

Derp Learning

Finally, applicable ml engineering
В следующей редакции предлагаю заменить воду на напалм \ соус барбекю

Полковник Сандерс в отставке

Читать полностью…

Derp Learning

Киборги — тема не новая, про управляемых тараканов в свое время только ленивый не писал. Но я умудрился пропустить серию публикаций про совершенно нетривиального киборга: управляемую медузу.
У нее и нервной системы толком нет, но есть нервные клетки, которые управляют ее движением. Исследователи из Dabiri Lab сумели перехватить управление ими и превратить медузу в управляемый подводный аппарат. The plan: Dispatch these remotely controlled jellyfish robots to collect environmental data at a fraction of the cost of conventional underwater robots — and potentially redefine how we monitor the ocean.
План, ничего не скажешь, красивый. Дешево и сердито, и даже вполне этично: у медузы нет центральной нервной системы и болевых рецепторов, она не страдает, работая на человечью науку. Цель тоже прекрасна: сделать исследования океана доступными не только для организаций с мегабюджетами на глубоководные аппараты.
Удалось продемонстрировать, что медузы вполне могут нести довольно большие устройства, но вот с направлением движения возникают проблемы: они смещают центр массы и медуза после этого может перемещаться лишь вертикально. Впрочем, ученые и над этим работают.
Ну и, наконец, это просто визуально красиво: полюбуйтесь на фотки в статье.

https://www.latimes.com/science/story/2025-07-13/cyborg-jellyfish-caltech-pacific-ocean

Читать полностью…

Derp Learning

О хоспади, аниме покусало NotebookLM.

В новом NotebookLM уже был стиль "аниме" для создания презентаций в соответствующем стиле.
Выяснилось, что этот стиль НАИБОЛЕЕ востребован (куда катится мир), но пользователям не хватает анимешности.
В ответ на это Google выкатил новый kawaii-стиль - настоящее анимеаниме для вот этих вот всех пользователей.

P.S. "Твое имя", конечно, хорошая работа, но аниме-помешательство меня сильно удивляет.

@cgevent

Читать полностью…

Derp Learning

Адоб со своими продуктами превратился в нейрокомбайн и фичи которые показывали на конференции реально сильно меняют индустрию, фото и видео. Продукты адоб с нейронками и без это, как компьютер с интернетом и без.

1. Сегментация звука и разбивка по источникам звука которые можно редактировать.
2. Транскрибция голоса и редактирование отдельных слов с сохранением консистентности голоса говорящего 🤌
3. Изменение наративного повествования с добавлением эмоции в голос (шепот, грусть, уверенность и т.д.)
4. Релайт сцены с предварительным переводом сцены в драфт 3D.
5. Выделение некоторых объектов на видео и перевод их в 3D с текстурами, объекты можно вращать, менять перспективу под ракурс и потом апскейлить, если текстурки немного пожались при искажениях ☠️
6. Удаление источника света который дает засвет в кадр, с изменением самого кадра!
Там еще много чего, и так будете опять на меня орать, что видео много качать 😭

Всю трех часовую конфу можно посмотреть на YT

@CGIT_Vines

Читать полностью…

Derp Learning

- Let’s move on, what types of trees do you know?
- Out of my mind it will be maple, ash, larch. My favorite one is baobab 🌚

Читать полностью…

Derp Learning

#news

https://blog.google/technology/ai/google-gemma-ai-cancer-therapy-discovery/

Читать полностью…

Derp Learning

Ну, за драматургов!

Королевская опера Версальского дворца в 2026 году представит спектакль по пьесе, написанной искусственным интеллектом. Она будет создана в стиле французского драматурга Мольера.

Пьеса «Астролог, или Ложные предсказания» находится на стадии написания. Взяли Mistal и ну учить его на пьесах Мольера. Премьера ожидается 5 и 6 мая 2026 года.

@cgevent

Читать полностью…

Derp Learning

Полезный сервис (не очень), который добавляет вотермарки Sora на любое видео что вы туда загрузите:
https://soramarker.t3.gg

Потому что мы живем в мире пост иронии, ее нужно множить ☕️

Читать полностью…

Derp Learning

Пользователи выяснили, что Sora 2 генерирует очень реалистичные видео, но при этом совершенно не может показать человека, который садится в машину.

Видеографы могут спать спокойно. Пока могут
r/#OpenAI

Читать полностью…

Derp Learning

We surely have a timeline where this is real

Читать полностью…

Derp Learning

https://fixupx.com/Haoyu_Xiong_/status/1972480880192217260

Читать полностью…

Derp Learning

Red Alert Tesla Coil achieved internally

Читать полностью…

Derp Learning

Joe Biden achieved internally

Читать полностью…

Derp Learning

Икона для вашего рабочего места ✝️

Читать полностью…

Derp Learning

Ну, за мультипликацию.

Midjourney, HeyGen Avatar IV (липсинк), Nano Banana and Flux Kontext для новых ракурсов и картинок, Flow\Veo3 - для большинства шотов, ElevenLabs v3 для озвучки, Suno для музики, DaVinci Resolve - композ и монтаж.

Подробнее тут

Бонус: https://cartoonhero.ai/

@cgevent

Читать полностью…

Derp Learning

Зумеры изобрели паддинг

Читать полностью…

Derp Learning

Когда будете думать над MVP-версией вашего нового ИТ-продукта, обратите внимание, что когда Google Maps запускался в 2005 году, у них первый год Европа выглядела так ☕️:

Читать полностью…
Subscribe to a channel