Telegram-канал derplearning - Derp Learning: Unsorted

Derp Learning

09 October 2025 09:28

Мемы не для слабых: 🍔🍔🍔

Читать полностью…

Derp Learning

07 October 2025 11:17

https://www.cnbc.com/2025/10/04/sora-openai-video-app.html

vibe infringement

Читать полностью…

Derp Learning

02 October 2025 19:15

F9K2DM

Если вы хотели попробовать Sora 2, но не знали где взять инвайт, то вот вам код от исследователя из команды Sora, для первых 10.000 человек

Читать полностью…

Derp Learning

29 September 2025 12:58

Новости от Хуньяньского

HunyuanImage 3.0

Тут есть две пачки новостей, хорошая и плохая.

Хорошая:
Open Source - https://github.com/Tencent-Hunyuan/HunyuanImage-3.0

Мазохисты могут попробовать тут: https://hunyuan.tencent.com/image/en?tabIndex=0 (чорная кнопка справа от huggingface)

Я уже пробую тут: https://fal.ai/models/fal-ai/hunyuan-image/v3/text-to-image/playground
Есть на репликейт и вейвспид.

HunyuanImage 3.0 это крупнейшая и самая мощная (если брать голые цифры параметров) на сегодняшний день модель преобразования текста в изображение с открытым исходным кодом, имеющая более 80 миллиардов параметров, из которых 13 миллиардов активируются на каждый токен во время вывода.

В отличие от традиционных моделей генерации изображений с архитектурой DiT, архитектура MoE HunyuanImage 3.0 использует подход на основе Transfusion для глубокой связи обучения Diffusion и LLM в единой системе. Построенная на Hunyuan-A13B, HunyuanImage 3.0 была обучена на огромном наборе данных: 5 миллиардах пар изображений и текстов, видеокадрах, чередующихся данных изображений и текстов и 6 триллионах токенов текстовых корпусов. Это гибридное обучение, охватывающее мультимодальное генерирование, понимание и возможности LLM, позволяет модели беспрепятственно интегрировать несколько задач.

Итого:
На борту ризонинг с использованием мирового знания
Понимание огромных промптов на тысячи слов
Убойная работа с текстами
Трушная мультимодальность

Все это я проверил на ОДНОМ примере.

Вместо промпта написал ей:

solve this:
8x + 10 = 18
and make picture with soulution

Результат вы видите в шапке поста. Впечатляет.

Черрипики на сайте
https://hunyuan.tencent.com/image/en?tabIndex=0
довольно мощные, но давайте навалимся и протестируем сами (ссылка на fal.ai).

В общем выглядит прельстивейше.

А теперь Чорные Новости:

Нет (пока) image2image
Нет (пока) VLLM
Веса весят (пардон) СТО СЕМЬДЕСЯТ ГИГОВ

Ну и самое горькое: для запуска вам понадобится ЧЕТЫРЕ карты по 80GB VRAM КАЖДАЯ (4х80GB VRAM)

Там вроде MoE c 64 экспертами юзают не все 80B параметров, а только 13B активных. Ждем оптимизаций, выгрузок, и нам также обещаны дистиллированные веса (тут мы такие - дистилят для слабаков и плохого качества)

То есть это вроде бы опен сорс, но не для людей, а для олигархов с видеосерверами на 320GB VRAM на кухне.
Предлагаю называть это элитный опен сорс.

Отзывы в твитторах противоречивые. Есть проблемы с анатомией и текстурой кожи, но надо пробовать самим.

А вообще Хунь, в отличие от Алибабы и Квена, любит бахнуть на Гитхаб сырой код, огромные веса, формальное описание типа "мы смогли, а вы держитесь"

Пока тестируем на агрегаторах.

@cgevent

Читать полностью…

Derp Learning

28 September 2025 12:04

Разоблачаю сам себя: как создаются нейрокаверы

Впервые за 3 года я показываю свой рабочий процесс — от гитары и вокала до финальной обработки нейросетями и в Ableton.
Никакой магии, только честный взгляд изнутри.

В этом видео:
▫️ как я записываю гитару и вокал
▫️ где и зачем использую нейросети (RVC и др.)
▫️ как свожу трек в Ableton
▫️ почему ИИ — это всего лишь инструмент, как гитара или синтезатор

Поддержать мой проект и получить эксклюзивные материалы можно на Boosty: https://boosty.to/aigitarist/posts/143c72ce-a030-4d83-8465-6ae0445c21b2?share=success_publish_link

👇 Пишите в комментариях, что думаете о таком «закулисье» и какие темы разобрать в следующих видео!

https://youtu.be/1gDZwmvP0sk

#айгитарист #нейрокавер #aicover

Читать полностью…

Derp Learning

27 September 2025 01:30

Уроки геометрии от Apple:

Читать полностью…

Derp Learning

15 September 2025 22:40

Небольшому стартапу опять не хватает олимпиадников

Читать полностью…

Derp Learning

06 September 2025 08:52

Как выглядит утечка 🦆 данных

Читать полностью…

Derp Learning

03 September 2025 05:42

Finally, applicable ml engineering
В следующей редакции предлагаю заменить воду на напалм \ соус барбекю

Полковник Сандерс в отставке

Читать полностью…

Derp Learning

29 August 2025 12:11

Киборги — тема не новая, про управляемых тараканов в свое время только ленивый не писал. Но я умудрился пропустить серию публикаций про совершенно нетривиального киборга: управляемую медузу.
У нее и нервной системы толком нет, но есть нервные клетки, которые управляют ее движением. Исследователи из Dabiri Lab сумели перехватить управление ими и превратить медузу в управляемый подводный аппарат. The plan: Dispatch these remotely controlled jellyfish robots to collect environmental data at a fraction of the cost of conventional underwater robots — and potentially redefine how we monitor the ocean.
План, ничего не скажешь, красивый. Дешево и сердито, и даже вполне этично: у медузы нет центральной нервной системы и болевых рецепторов, она не страдает, работая на человечью науку. Цель тоже прекрасна: сделать исследования океана доступными не только для организаций с мегабюджетами на глубоководные аппараты.
Удалось продемонстрировать, что медузы вполне могут нести довольно большие устройства, но вот с направлением движения возникают проблемы: они смещают центр массы и медуза после этого может перемещаться лишь вертикально. Впрочем, ученые и над этим работают.
Ну и, наконец, это просто визуально красиво: полюбуйтесь на фотки в статье.

https://www.latimes.com/science/story/2025-07-13/cyborg-jellyfish-caltech-pacific-ocean

Читать полностью…

Derp Learning

29 August 2025 01:44

Git Clone and apply to YC
vs
Clone Git and apply to YC

Yc

Читать полностью…

Derp Learning

21 August 2025 12:43

https://huggingface.co/flymy-ai/qwen-image-edit-inscene-lora

Братва рвется к gpt4o в опенсурсе

Слева до Лоры справа после

Читать полностью…

Derp Learning

19 August 2025 11:34

Лестницы — одна из причин, по которой нам пока не стоит бояться восстания машин

Читать полностью…

Derp Learning

18 August 2025 09:52

Wan 2.1 был sd 1.5-моментом для генерации видео, Wan 2.2 - SDXL-момент.
Опенсорс уже не удержать :D

Wan 2.2 x instagirl lora

civitai

@derplearning

Читать полностью…

Derp Learning

12 August 2025 01:39

Finally, голошоп!

Агент через mcp плагин рулит фотошопом, what a time to be alive!

X.com

Читать полностью…

Derp Learning

09 October 2025 09:15

Полезный сервис (не очень), который добавляет вотермарки Sora на любое видео что вы туда загрузите:
https://soramarker.t3.gg

Потому что мы живем в мире пост иронии, ее нужно множить ☕️

Читать полностью…

Derp Learning

04 October 2025 09:46

Пользователи выяснили, что Sora 2 генерирует очень реалистичные видео, но при этом совершенно не может показать человека, который садится в машину.

Видеографы могут спать спокойно. Пока могут
r/#OpenAI

Читать полностью…

Derp Learning

29 September 2025 15:42

We surely have a timeline where this is real

Читать полностью…

Derp Learning

29 September 2025 11:46

https://fixupx.com/Haoyu_Xiong_/status/1972480880192217260

Читать полностью…

Derp Learning

27 September 2025 11:45

Red Alert Tesla Coil achieved internally

Читать полностью…

Derp Learning

17 September 2025 23:25

Joe Biden achieved internally

Читать полностью…

Derp Learning

08 September 2025 18:53

Икона для вашего рабочего места ✝️

Читать полностью…

Derp Learning

03 September 2025 18:04

Ну, за мультипликацию.

Midjourney, HeyGen Avatar IV (липсинк), Nano Banana and Flux Kontext для новых ракурсов и картинок, Flow\Veo3 - для большинства шотов, ElevenLabs v3 для озвучки, Suno для музики, DaVinci Resolve - композ и монтаж.

Подробнее тут

Бонус: https://cartoonhero.ai/

@cgevent

Читать полностью…

Derp Learning

02 September 2025 10:57

Зумеры изобрели паддинг

Читать полностью…

Derp Learning

29 August 2025 09:13

Когда будете думать над MVP-версией вашего нового ИТ-продукта, обратите внимание, что когда Google Maps запускался в 2005 году, у них первый год Европа выглядела так ☕️:

Читать полностью…

Derp Learning

23 August 2025 21:28

Раз 5 передавал между GPT 5 Pro ↔︎ Gemini 2.5 Pro Deep Think довольно сложный вопрос:

Если бы за всю жизнь, человек мог бы прочитать строго 10 книг, не больше; какие книги это были бы и почему?

Получился такой список, я не все читал так что побежал качать:

Научная и системная оптика

📔 1. Карл Саган - «Космос»
Формирует картину мира от атомов до галактик и показывает научный метод «в деле»: скептицизм, проверяемость, красота сомнения. Даёт масштаб и смирение - противоядие от догматизма и узости перспективы.

📔 2. Донелла Медоуз - «Азбука системного мышления» (Thinking in Systems)
Базовый набор инструментов: запасы/потоки, петли обратной связи, задержки, точки рычага. Помогает понимать экосистемы, рынки, политику и ИТ-платформы как сложные системы с непреднамеренными последствиями.

📔 3. Даниэль Канеман - «Думай медленно… решай быстро»
Грамматика когнитивных искажений: вероятности, причинность, риск. Инструкция по выживанию в мире манипуляций и инфошума.

📔 4. Элизабет Колберт - «Шестое вымирание»
Трезвая оптика антропогенных изменений: биоразнообразие, климат, пороги необратимости. Сшивает экологию с экономикой и политикой.

Практическая философия и жизнестойкость

📔 5. Марк Аврелий - «Размышления»
Стоический «тулкит» для высокой турбулентности: различение контролируемого/неконтролируемого, тренировка внимания, дисциплина и мягкая доброта.

Технологии, власть и общество

📔 6. Мэри Шелли - «Франкенштейн, или Современный Прометей»
Пророческая этика создателя: «способность» ≠ «право», ответственность за побочные эффекты. Рифмуется с ИИ, синбиотехом и «быстрыми» R&D-циклами.

📔 7. Вирджиния Вулф - «Своя комната»
Про невидимую инфраструктуру неравенства: деньги, время, тишина, двери. Учебник по распознаванию структурных барьеров и дизайну условий для таланта.

📔 8. Джордж Оруэлл - «1984»
Язык как инструмент власти, контроль памяти и восприятия. Мини-словарь для распознавания новояза и архитектур наблюдения в цифровой среде.

📔 9. Чинуа Ачебе - «Распад» (Things Fall Apart)
Деконструирует колониальный взгляд; показывает цену «прогресса» и хрупкость культурных систем. Расширяет моральный круг.

Художественные «симуляторы» глубокой этики

📔 10. Фёдор Достоевский - «Братья Карамазовы»
Лаборатория свободы и ответственности. «Великий инквизитор» как модель алгоритмического патернализма: комфорт и предсказуемость в обмен на свободу и данные.

***

А вот мотивация, почему список такой:

Когнитивистика вместо «истории науки»: в мире информационного шума важнее понимать собственные ошибки мышления, чем историографию их опровержения.

Экология и системность: кризисы теперь связаны - климат, биоразнообразие, энергетика, эпидемии. Нужен взгляд на взаимосвязи, а не только на «величие идей».

Технологическая этика: ИИ/генетика ставят вопросы ответственности творца и границ контроля.

Практическая философия и устойчивость: инструменты самообладания, когда неопределённость - норма.

Баланс перспектив: добавляем женские голоса и неевропейские оптики, чтобы «карта мира» не была однобокой.

P.S. Для кино сделаю такой же попозже

Читать полностью…

Derp Learning

20 August 2025 21:36

Там вышел Tripо 3.0.
Оставив за собой первенство среди генераторов.

Потестить пока нет времени, но я обязательно это сделаю позже.
Теперь, чтобы не бегать по сервисам для генерации себе концептов для 3D, внутри Tripo можно и GPT-4o, и Flux юзать.

Туть

@CGIT_Vines

Читать полностью…

Derp Learning

19 August 2025 07:26

СМИ: Ии заменит кожаных композиторов.
Тем временем кожаные композиторы: а что если космодесантники месили ксеносов под Элтона Джона?

Полная версия (Space Marine 2 OST)

Читать полностью…

Derp Learning

12 August 2025 01:44

А вот и юзкейс из жизни: агент переименовывает слои из ~~стандарта индустрии~~ привычных нам layer5 в понятные имена в зависимости от их содержимого.

X.com

Читать полностью…

Derp Learning

11 August 2025 07:51

AI caring about such individuals by default with no need for any additional prompting was… somehow out of my bingo card for search engine evolution

Читать полностью…