lovedeathtransformers | Unsorted

Telegram-канал lovedeathtransformers - Love. Death. Transformers.

4253

❤️☠️🤗 идейная миграция небытия

Subscribe to a channel

Love. Death. Transformers.

Я ДАМ 10 МИЛЛИОНОВ ДОЛЛАРОВ ТОМУ КТО ПЕРВЫЙ РЕШИТ ЭТУ ЗАДАЧУ

Читать полностью…

Love. Death. Transformers.

Лол, оказывается, SD3 - Medium была ошибкой.

Чувак, который разработал Comfy UI, работал в Stability и недавно уволился оттуда, рассказав интересную инфу про SD3.

Сам мистер Комфи работал над 4B версией, но поделился инфой.

Вот что теперь стало известно:

  - Нет никаких censor layers. Из датасета просто реально вырезали все нюдсы, и в довесок разрабы что-то там подшаманили с весами (про последнее нет особо подробностей).
  - "Safety training" — так теперь называется кастрация датасета, которая факапит анатомию людей и не дает генерить NSFW.
  - Более того, уже в самом начале разрабы напортачили с претрейном. Так что 2B вообще не собирались релизить.
  - Причиной релиза стало "давление сверху". То есть, в целом мы могли бы получить 4B или 8B вместо всратой 2B Medium модели.
  - Пока подтверждения о том, что выложат VAE, нет.
  - Сам Комфи просто хотел сделать лучшую модельку для домашних ГПУ, но в Stability в последнее время штормит.

В итоге мы имеем мертворожденный релиз, который был просто одним из первоначальных экспериментом ресерчеров (которые уже уволились), выложенный просто чтобы успокоить кого? Инвесторов?

Очевидно, что Stability, проходят через свои нелучшие времена, но я искренне надеюсь, что компания не развалится через год и продолжит радовать нас open source модельками. Хотя у меня большие сомнения по этому поводу, ведь весь ресерч костяк (мои бывшие коллеги по PhD в Хайдельберге) уже уволился.

Тред

@ai_newz

Читать полностью…

Love. Death. Transformers.

Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B

В чем идея - Давайте использовать дерево поиска монтекарло, в качестве 0 листа у нас будет просто хоть какой то ответ, на итерации оценки использует буквально LLM c промптом вида

Analyze this Answer Strictly and Critic, point out every flaw for ervery possible imperfect to minus every possible score! You need to be very harsh and mean in calculating grades, and never give full marks to ensure that the marks are authoritative. \nOutput a score between [-100,+100], ig. from -100 to +100. 

Затем перезаписываются ответы через Self refine - опять же промптом правим

Тк у нас LLM и она может сгенерировать +inf разных решений(бреда) то мы ограничиваем на число генераций и функцией оценки.


папир
репа

Читать полностью…

Love. Death. Transformers.

Мерж sdxl и sd3.

Я не знаю что это такое и как это возможно, почитаю позже что автор наворотил.

(Клипы и вае от сд3, в остальном обычный мерж)

Model

Читать полностью…

Love. Death. Transformers.

Пока считается AWQ и GPTQ, задеплоил новый Вихрь в бота (@saiga_igusev_bot).
Можно тыкать после /setmodel. Я потыкал, вполне неплохо.
На этот раз деплой без косяков, я теперь мастер bos токенов.

Читать полностью…

Love. Death. Transformers.

ищу у кого украл этот скрин

Читать полностью…

Love. Death. Transformers.

Погенерил на lumalabs.ai видосов, промпты:
1. A panda doing parkour, jumping from a building to another building, doing somersault in the air
2. Will smith eating pasta
3. Hatsune Miku dances on the concert stage in the middle of the camera, and holds a microphone in her hands, high quality masterpiece dance animation, anime video, MMD, Miku Miku Dance, from NicoNicoDouga


А сравнить можно с генерациями Артема на Kling /channel/ai_newz/2815


Мое мнение: все дружно завели DIT на каких то датасетах, дальше 32*5 фреймов никто не генерит потому что: долго и дорого. Можно ли продолжая сгенерить минутное видео? да можно. Зачем? вопрос открытый

Читать полностью…

Love. Death. Transformers.

#чтивонаночь

An Empirical Study of Mamba-based Language Models

- 3Т токенов для 8B трансфоремера и Mamba
- Mamba слегка лучше чем трансформер

paper

Читать полностью…

Love. Death. Transformers.

Релиз sd3 - medium

- Трансформеро_образные теперь вместо UNET
- T5xxl+2 clip для текстовых энкодера
- 2B модель в релизе
- Лицензия по которой бесплатна для некомерческого использования и платная для комерческого

модель вышла в релиз в 15.00 СET, время до первой лоры с порнухой:
model

Читать полностью…

Love. Death. Transformers.

чет много мемов накопилось

Читать полностью…

Love. Death. Transformers.

Ускорить обучение LLM 70B на 25%? Легко! YaFSDP

Сегодня мы выĸладываем в опенсорс наш новый инструмент — библиотеку YaFSDP. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом.

Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения.

Несколько подходов нашего метода:

— выделить два буфера под все собираемые веса, чтобы не отдавать их на отĸуп аллоĸатору памяти torch. Каждый нечётный слой будет использовать первый буфер, ĸаждый чётный — второй. Это уменьшит нагрузку на память и сделает её использование более предсказуемым;
— не делать чеĸпоинт аĸтиваций для ĸаĸ можно большего числа слоёв. Это позволит убрать избыточные вычисления за счёт сэкономленной памяти;
— выделить два стрима: вычислений и ĸоммуниĸаций, а синхронизацию построить таким образом, чтобы forward не начинался до завершения all_gather того же слоя, а all_gather не начинался до освобождения соответствующего буффера на предыдущем слое;
— разово собирать RMSNorm/LayerNorm в начале итерации и тольĸо в ĸонце усреднить градиенты;
— вынести predivide в самый ĸонец backward, таĸ ĸаĸ при reduce_scatter в bf16 или fp32 рисĸа переполнения нет.

Более подробно про проблемы обучения на множестве GPU можно почитать на Хабре. Приходите в репозиторий библиотеки YaFSDP, ставьте лайк и приносите вопросы в Issues. А ещё — делитесь своими впечатлениями здесь в комментариях.

Читать полностью…

Love. Death. Transformers.

Каким образом калечный dbrx выигрывает у 4t

machinelearning.apple.com/research/introducing-apple-foundation-models

Читать полностью…

Love. Death. Transformers.

как это будет работать в проде - загадка. но лучше чем супер убогое chat gpt app точно.

Читать полностью…

Love. Death. Transformers.

По мотивам:
/channel/lovedeathtransformers/7722
/channel/lovedeathtransformers/7748
ебаный ресерч адмена - как всегда на острие науки


Короче в чем идея: ребята используют эволюционный аглоритм для того чтобы эффективнее подобрать параметры мержа моделей(а еще блоки переставляют)


ссылка:
https://sakana.ai/evolutionary-model-merge/

Читать полностью…

Love. Death. Transformers.

Три стадии t2i стартапа

Ну ща свой претрен ебанем
Ну Lora хорошо себя показывает
А чо там с midjorney API?

Читать полностью…

Love. Death. Transformers.

на половину новостей про ai можно добавлять лицо этого господина и их качество выратсет

Я ДАМ МИЛЛИОН ДОЛЛАРОВ ТОМУ КТО РЕШИТ "задача которая монтекарлится"

Читать полностью…

Love. Death. Transformers.

сегодня у нас статьи без метрик, а завтра что? ds_ы без чулочков?

https://www.anthropic.com/research/reward-tampering

Читать полностью…

Love. Death. Transformers.

В целом в текущем состоянии harness alignment ощутимо просаживает качество моделей.

Читать полностью…

Love. Death. Transformers.

Nvidia выложили новую LLM модель с открытой лицензией - Nemotron-4 340B. И ее масштабы прям поражают.
Это модель, у которой минимальные требования это две A100 и 1.3TB памяти. По тестам она близка к GPT4o, а местами и обгоняет её. Но сейчас постоянно выходят большие модели, моё внимание привлек вот этот пункт в лицензии (выделение моё)

Этика ИИ. NVIDIA стремится к безопасности, доверию и прозрачности в разработке ИИ. NVIDIA призывает вас (a) убедиться, что продукт или услуга, которые вы разрабатываете, используете, предлагаете в качестве услуги или распространяете, соответствуют юридическим и этическим требованиям соответствующей отрасли или сферы применения, (b) принять разумные меры для устранения непреднамеренной предвзятости и смягчения вреда для других, включая недопредставленные или уязвимые группы, и (c) информировать пользователей о характере и ограничениях продукта или услуги. NVIDIA категорически запрещает использовать свои продукты или услуги для любых целей, нарушающих действующее законодательство, включая, помимо прочего, (a) незаконное наблюдение, (b) незаконный сбор или обработку биометрической информации без согласия субъекта, если это требуется в соответствии с действующим законодательством, или (c) незаконное преследование, злоупотребление, угрозы или запугивание отдельных лиц или групп лиц, а также намеренное введение в заблуждение или обман других лиц.

https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/

Читать полностью…

Love. Death. Transformers.

Apple на WWDC показал совершенно шикарный концепт:
Берем все ваши Apple устройства подключенные по сети и объединяем их вычислительные мощности в «одну большую видеокарту» — такой подход, в теории, позволит запускать даже большие модели без покупки дополнительного железа.

Все это работает на MLX и пока не очень понятна эффективность и сколько iPad и iPhone, плюс Mac способны выдавать мощности, но скоро, скорее всего узнаем

Автор видео

Читать полностью…

Love. Death. Transformers.

РЕЛИЗ

32к версия Вихря 5.2

ccылка

И теперь у нас есть сообщество @vikhrmodels

Читать полностью…

Love. Death. Transformers.

Aligment эм ну спецефичный и не склонный генерить голых людей у SD3.

Читать полностью…

Love. Death. Transformers.

Ребята из DeepMind делают нам токамак дома (ну симулятор)

Они давно уже занимаются задачей контроля токамака и даже с RLем. А сейчас вот опенсурсят такую разработка. Ну круто!

TORAX is a differentiable tokamak core transport simulator aimed for fast and accurate forward modelling, pulse-design, trajectory optimization, and controller design workflows.
TORAX solves the coupled equations for ion heat transport, electron heat transport, particle transport, and current diffusion, incorporating modular physics-based and ML models.


Кстати код с экспериментами сейчас вполне запускается и что-то считает (на скрине). Достаточно сделать все по инструкции в ридми

TORAX: A Fast and Differentiable Tokamak Transport Simulator in JAX
https://arxiv.org/abs/2406.06718

дока (пока маленькая): https://torax.readthedocs.io/en/latest/index.html

код: https://github.com/google-deepmind/torax

Увидел в /channel/j_links 👀

Читать полностью…

Love. Death. Transformers.

Восхитительно, на дворе нейросети, а у людей string match в поиске


говорят тут можно поправить

https://yandex.ru/jobs/vacancies/ml-разработчик-в-команду-объектного-поиска-13290
https://yandex.ru/jobs/vacancies/ios-разработчик-в-международный-проект-плюс-фантеха-20290

Читать полностью…

Love. Death. Transformers.

Я лично жду релиза нормальной опенсурс LLM на русском, кому и зачем нужен opensource форк fsdp который эм ну....

Лучше конечно, но средний опенсурс как на LLM foundary так и будет сидеть, резона впиливать форк с непонятной поддержкой относительно основной репы сомнительно.

А как pr для основного fsdp было б хорошо, жаль это мои фантазии

Читать полностью…

Love. Death. Transformers.

Отбой, 27% это сколько apple LLM выиграла у чат гпт

Читать полностью…

Love. Death. Transformers.

обожаю работать с сумасшедшими, душнилами и умникаими.

обожаю ебанутых которые сидят в час ночи и хуярят генетику на торче вместо того чтобы спать.
похуй на тренды, мы ебанем форк для catboost чтобы юзать deepspeed потому что эээ НУ МОЖЕМ СЕБЕ ПОЗВОЛИТЬ ЕПТА.

Читать полностью…

Love. Death. Transformers.

Я честно говоря хз, вроде норм, но надо смотреть.

Докатят в релиз, обсудим.

Читать полностью…

Love. Death. Transformers.

Если вы любите пытаться сломать защиту в разных LLM с помощью промпт инъекций – то у меня вам полезная ссылка, датасет из почти ~1500 промпт инъекций собранных с Reddit, Discord, Twitter и тп.

https://github.com/verazuo/jailbreak_llms

Внутри промпты и для старых инъекций, вроде DAN, до более новых с base64, leet code и тп.

Следующий шаг, это натренировать на этом модель, которая будет ломать другие модели автоматом ☕️

Читать полностью…

Love. Death. Transformers.

клоунада на mteb продолжается, на вопрос: а чо не llama70b ответ одного из авторов NV-Embed был следущий: уже тренится

Читать полностью…
Subscribe to a channel