Telegram-канал lovedeathtransformers - Love. Death. Transformers.: Unsorted

Love. Death. Transformers.

04 Oct 2024 12:46

Vikhr paper едет на Workshop emnlp!

А из-за того что все авторы очень русские никому не выдали визу)))

Читать полностью…

Love. Death. Transformers.

03 Oct 2024 17:44

touch the grass is all you need

Читать полностью…

Love. Death. Transformers.

03 Oct 2024 16:57

Blueberry оказалась Flux 1.1. Pro

Помните загадочную Blueberry, которая лидировала на text2image-арене? На ECCV выяснилось, что это была Flux 1.1 Pro от Black Forest Labs — об этом сообщил сооснователь компании Алекс Зауэр. Более того, по его словам, сегодня нас ждёт ещё один анонс, связанный с этой моделью.

CV Time

#YaECCV

Читать полностью…

Love. Death. Transformers.

03 Oct 2024 09:55

Натурализация выходов llm

С помощью DPO можно учить LLM генерировать LLM более натуральные тексты, для этого берем текст, нарезаем на куски, суммаризируем, затем генерируем "любой сеткой" кандидатов. Учим DPO где хороший текст это оригинал, а плохой это то что сетка родила.

Собственно у нас в Vikhr Models есть трек с Roleplay+Interpretability поэтому мы сгенерировали такой датасет на основе habr+picabuu+ficbook.

Ну и забыли заанонсить🫠

А вчера увидел пост у Ильи что ребята в комьюнити проделали аналогичную работу над книжками!

На основе книжек
Наш датасет на основе более разнообразного датамикса

Читать полностью…

Love. Death. Transformers.

02 Oct 2024 13:28

🧐 Портал в мир науки открывается по средам!

Уже 2 октября в 18:30 встречаемся в Reading Club, чтобы обсудить новую порцию научных прорывов из мира AI.

Гость: Карина Романова
TeamLead CoreLLM:recsys.
Отвечает за добавление текстовых и картиночных фичей в рекомендации Wildberries. Магистрантка AI Talent Hub.

➡️ Разберемся в новом подходе к интерпретации крупных языковых моделей на примере Claude Sonnet. Обсудим, как удалось их выявить, какие концепции формируются внутри модели и как это может улучшить безопасность и надежность ИИ в будущем.

🔖 статья: Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet

➡️ Зарегистрироваться
📹 Смотреть предыдущий выпуск

#ReadingClub #AITalentHub #NapoleonIT #ITMO

Читать полностью…

Love. Death. Transformers.

01 Oct 2024 15:56

Чёт какой то пиздец творится в Abby, всех уволили одним днём. Пока не понятно, по цвету паспорта или просто всю разработку.

Ребята в революте нанимают:
- Computer Vision
- Natural Language Processing
- Engineering
- Product Owners
pavel.nesterov@revolut.com

Если у вы имеетее дс вакансии, пишите в личку/ кидайте под пост и добавлю в сообщение

Читать полностью…

Love. Death. Transformers.

30 Sep 2024 17:12

зарабатывать на разводе бабок на комиссии, говорить что вы ИТ компания

Читать полностью…

Love. Death. Transformers.

29 Sep 2024 14:22

ищу хорошего сантехника в московской области, если можете пореферить в личку @alexwortega

Читать полностью…

Love. Death. Transformers.

29 Sep 2024 00:23

Ну и как вам новый voice mode? Я четвертый день не могу понять зачем оно.

Читать полностью…

Love. Death. Transformers.

27 Sep 2024 17:30

деплоить крипто-стратегию в пятницу

Читать полностью…

Love. Death. Transformers.

27 Sep 2024 11:33

Happy Petrov day

Читать полностью…

Love. Death. Transformers.

26 Sep 2024 16:01

почему мы назваем fp19 как tf32

Читать полностью…

Love. Death. Transformers.

26 Sep 2024 00:23

https://arxiv.org/abs/2409.15997

Если ваша ресерч лаба без аниме даже не зовите меня.

Читать полностью…

Love. Death. Transformers.

25 Sep 2024 22:29

https://huggingface.co/Vikhrmodels/Llama-3.2-3B-Instruct
https://huggingface.co/Vikhrmodels/Llama-3.2-1B-Instruct

https://huggingface.co/Vikhrmodels/Llama-3.2-1B
https://huggingface.co/Vikhrmodels/Llama-3.2-3B

Работаем братья

ЛЛАМА БУДУТ СВОБОДНЫ!

Читать полностью…

Love. Death. Transformers.

25 Sep 2024 17:07

Тут недавно MERA обновилась: /channel/hikonon/59
Я тут полез Сайгу залить. И знаете что? Оно до сих пор не работает. На этот раз про openai api написали в README, но сам скрипт положить... забыли? Вот тикет.

Читать полностью…

Love. Death. Transformers.

03 Oct 2024 18:07

Ребята из JetBrains тоже активно ищут Mlщиков всех видов вне рф, писать сюда @Voiaking

Umojo

ML инженеров для CV. И Тим лида для команды CV, вне рф

@Tanya_tepli

Читать полностью…

Love. Death. Transformers.

03 Oct 2024 16:57

Я был до последнего уверен что blueberry это dalle4 лол

Читать полностью…

Love. Death. Transformers.

03 Oct 2024 15:19

Учить что либо на более 10 нодах сложно. Уже начинает влиять топология кластера, падает MFU, отваливаются ноды и так далее, на лету выкидывать ноды из обучения сложно. Скорость интернета внутри датацентра одинаковая только в теории.
В целом любое массивное обучение на сотнях и тысячах нод это очень сложно, затратно и инженерно.

В первые вижу в паблике подробный блогпост про оптимизацию network level для обучения на 4к h100.

Блогпост

Читать полностью…

Love. Death. Transformers.

03 Oct 2024 06:07

Feels like a best management book ever

Читать полностью…

Love. Death. Transformers.

02 Oct 2024 09:36

Помните, писала, что у нас с коллегами приняли статью на COLM, но конференция в США и ни у кого из нас нет виз? Так вот, конференция 7-9 октября в Филадельфии, и мы все еще в поисках человека, который мог бы туда поехать и презентовать нашу статью😢

В том посте я писала, что нужно будет постоять рядом с нашим постером. Но теперь все немного сложнее: наша статья попала на oral (spotlight). То есть, нужно будет выйти зачитать доклад по нашей статье на 12 минут🌝 Текст и презентация доклада будут готовы.

Поэтому если вдруг вы или ваши коллеги едут на COLM, и готовы с этим нам помочь, напишите, пожалуйста, Лаиде. Вы очень-очень нам поможете!
(Я помню, что под предыдущим постом были люди, готовые помочь. Спасибо вам большое, что тогда откликнулись! Если вы все еще готовы помочь, будем очень рады)

Читать полностью…

Love. Death. Transformers.

30 Sep 2024 17:12

зарабатывать на разводе гоев на инвестиции, говорить что вы строите agi

Читать полностью…

Love. Death. Transformers.

29 Sep 2024 20:58

Попросили как-то админку квант барби провести урок математики в школе. Админка согласилась. После урока спрашивают, мол, что, как, были ли проблемы?
- Ну, был один школьник. Спрашивает, мол, что такое интеграл, а я в душе не ебу, что это такое.
- Ну, и как вы из ситуации вышли, как ответили?
- Я ответила уклончиво: мол, иди ка ты на хуй.

Читать полностью…

Love. Death. Transformers.

29 Sep 2024 12:08

Пол часа с хуем в день полезнее чем два часа митингов

Читать полностью…

Love. Death. Transformers.

27 Sep 2024 21:04

У EleutherAI вышел классный гайд по muP параметризации LLMок.

Для тех, кто не знает, muP – Maximal Update Parameterization – это серия статей, в которых Greg Yang (сейчас в xAI) развивает теорию параметризации глубоких сетей. Что-то вроде Neural Tangent Kernel или анализ сетей при помощи теории среднего поля, но с выводами более таргетированными на обучение сеточек градиентным спуском. Один из результатов – стабильная инциализация параметров сетей, которая позволяет избавиться от необходимости тюнить learning rate градиентного спуска.

В статье "Tensor Programs V: Tuning Large Neural Networks via Zero-Shot Hyperparameter Transfer" с ребятами из OpenAI Грег выводит методы инициализации трансформеров. Нужно сказать, что, скорее всего, в индустрии не все инициализируют веса по muP, всё-таки теория и практика отличаются на практике. Тем не менее, с muP для каждой части нейросети мы можем (хотя бы в теории) сказать, корректно ли она пропускает через себя градиенты. Градиентные ~~энергетические~~ блоки – бич многих глубоких сеток, и дебажить такое – сплошная головная боль.

Сам Грег предлагает начинать знакомиться с теорией со статьи "A Spectral Condition for Feature Learning", к чему мы с уважаемыми подписчиками и приступим. 🤓

Читать полностью…

Love. Death. Transformers.

27 Sep 2024 14:43

🔥 Новое пополнение в семействе вихрей!

⚡️ Vikhr-Llama-3.2-1B-Instruct — компактная и мощная языковая модель, созданная на базе Llama-3.2-1B, специально обученная на русскоязычном датасете GrandMaster-PRO-MAX. Её эффективность в 5 раз выше по сравнению с базовой моделью, и она идеально подходит для мобильных и слабых устройств, занимая всего до 3GB.

💡 Что нового?
- Инструктивная дообученная модель: разработана для русскоязычных задач
- Компактный размер: всего 1B параметров
- Мощь в компактности: работает на уровне более крупных моделей

🔗 Подробнее о наших моделях: Vikhrmodels/Vikhr-Llama-3.2-1B-Instruct

Коллектив авторов: @LakoMoorDev @nlpwanderer

Читать полностью…

Love. Death. Transformers.

26 Sep 2024 16:06

почему никто не ресерчит ебаные идеи для ресерча

Читать полностью…

Love. Death. Transformers.

26 Sep 2024 11:13

Залил Qwen 2.5 70B и Gemma-2 27B в ArenaHard. Я не сомневался, что они хороши, но каким-то загадочным образом Квен обошёл Соннет. У меня 2 версии:
1) GPT-4 не любит Клоды, а он там судья.
2) Бейзлайн (gpt-3.5) уже слишком плох и мешает различать хорошие модели.

Весь замер с моей стороны обошёлся в 20 центов. Я платил только за инференс самих моделей, суд оплачивает бенчмарк.

Читать полностью…

Love. Death. Transformers.

25 Sep 2024 22:36

https://huggingface.co/collections/unsloth/llama-32-all-versions-66f46afde4ca573864321a22 алол уже unsloth перезалили

Читать полностью…

Love. Death. Transformers.

25 Sep 2024 19:44

Welcome to the future motherfuckera

Release llama3.2

Читать полностью…

Love. Death. Transformers.

25 Sep 2024 12:24

хотите агента который смотрит в прошлое?

messages +=[message]

мемы порождены этой репой, если вы первый день трогаете питон может быть стоит(не стоит)

Читать полностью…