lovedeathtransformers | Unsorted

Telegram-канал lovedeathtransformers - Love. Death. Transformers.

4254

❤️☠️🤗 идейная миграция небытия

Subscribe to a channel

Love. Death. Transformers.

Что-то все модели выпускают, а от Mistral🇫🇷давно новостей не было. Сегодня они выпустили две модели, одна заточена на математику, другая — на написание кода.

MathΣtral — компактная модель размера 7B, по архитектуре эквивалентная ранним релизам компании. Её доучили на решение сложных математических задач, требующих комплексных, многосутпенчатых логических рассуждений.

На MMLU модель показывает прирост более чем в 10% в отдельных под-категориях, и целых 15% в элементарной математике, физических задачах старшей школы/колледжей и, внезапно, машинном обучении.

Модель справилась с 2мя задачами из 30 на American Invitational Mathematics Examination (AIME). Это второй из трёх этапов отбора команды на международную олимпиаду по математике в США — тут задачки уже поинтереснее, но всё ещё не как на финалах. Кажется, что 2 задачи это мало, но из моделей сопоставимого размера лишь китайский Qwen 2 7B тоже решает 2; большинство остальных — нуль.

Проценты решений задач других олимпиад можете увидеть на картинке

Модель уже доступна на HF (не торрент!). Её, кстати, делали совместно с Project Numina — это проект, члены которого также недавно выиграли соревнование AIMO по решению олимпиадных задач LLMками (писал тут). Там победное решение использовало DeepSeek Math 7B (вторая строчка в таблице). Так что при следующем запуске соревнования можно ожидать, что результат первого места ещё подскочит вверх — просто за счёт смены одной модели на другую, чуть более мощную.

Для справки: maj@16 означает, что модель независимо генерирует 16 решений на задачу, после чего проводится голосование большинством, и выбирается тот ответ, который чаще попадался. Важно понимать, что это не означает, что система даёт 16 ответов с 16 попыток — попытка одна, а maj позволяет выбрать один ответ, который модели кажется наиболее правильным.

Читать полностью…

Love. Death. Transformers.

Привет!

Немного цифр:
- 230 кандидаток и кандидатов
- 17 человек отобрали по итогу

Мы закончили летний набор стажеров, если вам написали - поздравляю!

К сожалению у нас нет физической возможности написать всем кого не выбрали, пока что это нулевой батч стажеров-контрибьюторов, но когда нибудь будет и второй.

Читать полностью…

Love. Death. Transformers.

honey, new mteb sota just dropped

MTEBen разнесли китайцы со своей stella на 1.5b параметров(чо там, декодер лучший энкодер нуну)

Учили с матрешкой(можно обрезать эмбеды) и с инструкциями.

папиры и данных нет, но есть модель и гитхаб с обещаниями

Читать полностью…

Love. Death. Transformers.

И на последок минутка world modelling_а

Читать полностью…

Love. Death. Transformers.

Симпатичная open source книжка DevOps for Data Science полезная для всех кто сисадминит и хочет развиваться в сторону дата инфраструктуры. Не охватывает платформы, охватывает большую часть фундаментальных вопросов. Полезное и для дата инженеров тоже.

Читать полностью…

Love. Death. Transformers.

Сидят научник и аспирант, название для статьи придумывают. Научник записывает:

Foundation multi-agent multiscale multimodal multitask language model

Аспирант: У нас в название статьи место есть, может чет про ai safety добавим?

Научник, прикидывая:
— Да не, хуйня какая-то получится

Читать полностью…

Love. Death. Transformers.

⚡️⚡️ Arxiv заблокируют в сентябре — об этом сообщает «Вестник науки.ру», ссылаясь на источник, близкий к администрации президента, который ссылается на тред на дваче⚡️⚡️

📍По информации источника, доступ к Arxiv получат только блогеры с аудиторией более 1000 человек и зарегистрированные в базе РКН, РПЦ, сдавшие ПЦР, у них будет возможность пересказывать содержание видеороликов статей после предваривательного согласования с АП

🤔 «Сейчас для нас главная задача — взять под контроль админов нишевых каналов с мемами про говно. А Arxiv мы прикроем тупо потому что папиры про llm заебали в рекомендациях"



По мотивам

Читать полностью…

Love. Death. Transformers.

Вот я юзаю LLMки и радуюсь. А ведь когда-то я сам обучал разные жосткие мл модели, читал научные статьи, но сейчас я вообще не шарю, что там под капотом бурлит.

Flan называют одной из важнейших работ по инструктивному обучению, где показали генерализацию и перенос знаний на diverse instructions tuning. Что это все значит? Сложна? Сложна?

Сегодня в 20 по мск, в 6PM по Лондону будет стрим на канале @lovedeathtransformers, где я буду задавать тупые вопросы в попытках хоть что-то понять. Присоединяйтесь 👩‍🏫

Читать полностью…

Love. Death. Transformers.

AI’s $600B Question

Если вы знакомы со мной достаточно давно - вы знаете мою позицию про GENAI и пузырь который раздувается.

Собственно ребята из sequoia capital тоже имеют глаза и калькулятор. И прямо сейчас есть проблема - в сумме должны зарабатывать 600B usd, а заработок сейчас 100 + нет четкого понимания а как вообще заработать сильно больше, точек где текущее поколение genai полезно не очень много по прежнему, но количество уволенных будет увеличиваться - переводчки duolingo и cheap assets makers - первые в этом ряду

Кину кости и скажу следующее: за этот год вы увидим лажовый релиз одного из крупных игроков(модели будут значительно хуже прошлой версии) и схлопнется средне крупная AI контора(leonardo, runway, pika ) на ваш вкус


Нашел свой старый пост /channel/lovedeathtransformers/4865 wiki

article

Читать полностью…

Love. Death. Transformers.

опубликовали топ-1 решение AIMO

https://www.kaggle.com/competitions/ai-mathematical-olympiad-prize/discussion/519303

Читать полностью…

Love. Death. Transformers.

Aesty: Pocket AI Stylist теперь в AppStore! 🎉😎

Релизнули аппку Aesty, которая поможет собрать образ с нуля или оценить уже готовый. Никаких абстрактных советов, только конкретные и прозрачные рекомендации 🫡

С чем поможем?
1️⃣ Как стилизовать: Оценим ваш лук и дадим советы, как его улучшить, основываясь на ваших предпочтениях.
2️⃣ Персональные рекомендации: Покажем, какие цвета, бренды и вещи из вашего гардероба лучше всего соответствуют вашим запросам.
3️⃣Цифровой гардероб: Оцифруем вещи по любым фоткам, в том числе на человеке. Определим их стили и сезон.

Го тестить и скорить аутфиты! 🏄
Промик EARLYBIRD на первые 2 недели с премиумом!

Читать полностью…

Love. Death. Transformers.

накидайте реакций если надо стрим про FLAN, на 100 думаю на 200 делаю

Читать полностью…

Love. Death. Transformers.

Сегодня вечером пьем Aleksandrovic Chardonnay 2022 и перечитыаем Flan - одна из важнейших работ по инструктивному обучению.

В ней показали генерализацию и перенос знаний на diverse instructions tuning, а ещё ее делал стажёр (!!!)

А если вы в Белграде то заходите к друзьям из SlOJ - у них новое меню.

Статья

А слушаем крайний альбом Little Big Lobster popstar

Читать полностью…

Love. Death. Transformers.

Alignment what we deserve

Читать полностью…

Love. Death. Transformers.

Its world model if it hype enough2 - OpenVid-1M: A Large-Scale High-Quality Dataset
for Text-to-video Generation


Новая китайская бюджетная world model, 35к бачей на претрен, 1м пар видео-описание
Архитектурно это OpenSora с небольшими доработками, работает примерно так же(хуево), но учится на датасете в 50раз меньше.


model paper dataset

Читать полностью…

Love. Death. Transformers.

Model I’d Like to Finetune

Читать полностью…

Love. Death. Transformers.

Новый Вихрь 5.4

Базовый Вихрь 5той версии (мистраль) обученный на переведенных инструкциях и ответах GPT-4 и улучшенный с помощью ORPO на нашем внутреннем датасете.
Модель имеет довольно высокое разннобразие ответов, поэтому рекомендуется использовать temperature в рендже [0.1, 0.4].


HF PyTorch
HF GGUF

Читать полностью…

Love. Death. Transformers.

Если бы не ML-модели стоимостью в миллионы долларов, мы никогда бы не узнали как хотдог ест еду в китайском ресторане

Ave AI 🇻🇦

Читать полностью…

Love. Death. Transformers.

Кхм

КОД КРАСНЫЙ, КОД КРАСНЫЙ, AGI ACHIEVED EXTERNALY

Читать полностью…

Love. Death. Transformers.

Cо стороны подвала раздался крик postdoc_a - А как же, Ai safety for foundation multi-agent multiscale multimodal multitask language models !!!

Читать полностью…

Love. Death. Transformers.

Пост для вопросов

Ссылка на поддержку алкоголизма адмена, все деньги мы поделим поровну и пропьем.

Читать полностью…

Love. Death. Transformers.

господин @danokhlopkov будет ведущим, и как не DSный человек будет задовать вопросы

Читать полностью…

Love. Death. Transformers.

Эта пятница. 20 по москве. Стрим про флан.

Читать полностью…

Love. Death. Transformers.

Я к слову спиздел слегка, авторы используют majority voting для выбора лучшего.

Хочу новые форматы и хочу спать нормально.

А step DPO это личная хотела админа не у кого в реальности оно не работает офк, просто красивая идея.

А ну и sft ебет

Читать полностью…

Love. Death. Transformers.

Задача protein folding примерно такая - у нас есть аминокислоты, сами по себе мы умеем их определять и знаем, мы знаем их последовательность. Мы хотим предсказать как именно белок свернется, что позволит предсказать его свойства.


Тема далекая от меня, читайте материал про alphafold в частности тут


сидим болтаем в кофейне с челом из heidelberg university про protein folding.


вечер среды набирал обороты, а лед в матча бамбле таял на июльской жаре



Заходите к друзьям из rocket coffe они классные.

Читать полностью…

Love. Death. Transformers.

ЭЙ ПАРЕНЬ? ЧТО СИДИШЬ СЛОЖА РУКИ??? БЕРИ СВОЮ 3060 И БЕГИ ОБУЧАТЬ LLAMA MERGE ASUKA AYANMI RAY HORNY EDITION!!!!


а выяснить можно ли обучить такую модель достаточно воспользоваться

huggingface.co/spaces/Vokturz/can-it-run-llm


пост писался ради картинки

Читать полностью…

Love. Death. Transformers.

покупка nvidai a6000 это что то типа угадай мелодию поколение карты по охлаждению и турбине

Читать полностью…

Love. Death. Transformers.

К нам пришло много новых подписчиков — мы вас видим, привет! 👋

Для вас и для всех остальных — самый лаконичный дайджест: все актуальные вакансии из канала в одном посте. Только тайтл, локация, деньги. Все вилки — гросс в год, все контакты и подробности — в исходных постах. Поехали!

SWE, SRE:

1️⃣ Founding Engineer with system experience в Axiom. Remote, US hours, $150k-250k + доля 0.5-1%.

2️⃣ Core Rust Engineer with blockchain/system experience в NEAR. Remote, $200k-400k total.

3️⃣ Senior C++ Developer в Order Capital. Релокейт в Дубай, $180k-360k на руки(!) в среднем с бонусами + возможен профитшеринг. В посте было написано меньше, но вы верьте тому, что мы говорим сейчас.

4️⃣ System Architect в Noeon. Релокейт в Токио, $130k-200k + опционы.

5️⃣ Software Engineer with system/distributed experience в Databricks. Релокейт в Сербию, вилка-которую-нельзя-называть + опционы (очень много опционов!)

6️⃣ Search Engine Engineer в Perplexity. Релокейт в Лондон, $150k-250k + опционы.

7️⃣ Senior Rust Engineer в Aurora. Поста нет, а вакансия есть. Про саму Аврору мы писали, например, тут. Нужен опыт с L1-блокчейном и Rust. $140k-180k + токены. Расскажет @AlbinaMakarova.

8️⃣ SRE/SWE(Go) в инфра-команду Aurora. По ссылке — вакансия с уклоном в SRE примерно 80 на 20, но и зеркальная ей тоже существует! $80k-120k (вилка подросла!), ремоут.

9️⃣EA-aligned Software Engineer (middle) в BlueDot Impact. Релокейт в Лондон. Coming soon! Можете тихонько спросить в лс у @owlkov.


ML (Engineers, Researchers, Ops):

1️⃣ Data Engineer в Recraft. Релокейт в Лондон, $100k-145k + опционы.

2️⃣ Founding MLOps в Atla. Релокейт в Лондон, $200k–380k + норм доля.

3️⃣ ML Research Scientist в METR. Релок в US (Berkeley) без лотереи, $150k-365k, до 550k для супер-лида.

4️⃣ ML Engineer снова в METR. Тоже релок в Беркли без лотереи, тоже $150k-365k.

5️⃣LLM Engineer в Perplexity. Релокейт в Лондон, $150k-250k + опционы.

6️⃣ Research CV Engineers, Research Tech Lead в HeyGen. Можно ремоут из Европы, можно офис в США. $180k-300k + опционы.

7️⃣ Engineering Manager в FAR, AI safety лабораторию. Тут мы тоже не успели написать пост, но от вас нужно 2+ года лидерства техническими командами и опыт в разработке или ML. Ремоут ок, но лучше релокейт в Беркли, США, причём без лотереи! $125k-$250k+. Всё остальное можно узнать у @natmartem.


Quantitative Research:

1️⃣ Senior Quant в Order Capital. Дубай, $220k-360k в среднем с бонусами + профитшеринг.

2️⃣ Кванты всех уровней в NDA HFT. Кипр, джунам $100k-180k на руки(!) в среднем с бонусами, синьорам — больше. Спросите у @owlkov!

Читать полностью…

Love. Death. Transformers.

#чтивонаночь

Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Image Synthesis

Отличная китайская модель,

- 2.6b DIT, t5 xxl как text encoder
- много чистили данные с помощью VLM и дополнительно OCRили их
- обратите внимание что модель лучше с китайским работает

игратся
github
kolors.kuaishou.com

Читать полностью…

Love. Death. Transformers.

Привет!
Мы в лабараторию ебаного ресерча Vikhr models открываем летние стажировки
Что по задачам:

- Мержинг, стакинг, замеринг, эволюционка поверх LLM cтакинга
- собирать крутые инструкт сеты, у нас много gpt4 токенов, если хочется трогать руками RAG, агентность, function calling и прочие хайповые слова - велком!
- Учить Lora на разные задачи и трогать кучу очень интерсных задач (SPPO, DPO, KTO)
- Есть целых! 4v100 и к конце лета приедет а6000
- Собрать самые крутые и самые мемные бенчмарки😎
- развлекатся с vllm, быстрым инференсом и при желании строить опенсуср
- если вам хочется заводить свою шизо идею а на работе не дают - велком, мы сами такие

Оплата: в авторах на хабре, вероятно на arxiv, уникальный опыт(сорян денег реально нет, мы реально работаем на энтузиазме)

Скидывать cv, нюдсы, вопросы, ответы, предложения в: https://forms.gle/54BLnMMxZuNNboev6

Читать полностью…
Subscribe to a channel