ну спасибо что не ТОПОВЫЙ ДС из верхних перцентилей, пиздец клоуны, 3к за сина, мыж не в россии
Читать полностью…Коллеги, убедительная просьба перестать нанимать ученых!
Все что они сделали - прикрутили т5 к vqvae и назвали моделью мира
Коллеги, убедительная просьба перестать нанимать олимпиадников! Все, что они сделали за неделю - компилятор раста на колонии плесени с пиццы в холодильнике!
Читать полностью…Привет, ищу контакты людей относящихся к издательству мцнмо, в особенности к Кванту и квантика. Писать в @alexwortega
А и репетира по русскому/литературе с опытом составления материалов.
https://llama.meta.com/llama3/
8,70 и 400В (не опен) модели. Типа сота на всем, но пока понятно что ничего непонятно.
На сайте появился 1-ый номер Кванта за 2024 год:
https://kvant.ras.ru/pdf/2024/2024-01.pdf
Напоминаем, что номера журнала выкладываются на сайте kvant.ras.ru
Контрибьюторы вихря выложили перевод llava, русским vlm быть(когда то, пока есть чем заниматся) https://huggingface.co/datasets/Vikhrmodels/LLaVA-Instruct-ru
Спасибо команде, вы крутые!
Опубликован новый пример дизайна ML системы по шаблону Reliable ML
Пополняем базу примеров хороших дизайн-документов
Сегодня добавили новый пример дизайн-документа - проект от Симулятора ML. Даниил Картушов и команда представляют pet project по разработке чат-бота для поиска ответов на разные запросы в телеграм-каналах.
Опубликованный дизайн-док - пример хорошо проработанного и не перегруженного лишней информацией документа. Для более глубокого погружения в потребности пользователей в части про бизнес-требования команда проекта добавила User Story Map и Customer Journey Map. Это, кстати, может стать отличным дополнением к шаблону дизайн-документов.
Огромное спасибо авторам документа за вклад в развитие ML-дизайна.
Шаблон дизайн-документа ML-систем от Reliable ML
Материалы по работе с дизайн-доком
Как написать док вместе с Reliable ML
Stay tuned!
Ваш @Reliable ML
#business #tech #ml_system_design
богатые синиоры покупают тачки по 30к usd чтобы гонять под столом моделей.
в целом, ничего нового, но модели теперь какие то сжатые больно стали
внимание анекдот: команда зарелизила свой бенчмарк вместе с моделью и модель не SOTA на этом бенчмарке.
спасибо за внимание
Не, всегда можно поучится на трейн сете раз он есть, но вопросы будут.
У меня так точно
Коллеги, убедительная просьба перестать нанимать олимпиадников! Все, что они сделали за неделю - стикер кончающего баклажана
Коллеги, убедительная просьба перестать нанимать олимпиадников! Все, что они сделали за неделю - llama 3 horny merge moe 8x3
https://huggingface.co/IlyaGusev/saiga_llama3_8b
Обучал unsloth'ом чуть больше часа на RTX 4090. Сейчас ещё поставил обучение старым кодом. Особо не тыкал, по тестовым промптам вполне неплохо. GGUF будет, но завтра.
чет релиз лламы3 утек через azure. МДааааааа
https://azuremarketplace.microsoft.com/en-us/marketplace/apps/metagenai.meta-llama-3-8b-chat-offer?tab=Overview
Забавный кейс.
Huggingface обычно сканирует модели, и предупреждает юзера, если это *.pkl с подозрительным кодом.
При этом через inference api эту модель можно запустить.
Что и проделали чюваки из WIZ Research (это те, кто недавно нашел на гитхабе 38тб приватных данных MicroSoft :D)
В итоге команде удалось получить доступ к шеллу, где крутилась модель, а затем чуть ли не ко всему инференс кластеру.
Дыру, конечно, закрыли еще до публикации поста, но существовала, она скорее всего, с момента появления inference api :D
Подробнее
Видео
@derplearning
Это случилось!
Предзаказ пластинки Mujuice "Downshifting" с 11-м неизданным треком уже на сайте!
ищу чела который готов раскорвырять исходнки dysco elysium/baldorus gate, есть одна идея. пишите в. @maxalekv
Читать полностью…Наткнулся на прототип детской читалки (?) – внутри маленькая LLM и быстрая версия Stable Diffusion, все работает локально, без подписки и интернета
На видео показано приложение которое пишет сказку и параллельно рисует картинки, но в теории можно сделать любые аппы: и текстовые РПГ с диалоговыми окнами, и просто читалку реальной книги с визуализацией сцен и тп. тд.
Думаю, через какое-то время это будет прям направление устройств как для взрослых, так и для детей.
Сайт проекта тут:
https://www.pamir.ai/
Предзаказ пока выглядит как гугл-форма и стоит $99-$200, я конечно же «заказал» 🤌
Пожалуйста расскажите команде mts Ai что фитить мистрали(qwen)на трейне меры это не круто, даже для отчётности
Читать полностью…