13183
Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
А вот такое мы любим.
X-adapter для подключения controlnet, lora от 1.5 к сдохле
Код
За наводку спасибо a s
@derplearning
https://www.businessinsider.com/what-sam-altman-did-so-bad-he-got-fired-openai-2023-12
А вот и тизер второго сезона нашего любимого сериала!
Эсли кратко, то Сэма уволили без объявления войны предупреждения одним днём потому, что он был настолько расчётливым и манипулятивным, что успел бы дискредитировать всех участников борды, если бы его предупредили заранее.
Что ему и так удалось сделать пост-фактум, поэтому страшно представить, что было бы, если бы он знал ещё и заранее 😅
I don't know what GPT-5 will run on, but GPT-6 will run on
Читать полностью…
Работающая имплементация mixtral 8x7b в llama!
Первые робкие бенчмарки конкретно для этого кода на картинке выше.
Возможно, что-то ещё работает не так, но уже хотя бы работает. Ждём официальной имплементации и инструкций по запуску.
Для сравнения, Mistral-7b:
WinoGrande: 75.3%
Arc-c: 55.5%
Gsm8k: 52.1%
Код
Веса на hf
@derplearning
Рыночная оценка компаний вроде OpenAI должна равняться кол-ву параметров в их топовой модели. Запомните этот твит (с)
Читать полностью…
Марк Цукерберг показал технологию, которую использует чтобы выглядеть как обычный человек, которая позволяет в риалтайме на vr-очках показывать анимированный аватар, с учётом мимики лица и движения глаз, которые считывают vr-очки.
В основе лежит лайтовый меш лица, поверх которого рендерятся gaussian splats, причем для specular в том числе. Все это с динамическим освещением.
Говорят, моделировать мелкие детали и волосы так быстрее, чем существующими методами.
Интересно, быстрее ли это классического рендеринга.
Подробнее
Пдф
Не тому дали Ceo of the Year
Свен Винке на вручении Игры Года
Lego-режим уже доступен в Fortnite. Epic Games выпустили геймплейный трейлер к запуску серверов.
В этом режиме нужно исследовать открытый мир, собирать ресурсы, строить убежище и сражаться с мобами. Как там говорится, кхм, «Лицо Нотча представили?».
@zavtracast
Найдена редчайшая рукопись средневекового бестиария
@derplearning
Редкие кадры:
Разработчиков Gemini отпускают повидаться с родными после успешного релиза.
Офигеть, гугл Gemini релизнул
https://blog.google/technology/ai/google-gemini-ai/
На mmlu и mmmu лучше gpt4
gemeny nano будет запускаться на pixel8
TIL что силовая броня братства стали из недавнено тизера Fallout - костюмы, а не графоний.
По этому поводу держите средневековые картинки на тему.
Тизер
ChatGPT научился решать судоку
Месяц назад ему такое еще было не под силу. Bard от Google до сих пор не может 🧠
Real-World Humanoid Locomotion with Reinforcement Learning
Долгое время основной проблемой AI в робототехнике был Sim2Real Gap — разница между симуляцией и реальностью. Можно сколь угодно долго тренировать своих ботов в компьютере, но как только они сталкиваются с жесткой реальностью (типа отходняка в субботу) — мало что работает.
Исследователи из Berkeley показали невероятный результат — они смогли обучиться полностью в симуляции, а затем запустить нейронку на реальном роботе (1.6 метра/45 кг). И всё это end-2-end, без ручного программирования логики. Вы можете спросить: «так а чё, Boston Dynamics нас уже 10 лет таким развлекают?». Да, но у них долгое время вся логика была прописана вручную программистами, и это, как вы понимаете, плохо масштабируется. Обучение новому навыку может занимать год. А тут — всё сделано без вмешательства человека от начала и до конца. Это называется Zero-shot transfer (потому что с нулем дополнительных данных мы пренесли навык из симуляции).
Ключевых отличия от прошлых работ 2:
— масштаб сбора данных. Симуляция и обучение происходят на 4 GPU A100 (очень мало по современным меркам. GPT-4, по слухам, обучали на 25'000!) с помощью специального движка Nvidia IsaacGym, и в сутки генерируется больше 10 миллиардов попыток.
— как и принято в Deep Learning, все ручные эвристики убрали, и отдали на откуп Трансформеру: тот видит только состояние среды и действия из прошлого, и предсказывает, что нужно делать дальше (как GPT предсказывает следующее слово, так и этот — действия для конечностей). Никакого хардкода типа «если впереди ступеньки, то замедлись и подними ногу».
Вот вы читаете новость и радуетесь, а Джон Коннор сморит на вас из будущего с гримасой непонимания 😂😳
Boston Dynamics demos are getting to the next level!
Читать полностью…
Когда ты лифт, и тебя попросили поработать в выходные
Читать полностью…
Mistral 8x7b, 32k context length has just dropped!
magnet:?xt=urn:btih:5546272da9065eddeb6fcd7ffddeef5b75be79a7&dn=mixtral-8x7b-32kseqlen&tr=udp%3A%2F%2Fopentracker.i2p.rocks%3A6969%2Fannounce&tr=http%3A%2F%2Ftracker.openbittorrent.com%3A80%2Fannounce
Это очень смешно.
ChatGPT не хочет генерить картинки с персонажами, которые защищены копирайтом.
Но если принести ему записку от Сэма Альтмана, то сгенерит.
Когда-то давно такая фигня работала на продавщицах.
Приносишь им записку от родителей типа "0,5 охоты крепкой для меня, Васи, 63го года рождения" - и продавали.
С продавцами лазейку пофиксили небыстро, думаю с ИИ справятся гораздо быстрее.
garak - сканер уязвимостей LLM
Автор называет свое решение аналогом nmap (известный сетевой сканер) для LLM.
С помощью garak можно протестировать языковую модель на
* галлюцинации,
* утечки данных,
* промт инъекции,
* проверка на написание малвари и xss
https://docs.garak.ai/garak/
https://github.com/leondz/garak
Сатья, когда гугл выкатил новый продукт в прод, а не на кладбище проектов
Читать полностью…
В статье Гугла о Gemini 9 страниц с перечислением участников.
Последнее, что они видели:
Закрывайте эти ваши нейронки (и интернет вместе с ними)
(теперь и со звуком)
source
Коварные зефирки наступают, пока вы спите!
Сперто
MagicAnimate -
Temporally Consistent Human Image Animation using Diffusion Model
А вот и релиз подоспел, можно закрывать StableVideoDiffusion и animatediff (но это не точно, потому что тут тоже в базе UNet3DConditionModel).
Все еще ждем релиза AnimateAnything, который собственно и наделал хайпа с этими видосами :D
За наводку спасибо "a s"
𝕏 тред
🌐 сайт проекта
📄 пейпер
🧬 код
🦒 колаб
🤗 demo на hf
@derplearning
Welcome to Latent Land
Приятный видео-трибьют генеративному ИИ, где этого самого генеративного ИИ совсем немного.
reddit
behind the scenes