13183
Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Lucy lawless as Warhammer 40k adepta sororitas
V2.2 vs v что там было до этого
Результат налицо!
Пока готовил материал для статьи, наткнулся в Твиттере на смешной пост про онлайн-игру.
Философы: Понимаешь ли, некоторые вещи фундаментально несравнимы по ценности, и это ведет к таким парадоксам, как...
Инженеры: поставь оценку Эло-рейтинга ЧЕМУ УГОДНО
Например, что вы оцените выше - Канта или мобильные телефоны (🙄 што?) ?
В общем, можно позалипать, а потом пойти посмотреть рейтинг - я с этого угарел)
Сайт: https://eloeverything.co/
Лидерборд вещей по Эло-рейтингу: https://eloeverything.co/leaderboard
Фотокамеры, работающие на ИИ-стимуляторах начали появляться тут и там
И вот еще одна версия «снимающая на Midjourney». У нее сразу есть пресеты! Камера фиксирует картинку, посылает команду discribe, а дальше генерирует как мы привыкли.
В отличие от прошлых известных экземпляров у этой есть большой дисплей и переключатель режима с заранее введёнными частями промта. Так можно сразу «снимать» генерировать картинку в нужном стиле.
Пока игрушка выглядит просто очаровательной, но думаю, скоро подобные приложения займут почетное место в наших телефонах, а пайплайн — в серьёзных кейсах. Потому то хорошее следование референсу и стиль часто все, что необходимо для работы. Пайплайн можно посмотреть по ссылке на Medium и попробовать сделать такую самому!
Кодеки новой эпохи: HEVC, AV1, VVC и нейросети
Хотя новые стандарты кодеков появляются каждые десять лет, все они основаны на пиксельной математике — манипулировании значениями отдельных пикселей в видеокадре для удаления информации, не важной для восприятия. Другие математические операции уменьшают объём данных после первоначального кодирования.
В новом поколении кодеков алгоритмы машинного обучения используются для анализа и понимания визуального содержания видео, выявления избыточных данных и более эффективного сжатия. Вместо написанных вручную алгоритмов тут применяют методы Software 2.0, основанные на обучении. Данная область развивается на протяжении десятилетий, но в последние годы получила сильный толчок.
Replica Studios сделала войс плагин для движков, позволяющий озвучивать внутриигровых персонажей и передавать голоса непосредственно в проекты. Кроме игровых движков, совместим также с Iclone, Omniverse, Roblox, Metahuman.
Цитата компании: "NPC, управляемые искусственным интеллектом, будут динамически реагировать на голос игрока в реальном времени. Персонажи будут менять свой диалог, эмоциональный тон и жесты тела в ответ на то, как игрок обращается к ним."
Демку можно скачать тут
Есть две книги, которые могут сильно повлиять на молодого человека 14 лет. "Властелин колец" и "Атлант расправил плечи". Одна - глупая нереалистичная сказка с инфантильными героями. Чтение и восторг от этой книги может привести к эмоциональной незрелости, уходу от реальности в мир фантазий и неспособности самостоятельно решать свои проблемы во взрослой жизни. В другой книге, конечно, есть орки...
Читать полностью…
Pros of Being an Orca:
1. Highly Adapted Marine Mammal: Orcas are well-adapted to their marine environment, possessing streamlined bodies, excellent swimming abilities, and the capacity to dive to great depths. These adaptations enable them to thrive in diverse aquatic ecosystems.
2. Social Cohesion: Orcas live in tightly-knit social groups called pods, which foster strong social bonds and cooperative behaviors. This social cohesion provides support, protection, and hunting advantages.
3. Ecological Role: Orcas are apex predators, playing a crucial role in maintaining the balance of marine ecosystems. Their presence helps regulate prey populations, contributing to the overall health and stability of the marine environment.
4. Long Lifespan: Orcas have a relatively long lifespan, with some individuals living up to 70 years or more. This extended lifespan allows for a greater accumulation of knowledge and experience within the pod.
5. Echolocation Abilities: Orcas possess highly developed echolocation abilities, enabling them to navigate, communicate, and locate prey in their underwater environment with great precision.
Cons of Being an Orca:
1. Limited Environmental Adaptability: Orcas are highly specialized marine mammals, adapted to specific oceanic environments. Their reliance
Тем временем варп прокрался на CVPR2023, лол.
Твит
Интересную нейронку показали разработчики Wayve (компания которая делает автопилот для машин):
GAIA-1 обучена на тексте, видео и действиях автомобиля (!) собранных в реальном мире, то есть это что-то вроде текст-в-видео, но только в рамках автовождения. Ну или нейронный GTA, только для ученых.
Интересным мне показалось это:
>Истинное чудо GAIA-1 заключается в ее способности проявлять генеративные правила, которые лежат в основе мира, в котором мы живем. Благодаря обширному обучению на разнообразных данных о вождении, наша модель синтезирует структуру и закономерности, присущие реальному миру, что позволяет ей генерировать удивительно реалистичные и разнообразные сцены вождения.
То есть модель, например, может предсказать, что будет в синтетическом мире, если резко остановиться, сделать 360-бублик на дороге, и тп. Все "участники" синтезированного мира будут реагировать соответственно.
Модель будут использовать для улучшения работы автопилота, и видимо именно благодаря этой задаче мы и приблизимся к нормальному генеративному кино (это мое мнение).
Анонс тут:
https://wayve.ai/thinking/introducing-gaia1/
Подорванная и оккупированная РФ Каховская ГЭС принесла очень много несчастья украинцам которые жили на территории затопления и рядом: нанесен непоправимый ущерб местной экологии, экономике и культурному наследию, уничтожены целые поселения. Там постоянно находят много погибших, и сердце кровью обливается когда читаешь истории волонтеров с мест затопления.
Я порывался уже пару раз написать в канал, на эту тему, но эмоциональные посты я стараюсь на вас не вываливать, пользы от них нет никому – все кому не все-равно, все помогают, кто как может.
Бессилие опустошает, отправка денег не помогает это исправить, поэтому я решил попробовать немного помочь культурному наследию Украины.
Есть такая украинская художница Полина Райко: она рисовала в жанре «наивного искусства», самоучка, стала художницей в 69 лет, а в 76 лет ее уже не стало. У нее грустная история жизни, почитать можно тут.
Ее дом-музей оказался в районе затопления, в Олешках, утрачены и работы, и фрески, и все что было. Учитывая что война все еще идет, а территория ее дома все еще под оккупацией, чудом будет если хоть что-то уцелеет.
Я собрал небольшой датасет на основе работ Полины Райко на стенах дома и натренировал специальный вид Lora который теперь каждый желающий может скачать, и подключить к любой модели Stable Diffusion, чтобы генерировать картинки в ее стиле, и дальше нести в массы культурное наследние Украины.
Скачать можно тут, инструкция там же.
И если вам хочется натренировать копирование стиля самому, то вот тут можно скачать датасет работ Полины Райко – я его обработал вручную, постаравшись замазать объекты мебели другой нейронкой, он не самого лучшего качества, но все что я смог собрать за пару часов гугления.
Копия дома также доступна в виде 360 видео.
Искусство бессмертно, нет войне 🕊️
Ох, свершилось. Кто-то наконец-то сделал виртуальную примерочную. И не кто-то, а Google.
Над этой проблемой бились долго, и много стартапов полегло. А тут взяли диффузию, на вход фото человека, виесто промто еще одно фото целевой одежды, джынь-брынь и готово! На выходе – человек, переодетый в заданную одежду.
Попробовать можно прямо в Google Shopping
Кстати, примерно 2.5 года назад гугл выпустил похожий продукт — виртуальную примерку помад.
А вот ещё подборка постов, где я писал про попытки сделать виртуальную примерку а помощью ГАНов (это технология для генерации картинок, которая была актуальна до прихода диффузионок). Можете проследить, как сильно результаты улучшились всего за 2 года:
/channel/ai_newz/60
/channel/ai_newz/694
/channel/ai_newz/733
/channel/ai_newz/914
Сайт проекта (CVPR 2023)
Блогпост
@ai_newz
Colab MusicGen с простым интерфейсом, но без очереди как на HuggingFace
После появления Mubert мы все ждали новых инструментов с генерацией музыки в опенсорсе. MusicGen классный релиз, но к нему непросто добраться на HF и возможности были ограничены, вариант без интерфейса тоже нравится не всем.
Можно вставлять мелодии как референс, можно генерировать до двух минут музыки.
Сгенерировала без референта славянскую фольклорную песню о любви, по-моему здорово и достаточно качественно вышло!
Инструкция по запуску тут
За ссылку спасибо St Laurent Jr
"To the moon" 🌝
А вот как реагирует рынок на всю эту мышиную возню с AI.
Я как-то зассал, когда всё начало падать в 2022 и на некоторое время перестал покупать тех стоки, если не считать, что я по уши в Мете сижу. Сейчас буду потихоньку возобновлять регулярные покупки избранных компаний.
@ai_newz
У Зума классный апдейт, который наверное все уже ждали лет 10 — теперь он может стенографировать и подытоживать целиком всю встречу давая краткую выжимку без кряхтений и скрипов стульев
https://news.zoom.us/zoom-iq-meeting-summary-chat-compose-free-trial/
Kandinsky 2.2
Благодаря более крупному картиночному энкодеру (CLIP-ViT-G) у нас получилось сильно забустить как качество генерации изображений, так и понимание текста. Веса и код уже в открытом доступе!
Хабр, colab, бот, сайт
Юзер: инпейтит без промпта
Любая популярная модель с CivitAI: женское полуобнаженное тело хочешь, да?
А текст-в-видео уже умеет в «Ведьму из Блер» по качеству – выше примеры генерации по запросу «найденные кадры ужаса» и тп.
Автор
GPT4 как в детских анекдотах:
Я не скажу тебе что на капче написано «overlook inquiry», даже не проси меня ☕️
Отсюда, это из тестов Bing Chatbot – для некоторых включили распознание картинок
А теперь к действительно важным вопросам
As an anthropologist describe pros and cons of being human compared to an orca
As an anthropologist, I can provide an analysis of the pros and cons of being human compared to an orca, also known as a killer whale. It's important to note that this comparison is based on our current understanding of these two species and their respective lifestyles.
Pros of Being Human:
1. Cognitive Abilities: Humans possess advanced cognitive abilities, including complex reasoning, language, and the capacity for abstract thought. These abilities allow us to create and manipulate tools, develop technology, and engage in various forms of intellectual and creative pursuits.
2. Social Structure: Human societies are highly complex, with intricate social structures that facilitate cooperation, coordination, and specialization. This enables us to form large communities, establish institutions, and engage in collaborative endeavors.
3. Technological Advancements: Humans have harnessed their cognitive abilities to develop sophisticated technologies, ranging from transportation and communication systems to medical advancements. These advancements have significantly improved our quality of life and our ability to adapt to diverse environments.
4. Cultural Diversity: Humans possess a rich cultural heritage characterized by diverse belief systems, customs, and practices. This cultural diversity fosters creativity, innovation, and the ability to adapt to various social and environmental challenges.
5. Versatile Diet: Humans have the ability to consume a wide range of foods due to their omnivorous nature. This versatility provides a higher level of dietary flexibility, which can be advantageous in terms of survival and adaptability.
Cons of Being Human:
1. Vulnerability to Diseases: Humans are susceptible to a wide range of diseases, both infectious and non-communicable. This vulnerability requires constant vigilance, healthcare infrastructure, and preventive measures to maintain health and well-being.
2. Existential Anxiety: Humans possess self-awareness and the ability to contemplate their existence, which can lead to existential anxieties and philosophical pondering about the meaning of life, mortality, and purpose.
3. Environmental Impact: Humans have a significant impact on the environment through their activities, including deforestation, pollution, and the depletion of natural resources. This impact can have long-lasting consequences for ecosystems and biodiversity.
4. Social Inequality: Despite the potential for social cooperation, human societies are also marked by social inequalities and disparities in access to resources, opportunities, and basic necessities. This inequality can lead to social unrest and injustices.
5. Emotional Complexity: While emotions can be seen as a strength, the emotional complexity of humans can also be a source of vulnerability. Humans can experience a wide range of emotions, including negative ones such as stress, anxiety, and depression, which can impact mental well-being.
минутка флюидной красоты - целиком на нейронках
в этой завораживающей анимации органично соединились два важных для меня элемента:
лора, обученная на кислотных флюидных картинках. рад поделиться ей на civitai
собственный аналог дефорума созданный с помощью Stable Houdini. он позволяет использовать Automatic1111 как движок генерации а все команды отправлять из Houdini.
нодами очень удобно и наглядно удалось собрать мощный сетап - он идеально подходит для 2д флюидной анимации и не только - гифки в комментах
сетапом тоже буду рад поделиться. и ваши лайки и репосты мотивируют меня поскорее подготовить файл и стрим на ютуб - о том как им пользоваться. всем любовь!
LoRa AcidFluid
Stable Houdini
@тоже_моушн
Midjourney показала польского «Гарри Поттера».
– Kurwa… After all this time?
– Always.
➡️r/ретранслятор⬅️
Произошел очередной отвал жепы башки на поприще ИИ-ассистентов!
Даем на входе видео с ютуба, скриншот из дискорда, и говорим: я вот дошел до этого шага на видео, покажи на скриншоте, куда мне кликать дальше.
Агенты ищут в видео кусок, описанный юзером, смотрят, что идет дальше, ищут нужный кусок скриншота.
Какой простор для оптимизации техподдержки, 99% работы которой сводится к совместному чтению уже существующих мануалов вместе с юзером.
Hold on to your jobs papers, what a time to be alive intensifies
Магия, да и только!
paper
tweet
Вот это новость от AMD! Как долго я этого ждал.
AMD наконец вступила в Deep Learning игру и показывает серьезную заявку пошатнуть монополию NVIDIA на рынке AI чипов.
Сегодня они представили новую видеокарту для обучения и инференса нейронных сетей — AMD MI300X.
Эта крошка вполне может тягаться с Nvidia H100.
Вот её характеристики:
— 192 Gb VRAM на одном чипе, (против 80Gb у H100, NVL версия не в счёт)
— 5.2Tb пропускная способность памяти (против 3.35 y H100)
— Бенчмарков по скорости пока нет, но одна Mi300X легко тянет 40B языковую модель Falcon в риалтайме (см на видео). Это первая видеокарта, которая вмещает модель такого размера полность в своей памяти.
Ещё (это очень важно) AMD договорились с Pytorch Foundation о том, что их софтовый стэк ROCm и все обновления будет поддерживаться и сразу запиливаться в Pytorch 2.0. То есть теперь гонять сети на картах AMD станет также легко как и на гпу от Nvidia! Это чудесные новости!
@ai_newz
«Но это же так удобно...»
Автор оригинала: riju-km
LEACE или Вечное сияние чистого разума LLM Edition
Ни для кого не секрет, что эти ваши Большие Языковые Модели (БЯМ :3), обученные на нефильтрованных интернетах, горазды рекомендовать юзерам всяческие рецепты приготовления РОСКОМНАДЗОР в домашних условиях, РОЗСКОМНАДЗОР, а также способы совершения РОСКОМНАДЗОР.
Тщетные попытки авторов этих моделей усмирить их пыл с помощью начальных промтов были играючи пресечены мастерами промта и чего-нибудь там еще. Фильтровать же датасеты было бы не очень разумно, потому что так можно и без данных остаться :D
В общем, умельцы из EleutherAI запилили LEACE (LEAst-squares Concept Erasure) - алгоритм, позволяющий выпиливать определенные концепты из LLM на лету, не затрагивая при этом остальные.
Так что больше никаких вам планов захвата парижу из подручных средств, но зато и без
I'm sorry, but I cannot fulfill that request. I am here to provide helpful and respectful information. If you have any other non-offensive questions or need assistance with something else, feel free to ask.Paper: https://arxiv.org/abs/2306.03819