13183
Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Пока все ждут продолжения бразильского телесериала "бордмемберы тоже плачут", предлагаю почитать немного околоинсайдерской инфы про stability.ai, и про то, как Емад собирал $100млн под веб интерфейс для stable diffusion, при этом не владея никакой связанной с моделью интеллектуальной собственностью, и рассказывая, как они "co-created midjourney"
https://sifted.eu/articles/stability-ai-fundraise-leak
А ещё за последний год оттуда свалили 10 c-level\head\vp 😅 - тык
@derplearning
Никогда такого не было, и опять то же самое
Ed Newton-Rex, Директор по генеративному аудио stability.ai, покинул компанию из-за этических разногласий.
(Ну вы понели, потому что они, как обычно, тренили модели на данных, защищённых авторским правом)
Когда заказал c-level conflict in an AI startup на АлиЭкспресс
Сорс:
https://futurism.com/the-byte/stability-ai-music-executive-quits
(Количество каламбуров в статье зашкаливает)
Взрыв первой ступени с другого ракурса.
Киноделы, берите на заметку как должны выглядеть взрывы в космосе 😅
Yet another Matthew x Salesforce x Warp ad
https://youtu.be/4OHD4sqCE3w?si=v00psWRz5rSQ_-t6
OpenAI be like:
1. close new subs because of "the lack of compute"
2. wait for the hype to build up
3. increase the sub price for newcomers :D
4. ???
5. profit
Ну, попытки с 4й сненерил
A unique, asymmetrical flower with seven distinct petals, emphasizing its unconventional beauty. Each of the seven petals should be of a different size and shape, contributing to the flower's asymmetrical appearance. The petals are brightly colored, with a mix of hues that stand out against the flower's center, which is slightly off-center. The background is a blurred, natural setting with hints of greenery, focusing attention on the flower's unusual and striking form with exactly seven petals.
Админы других каналов: генерят пейзажи, натюрморты, в общем всякую красоту.
Я: что будет, если скрестить мангал с настольным футболом
Найден свитер, в котором нужно встречать новый год
В хачапури сердечком - в комментах
Увольнение Сэма из OpenAI
ШОК ВИДЕО СКАЧАТЬ БЕЗ СМС
source
Эти ваши околореалтаймовые img2img сервисы можно выкидывать, потому что для криты можно собрать то же самое с помощью плагина krita-ai-diffusion и пайплайна с LCM в ComfyUI
твит
@derplearning
Загружаешь скриншот — в ответ получаешь HTML/Tailwind/JS код.
GitHub тут. Работает на GPT-4 Vision API, поэтому нужен будет еще ключ.
Продолжаем рубрику "шлакоблокунь и его друзья". Что на картинке?
Читать полностью…
– Ну, я не уверен, но как эксперт могу предположить что код нейросети написан…
Хватит, – программист пьяно икнул и поморщился, – Хочешь я покажу тебе что такое midjorney на самом деле?
Он не без труда встал из-за стола и махнул рукой, призывая следовать за ним вглубь офиса.
– Мы идем к серверам? – не понял журналист и чуть было не завалился на повороте.
– Можно и так сказать.
Они прошли через незапертую сейфовую дверь и вошли в лифт. Программист два раза промахнулся мимо кнопки, по все таки справился.
– Ну? – он пьяно посмотрел на журналиста, – Думал когда-нибудь почему midjorney не умеет рисовать пальцы?!
– Конешн. Потому что мыслит паттернами а не цифрами!
– Неплохо, – программист уважительно кивнул, – А почему текст не умеет рисовать?
– Ну… Как-то так же… наверное?
– Ха! Вот тут ты и посыпался да? Ик! А где еще ты видел пример, чтобы не складывалось с пальцами и текстом?
– Не знаю, – признался журналист.
– Во сне!
Лифт остановился и программист вышел в сырой темный тоннель.
– Осторожно, тут скользко.
– И воняет.
– И воняет, – согласился он.
– Я чет не понял про сон, – опомнился журналист.
– Ты когда-нибудь пробовал во сне читать?
– Кажется нет.
– Попробуй – ниче не выйдет! Никогда. А если точнее, то ты ты сможешь понять смысл послания в записке, но если приглядишься к буквам – увидишь мутную крокозябру. Набор черточек, например. Это вообще бессмысленные палки, не буквы. А смотреть на свои руки во сне пытался?
– Нет.
– Попробуй! Увидишь мутный набор пальцев. То есть они как бы есть, но что-то с ними не так. Как и в миджорни. Паттерн есть, конкретного числа нет.
– Почему?
– Потому, что во сне области Брока и Вернике, – программист постучал себя по голове, – Практически неактивны. А они и отвечают за текст и математику. Понимаешь?
Программист открыл хлипкую дверь и вошел в темное сырое помещение. С его потолка свисал огромный кабель, нижний конец которого терялся в черной мутно жиже.
– При чем тут сон? Какая связь с нейросетью? – журналист пьяно размахивал руками, – Куда этот кабель ведет?
– Сон тут при том, что миджорни и есть он. Ну то есть этот вот кабель подключен к мозгу.
Журналист мгновенно протрезвел, оценил толщину кабеля, сильно превышающую размер человеческого туловища и уставился в воду.
– К мозгу чего? – спросил он ошарашенно.
– Ктулху.
– А?!
– Не ори. Ктулху, говорю. К мозгу спящего ктулху. Ну такой древний бог с щупальцами.
– Какого… Вы… Что за… Погоди! – журналиста осенило, – Но новая версия миджорни нормально рисует руки!
– Угу. Зона Вернике активизируется.
– То есть…
– Просыпается. Здорово, да?
Голосуем за автора тут
Gradio Custom Components
В gradio завезли кастомные компоненты!
Теперь можно еще более лучше городить кошмар ux дизайнера интерфейсы для этих ваших нейронок.
Карты, вращалки 3д-моделей, пдфки, галереи видео, аутпуты с маркдауном и хтмл - вот это вот все, и то, что вы сами наговнокодите!
Все это еще и полуавтоматически можно выгрузить как пакет в пакет с пакетами PyPi.
5-minute-guide
3d-model
video-gallery
rich-textbox
gradio-pdf
folium-maps
@derplearning
А это для тех, кто называет warp wrap'ом
Встречайте: wrapfusion!
Новая версия AutoChar и видеогайд!
Друзья, с радостью представляем вам AutoChar 0.9.5: улучшенную и исправленную версию скрипта для улучшения генераций в Stable Diffusion. Среди изменений как фиксы багов, так и полностью новые функции!
В новой версии вас ждут:
• Полностью переработанный интерфейс;
• Новая вкладка настроек Really Advanced Options для настоящих энтузиастов! Целиком контролируйте пайплайн генерации AutoChar, раскройте свои творческие способности и комбинируйте сильные стороны ваших моделей, меняя чекпоинты для каждого шага алгоритма!
• Нативный img2img режим: редактирование редактирование существующих изображений с SD-увеличением и автоматическим инпеинтом лица и глаз;
• Новые функции, позволяющие управлять не только качеством, но и логикой работы алгоритма.
Что по багфиксам:
• Исправлена печально известная ошибка с OpenCV на этапе инпеинта;
• Исправлена ошибка с inpaint padding'ом, что значительно улучшает результаты на некоторых стилях и чекпоинтах;
• Исправлен список апскейлеров для High-Res Fix: теперь он показывает все доступные апскейлеры, как и должно быть;
• Стили из меню стилей теперь работают правильно;
• Много мелких исправлений в логике кода и параметров.
Обязательно посмотрите наш гайд, объясняющий работу со скриптом и основные его функции (доступны русские субтитры):
https://www.youtube.com/watch?v=jNUMHtH1U6E
Для подробного ознакомления со скриптом посетите нашу страницу на CivitAI или GitHub:
https://civitai.com/models/95923
https://github.com/alexv0iceh/AutoChar
Ну, за курсы по блендору и техническую поддержку.
А в общем-то за любые курсы, инструкторов и вот эти вот проверки заданий, ответы на вопросы, живые, блин, созвоны, и все, что продается как ценность очередных курсов.
Вот вы же шарили экран на зум-созвонах? Ну или были в ситуации типа "покажи свой экран, я быстро скажу, что надо сделать".
Теперь вы просто можете пошарить свой экран с ИИ, и поговорить с ним об этом, голосом. Чем ИИ хуже кожаного?
Поглядите - на видео обобщенный Радж шарит свой экран с chatGPT и спрашивает голосом(!) самый главный вопрос трехмерщиков - как превратить кубик в шарик. В Блендоре.
Просто разговаривает с ним, делает, что ему говорят, спрашивает "ичодальше", получает ответы.
Я три месяца назад охреневал о того, как мне chatGPT рассказал за вечер, как перенести блендшейпы из майки в юнити и научил прикручивать слайдеры к деформации. А теперь это можно делать на совершенно другом уровне.
Явшоке.
P.S. Тут напрашивается сначала пост про то, что проще не только шарить экран, а сразу давать управление, пусть наведет порядок и превратит все кубики в шарики.
Ну и все идет в эту сторону, как сказал Билл Гейтс, у нас у всех в ухе будет ассистент, который будет шептать нам полезные ситуации в моменте.
А шарить с ним мы будем все, что с нами происходит.
Шаринг жизни, в общем.
А теперь, внимание, челлендж.
Вам надо нарисовать с помощью chatGPT и DALL·E 3 цветик-семицветик.
Цветок с семью лепестками. Ровно.
Все мои попытки провалились. Рисует либо 6, либо 8.
После генерации даже считает лепестки неправильно, если ему дать на вход его же картинку и попросить посчитать(к вопросу о когнитивных заблуждениях). Правильно считает только в новом чате (необусловленном собственным творчеством).
Я сделал в фотошопе семицветик, дал ему, считает лепестки правильно, воспроизводит неправильно.
Мы с Лешей К. убили вечер, но не смогли родить каменный семицветик. Леша умудрился сделать пятицветик (подвиг, я считаю).
В общем для вас это повод залипнуть в DALL·E 3.
Присылайте в коменты свои варианты и диалоги с chatGPT - он вас удивит.
P.S. В природе семицветиков почти нет. Есть очень редкий вид - седмичник. Либо DALL·E 3 просто не досталось изображений с седмичником, либо он жестко завязан на осевую и центральную симметрию. Пишите теории заговора в чат.
Никаких миджорней и Stable Diffusion с контронетами. Взламываем мозuи DALL·E 3
Большое спасибо подписчику Николаю за идею и наводку.
Art Evolutionist v0.1
Создал приложуху внутри ChatGPT, которая создает вариации вашего изображения.
Основано на ролике, где добавляя midjourney бота и создавая вариации одного и того же изображения люди доходили до безумно интересных вещей. LINK полного видео на английском, очень увлекательно и красиво.
В Dalle 3 пока такой возможности нет, делать ремиксы картинок(Например в Dalle 2 такой функционал присутствует) потому это пока аугментация с помощью рандомных слов и emoji. А так же нескольких стилей. Первая версия так сказать.
Функционал: Можно загрузить входную картинку или попросить сгенерировать рандомный начальный промпт/emoji, затем начинается ремикс, не больше двух картинок за генерацию, далее GPT попросит продолжить, это сделано чтобы чат не падал (хотя и при этих ограничениях часто падает).
У вас есть возможность сделать от 5 до 20 итераций. А если захотите остановиться, то просто попросите Grid, и в конце вам выведется грид картинок, которые получились.
Кому это подойдет?
Если вам нужно поиграться со стилями или сдивнуться с креативного тупика - этот чат поможет.
Если скучно и хотите поиграться и нагенерить красоты.
Попробовать тутЕсли есть ошибки или идеи как улучшить, пишите в комменты под постом.
Забавный ответ поучил пользователь GPT на запрос о создании блюпринта на UE:
"how do I get the normal between two 3d points in unreal blueprint"
По итогу чат выдал, кроме самого ответа, базу данных с логинами, паролями и ip адресами с сайта EA.com.
Дивный новый мир!
Сорс
Забавное с презентации OpenAI: если дообучить модель на сообщениях из Slack стартапа, то ассистент может отказаться что-то делать сейчас и ответит что сделает это завтра ☕️
Читать полностью…
Как создать агента (бота) за 1 минуту
Боты, они же агенты, это новые приложения! Вас точно порадует возможность создавать нужного бота без знания программирования.
Инструкция по созданию бота:
1. Перейти по ссылке
2. Написать свою идею бота
3. Скопировать код и заполнить по новой ссылке все поля
4. Подредактировать под себя, если есть желание.
5. Ваш уникальный бот готов!