не совсем моя эстетика, но чтобы напоминать о себе буду публиковать старые тесты. рефы к генерациям — плохо отсканированные документы с гербом на лицах
Читать полностью…ещё редкрафт — единственная на моей памяти модель, которая ок генерирует в настоящем векторе. и в разных стилях. ну норм.
Читать полностью…рекрафт правильно генерирует, даже если в запросе много русских слов: cтудия с евроремонтом, кудрово. двуспальная кровать с новым матрасом, раскладной диван, шкаф-купе с зеркальными дверцами. ламинат.
интересно, что за компанией стоит анна вероника дорогуш, которая работала в поиске яндекса. рекрафт понимает русскую эстетику иначе, чем миджорни. не скажу, что всегда лучше, но точно чувствует.
Читать полностью…прочекал флюкс про ультра рав
стоит шесть центов за картинку с разрешением 1792х2368, поэтому это для сверхбогатых
картинки 3 и 5 и 7 в подборке — мои кадры на сяоми в 20 лет, когда я перевернулся на блаблакар и автостопом добирался до казани. круто работать с реальными вещами через нейросети. можно делать автофикшн, но пикчами, как будто генерируешь событие заново во сне.
процесс: использовал несколько своих фотографий в режиме стилистических референсов + shot on xiaomi в промпте
кстати, в миджорни обновились коды для персонализации, поэтому модель лучше меня понимает. если кто-то не знает, нейросеть всегда скрытно улучшает и дописывает запросы, но с параметром --p учитывает вкус пользователя (после того, как он оценит 200+ картинок). чаще встречаю любимый кроп, естественность и странность.
разработчики миджорни говорили, что доработают эту фичу и ждут от неё многого. я бы сравнил это с алгоритмами спотифай или ютуба, но перспективы больше. это сделает нейросети аддиктивнее тиктока (чему рад т. к. станет проще деградировать и отвлекаться от жизни)
--v 6.1
я верю, что со временем миджорни превратится во что-то другое. гпт-3.5 обучали на тексте, а гпт-4o — ещё и на аудио с картинками, поэтому модель говорит живым человеческим голосом. сора лучше понимает физику из-за компьютерных симуляций воды, частиц и столкновений в датасете.
думаю, тут разработчики тоже догадались взять метахьюман, текстуры, разное 3д и 2д. можно загрузить тысячи рендеров фотореалистичной руки с сотней ракурсов и жестов, чтобы обучить нейросеть анатомии. как и люди, модели получают знания о мире из разных данных.
команда миджорни уже давно работает над 3д (как и над видео). не удивлюсь, если они сделают мультимодальную нейросеть, которая по кнопке поменяет ракурс у картинки или скопирует геометрию объектов. жду --v 7 почти настолько же сильно, как гпт-5.
фан-факт: я не накладывал текст — его сгенерировал миджорни вместе с картинками. в промпте я написал «big red text "..." on photo» с фразами и описанием сцены, ну и ещё засунул авангардистский плакат в качестве референса к ещё десятку пикч. исправлял совсем мало (только пару скучных ошибок)
Читать полностью…из-за санкций на сайте просто так не сгенерируешь картинку. дают ежедневно 50 бесплатных кредитов (нельзя в коммерции), а так картинка стоит четыре цента по апи и примерно один — по базовой подписке. дороже миджорни, ну и нет аналога релакса.
попробуйте по фану. моя ссылка, чтобы я получил чуть кредитов.. не реклама, просто рад видеть модель с русским вайбом + тестирую новый формат.
держите напоследок мем (я не понял).
с рекрафтом можно даже общаться. на запрос «2024 + 3 =» он выведет тот же текст вместе с 2027. всё это есть и у далл-и 3, но тот кринжовый по эстетике.
вот что можно получить на запросы расскажи шутку
и расскажи шутку о себе
.
рекрафт знает русский язык. вряд ли это автоперевод, скорее нативное понимание из-за архитектуры и датасета нейросети. фразу ладонь on the beach
генерирует как надо, а не с пальмой.
короче, модель говорит по-русски
.
прочекал рекрафт.
крутая модель. она получила высокий рейтинг в слепых тестах, но в отличие от флюкса у неё больше души. расскажу о ней.
потестировал клинг 1.5 и ни к чему не пришёл, но понял, что хочу скорее оказаться в 2025 году..
Читать полностью…выкладываю с мыслью: а зачем это вам, но мне забавно. когда я сфотографировал эту деревянную штуку неизвестного происхождения, не думал, что через два года сделаю из неё вот это. уважаю прогресс — даже самые тупые вещи могут стать приколом.
кому интересно, то вот секрет: character reference в миджорни + немного везения + подготовка самих референсов. были варианты ближе к оригинальным кадрам, но я намеренно взял те, где вижу что-то осмысленное в самом образе.
давно хотел показать эту функцию, потому что о ней как будто особо не знают. для хорошего результата лучше работать ещё со стилистическими референсами, перебирать разные картинки и экспериментировать с промптом (а ещё можно совместить несколько персонажей). вот ещё десять рандомных глупеньких пикч
Читать полностью…ребята, давно хочу сказать: в @pereulye я отбираю лучшие генерации, но много забавных или странных вещей лежат в черновиках месяцами. мне хочется этим делиться, так что я создал @transhive, куда буду без разбора всё закидывать (с ужасным шитпостингом). можно сказать, это такой мой патреон или бусти, только бесплатно.
подписываться необязательно, просто знайте.
пока что нейросети туповаты в анимации, поэтому я упростил задачу и трансформировал один объект на шахматной сетке. забавно, что фон остается нетронутым: наверняка это сработает и с зеленой подложкой, что по идее полезно для видеоэффектов или мемных шаблонов. без звука, но вы вообразите что-то магическое
Читать полностью…всю ночь тестировал новую функцию люмы, которая работает на основе двух ключевых кадров. загружал свои рандомные генерации. считаю, что это будущее дизайна и анимации, потому что такие неожиданные переходы человек делает редко.
я купил подписку, но можно попробовать бесплатно на сайте люмалабс (5 штук в день, 30 штук в месяц). пока что криво, но это только начало. ещё больше стану экспериментировать с ген-3: он вот-вот выйдет для всех в открытым доступе и прям близок к соре от опенаи.