Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
ИИ читает спикера за секунды, угадывая успех выступления по первым фразам.
Модели GPT и Gemini оценивают научный доклад уже после 15–60 слов — и попадают в точку.
До сих пор сверхвозможности больших языковых моделей мы видели в «текстовом океане» — когда нужно осмыслить миллиарды слов. Новая работа Michigan State University показала, что те же модели не менее точны в микромире: по первым двум-трем предложениям (≈ 1-5 % текста, меньше полуминуты речи) они с корреляцией 0,7 предсказывают, как доклад оценят живые эксперты.
Иными словами, ИИ выхватывает те самые сигналы, по которым мы подсознательно решаем: «слушать дальше или переключиться». Это приближает к эмпирической проверке популярного «7-second rule» Роджера Айлза (авторы уточняют: точное число секунд условно) - популярный постулат о публичных выступлениях, ораторском мастерстве и деловом общении:
«Слушатели (или собеседники) составляют первичное и часто стойкое мнение о спикере за первые семь секунд после его появления».
Ну за шрифтовых дизайнеров!
А заодно за векторизацию.
Идете в chatGPT (хоть в 4o, хоть в o4)
И говорите:
Design a type specimen sheet that clearly displays every character of the English alphabet and numerals in a clean, consistent layout. Include all uppercase letters (A–Z). Arrange them in a precise grid layout with ample vertical and horizontal padding to ensure no characters are cropped or cut off. Sort characters alphabetically and numerically in clearly defined rows or sections. [Use a cyberpunk] aesthetic with black glyphs on a white background. Ensure the typeface style is uniform across all characters, with sharp lines, balanced proportions, and ideal legibility for typography development. Explicitly render the following characters with full visibility and spacing: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Do not OCR picture, just trace inner and outer contours of every symbol and make svg file
" now fill letters with black, fill only space between inner and outer countour
- сделал скриншоты, могу скинуть SVG в коменты, если не верите.FLUX.1-dev-ControlNet-Union-Pro-2.0
Для гиков. Вышел новый(версия 2.0) ControlNet-Union-Pro-2.0 для Флюкса.
Меньший размер модели.
Пофиксили качество и управляемость.
Зачем-то убрали tile (говорят, что при обучении он сильно портил остальные режимы)
Фарш тут:
https://huggingface.co/Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro-2.0
В вот тут даже демо:
https://huggingface.co/spaces/Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro-2.0
Демо рабочее, вначале видно, что долго грузит модель, потом отрабатывает
Я взял мем, и попросил chatGPT 4o вынуть глубину из него (об этом серия постов) , а потом скормил это в новый контролНет. Вышло на удивление неплохо, с дофом.
Остальные картинки с их репо на хф.
@cgevent
Попросил Чатгпт поискать лоры по стилям. Штош, аги ачивд интерналли.
Читать полностью…Наконец-то кто-то решает проблему длительности генерации видео – вместо коротких сегментов сцена просто описывается длинным сценарием, где явно указаны начало и конец каждый сцены, и что в сцене должно происходить – на выходе у нас не Голливуд конечно, зато все в одном стиле и с теми же персонажами. Через полгодика, заживем, со всеми этими текст-в-видео
Код и другие примеры тут
Пример промпта который использовали в этом видео:
The World Trade Center towers stand tall against a clear, bright blue morning sky. Streets bustle with pedestrians in suits, and yellow taxis move slowly through heavy traffic. Sunlight reflects sharply from glass windows of nearby buildings. Tom, the blue-gray cat, walks briskly along the wide gray sidewalk with a single black briefcase in his hand.<end_scene>Читать полностью…
<start_scene>Inside the World Trade Center lobby, expansive marble floors reflect warm golden recessed lighting. Gray marble pillars and brass fixtures highlight the elegant entryway, along with a brass elevator door. A uniformed doorman wearing a dark navy-blue suit stands behind a polished wooden counter. Tom, the blue-gray cat, with a single black briefcase in his hand calmly walks in from the right and approaches the elevator doors. Tom's left hand is empty.
Inside the World Trade Center lobby, expansive marble floors reflect warm golden recessed lighting. Gray marble pillars and brass fixtures highlight the elegant entryway, along with a brass elevator door. A uniformed doorman wearing a dark navy-blue suit stands behind a polished wooden counter. Tom, the blue-gray cat, has a single black briefcase in his hand slowly presses the elevator button on the left side of the elevator and waits. Tom's left hand is empty.<end_scene>
И так еще 7 абзацев
по просьбе папищеков Семен Альтманов
жизнь без борды \ жизнь с бордой
Обставляем нашу квартиру с нейросетями
Короче, у нас достроилась и сдалась квартира в Москве
Мы планируем ее сдавать. Квартира с ремонтом
Я 2 месяца назад попросила дизайнера сделать нам подборку мебели для сдачи. Она сделала саму подборку, но не сделала визуализацию, потому что с визуализацией это стоило 100к
(сейчас я понимаю, что вообще можно было не платить даже за подборку, а просто самой сесть выбрать мебель)
Сегодня я взяла все фотки мебели из ее подборки с Озона / Диван ру, прикрепила план и фото квартиры и дала чату джипити задачу сделать визуализацию.
смотрите что получилось
По пути я поменяла ковер на другой из подборки, столики выбрала круглые, чат джипити добавил лампу
Вечером буду сидеть визуализировать разные картины на стену и разные ковры, а завтра буду другие стороны зала и спальни обставлять
В восторге, короче 🚀 как вам?
Это еще получается, что мы теперь весь мир в аниме можем конвертировать, даже плакаты пропаганды времен СССР ☕️
Промпт:
Convert image to anime Ghibli studio styleЧитать полностью…
Обожаю Азимова, он поднимал вопросы, которые вдохновляли ученых, исследователей, режиссёров и целые поколения.
Из этой идеи, я так понимаю, получился роман, а потом и фильм «Двухсотлетний человек». А затем — и философские рассуждения майора Кусанаги на лодке после дайвинга в ночном мегаполисе. Там она неожиданно для себя принимает решение слиться с ИИ.
Я оставил английский звук, потому что так звучит атмосфернее. Ру перевод закину в комменты.
NotebookLM от Гугла теперь поддерживает 50+ языков, включая русский.
Загружаете PDF- и аудиофайлы, указываете ссылки на сайты, видео YouTube, документы и презентации Google. NotebookLM будет обобщать всю информацию и проводить интересные связи между темами с помощью мультимодальной ИИ-модели Gemini 2.0.
Пора заводить подкаст, вестимо.
https://notebooklm.google/
@cgevent
Быстрые 3D композиции локально для ComfyUI
Это просто находка для тех, кто работает с ComfyUI и хочет быстро создавать 3D-композиции. A3D позволяет легко:
— Задавать позы простым болванками.
— Выбирать идеальные ракурсы камеры и строить сцены.
— Импортировать любые 3D-модели — от Mixamo до результатов Hunyuan3D 2.5.
— А самое крутое — вы можете моментально отправить цветное изображение или карту глубины из A3D в ComfyUI и использовать их в своих любимых workflow! ✨
🔗 Оценить разработку n0neye можно по ссылке: LINK — причем это опенсоурс
Как пишет сам автор, A3D задуман как быстрый и легкий способ создавать сцены без погружения в сложные 3D-редакторы. Некоторые фишки вроде 3D-генерации пока зависят от Fal.ai, но n0neye планирует добавить локальные альтернативы в будущем.
Мне нравится,что проект опенсоурсный и автор ищет сейчас умельцев для продолжения интеграции A3D в ComfyUI и планирует прикрепить к нему локальную генерацию через Hunyuan3D.
Мне понравилась идея, так как иногда Blender слишком сложный для новичков, а этот проект выглядит простым в использовании.
📕 Минусы:
— Пока только для Windows пользователей
GITHUB—AUTHOR
Наконец-то появился повод собрать so-100. Это вам не футболки складывать!
X
@derplearning
У ваших детей мало травмирующих воспоминаний? Самое время добавить ещё парочку, оживив их рисунки 😅
Читать полностью…Дизайнер прислал ужасный макет (как в примере), а вы не арт-директор и не можете сказать, что конкретно в нем не так? В новом ChatGPT o4 серьезно прокачали vision — способность понимать, что изображено на картинках. Поэтому грузим макет, пишем промт из серии: Представь, что ты арт-директор. Критически прокомментируй этот макет. Дай профессиональные рекомендации, как его улучшить.
Получаем детальный разбор (разверните цитату):
1. Композиция и иерархия
Перегруженность визуальных центров. Сейчас «пластиковые ОКНА», «БЫСТРО И ДОСТУПНО» и номер телефона конкурируют за внимание одновременно.
Рекомендация: выбрать один‑единственный силовой элемент (например, «ОКНА») и остальные блоки выстроить в пределах подчинённой иерархии.
2. Типографика
Слишком много гарнитур и стилей. Используется минимум три разных шрифта (узкий, полужирный, курсивный), плюс вариативные размеры и регистры – глаз «теряется».
Рекомендация: ограничиться двумя семействами шрифтов (один — для заголовков, другой — для текста), унифицировать вес (например, заголовки — Bold, подзаголовки — Regular) и убрать курсив, заменив его подчёркиванием или другим цветом.
3. Цветовая палитра
Непродуманная градиентная заливка. Переход со светло‑жёлтого в светло‑зелёный фоновый цвет выглядит пестро и отвлекает.
Рекомендация: оставить однотонный или очень мягкий фон (например, светло‑серый), а акцентные цвета (красный, тёмно‑синий) использовать дозированно, чтобы не «резали» глаз.
4. Выравнивание и сетка
Смещение блоков. Линии текста выглядят «плавающими»: номер телефона выступает за границы, надписи «двери⋆лоджии⋆перегородки» не выровнены.
Рекомендация: задать модульную сетку (колонки и ряды), чётко выровнять все текстовые блоки по левой или по центру (но одним стилем), выдержать равные отступы.
5. Пространство и «дыхание»
Слишком плотно. Между заголовками, иллюстрацией окна и контактами почти нет пустого пространства.
Рекомендация: увеличить внутренние поля (padding) вокруг каждого смыслового блока, добавить «воздуха» между строками (line‑height ≈ 1.3–1.5 от размера шрифта).
6. Иллюстрация окна
Мелковата и теряется. Сейчас иллюстрация не поддерживает текстовую иерархию и выглядит «прилепленной».
Рекомендация: либо увеличить её размер и использовать как фоновой элемент за заголовком, либо вынести в правый или нижний угол, дав ей больше «плошадки».
7. Контраст и читаемость
Красный по светлому градиенту. «БЫСТРО И ДОСТУПНО» в красном читается тяжело из‑за бликов фона.
Рекомендация: либо сделать тон фона более ровным, либо заменить красный на более тёмный, сохраняя при этом акцент.
В итоге — упростить, выстроить чёткую сетку, сократить число шрифтов и цветов, усилить один‑единственный ключевой акцент и обеспечить достаточно «воздуха» между элементами. Это сразу повысит читабельность и впечатление о профессионализме макета.
Пакет для питона, который позволяет накладывать тарифы на импорт других пакетов.
А то крадут наши компьюты понимаете ли
Make python great again!
Git
Google добавил AI
как формулу в гугл-таблицы – наконец-то можно не мучаться с плагинами и скриптами
Тут подробнее, фича доступна в альфа версии и активируется этой инструкцией
и немного сентиментального
Miki Matsubara - Mayonaka No Door
Сколько зарабатывают Ai-художники?
За последние пару лет у нас сформировалась совершенно новая индустрия, которая развивается стремительно и непредсказуемо. И вместе с этим — возникает много вопросов. Один из самых важных: а сколько вообще зарабатывают люди, работающие с AI-визуалом?
Сейчас в профессии — хаос в ставках, непонимание “нормы” и огромный разброс по деньгам. Чтобы разобраться, я создала анонимный опрос, который поможет всем нам сформировать более прозрачную и честную картину рынка.
Очень прошу:
— если ты используешь нейросети в своей работе (не важно, коммерчески или творчески) — заполни его
— и пожалуйста, перешли коллегам, друзьям, в каналы / сторис / комьюнити. Только так мы соберём объёмную и полезную статистику.
Важно: оценивай доход в среднем за год — если ты в один месяц получил 500, а в другие по 30, не ставь 500. Нам нужна реальная средняя картина.
Еще раз повторю вопрос полностью анонимный (даже для меня) поэтому не стесняйся.
Ссылка на опрос тут.
Спасибо тебе! Надеюсь, это поможет нам всем ориентироваться и развиваться честно и осознанно. Позже обязательно поделюсь статистикой в своем канале.
#money
Атсрологи объявили неделю гибли мемов. Количество число увеличилось вдвое.
Читать полностью…⚡ Умельцы запустили Spore на ночном небе
Взять из Gamer's Hut
Вышла новая нейросеть Reve, а это ее художественный тест.
Если коротко: это гибрид FLUX и Идеограма, прекрасно слушает длинные промты, так же прекрасно может в текст (однако немного шакалит лица и детали на крупных планах). Но что самое классное и интересное: отлично знает советское и пост-советское. Панельки, автопром, ковры на стенах. Вот это вот все. Если раньше для этого нужны были отдельные лоры, то теперь можно пользоваться Reve.
Бесплатно, в день дается n-ое количество генераций на один аккаунт (который можно удалить и зарегистрироваться заново). Приглашаю всех в тесту в комментарии. Помните, что можно кидать картинку в окно промта.