7590
Делаем нейросети удобными и доступными. Made by @Neuro_Cartel
🏆 Битва всех популярных чатов: ChatGPT, Claude, LeChat, DeepSeek, QWEN, Gemini, Grok чей код лучше?
Друзья, провел масштабное тестирование всех топовых LLM! Дал им конкретную задачу - переписать моё React-приложение для сравнения изображений в обычный HTML+JS.
В сравнении участвовали:
🟣 ChatGPT (OpenAI) - https://chat.openai.com/
🟣 Claude Sonet 3.5 (Anthropic) - https://claude.ai/new
🟣 Le Chat (Mistral AI) - https://chat.mistral.ai/chat
🟣 DeepSeek - https://chat.deepseek.com/
🟣 QWEN - https://chat.qwenlm.ai/
🟣 Gemini (Google) - https://gemini.google.com/app
🟣 Grok (xAI) - https://grok.com/
Из видео вы узнаете:
🔘 Как каждая модель справляется с реальной задачей
🔘 Кто быстрее и качественнее пишет код
🔘 Особенности работы с каждой LLM
🔘 Неожиданные результаты после второй итерации
Видео доступно везде:
📺 Смотреть в YouTube
📺 Смотреть в VK
📝 Смотреть на Pikabu
📝 Смотреть на DTF
📝 Смотреть на VC.ru
Буду очень благодарен, если поддержите видео лайками и плюсиками везде, где получится, а ещё лучше - оставите комментарий. Это реально помогает роликам выходить в топ и очень мотивирует делать новый контент! 🙏
Всех обнял, увидимся на стриме всегда ваш - Илья Nerual Dreming ❤️
🎬 Новая эра видеогенерации: Step-Video-T2V – китайский прорыв в создании видео!
Привет, друзья! Сегодня хочу поделиться с вами невероятно крутой новинкой из мира нейросетей. Познакомьтесь с Step-Video-T2V – новым опенсорсным видеогенератором из Китая, который буквально взрывает представления о том, как можно создавать видео по текстовым запросам.
🔥 Что это за зверь?
Step-Video-T2V – это текстово-видео модель с 30 миллиардами параметров , способная генерировать видео длиной до 204 кадров с разрешением 544x992 пикселей . Модель использует передовые технологии для сжатия видео и обработки данных, что делает её одной из самых мощных и эффективных на сегодняшний день.
🌟 Чем она отличается от конкурентов?
✅ Масштабируемость: Поддерживает как английский, так и китайский языки, что делает её универсальной для международного использования, даже русский как-то понимает.
✅ Глубокое сжатие видео (Video-VAE): Благодаря уникальной технологии Video-VAE, модель достигает сжатия видео в 16x16 пространственно и 8x временно , сохраняя при этом высокое качество воспроизведения.
✅ Direct Preference Optimization (DPO): В финальной стадии обучения применяется DPO – метод, основанный на предпочтениях пользователей, чтобы сделать видео более реалистичными и минимизировать артефакты.
✅ Высокая производительность: Для работы модели требуется 80 ГБ VRAM , но результаты того стоят: генерация занимает всего 743 секунды с использованием flash-attention.
🛠 Как начать использовать Step-Video-T2V?
Регистрация доступна прямо сейчас! Просто переходите на официальный сайт проекта:
➡️ Попробовать Step-Video-T2V онлайн
Для входа потребуется только ваш номер телефона (код приходит даже на российские номера через Telegram или SMS).
Если вы хотите использовать модель локально или интегрировать её в свои проекты, загрузите код и веса с GitHub или Hugging Face:
💻 GitHub
🤗 Hugging Face
Ждем когда модель ужмут до 24 гигов, а пока насилуем китайский сервер, там очередь уже 200 человек каждый раз 👀
Скидывайте то, что у вас получается в комментарии к посту 👇
Всех обнял и удачных генераций - Илья Nerual Dreming 💗
🎵 Новое видео: Три мощных нейросети для работы со звуком: MM-Audio, Fish Speech и LatentSync | 30 минут годноты + все ссылки в описании
Друзья, выпустил новое полезное видео - разбираем целых три офигенных нейросети для работы со звуком! 30 минут годноты, без воды, чтобы вы могли использовать их прямо сегодня.
В видео расскажу про:
➡️ MM-Audio: создаёт звуки для видео и игр, даже по обычной картинке! Идеально для геймдева и контент-мейкеров 🎮
➡️ Fish Speech: клонирует любой голос всего по минутной записи. Есть готовая база голосов и инструкция по записи своих 🎙
➡️ LatentSync: синхронизирует сгенерированную речь с видео для идеального липсинка 🎬
В описании собрал для вас все нужные ссылки: портативные версии каждой нейросети, исходники на GitHub, онлайн-демки и полезные инструменты для работы с голосом, короче если работаете со звуком к просмотру обязательно!
Видео доступно везде:
📺 Смотреть в YouTube
📺 Смотреть в VK
📝 Смотреть на Pikabu
📝 Смотреть на DTF
📝 Смотреть на VC.ru
Буду очень благодарен, если поддержите видео лайками и плюсиками везде, где получится, а ещё лучше - оставите комментарий. Это реально помогает роликам выходить в топ и очень мотивирует делать новый контент! 🙏
Всех обнял, увидимся на стриме всегда ваш - Илья Nerual Dreming ❤️
Друзья, хочу рассказать вам мою историю🎵
Всю жизнь я мечтал создавать музыку. Пытался научиться играть на гитаре – не вышло. Купил электрогитару – та же история. И с MIDI-клавиатурой не сложилось. Даже барабаны были... За 35 лет единственное, что освоил – это варган (крутая штука, но явно маловато для самовыражения 😅).
И вот полгода назад в моей жизни появилась нейро-музыка. Помню, как сделал свой первый трек... А сейчас их уже больше 30! Двадцать из них играют на Spotify и Яндекс.Музыке, остальные можно найти на моём YouTube.
Но самое удивительное – это как нейросети меняют правила игры. Больше не нужно годами учиться играть на инструментах или тратить сотни тысяч на студийное оборудование.
Теперь вы можете:
➡️ Создавать музыку в любом жанре – от поп-хитов до саундтреков для игр
➡️ Генерировать профессиональный вокал и инструменталы
➡️ Выпускать треки на Spotify, Apple Music и другие площадки
➡️ Зарабатывать на своём творчестве
И всё это – имея только смартфон или компьютер с интернетом.
Мы с командой Neuro-Cartel запускаем первый в СНГ клуб по нейро-музыке. За 2 месяца вы пройдёте весь путь от идеи до релиза на стриминговых платформах. Вместе с кураторами и поддерживающим увлеченным сообществом.
Клуб идеально подойдёт, если вы:
➡️ Хотели создавать музыку, но не было времени на обучение
➡️ Ищете новые способы творческого самовыражения
➡️ Работаете с контентом и нуждаетесь в уникальной музыке
➡️ Создаёте игры или видео и нужны саундтреки
➡️ Просто любите музыку и хотите попробовать что-то новое
В программе:
✅ 15 практических уроков
✅ Работа с Udio и Suno а так же другими нейросетями
✅ Основы музыкальной теории - без сложных и скучных нот!
✅ Мастеринг и подготовка к релизу
✅ Продвижение и монетизация
А ведёт курс Владислав Вандер – музыкальный продюсер с 14-летним опытом, за плечами которого сотрудничество с известными артистами и создание саундтреков для игр.
Подробности и запись в клуб:
➡️ https://neuromusic.club/ 👈
Количество мест ограничено, так как на первом потоке мы даём персональную обратную связь каждому участнику.
Присоединяйтесь к музыкальной революции вместе с нами! Let's Rock! 🎸
Сделали для вас с любовью Nerual Dreming и канал 🔊 Нейро-Звук ❤️
🐠 Fish Speech MOD ● Модифицированная версия синтезатора речи с клонированием голоса ● RU ● Portable by NerualDreming
Ссылка на оригинальный GitHub: https://github.com/fishaudio/fish-speech
Репакер: #NerualDreming
Дата обновления: 15 января 2025
Версия: 1.4.3
Категории: #TTS, #voiceclone, #AIaudio
Платформа: #Windows
Язык: RU
Место на диске: 10 ГБ
Системные требования: NVIDIA GPU 8gb
Совместимость: #Nvidia
🖥 Описание софта:
Fish Speech - это мощный инструмент для синтеза речи с возможностью клонирования голоса. Особенность данной модифицированной версии в том, что она адаптирована для русскоязычных пользователей и дополнена новыми функциями для более удобной работы.
🟣 Клонирование голоса по образцу 15-60 секунд
🟣 Поддержка русского и других языков (английский, японский, корейский, китайский, французский, немецкий, арабский, испанский)
🟣 Высокая точность синтеза речи
🟣 Сохранение в форматах MP3 и FLAC
🟣 Полностью русифицированный интерфейс
🟣 Упрощенная работа с папкой examples - достаточно добавить MP3 и текстовый файл с расшифровкой для добавления новых голосов
🟣 Оптимизированный интерфейс без неиспользуемых элементов
🔘 Крастер (YouTube)
🔘 Губка Боб
🔘 Тинькофф (YouTube)
🔘 Кропина (YouTube, женский)
🔘 Бухмин (AudioBook)
🔘 Володарский
🔘 Гоблин Пучков (YouTube)
🔘 Дедпул (Гланц)
🔘 Денис Колесников (YouTube)
🔘 5 дополнительных женских голосов на английском языке
Все примеры голосов взяты из открытых источников и представлены с уважением к их носителям и исключительно в демонстрационных целях. Для коммерческого использования рекомендуем обращаться к авторам. Несанкционированное использование чужих голосов в коммерческих целях и без разрешений не только нарушает права их владельцев, но и может преследоваться по закону. Мы категорически запрещаем и осуждаем использование данной технологии для нарушения чьих-либо прав или для совершения противоправных действий!
⁍ Скачайте zip архив Fish Speech
⁍ Распакуйте архив в удобное место
⁍ Запустите файл install.bat
⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение)
⁍ Запустите start.bat для начала работы
🎶 MMAudio: Генерация звука для видео с помощью ИИ
Друзья, вышла новая большая обзорная статья про MMAudio - впечатляющую нейросеть от исследователей Университета Иллинойса и Sony AI! Технология умеет создавать звуковое сопровождение по видео и изображениям, и результаты действительно впечатляют.
В статье вы найдете:
🟣 Подробный разбор технологии
🟣 Множество примеров работы системы
🟣 Анализ возможностей и ограничений
🟣 Варианты практического применения
🟣 Все доступные демо и способы тестирования
📝 ЧИТАТЬ НА ХАБРЕ
📝 ЧИТАТЬ НА ПИКАБУ
📝 ЧИТАТЬ НА DTF
📝 ЧИТАТЬ НА VC.RU
За лайк и плюсик везде, где дотянетесь - отдельное спасибо! Это реально помогает материалам выходить в топ и очень меня радует 🙏
💬 Обсудить в чате | ⭐️ Поддержать канал
👾 НЕЙРО-СОФТ — делаем нейросети доступнее.
🛠 Три незаменимые программы для стримера и блогера!
Друзья, продолжаю рассказывать про софт, которым я пользуюсь после переустановки Windows. Сегодня у меня для вас сразу три маленьких, но очень полезных приложения.
🎬 NVIDIA Broadcast
Кто на RTX сидит - обязательно поставьте! Эта программа творит просто чудеса с вашим аудио и видео:
- Чистит звук на входе и выходе
- Улучшает качество с веб-камеры
- Умеет вырезать или размывать фон
- Добавляет крутые эффекты
Раньше я активно использовал вырезание фона, а сейчас перешел на blur - его вы можете видеть в моих новых видео и стримах. Да, немного нагружает видеокарту, но результат того стоит!
➡️ Скачать NVIDIA Broadcast
📺 Media Player Classic - Home Cinema
Старый добрый MPC-HC с открытым исходным кодом. Раньше я ставил его в составе K-Lite Codec Pack, но в Windows 11 отдельные кодеки уже не нужны, так что теперь просто ставлю свой любимый плеер отдельно. Он лёгкий, в нём есть все нужные функции, и главное - умеет просто играть следующее видео из папки! Казалось бы, мелочь, но стандартный плеер Windows 11 почему-то так не умеет 🤷♂️
➡️ Скачать MPC-HC
🖥 Sizer
Эта малышка делает всего одну вещь - меняет размер окна точно под заданные значения. Звучит просто, но для меня это незаменимая штука! У меня ультраширокий монитор Xiaomi 34", а стримлю я в 1080p. Выставлять размер окна руками каждый раз - это пытка. А с Sizer одно нажатие - и окно точно под нужный размер!
➡️ Скачать Sizer
Друзья, а какими программами пользуетесь вы? Что для вас незаменимо в работе? Делитесь в комментариях вашими находками! 💬
Всех обнял, всегда ваш - Nerual Dreming ❤️
Настройка RGB-подсветки без геморроя, Как я победил драйвера Razer 🎮
Раз уж я переустанавливаю систему и настраиваю все проги, расскажу вам о тех проблемах, с которыми сталкиваюсь, о тех программах, которые использую, и решениях, которые для себя нашёл. Вдруг они окажутся полезны и вам.
Как все, кто давно на меня подписан, знают - я люблю всякие светящиеся штуки ✨. У меня есть клавиатура Razer DeathStalker V2 Pro, светящаяся мышка SteelSeries Rival 3 и что-то там светящееся внутри компьютера, но это я отключаю - компьютер в глухом корпусе, всё равно не видно. Ещё есть Ambilight-подсветка с Алика от Skydimo (я на неё обзор делал), использую в статичном режиме сзади монитора, чтобы глаза меньше уставали в темноте.
Вот уже много лет я использую Aurora RGB ⚡️ - замечательная программа с открытым исходным кодом, бесплатная, поддерживает кучу девайсов и устройств. Но есть одна проблема - она очень глючная. Может⚡️ внезапно перестать работать, выдать какую-то ошибку или начать грузить компьютер 💻. Недавно я писал про свой бугурт от того, что приходится иметь дело с чрезмерными сложностями, и вот опять - Aurora RGB просто взяла и перестала запускаться.
После переустановки Windows я наконец смог эту проблему решить. Сначала установил драйвера Razer, понял что они делают только хуже, и удалил их нафиг. Клавиатура не хотела подцепляться через Aurora на Windows 11, долго не мог понять в чём дело. Ставить драйвера Razer и SteelSeries ради набора светодиодов не хотелось.
Попробовал несколько альтернативных программ. SignalRGB была очень классной, пока не узнал что она стоит 5 баксов в месяц - увольте, подписки на светящуюся клавиатуру мне ещё не хватало 💸.
В итоге нашёл OpenRGB ⚡️. И что удивительно - в ней всё подключилось моментально и сразу заработало, но она такая уродская, хреновые настройки, мало функций, совершенно не понравилась. Но я придумал использовать OpenRGB в качестве прокси для Aurora.
Aurora по какой-то непонятной причине не могла подключиться к моей мышке SteelSeries и клавиатуре Razer. В обычной ситуации пришлось бы ставить SDK от каждого производителя, но всё это можно обойти через OpenRGB - это открытый стандарт 🛠. Я просто добавил OpenRGB в автозагрузку с автоматическим запуском сервера, и теперь Aurora подключается к серверу OpenRGB на локалхосте. Всё работает без проблем.
Думал, что это будет сильно грузить компьютер, но оказалось что нет - Aurora и OpenRGB вместе жрут меньше 1% процессора. До того как я начал чинить компьютер, было лишних 20% загрузки ЦП, из-за чего он постоянно нагревался, что очень раздражало 🌡. Теперь загрузка в простое менее 5%, что меня полностью устраивает.
Этот рецепт подойдёт и вам. Можете скачать OpenRGB - она очень прикольная, ничего делать не надо, сама подцепляется ко всем устройствам. А дальше используйте удобную и более понятную Aurora, в которой гораздо больше функций.
Мой конфиг Aurora 💡
Расскажу о функциях, которые использую я, и заодно поделюсь своим профилем для Aurora. Это мой основной профиль, я его много лет использую. Не полностью моё изобретение - когда-то где-то взял и доработал.
После установки Aurora откройте профили, затем "View Profile Folder", положите туда мой файл профиля и перезапустите Aurora.
У меня клавиатура состоит из 12 слоёв. Есть основная заливка - две зоны: основная там где буквы и цифры, и вторая зона - всё остальное, своеобразная рамочка. Эти два цвета переключаются рандомно, эти же цвета забиндены на мышку. Это просто для красоты, не самое интересное.
👇 👇 👇
👀 Н - насмотренность
Можно по-разному относится к арту, созданному нейросетью.
Но игнорировать его в современном мире точно не стоит!
Является ли такой арт действительно настоящим искусством? Этот вопрос мы часто будем слышать в будущем.
А пока, на нашем канале мы вместе удивляемся, с какой скоростью нейросети проникают во все сферы нашей жизни🔥
Это 100% AI-generated
🎭 FaceFusion ● Замена лица на фото и видео ● RU ● Portable by NeuroDonu
Ссылка на оригинальный GitHub: https://github.com/facefusion/facefusion
Репакер: #NeuroDonu
Дата обновления: 3 октября 2024
Версия: 3.0.0
Категории: #deepfake, #img2img, #txt2img
Платформа: #Windows
Язык: RU, ENG
Место на диске: 16 ГБ
Системные требования: NVIDIA GPU с CUDA поддержкой или AMD/Intel GPU
Совместимость: #Nvidia, #AMD, #Intel
🖥 Описание софта:
FaceFusion — это мощный инструмент для замены лиц на изображениях и видео. Он предлагает высококачественные результаты и широкий спектр функций для манипуляции лицами.
• Замена лиц на фото и видео
• Улучшение качества лиц и кадров
• Раскрашивание черно-белых видео
• Синхронизация губ (липсинк)
• Поддержка нескольких моделей для замены лиц
• Настройка параметров обработки
• Работа с несколькими лицами в кадре
Изменения версии:
🔤 Добавлена возможность изменения возраста
🔤 Улучшение качества пикселей для алгоритмов замены лиц
🔤 Live Portrait улучшает выражения лиц на фотографиях
🔤 Порядок выбора лиц теперь учитывает возраст, пол и другие параметры
🔤 Новые видеокодеки h264_videotoolbox и hevc_videotoolbox
🔤 Исправлено качество изображений формата webp
и другие улучшения и изменения, полный список на GitHub
⁍ Скачайте zip архив FaceFusion или самораспаковывающийся архив.
⁍ Распакуйте архив в удобное место.
⁍ Запустите файл start_portable_nvidia.bat.
⁍ После загрузки необходимых компонентов, FaceFusion откроется в вашем браузере.
🎭 FLUX — революция в генерации изображений. Полное руководство по всем версиям, установке и настройке
Друзья, в новом видео я раскрываю все секреты FLUX - революционной модели для генерации изображений! Узнайте, как использовать эту мощную технологию на своем компьютере.
Из видео вы узнаете:
🔘 Чем отличаются версии PRO, DEV и SCHNELL
🔘 Как установить FLUX на видеокарты с разным объемом памяти
🔘 Секреты настройки для максимального качества генерации
🔘 Как ускорить работу с помощью квантованных моделей
🔘 Практические советы по использованию в Forge
📺 СМОТРЕТЬ ВИДЕО В VK
📺 СМОТРЕТЬ НА YOUTUBE
📝 СМОТРЕТЬ НА ПИКАБУ
📝 СМОТРЕТЬ НА DTF
📝 СМОТРЕТЬ НА VC.RU
За лайк и комментарий под видео - отдельная благодарность и низкий поклон, это помогает роликам выходить в рекомендации и очень меня радует ❤️
Всех обнял, всегда ваш Илья - Neural Dreaming ❤️
🎨 Обновленный Fooocus_extend v6 ● Генерация изображений ● by Shahmatist/RMDA
Ссылка на оригинальный GitHub: https://github.com/lllyasviel/Fooocus
Ссылка на форк GitHub: https://github.com/shaitanzx/Fooocus_extend
Репакер: #Shahmatist/RMDA
Базовая версия: 2.5.5
Категории: #img2img, #txt2img
Платформа: #Windows
Язык: RU, ENG
Место на диске: 16 ГБ
Системные требования: NVIDIA GPU с CUDA
Совместимость: #Nvidia
🖥 Описание софта:
Fooocus — это ПО для генерации изображений (на основе Gradio).
В отличие от оригинальной версии имеются:
🔤 автоматический переводчик промптов с любого языка на английский перед запуском генерации
🔤 Civitai_helper от zixaphir для automatic1111, адаптированный для Fooocus.
🔤 онлайн-редактор Photopea
🔤 модуль удаления фона
🔤 групповая обработка изображений через ImagePrompt
🔤 по умолчанию тёмная тема
В этой версии добавлены:
🔤 Групповая обработка промптов
🔤 Выбор разрешения генерируемого изображения
🔤 Генератор промптов с возможностью пакетной генерацией изображений
⁍ Скачайте 7z-архив.
⁍ Распакуйте архив в удобное место.
⁍ Запустите файл run_anime.bat, run_realistic.bat или run.bat в зависимости от небходимой загруженной модели.
⁍ После загрузки необходимых компонентов, Fooocus откроется в вашем браузере.
Пост для благодарностей 🌟
Мы стараемся для вас, и если вам нравится контент в канале, вы можете выразить свою благодарность, оплатив доступ к этому посту, или отправив звездочки под понравившейся публикацией.
Тут нет никакого контента, но нам будет полезно и приятно, а звездочки мы сможем потратить на развитие канала ❤️
Ну, хватит саспенса.
Сегодня я был в гостях во Фрайбурге у своих кентов из Stability AI, основных авторов Stable Diffusion.
Кто не знает, мы учились в одной лабе в Heidelberg University, впоследствии переехавшей в LMU в Мюнхен.
На фото Фредди печатает для меня их последнюю статью про новую text-to-image модель, которую они засабмитили сегодня на ICML.
@ai_newz
Вот так выглядит типичный пост в Эйай Ньюз, автор которого, Артем, защитил PhD в лабе, откуда вышел Stable Diffusion. Челик написал свою диссертацию у того же профессора, что и авторы SD. Но кроме того, Артем - Staff Research Scientist в элитной лабе по генеративному AI, Meta GenAI в Цюрихе, и выступает на топовых конференциях по всему миру.
Еще канал успевает вести.
Артем пишет о нейронках, AR/VR и генеративном AI, разбирает сложные статьи, добавляя свое критическое мнение, а также травит байки о ресерче и карьере в сфере AI в Meta.
В общем, подписывайтесь, если любите ИИ: @ai_newz
🧡 Всем привет
Встречаем новую статью про Resemble Enhance — новую нейросеть для улучшения голоса и очистки его от шума!
Взглянем на возможности Resemble Enhance и протестируем ее на старых и всеми любимых мемах!
Для вас мы сделали портативную версию Resemble Enhance, которую вы найдёте в статье!
📝 ЧИТАТЬ НА ПИКАБУ
📝 ЧИТАТЬ НА DTF
📝 ЧИТАТЬ НА ХАБРЕ
📝 ЧИТАТЬ НА VC.RU
Ну и конечно не забудьте поставить лайки и плюсики везде, где только дотянетесь, это очень помогает в развитии и радует меня лично! 💙
🎭 Fish Speech Dialogue Portable ● Обновленная мультиязычная портативная версия с 50+ голосами ● RU+EN ● Portable by Shahmatist^RMDA
Ссылка на оригинальный GitHub: https://github.com/shaitanzx/fish_speech/
Репакер: #Shahmatist/RMDA
Дата обновления: 24 февраля 2025
Версия: 0.07
Категории: #TTS, #voiceclone, #AIaudio, #dialogue
Платформа: #Windows
Язык: RU, EN
Место на диске: 10GB
Системные требования: NVIDIA GPU 8GB
Совместимость: #Nvidia
🖥 Описание софта:
Fish Speech Dialogue — это мощное решение для озвучки диалогов и отдельных реплик с использованием различных голосов. Новая портативная версия включает все необходимые компоненты и библиотеку из более чем 50 готовых голосов от сообщества. Теперь работает даже с одним говорящим. Больше не требуется установка базового Fish Speech MOD. Портативная версия.
🟣 Поддержка от 1 до 10 говорящих в одном диалоге
🟣 Автоматическое распределение голосов в диалогах
🟣 Озвучка одиночных реплик и монологов
🟣 Более 50 готовых голосов от сообщества
🟣 Форматирование диалога "Говорящий: текст"
🟣 Форматы сохранения: WAV, MP3 и FLAC
🟣 Мультиязычный интерфейс (RU/EN)
🟣 Стабильная GitHub версия с автообновлением
🟣 Расширенные настройки для продвинутых пользователей
⁍ Скачайте zip или exe архив Fish Speech Dialogue
⁍ Распакуйте в любую папку на диске
⁍ Запустите start.bat
⁍ После проверки обновлений и загрузки компонентов интерфейс откроется в браузере
🎭 Fish Speech Dialogue DLC ● Система для озвучивания диалогов различными голосами ● RU ● by NerualDreming
Ссылка на Fish Speech MOD: /channel/neuroport/134
Репакер: #NerualDreming
Дата обновления: 15 февраля 2025
Версия: 0.06
Категории: #TTS, #voiceclone, #AIaudio, #dialogue
Платформа: #Windows
Язык: RU
Место на диске: 10kb
Системные требования: NVIDIA GPU 8GB
Совместимость: #Nvidia
🖥 Описание софта:
Fish Speech Dialogue — это мощное дополнение на базе Fish Speech MOD, разработанное для генерации озвучки целых диалогов с использованием различных голосов. Этот инструмент позволяет автоматически распознавать и назначать голоса говорящим в диалоге, что делает процесс создания озвучки быстрым и удобным. Это мой первый эксперимент такого рода на базе одного приложения, создано другое. Это не отдельное приложение, это дополнение которое устанавливается в папку к уже существующему Fish Speech MOD.
🟣 Автоматическое распределение голосов: Просто вставьте текст диалога, в формате Говорящий 1: и система автоматически определит говорящих и назначит им случайные голоса.
🟣 Поддержка до 10 говорящих: Создавайте сложные диалоги с большим количеством участников (хотя автор не тестировал так много говорящих, поэтому возможны некоторые ограничения).
🟣 Гибкая настройка голосов: Использует ту же базу голосов, что и Fish Speech MOD из папки examples. Все готово сразу после установки. Дополнительные голоса.
🟣 Форматы сохранения: Сохраняйте результаты в форматах WAV, MP3 и FLAC.
🟣 Расширенные настройки: Настройте параметры генерации, такие как длина промпта, максимальное количество токенов, температура и штраф за повторение.
⁍ Скачайте zip архив Fish Speech Dialogue.
⁍ Распакуйте архив в ту же директорию, где находится Fish Speech MOD.
⁍ Запустите файл start_dialogue.bat.
⁍ После загрузки компонентов интерфейс приложения откроется в браузере.
⚡️Превращаем микрофон в СТУДИЙНЫЙ — NVIDIA представила Studio Voice
Теперь создавать контент и записывать подкасты можно без аудиокарт и дорогих микрофонов.
Всё просто: активируйте функцию, начните запись — и даже бюджетный микрофон выдаст звук студийного качества.
Работает бесплатно, качаем — здесь.
🔊 Нейро-Звук
Создаём общую базу голосов для синтеза речи!
Предлагаю организовать удобную систему хранения и обмена голосовыми образцами. Рассказываю как это будет работать.
📋 Формат названия файлов: Lang_Sex_Name_Desc
Например: RU_Female_Kropina_YouTube
Где:
Lang - язык голоса
Sex - пол диктора
Name - имя/псевдоним
Desc - краткое описание или источник
fish_speech_Portable_Mod_NeuroPort\fish-speech\examples
👄 LatentSync ● Синхронизация движения губ с аудио ● RU ● Portable by NerualDreming
Ссылка на оригинальный GitHub: https://github.com/bytedance/LatentSync
Репакер: #NerualDreming
Дата обновления: 11 января 2025
Версия: 1.0
Категории: #lipsync, #AIvideo, #video2video
Платформа: #Windows
Язык: RU
Место на диске: 17 ГБ
Системные требования: NVIDIA GPU с не менее 8 ГБ VRAM
Совместимость: #Nvidia
🖥 Описание софта:
LatentSync - это инновационный инструмент для синхронизации движения губ с аудио на основе латентных диффузионных моделей. Особенность системы в том, что она создает естественную и точную синхронизацию губ с речью без промежуточных этапов обработки, что делает результат более качественным и реалистичным.
🟣 Высокоточная синхронизация движения губ с аудио
🟣 Сохранение естественной мимики лица
🟣 Поддержка как реальных, так и анимированных видео
🟣 Простой и понятный интерфейс
⁍ Скачайте zip архив LatentSync
⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути)
⁍ Запустите файл install-script.bat
⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение)
⁍ Запустите start_latentsync.bat для начала работы
🎵 MMAudio ● Генерация синхронизированного закадрового аудио из видео, изображений и текста ● RU ● Portable by NerualDreming
Ссылка на оригинальный GitHub: https://github.com/hkchengrex/MMAudio
Репакер: #NerualDreming
Дата обновления: 5 января 2025
Версия: 1.0
Категории: #AIaudio, #video2audio, #txt2audio
Платформа: #Windows
Язык: RU
Место на диске: 12 ГБ
Системные требования: NVIDIA GPU 8gb
Совместимость: #Nvidia
🖥 Описание софта:
MMAudio - это инновационный инструмент для генерации синхронизированного звука на основе видео, изображений или текста. Особенность системы в том, что она не просто генерирует звук, а создает его в полной синхронизации с происходящим на экране, что делает его незаменимым для создателей контента и видеомонтажеров.
🟣 Генерация аудио из видео с точной синхронизацией
🟣 Создание звука по текстовому описанию
🟣 Преобразование изображений в звуковое сопровождение
🟣 Генерация окружающих звуков и эффектов
🟣 Создание фоновой музыки и атмосферы
🟣 Имитация речи (в виде стилизованной тарабарщины)
🟣 Возможность сохранения аудио отдельно от видео
🟣 Русифицированный интерфейс для удобства использования
⁍ Скачайте zip архив MMAudio
⁍ Распакуйте архив в удобное место (без кириллицы в путях)
⁍ Запустите файл install_mmaudio.bat
⁍ После автоматической загрузки всех компонентов и моделей интерфейс приложения откроется в браузере
⁍ Загрузка и установка займет некоторое время и зависит от скорости вашего интернет соеденения, всего будет скачено около 15gb.
Что действительно прикольного:
🔘 Есть подсказки по клавишам 💡. Нажимаете Alt - видите какие дополнительные кнопки работают с Alt. Нажимаете Win - видите какие кнопки работают с Windows
🔘 При Caps Lock включается мерцание всего буквенного ряда. Сам индикатор слева не всегда заметен, а когда мигает весь ряд - сразу видно что капс включен
🔘 На numpad и цифровых клавишах над буквами - эквалайзер 🎵. Сигнализирует когда играет музыка (у меня это почти всё время). Такой ненавязчивый эквалайзер мне очень нравится
🔘 Есть эффект летящих вверх белых частиц ❄️. Генерируется от одной до пяти штук одновременно, красиво разбавляет основные цвета подсветки
🔘 Мониторинг нагрузки системы на клавишах F1-F12 📊. Одним цветом показывает загрузку CPU, другим - GPU. Очень удобно когда нужно быстро оценить нагрузку, особенно если экран занят или комп подвис - по клавиатуре сразу видно что происходит
Это конечно не все функции Aurora - только то, что использую лично я. Может, откроете для себя что-то другое. Кроме этих фишек для рабочего стола можно много сделать для игр 🎮 - для многих уже есть готовые схемы. А для тех игр где схем нет, но есть поддержка Chroma (движок Razer) - можно перехватывать сигналы через Aurora, и это будет автоматически создавать слой из игры, как будто у вас уникальная клавиатура Razer.
Поддержка игр встроенная, для неё даже ничего особо делать не надо. Можете настроить ярлыки для горячих клавиш, чтобы помнить основные кнопки - очень помогает когда только изучаете какую-нибудь программу 🖥.
Нужные ссылки:
🟣 OpenRGB (тот самый универсальный прокси для подключения RGB устройств): https://openrgb.org/
🟣 Aurora (основная программа для управления подсветкой): https://www.project-aurora.com/
🟣 Мой профиль для Aurora приложил к посту
Друзья, а какими фишками для управления RGB-подсветкой пользуетесь вы? Давайте делиться опытом! 💬
Всех обнял, всегда ваш - Nerual Dreming ❤️
Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях 🤖
Интернет взорвался громкими заголовками про нейросети, которые "обманывают людей и пытаются сбежать".
Каждый второй блогер уже предрекает появление Скайнета, а технопаникеры собирают чемоданы и прячутся в бункер. Давайте разберемся без драмы и хайпа, что же действительно обнаружили исследователи из Apollo Research.
В новой статье:
🟣 Настоящие цели и методы исследования
🟣 Как на самом деле вели себя ведущие языковые модели
🟣 Неожиданные паттерны в тестах безопасности
🟣 Критический анализ методологии экспериментов
🟣 Главные открытия, которые все пропустили за шумихой
Спойлер: если отбросить истерику, реальные результаты тестов гораздо глубже и интереснее, чем очередные страшилки про Скайнет.
📝 ЧИТАТЬ НА ХАБРЕ
📝 ЧИТАТЬ НА ПИКАБУ
📝 ЧИТАТЬ НА VC.RU
📝 ЧИТАТЬ НА DTF
За лайк и репост спасибо! Вместе мы сделаем IT-сообщество чуточку рациональнее и спокойнее 🤝
Всех обнял, всегда ваш Илья - Nerual Dreming ❤️
🎭 ОБНОВЛЕНИЕ FACEFUSION v3.0.0
Всем привет 👋
Встречайте статью-обзор про обновление мощнейшей нейронки для дипфейков — FaceFusion 3.0.0 🔥
Подробно рассмотрим интерфейс и все параметры и крутилочки, превратимся в ПАПИЧА, ЖАКА ФРЕСКО и даже КАНЬЕ ВЕСТА, ну и посмотрим, что добавили и исправили в этой обнове
А специально для вас мы сделали портативную версию FaceFusion, которую можно поставить себе на ПК и делать угарные дипфейки, ссылку вы найдете в статье!
📝 ЧИТАТЬ НА ХАБРЕ
📝 ЧИТАТЬ НА ПИКАБУ
📝 ЧИТАТЬ НА DTF
📝 ЧИТАТЬ НА VC.RU
Не забудьте поставить плюсики и лайки — вам легко, а мне приятно, так новая статья не заставит себя ждать! 💙
💬 Обсудить в чате | ⭐️ Поддержать канал
👾 НЕЙРО-СОФТ — делаем нейросети доступнее.
🧬 По многочисленным просьбам Шпаргалка по всем ресурсам Flux, сохраните, чтобы не потерять.
Основное:
🖥 Видео гайд
🛠 Forge
🚀 FLUX.1 [schnell]
🧠 FLUX.1 [dev]
Дополнительные компоненты:
🎨 VAE
🔤 T5XXL
📊 T5XXL GGUF
🖼 CLIP-L
GGUF модели:
🌟 FLUX.1-dev-gguf
⚡️ FLUX.1-schnell-gguf
Прочее:
🔧 LoRa Hyper
💾 Модели NF4 dev, schnell+Hyper
🎭 Модель fp8 STOIQO NewReality
📱 Портативка FLUX.1 dev NF4 Portable
🔍 Апскейлер 4x-NMKD-Superscale
🎨 Заказать Арт в Neuro Cartel Art Studio
🎓 Лучшее обучение нейросетям для новичков
Пути:
Положите модель в models\Stable-diffusion.
Положите VAE в models\VAE.
Положите clip-l и t5 в models\text_encoder.
Положите Hyper лоры в models\lora.
Положите 4x-NMKD-Superscale в models\ESRGN
Если что-то забыл - кидайте в комментарии дополним вместе.
Всех обнял, всегда ваш - Nerual Dreming 💗
⚡️Mulumbator Ai. Новый авторский канал про ИИ-видео от креативного директора ведущего диджитал-агентства России.
😂Смешные ролики
🔧Тесты анимации
🤖Промпты и разные полезности
Подпишись на /channel/mulumbatorai
Приглашаем вас в чат Нейро-Софт! 👾
Привет! Мы — команда Нейро-Софт, с любовью делаем бесплатные репаки нейросетей на русском.
Для вас мы создали отдельный чатик с темами, где вы сможете:
🔤пообщаться и обсудить новости мира AI
🔤протестировать новую портативку раньше, чем она выйдет на канале
🔤спросить совета или задать вопрос
🔤поделиться своими нейро-шедеврами
🔤предложить репак
и просто стать частью нашего сообщества!
➡️Присоединяйтесь к чату Нейро-Софт, чтобы осваивать нейросети вместе и делать их доступнее!
Подборка портативок от Нейро-Софт 👾
Собрали для вас все полезные сборки в одном посте на случай, если вы что-то пропустили!
🔤 Deep Live Cam — дипфейки в реальном времени, понадобится только веб-камера и картинка-референс
🔤 FLUX — прорывная модель для генерации изображений. Основана 12-миллиардном трансформере и позволяет генерировать изображения высокого качества
🔤 LivePortrait — анимация изображений по видео. Высокое качество и поддержка аудио
🔤 FaceFusion — замена одного или нескольких лиц на видео и картинках по одному фото
🔤 Fooocus_extend — удобный интерфейс Fooocus с автоматическим переводом, загрузчиком изображений и удалением фона
🔤 Stable Diffusion 3 — передовая модель для генерации изображений для некоммерческого использования. Улучшенное понимание текста и запроса
🔤 Resemble Enhance — очистка от шума и улучшение речи. Расширение полосы пропускания и восстановление искаженных исходников
🔤 ProPainter — удаление объектов и заполнение пропусков на видео
🔤 AuraFlow — модель для генерации изображений с открытым исходным кодом
🔤 Omost — ChatGPT и SDXL в одном флаконе - чат-бот для генерации изображений и создания сложных сцен
Все портативки переведены на русский язык и устанавливаются в один клик.
👾 НЕЙРО-СОФТ - Делаем нейросети доступнее.
Всем привет👋
Встречайте статью-обзор про нашумевшую Flux — мощную модельку для генерации изображений!
В статье я расскажу, как попробовать ее бесплатно онлайн или установить локально к себе на компьютер. Так же посмотрим, как она в действии и почему вам точно стоит обратить на нее внимание!
А специально для вас мы сделали портативную версию Flux, которую вы найдете в статье!
📝 ЧИТАТЬ НА ПИКАБУ
📝 ЧИТАТЬ НА DTF
📝 ЧИТАТЬ НА ХАБРЕ
📝 ЧИТАТЬ НА VC.RU
Не забудьте поставить плюсики и лайки — вам легко, а мне приятно, так новая статья не заставит себя ждать!💙
🎧 Resemble Enhance ● Улучшение звукозаписей и очистка от шума ● RU ● Portable by NeuroDonu
Ссылка на оригинальный GitHub: https://github.com/resemble-ai/resemble-enhance
Репакер: #NeuroDonu
Дата обновления: 10 августа 2024
Версия: 1.0
Категории: #AIaudio, #denoise, #audioenhancement
Платформа: #Windows
Язык: RU
Место на диске: 8 ГБ
Системные требования: NVIDIA GPU с не менее 4 ГБ VRAM
Совместимость: #Nvidia
🖥 Описание софта:
Resemble Enhance - это инструмент на основе ИИ для улучшения качества речи путем шумоподавления и усиления. Он состоит из двух модулей: шумоподавителя, который отделяет речь от шумного аудио, и улучшателя, который повышает качество звука, устраняя искажения и расширяя полосу пропускания. Модели обучены на высококачественных речевых данных с частотой дискретизации 44.1 кГц.
🟣 Эффективное шумоподавление для очистки речи
🟣 Улучшение общего качества звука
🟣 Восстановление искажений аудио
🟣 Расширение полосы пропускания для более чистого звучания
🟣 Удобный веб-интерфейс для быстрой обработки аудио
🟣 Возможность использовать только шумоподавление при необходимости
⁍ Скачайте самораспаковывающийся архив resemble-enhance-cuda.exe или одноименный ZIP-архив.
⁍ Если вы скачали EXE, запустите его и выберите папку для распаковки. Если ZIP, распакуйте его в удобное место.
⁍ После распаковки запустите файл start_portable_nvidia.bat.
⁍ Дождитесь загрузки компонентов, после чего интерфейс откроется в браузере.
⁍ Чтобы включить темную тему, добавьте в конце URL адреса /?__theme=dark