vistehno | Unsorted

Telegram-канал vistehno - Искусственный интеллект. Высокие технологии

17923

Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы

Subscribe to a channel

Искусственный интеллект. Высокие технологии

🔥 Memenome — это ИИ платформа для преобразования скучных PDF-документов в видео из ТикТока с паркуром в Майнкрафт на фоне! Сложно придумать этому по-настоящему полезное предназначение, однако это забавно и бесплатно

🔗 Ссылка: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

🐎 Стыдно не знать!

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

ИТ-событие МТС True Tech Champ

Дата: 8 ноября
Место: МТС Live Холл + онлайн

МТС приглашает разработчиков присоединиться к мультиформатному ИТ-событию True Tech Champ. Будем обмениваться опытом, общаться с экспертами и просто классно проводить время среди своих.

Что тебя ждет:

— True Tech Garage. Интерактивный лекторий с воркшопами, ИТ-батлом «Плохие прогерские шутки» и кодинг-дуэлью с победителем олимпиады.
— Технофест. Более 20 площадок с кодерскими и фановыми активностями. Можно забраться на скалодром, погонять роботов по лабиринтам и взломать код сейфа.
— Шоу-финал. Лучшие команды ИТ-чемпионата на глазах у зрителей поборются за победу в гонках роботов по усложнённым интерактивным лабиринтам с подвижными консолями и спецэффектами.

Участие бесплатное, детали и регистрация по ссылке https://truetechchamp.ru/conf

Читать полностью…

Искусственный интеллект. Высокие технологии

❓Узнайте как построить модель финансового рынка, создать и обучить торгового агента с использованием специализированного фреймворка на открытом уроке в Otus

Моделировать финансовый рынок непростая задача, а когда мы хотим обучить торгового агента для эффективной работы, она становится непосильной для одного человека

На открытом уроке «Построение торгового агента на базе алгоритмов обучения с подкреплением» рассмотрим свободно распространяемые фреймворки для моделирования финансового рынка

✅ Сосредоточимся на финансовой стратегии, а детали реализации алгоритма фреймворк возьмет на себя 

Регистрация на урок 👇
https://otus.pw/GgIr/?erid=LjN8K5jmq

#реклама
О рекламодателе

Читать полностью…

Искусственный интеллект. Высокие технологии

⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
АНАЛИЗ Данных: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Linux: t.me/linuxacademiya
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Angular: /channel/+qIJAuSEb2MQyMDJi

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: /channel/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: /channel/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: /channel/addlist/BkskQciUW_FhNjEy

Читать полностью…

Искусственный интеллект. Высокие технологии

🔥 Easy-Peasy.AI — полезный сайт, предоставляющий инструменты на базе искусственного интеллекта для автоматизации создания контента, текстов и маркетинговых материалов!

🌟 Сайт предлагает различные AI-генераторы, такие как создание текстов, генерация картинок, создание идей для маркетинга, написание сценариев, перевод аудио в текст и многое другое! На сайте также присутствует бесплатный тариф!

🔗 Ссылка: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

🌟 Open-Sora-Plan v1.3.0: воссоздание сервиса генерации text-to-video Sora средствами opensource.

Проект Open-Sora-Plan предлагает набор инструментов и моделей для генерации видео на основе текстовых запросов и решения сопутствующих задач: восстановление и улучшение качества видео, интерполяция кадров и уточнение текстовых описаний.

▶️ Ключевые особенности версии 1.3.0:

🟢Улучшенный вариационный автоэнкодер WF-VAE
Он использует вейвлет-преобразование для разложения видео на поддиапазоны, захватывая информацию в различных частотных областях.

🟢Skiparse (Skip-Sparse) Attention
Методика Skiparse организовывает токены-кандидаты для внимания с помощью двух чередующихся методов пропуска и сбора, сокращая количество операций с плавающей запятой.

🟢Новая стратегия очистки данных
Cостоит из анализа семантической схожести кадров, ОСR для обнаружения субтитров, оценки эстетики и качества видео, анализа движения и повторной оценкb движения с учетом субтитров.
Стратегия позволила сократить датасет Panda70m до 27% от исходного.

🟢Динамическое разрешение и длительность.
Open-Sora-Plan v1.3.0 поддерживает динамическое разрешение и длительность видео, обрабатывая отдельные кадры как изображения.

⚠️ Такое масштабное обновление позволило значительно сократить аппаратные требования инференса и генерировать 93 кадра text-to-video в разрешении 480р на 24 GB VRAM.

▶️ Подробные инструкции по установке, обучению и инференсу в режимах
CausalVideoVAE, Prompt Refiner, Text-to-Video, Image-to-Video доступны в репозитории проекта.


📌Лицензирование: MIT License.


🟡Модель
🟡Сообщество в Discord
🟡Техотчет
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #OpenSora #Text2Video #Image2Video

Читать полностью…

Искусственный интеллект. Высокие технологии

🔥 GAGAvatar — это проект с NeurIPS 2024, который генерирует анимируемые 3D аватары головы на основе одной фотографии.

Он позволяет реконструировать голову в 3D и осуществлять ее анимацию в реальном времени, используя видео или изображения.

🌟 Репозиторий включает инструменты для рендеринга, обучения и выполнения генераций с помощью встроенных моделей, написан на Python.

🔐 Лицензия: MIT

▪️GitHub

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

📹 AISaver.io — инструмент для замены лиц в видеороликах. С помощью этой технологии можно автоматически заменять лица на видео, используя алгоритмы искусственного интеллекта и глубокого обучения

🌟 Инструмент может применяться для создания контента, видеомонтажа и других креативных проектов

🔗 Ссылка: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

📎 ML: Медицинский дайджест за 14 - 20 октября 2024 г.


▶️Модели машинного обучения и бенчмарки

🔘OLAPH: Повышение достоверности ответов на медицинские вопросы.
Метод, который фокусируется на повышении достоверности ответов в формате лонгрида, используя итеративный процесс обучения с SFT и DPO.

🔘LLMD: LLM для интерпретации медицинских карт пациентов.
Модель, разработанная для анализа истории болезни пациента на основе его медицинских карт.

🔘LifeGPT: агностическая генеративная модель клеточных автоматов.
Первая модель, способная предсказывать переходы состояний в двумерной системе Cellular Automata.

🔘MedCare: Раздельное согласование в обучении медицинских LLM.
Модель для решения проблемы снижения производительности LLM при адаптации к специализированным медицинским задачам.

🔘Y-Mol: LLM для разработки лекарственных средств.
Инструктивная модель, основанная на LLaMA2 для решения задач разработки лекарственных средств.

🔘WorldMedQA-V: многоязычный мультимодальный корпус данных для оценки медицинских моделей.
Мультимодальный датасет на разных языках для оценки моделей разной модальности в задачах здравоохранения.


▶️Фреймворки и методологии

🔘MedINST: набор медицинских инструкций для обучения LLM.
Многозадачный мета-набор данных медицинских инструкций из 133 задач.

🔘MCQG-SRefine: автоматическая генерация медицинских вопросов.
Система для автоматической генерации высококачественных вопросов множественного выбора в стиле экзамена USMLE.

🔘AgentClinic: повышение диагностической точности LLM в симулированной медицинской среде.
Система, которая дает возможность агенту-врачу, основанному на LLM, итеративно совершенствовать свои рассуждения и действия после постановки неверного диагноза.

🔘MeNTi: использование инструментов в LLM для решения медицинских задач.
Архитектура агента для LLM, разработанная специально для решения задач, связанных с медицинскими расчетами.


▶️Медицинские LLM-приложения

🔘AGENTiGraph: Интерактивная чатбот-платформа под управлением LLM.
Платформа, которая объединяет LLM с графами знаний для решения задач в специфических медицинских областях.

🔘MMed-RAG: Мультимодальная медицинская RAG-система.
Система повышения фактической точности, разработанная для борьбы с галлюцинациями, возникающими в медицинских VLM.

🔘Medical Graph RAG: Безопасная медицинская LLM c поиском по графу знаний.
Метод использования LLM в медицине, основанный на RAG, дополненной поиском по графу знаний.

🔘MedAide: Многоагентная система для комплексных медицинских задач.
Платформа для решения сложных медицинских задач, основанная на LLM и мульти-агентной архитектуре, где каждый агент специализируется на определенном аспекте здравоохранения.

🔘Генерация синтетических клинических испытаний на LLMs.
Методика использования LLM для создания синтетических клинических испытаний.


▶️Исследования и обзоры

*️⃣UniStruct: новая архитектура для представления структурированных медицинских данных.
Метод адаптации техник субсловной токенизации для представления групп медицинских кодов как единые токены.

*️⃣Адаптация медицинских LLM для 50 языков: подход с использованием MoE по языковым семьям.
Исследовании проблемы адаптации медицинских LLM к локальным языкам, чтобы улучшить доступ к медицинским услугам.

*️⃣ Можно ли добиться успеха в обучении медицинской VLM на чисто синтетических данных?
В статье изучается возможность использования исключительно синтетических данных для обучения моделей MedVLM. Спойлер - да, можно


🔜 Читать полный дайджест


@ai_machinelearning_big_data

Читать полностью…

Искусственный интеллект. Высокие технологии

🔈 E2/F5-TTS — система, которая преобразует текст в речь (TTS — text-to-speech). Это позволяет вводить текст и получать его озвучивание с помощью двух различных моделей. Программа использует новейшие достижения в области искусственного интеллекта для синтеза речи, что делает голос естественным и понятным.

💡 Обе модели, E2-TTS и F5-TTS, предназначены для создания синтезированной речи, которая звучит максимально похоже на настоящую человеческую. При этом E2-TTS фокусируется на быстром и простом преобразовании текста, а F5-TTS использует более сложные методы для плавности и реалистичности речи

🔥 Модели бесплатные и их можно развернуть локально!

🔗 Huggingface: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

Станьте разработчиком нейро-сотрудников на Python и зарабатывайте от 150.000р в месяц 🔥🔥🔥

Мы научим вас создавать топовых нейро-сотрудников на базе GPT-4 Omni, и вы сможете:
1️⃣ Устроиться разработчиком в крупную компанию и зарабатывать от 150 тысяч ₽ в месяц
2️⃣ Разрабатывать такие проекты на заказ и зарабатывать от 500 тысяч ₽ за проект
3️⃣ Создать нейро-сотрудника в вашей компании и вырасти на +30-100% в зарплате

Что будет на интенсиве?
🧬 Теория: как создаются нейро-сотрудники с GPT-4o на Python
🧬 Практика: мы создадим нейро-консультанта, нейро-HR, нейро-маркетолога и др.

Ведущий интенсива - Senior AI разработчик нейросетей и основатель Университета искусственного интеллекта
🔥 Регистрируйтесь на бесплатный интенсив! Встречаемся в ближайший четверг!

Читать полностью…

Искусственный интеллект. Высокие технологии

🔥 Ovis (Open Vision) — новая архитектура мультимодальной модели языка (MLLM), которая предназначена для структурного совмещения визуальных и текстовых эмбеддингов. Модель способна обрабатывать изображения высокого разрешения и текстовые данные, улучшая производительность в задачах, требующих интеграции визуальных и языковых данных

🔗 Huggingface: *клик*
▪️Github

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

Вечерний митап для ML-инженеров в Белграде и онлайн

📅 17 октября в 18:00 собираемся в хабе «Сербская Роза», чтобы обсудить тренды, новые подходы, решения и вызовы индустрии в неформальной обстановке.

Спикеры и темы докладов:

🔸 Илья Ирхин, руководитель подразделения аналитики в Яндекс Еде. Подробно рассмотрит рекламу ресторанов в сервисе: аукцион, ранжирование, ценообразование

🔸 Дмитрий Солодуха, руководитель группы в Алисе и Умных устройствах Яндекса. Покажет, как мы учим Алису откликаться без имени

🔸 Антон Клочков, руководитель подгруппы распознавания текста в VLM в Яндекс Поиске. Расскажет о развитии навыков распознавания текста в VLM

🔸 Пётр Вытовтов, руководитель группы в Яндекс Погоде. Рассмотрит трансформеры сервиса и расскажет, как начать прогнозировать до миллиметра осадков

После докладов офлайн-участников ждёт нетворкинг с экспертами из разных компаний!

📎 Регистрация и подробности тут.

Ждём вас на ML Party в Белграде!

Реклама. ООО "Яндекс", ИНН 7736207543.

Читать полностью…

Искусственный интеллект. Высокие технологии

🔈 Notta Showcase — это инструмент для дубляжа на основе искусственного интеллекта, который переводит видео на 15 языков, в том числе русский!

🌟 К сожалению, бесплатная версия ограничена лишь тридцатью минутами видео в месяц, однако ничего не мешает вам создавать мультиаккаунты 👀

🔗 Ссылка: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

Ищете удобную и надежную IT-инфраструктуру для вашего проекта?
 
Размещайте собственный сайт, запускайте приложения, обучайте нейросети или загружайте огромное количество данных в одном окне браузера. Все эти и многие другие задачи можно решить в Selectel. (тут можно кликабельную ссылку с utm вставить)
 
Selectel — один из ведущих провайдеров IT-инфраструктуры и облаков. Выделенные серверы, облако собственной разработки, сервисы информационной безопасности и еще более 50 продуктов — все настраивается и масштабируется из единой панели управления.
 
Что вы получите, выбрав Selectel:
 
— Удобство. Чтобы начать работу с сервером, достаточно выбрать нужные характеристики и в пару кликов запустить его.
— Масштабируемость. Быстрое развертывание новых мощностей при увеличении нагрузки на ваш сайт или приложение.
— Безопасность. Все дата-центры Selectel соответствуют требованиям 152-ФЗ, а также вам будет доступна бесплатная защита от DDoS-атак.
 
Регистрируйтесь в панели управления и разверните инфраструктуру вашего проекта в несколько кликов.

Читать полностью…

Искусственный интеллект. Высокие технологии

📌Учебное пособие по диффузионным моделям для обработки изображений и СV.

Учебник Стэнли Чана, профессора кафедры электротехники, вычислительной техники и статистики Purdue University (США), содержит ультраполезные знания в области диффузионных моделей в контексте обработки изображений и CV. Он доступно и детально объясняет сложные концепции и подходит как опытным профессионалам, так и тем, кто только начинает изучать эту область.

Для профессионалов, уже работающих с диффузионными моделями или стремящихся углубить свои знания, этот учебник послужит отличным ресурсом, который предоставляет прочную основу для понимания и применения концепций в прикладных задачах.

▶️ Содержание:

Вариационный автоэнкодер (VAE)

🟢Структурные элементы VAE
🟢Нижняя граница доказательства (ELBO
🟢Оптимизация в VAE
🟢Заключение и ограничения

Вероятностная модель диффузионного денойза (DDPM)

🟠Базовые элементы DDPM
🟠Нижняя граница доказательства (ELBO)
🟠Распределение обратного процесса
🟠Обучение и инференс
🟠Предсказание шума
🟠Неявная модель диффузионного денойза (DDIM)
🟠Заключение и преимущества DDPM и DDIM

Динамика сопоставления баллов Ланжевена (SMLD)

🟢Выборка из распределения
🟢Функция оценки Штейна
🟢Методы сопоставления баллов
🟢Итоги по SMLD

Стохастическое дифференциальное уравнение (SDE)

🟠От итерационных алгоритмов к обыкновенным дифференциальным уравнениям
🟠Что такое SDE?
🟠SDE для DDPM и SMLD
🟠Численные решатели для ODE и SDE
🟠Заключение и взаимосвязь между DDPM, SMLD и SDE

Уравнения Ланжевена и Фоккера-Планка

🟢Броуновское движение
🟢Мастер-уравнение
🟢Разложение Крамерса-Мойала
🟢Уравнение Фоккера-Планка
🟢Заключение и связь между SDE и уравнением Фоккера-Планка


🟡Arxiv


@ai_machinelearning_big_data

#AI #ML #Tutorial #Duffusion

Читать полностью…

Искусственный интеллект. Высокие технологии

🤖 Skyvern — это инструмент с открытым исходным кодом для автоматизации браузерных рабочих процессов с использованием больших языковых моделей (LLM) и компьютерного зрения

🌟 Skyvern позволяет создавать и запускать автоматизированные сценарии для выполнения задач, таких как парсинг веб-страниц, клик-акции, заполнение форм и навигация, что делает его полезным для автоматизации повторяющихся задач в браузере

🔗 Ссылка: *клик*
🖥 Github

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

📝 TextBuddy — это онлайн-редактор и помощник для улучшения текстов! Он помогает упрощать сложные предложения, исправлять грамматику и орфографию, а также структурировать текст, делая его более читабельным

🌟 Используя AI, TextBuddy может перефразировать, сокращать текст, подбирать синонимы и оптимизировать сообщения для лучшего восприятия аудиторией!

🔗 Ссылка: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

👑 Король Дании Фредерик во время презентации первого в Дании суперкомпьютера Gefion с искусственным интеллектом совместно с Дженсеном Хуангом главный исполнительным директором компании NVIDIA

Цитата Фредерик с презентации - "Я не единственный король в этом зале. На другом из них кожаная куртка" 😎

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

Привет, я Ярослав, окончил МФТИ и рассказываю в канале моей студии о хардкорном внедрении AI в корпорациях и производствах)

Я не выкладываю новости из мира AI и генерации Миджорни, только суровый ентерпрайз, рассказываем о технических и бизнесовых нюнсах наших проектов, например, как:
- Внедряли AI для литья стали;
- Выявляли окллюзии головного мозга;
- Узнавали период овуляции у свиней по видео)

Контент будет интересен разработчикам и продукт-овнерам, которые внедряют ИИ у себя.

Еще у нас есть подкаст куда приходят, например, Игорь Котенков из "Сиолошной".
Подписывайтесь, если интересно реальное внедрение Ai в корпорации: @r77_ai

Читать полностью…

Искусственный интеллект. Высокие технологии

🔥 IBM Granite 3.0 — это набор новых корпоративных моделей искусственного интеллекта (ИИ) от IBM, ориентированных на высокую производительность, безопасность и гибкость. Модели Granite обходят Llama-3.1 8B аналогичного размера в рейтинге лидеров OpenLLM HuggingFace!

⭐️ Эти модели предназначены для выполнения сложных задач, таких как генерация текста, классификация данных и редактирование кода. Granite 3.0 включает в себя улучшенные алгоритмы для ускорения обработки данных, включая инновации, такие как "спекулятивное декодирование" для более быстрого вывода и использование моделей "микса экспертов" для снижения задержек

🔗 Подробнее: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

🗣«Люди в RPA» — это не просто митап, а площадка для обсуждения актуальных проблем и возможностей в роботизации процессов.

X5 Tech и Газпромбанк.Тех меняют парадигму конференций по роботизации — время отойти от обычного обсуждения преимуществ роботизации перед другими подходами и сосредоточить внимание на тех, кто сегодня задает вектор развития этого направления.

Целевая аудитория — разработчики RPA, у которых в фокусе внимания реальные вопросы развития технологии:

🫥 Управление командами роботизации — чем отличается организация RPA-разработки от других продуктовых команд;
🫥 Citizen-разработка — разработка RPA-решений силами линейных сотрудников: коллеги поделятся опытом и успехами такого подхода, обсудят риски и перспективы развития;
🫥 Развитие отечественных платформ роботизации — представители ведущих платформ поделятся своим видением текущей ситуации и расскажут, как они адаптируют свои решения под требования разработчиков;
🫥 Квалификационный стандарт RPA — тимлиды RPA вместе обсудят, какими навыками должен обладать сотрудник в начале пути и к каким вершинам должен стремиться в профессиональном росте.

28 октября проведем дискуссию, которая станет началом детального обсуждения поднятых вопросов с пользой для сообщества разработчиков RPA.

⚡️ Увидимся в офисе Газпромбанк.Тех по адресу: Москва, ул. Коровий Вал, 5, БЦ «Оазис» 28 октября

Сбор участников офлайн с 13:00
Начало трансляции онлайн в 14:00

Зарегистрироваться на митап «Люди в RPA»

Реклама, Банк ГПБ (АО), ИНН: 7744001497, erid:2VtzqusNXWB

Читать полностью…

Искусственный интеллект. Высокие технологии

🔥 EgoAllo — это исследовательский проект, направленный на оценку движения тела и рук в мире.

💡 Репозиторий содержит код для обучения моделей, обработки данных и визуализации результатов, используя данные от камер Project Aria. Основная цель — предсказать 3D-позицию тела и рук на основе этих данных. Этот проект помогает исследовать движение человека с использованием технологий SLAM и других методов компьютерного зрения

🔗 Страница проекта: *клик*
📖 Arxiv: *клик*
▪️Github

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

🖥 OpenAI выпустила приложение ChatGPT для Windows!

🌟 Скачать можно из Microsoft Store, однако это ранняя версия, доступная пока только для обладателей подписки на сервис

🔗 Ссылка: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

🔥 Компания Adobe представила новую функцию под названием Harmonize.

Она автоматически регулирует освещение, тени, отражения и цветовую коррекцию, чтобы новые объекты в кадре смотрелись естественно. Эта функция работает с людьми, животными и любыми другими объектами.

Прогнозируется, что к 2025 году продвинутые пользователи Photoshop будут использовать всего две клавиши: "Удаление фона" и "Harmonize".

Читать полностью…

Искусственный интеллект. Высокие технологии

🌟 Возвращение RNN: LSTM и GRU — все, что нам было нужно?

Архитектура Transformer доминирует в моделировании последовательностей уже несколько лет, демонстрируя отличные результаты в задачах NLP, машинного перевода и генерации текста. Главный недостаток Transformer — они долго считают длинные последовательности. А если вычислительных ресурсов мало, то реализация занимает либо много времени, либо требует их увеличения.

Авторы исследования предлагают вернуться к RNN, ведь они быстрее считают и параллельно учитывают контекст. Чтобы отвязаться от обратного распространения ошибки (BPTT), которая требует линейного времени обучения, применяется алгоритм параллельного сканирования за счет устранения зависимости от срытых состояний из гейтов LSTM и GRU.

В предлагаемом методе представлены "уменьшенные" LTSM и GRU - minLSTM и minGRU. Они не только обучаются параллельно, но и используют значительно меньше параметров, чем их старшие аналоги.

Минимализм версий достигается следующим образом:

🟢Устранение зависимостей скрытых состояний из гейтов.
В minLSTM и minGRU input, forget и update gate зависят только от входных данных, а не от предыдущих скрытых состояний.

🟢Отказ от ограничения диапазона candidate hidden state.
В традиционных LSTM и GRU функция гиперболического тангенса используется для ограничения диапазона значений скрытых состояний. В minLSTM и minGRU это ограничение снимается.

🟢Неизменность масштаба выходных данных во времени (только для minLSTM).
Для minLSTM выполняется нормализация forget и input гейтов, чтобы гарантировать, что масштаб состояния ячейки не зависит от времени.

Результаты экспериментов:

🟠Время выполнения: minLSTM и minGRU скорость обучения по сравнению с LSTM и GRU, больше в 1361 раз для последовательности длиной 4096;

🟠Задача выборочного копирования: minLSTM и minGRU успешно справились, в отличие от S4, H3 и Hyena;

🟠Обучение с подкреплением на датасете D4RL: minLSTM и minGRU обошли Decision S4 и показали производительность, сопоставимую с Decision Transformer, Aaren и Mamba;

🟠Языковое моделирование: minLSTM, minGRU, Mamba и Transformer показывают одинаковые результаты, но Transformer требует значительно большего количества шагов обучения.

Прикладная реализация численно-устойчивой в логарифмическом пространстве версии метода minGRU на Pytorch представлена в репозитории на Github.

▶️ Локальная установка и запуск minGRU в последовательном и параллельном режиме :

# Install miniGRU-pytorch
pip install minGRU-pytorch

# Usage
import torch
from minGRU_pytorch import minGRU

min_gru = minGRU(512)
x = torch.randn(2, 1024, 512)
out = min_gru(x)
assert x.shape == out.shape

# Sanity check
import torch
from minGRU_pytorch import minGRU

min_gru = minGRU(dim = 512, expansion_factor = 1.5)
x = torch.randn(1, 2048, 512)

# parallel

parallel_out = min_gru(x)[:, -1:]

# sequential

prev_hidden = None
for token in x.unbind(dim = 1):
sequential_out, prev_hidden = min_gru(token[:, None, :], prev_hidden, return_next_prev_hidden = True)
assert torch.allclose(parallel_out, sequential_out, atol = 1e-4)


📌Лицензирование : MIT License.


🟡Arxiv
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #RNN #miniGRU

Читать полностью…

Искусственный интеллект. Высокие технологии

🖥 UniMuMo — это унифицированная мультимодальная модель, которая принимает текстовые, музыкальные и данные о движении для генерации выходных данных в трех модальностях. Она решает проблему синхронизации, выравнивая музыку и движение по ритмическим шаблонам. Модель использует архитектуру трансформера кодера-декодера и поддерживает параллельную генерацию музыки и движения. Благодаря тонкой настройке предварительно обученных моделей, UniMuMo достигает конкурентоспособных результатов в генерации всех трех модальностей

📖 Arxiv: *клик*
▪️Github

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

🔥 Vivago.ai — это платформа, использующая искусственный интеллект для работы с видео.

Сайт предлагает инструменты для генерации видео, изображений и 3D-моделей из текстовых запросов.

💡 Основные функции включают улучшение качества видео и изображений до 4K, преобразование текста в видео, добавление анимации к изображениям и создание 3D-моделей. Платформа предназначена для упрощения работы с визуальными проектами и поддерживает создание коротких вертикальных видео для социальных сетей. Также присутствует бесплатный ограниченный доступ, однако продвинутые функции доступны только по подписке

🔗 Ссылка: *клик*

@vistehno

Читать полностью…

Искусственный интеллект. Высокие технологии

🖥 OpenAI внезапно решили видоизменить главную страницу общения с ChatGPT. Теперь под вашим запросом могут выпадать подсказки, подобно поиску в браузере!

@vistehno

Читать полностью…
Subscribe to a channel