machinelearning_ru | Unsorted

Telegram-канал machinelearning_ru - Машинное обучение RU

5779

Все о машинном обучении админ - @workakkk @data_analysis_ml - анализ даннных @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python 📚 @datascienceiot - ml 📚

Subscribe to a channel

Машинное обучение RU

⚡️ Vikhr: новые модели на 12B и 8B для русского языка с уникальным методом выравнивания.

Vikhr Team — сообщество энтузиастов, занимающихся созданием и развитием русифицированных LLM, выпустили две новые модели, оптимизированные для русского языка в задачах генерации кода, решения математических задач, обобщения, ответов на вопросы и построения логических выводов. Обе модели адаптированы для RAG и могут выступать реранкером на уровне LLM.

▶️ Vikhr-Nemo-12B-Instruct-R-21-09-24 — инструктивная модель на базе Mistral-Nemo-Instruct-2407 с 12 млрд. параметров и контекстным окном в 128К токенов.
В бенчмарке Ru-Arena General, Vikhr-Nemo-12B-Instruct-R-21-09-24 достигла результата в 79.8, уступая только двум моделям семейства GPT-4 .

🟢Версии квантования Vikhr-Nemo-12B-Instruct-R-21-09-24 в разрядности от 3-bit (6.08 Gb) до 16-bit (24.5 GB) в GGUF формате.

▶️ Vikhr-Llama3.1-8B-Instruct-R-21-09-24 — инструктивная модель на базе Meta-Llama-3.1-8B-Instruct с 8 млрд. параметров, контекстным окном в 128К токенов. В Ru-Arena General она показала значение winrate 63.4. По словам Vikhr Team — это лучший результат среди 8B моделей с поддержкой русского языка.

🟠Версии квантования Vikhr-Llama3.1-8B-Instruct-R-21-09-24 в разрядности от 3-bit (4.02 Gb) до 16-bit (16.1 GB) в GGUF формате.

Для файнтюна базовых моделей Mistral-Nemo-12B и Llama-3.1-8B, Vikhr Team разработали уникальный метод выравнивания — Simple Margin Preference Optimization (SMPO).

Он представляет собой микс из техник, заимствованных из CRLFT, IPO и SimPO, с добавлением своей функции потерь. Метод опубликован в репозитории на GitHub в комплекте тулкита скриптов и конфигураций, использовавшихся для обучения представленных моделей.

В процессе обучения моделей использовался кастомный SFT-датасет GrandMaster-PRO-MAX, собранный Vikhr Team самостоятельно, для следования самым разным наборам инструкций на разных языках (в основном на русском) и отвечать также - на русском языке. В него была включена CoT-способность.


📌Лицензирование : Apache 2.0 License.



🟡Модель Vikhr-Nemo-12B-Instruct
🟡Модель Vikhr-Llama3.1-8B-Instruct
🟡GGUF Vikhr-Nemo-12B-Instruct
🟡GGUF Vikhr-Llama3.1-8B-Instruct
🟡Датасет
🟡Demo Vikhr-Nemo-12B-Instruct
🖥Github


@ai_machinelearning_big_data

#AI #ML #LLM #Vikhr

Читать полностью…

Машинное обучение RU

⚡️ Похоже, это самая большая в мире открытая коллекция лор

Более 500 лор.

@machinelearning_ru

Читать полностью…

Машинное обучение RU

Вебинар «Как начать работать с объектным хранилищем S3: эффективная защита и хранение данных по минимальной стоимости»

2 октября в 16:00 эксперты из VK Cloud покажут, как легко настроить облачное объектное хранилище. Вы узнаете, как создавать бакеты, управлять доступами, защищать информацию и интегрировать S3 с другими облачными продуктами.

Программа

🔹 Что такое облачное объектное хранилище
🔹 Архитектура и компоненты Cloud Storage
🔹 Классы хранения и управление данными
🔹 Безопасность и управление доступом
🔹 Практические сценарии использования
🔹 Live-демонстрация и Q&A-сессия

Регистрируйтесь на вебинар — ссылка на трансляцию придет в день мероприятия, а после вы получите запись.

Зарегистрироваться бесплатно

Читать полностью…

Машинное обучение RU

📍 Awesome-LiDAR-Visual-SLAM

LiDAR-Visual SLAM сочетает в себе преимущества лидарных датчиков для обеспечения высокоточной и надежной локализации местности и картографирования.

Github

@machinelearning_ru

Читать полностью…

Машинное обучение RU

Разница между GPT-4o и o1. 😁

@machinelearning_ru

Читать полностью…

Машинное обучение RU

🖥 reCAPTCHAv2

Инструмент Python, который Решает 100% копти и превосходит показатели успешности предыдущих инструментов, которые составляли от 68% до 71%.

репо: https://github.com/aplesner/Breaking-reCAPTCHAv2
abs: https://arxiv.org/abs/2409.08831

@machinelearning_ru

Читать полностью…

Машинное обучение RU

Яндекс признан лидером среди российских разработчиков Open Source

Эксперты ИТМО составили рейтинг российских компаний, развивающих open-source проекты в Data/ML.

Что обеспечило компании лидерство в рейтинге::
— Много активных open-source проектов по разным направлениям Data/ML, включая открытые модели и данные.
— Проекты компании пользуются высоким интересом среди российских пользователей. Это подтверждается звёздами, форками и скачиваниями на платформах вроде GitHub. Особенно выделяется CatBoost, который активно используется по всему миру.
— Высокое качество репозиториев и активные контрибьюторы.
— Поддержка сообщества через мероприятия и гранты для независимых разработчиков.

В число лидеров также вошли Сбер, Т-Банк, VK, а среди вузов — ИТМО, Сколтех, ВШЭ и AIRI.

Читать полностью…

Машинное обучение RU

Как искусственный интеллект меняет правила игры в бизнесе?

Приглашаем тебя на митап по Data Science от экспертов Газпромбанк.Тех, где ты узнаешь:

– Как мы используем нейронные сети для разбора платежных документов
– Каким образом оптимизатор позволяет максимизировать прибыль от маркетинговых коммуникаций
– Какие задачи решают квантовые технологии в мире финансов

В конце тебя ждет нетворкинг с участниками и спикерами митапа.

Регистрируйся и приходи 19 сентября к нам в гости: Москва, ул. Коровий Вал д.5, БЦ «Оазис» — https://vk.cc/cASzhw

Реклама, Банк ГПБ (АО), ИНН: 7744001497, erid: 2VtzqufzBCB

Читать полностью…

Машинное обучение RU

Если чувствуете, что хотите сделать следующий шаг в IT, то самое время действовать! Не ждите выпускного из школы или колледжа — развивайтесь в интересующем направлении прямо сейчас 🚀🌟

Помимо самообучения, стоит воспользоваться поддержкой опытных менторов и преподавателей. Яндекс Лицей, проект Яндекс Образования, предлагает именно такую возможность. На бесплатных онлайн-специализациях вы сможете углубить свои знания в одном из востребованных направлений:
- Веб-разработка на Django.
- Большие данные.
- Машинное обучение.
- Анализ данных.
- Веб-разработка на GO.

Специализации длятся 3 месяца и ориентированы на подростков 13-20 лет, у которых уже есть опыт в программировании. Во время онлайн-обучения вы прокачаете свои навыки, поработаете над реальными задачами и групповыми проектами, пообщаетесь со специалистами из индустрии… в общем, сделаете всё, чтобы подготовиться к карьере в IT!

Подайте заявку на специализации до 24 сентября и выйдите на новый уровень в IT!

Читать полностью…

Машинное обучение RU

CrossViewDiff может генерировать высококачественные изображения уличных фотографий из спутниковых снимков, используя модель диффузии!

https://opendatalab.github.io/CrossViewDiff/

@machinelearning_ru

Читать полностью…

Машинное обучение RU

OpenAI o1: ChatGPT Supercharged!

https://www.youtube.com/watch?v=SBDbfCcCeHk

@machinelearning_ru

Читать полностью…

Машинное обучение RU

⚡️ RePlay: рекомендательный фреймворк для экспериментов и производственного использования

Представляет инструментарий с открытым исходным кодом для создания рекомендательных систем, поддерживающий различные бэкенды обработки данных и аппаратные архитектуры.

📝https://arxiv.org/abs/2409.07272
👨🏽‍💻https://github.com/sb-ai-lab/RePlay

@machinelearning_ru

Читать полностью…

Машинное обучение RU

🎧 SongCreator: Lyrics-based Universal Song Generation

Универсальный генератор песен на основе лирики.

Модель включает в себя два новых иннструмента: тщательно разработанную модель языка двойной последовательности (DSLM) для сбора информации о вокале и аккомпанементе для генерации песен, а также инструмент маскировки внимания для DSLM, который позволяет модели понимать, генерировать и редактировать песни.

Обширные тесты демонстрируют эффективность SongCreator: во всех восьми задачах генерации показывает лучшие или конкурентоспособные результаты в этой области.

В частности, он с большим отрывом превосходит предыдущие работы в задачах «текст-песня» и «текст-вокал». Кроме того, он способен самостоятельно управлять акустическими условиями вокала и аккомпанемента в создаваемой песне с помощью различных промотав, что свидетельствует о его потенциальной применимости.

HF: https://huggingface.co/papers/2409.06029
Page : https://songcreator.github.io/

@machinelearning_ru

Читать полностью…

Машинное обучение RU

Вот что ждет в Т-Банке ML-разработчиков, кроме ДМС, крутых офисов и других плюшек:

Актуальный стек. Здесь следят за трендами и быстро внедряют новое.
Общение на «ты». Так проще.
Прозрачная система роста. Вы всегда будете знать, какие навыки нужно подтянуть и как получить повышение.
Вы окажетесь среди профессионалов, у которых можно многому научиться. А если захотите — можете стать ментором для младших коллег.

Больше о вакансиях ML-разработчиков — здесь

Erid: 2Vtzquh3ArB

Читать полностью…

Машинное обучение RU

Вебинар «Создание масштабируемой инфраструктуры для AI/ML на базе GPU Cloud»

На вебинаре эксперты ITGLOBAL.COM и Ainergy помогут разобраться в особенностях GPU и выбрать оптимальную конфигурацию под конкретные задачи проекта. 

Теоретический блок мы дополним кейсом компании Ainergy по запуску AI-платформы на базе GPU Cloud.

Когда: 19 сентября, 12:00 МСК

Эксперты расскажут:
🔹какие задачи лучше всего решаются с помощью GPU (ML, AI, 3D VDI);
🔹почему облачные решения становятся предпочтительными для работы с GPU;
🔹 какие графические ускорители доступны в облаке и чем они отличаются: A16, A800, L40S, HGX H100;
🔹 как компания Ainergy реализовала AI-экосистему на базе GPU Cloud.

🔗 Регистрация по ссылке

Читать полностью…

Машинное обучение RU

True Tech Champ

Всероссийский чемпионат по алгоритмическому и робототехническому программированию от МТС.

Регистрация: до 12 октября
Доступ к онлайн-заданиям: с 1 октября
Финал в офлайне: 8 ноября

Регистрируйся на алгоритмический трек и решай задачи в классическом олимпиадном формате.

Участникам в ходе отборочных испытаний предстоит решить алгоритмические задачи онлайн и посоревноваться в индивидуальном зачете. 150 участников с лучшим рейтингом будут приглашены на очный шоу-финал чемпионата. Призовой фонд трека — 2 750 000 руб.

Смотри подробности и регистрируйся на сайте.

Читать полностью…

Машинное обучение RU

💡 GVHMR: World-Grounded Human Motion Recovery via Gravity-View Coordinates

Модель, которая позволяет точно оценить движения человека , которые легко переносятся в VR.

Код: https://github.com/zju3dv/GVHMR
HuggingFace: https://huggingface.co/spaces/LittleFrog/GVHMR1300

Читать полностью…

Машинное обучение RU

📹 NVIDIA’s Tech: Impossible Water Simulation!

https://www.youtube.com/watch?v=TixUHjIVovE

@machinelearning_ru

Читать полностью…

Машинное обучение RU

⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Хакинг: t.me/linuxkalii
Devops: t.me/devOPSitsec
АНАЛИЗ Данных: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Linux: t.me/linuxacademiya
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc


💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: /channel/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: /channel/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: /channel/addlist/BkskQciUW_FhNjEy

Читать полностью…

Машинное обучение RU

🦙 LlamaCoder — веб-приложение с открытым исходным кодом, которое может генерировать целое приложение из промпта.

Репозиторий уже был клонирован сотнями разработчиков на GitHub и отмечен более 2 тысяч раз.

➡️ https://llamacoder.together.ai

Подробнее об этом проекте ➡️ https://go.fb.me/p5o0x0

@machinelearning_ru

Читать полностью…

Машинное обучение RU

📊Plotlars — крутая Rust-библиотека для отрисовки графиков

▪Работает как обёртка вокруг библиотеки Plotly, чтобы упростить процесс создания визуализаций из Polars DataFrame.
▪ Поддерживает различные типы графиков и предлагает интуитивно понятный интерфейс для настройки визуализаций.
▪ Интегрируется с Jupyter Notebooks.

👉Ссылка на репозиторий проекта

@machinelearning_ru

Читать полностью…

Машинное обучение RU

⚡️ XVERSE-MoE-A36B: большая языковая модель на архитектуре MoE.

XVERSE-MoE-A36 - мультиязычная LLM, разработанная с нуля Shenzhen Yuanxiang Technology. Модель основана на архитектуре Mixture-of-Experts, имеет 255 млрд. параметров, из которых 36 млрд. активируются в процессе работы.

XVERSE-MoE-A36B предназначена для решения задач: генерация текста, машинный перевод, анализ тональности, реферирование текста, вопрос-ответ, применение в интеллектуальных системах обслуживания клиентов, образовательных помощниках и анализе данных.

Модель использует структуру decoder-only Transformer, где слой Feedforward Network разделен на специализированные экспертные слои.

Отличительной особенностью модели является использование набора общих и не общих экспертов, каждый из которых составляет 1/4 от размера стандартного FFN. Общие эксперты всегда активны во время вычислений, а не общие - активируются выборочно маршрутизатором.

Для обучения модели использовался массив данных на 40 языках, включая китайский, английский, русский и испанский. В процессе обучения использовалась стратегия динамического изменения набора данных с изменением скорости обучения (LR).

Тестирование модели проводилось на наборах данных MMLU, C-Eval, CMMLU, RACE-M, PIQA, GSM8K, MATH, MBPP и HumanEval.

Результаты показывают, что XVERSE-MoE-A36B превосходит другие модели MoE с открытым исходным кодом по производительности и эффективности.

▶️ Технические параметры модели:

🟢total parameters: 255.4B;
🟢active parameters: 36.5B;
🟢total layers: 50;
🟢dimensionality: 6144;
🟢attention heads: 48;
🟢feed-forward dimensionality: 4096;
🟢non-shared experts: 64;
🟢shared experts: 2;
🟢top-k sampling: 6.

⚠️ Важно! Несмотря на название, модель - 255B, ее физический размер ~ 512 Gb

▶️Установка и запуск:

# Clone repository:
git clone https://github.com/xverse-ai/XVERSE-MoE-A36B
cd XVERSE-MoE-A36B

# Install the dependencies:
pip install -r requirements.txt

# Inference with Transformers:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("xverse/XVERSE-MoE-A36B")
model = AutoModelForCausalLM.from_pretrained("xverse/XVERSE-MoE-A36B", trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='auto')
model = model.eval()
inputs = tokenizer('Attraction of Omsk: The Forbidden City', return_tensors='pt').input_ids
inputs = inputs.cuda()
generated_ids = model.generate(inputs, max_new_tokens=70, eos_token_id=tokenizer.eos_token_id, repetition_penalty=1.1)
print(tokenizer.batch_decode(generated_ids, skip_special_tokens=True))

# Inference with WebUI:
python chat_demo.py --port='port' --model_path='/path/to/model/' --tokenizer_path='/path/to/tokenizer/'


📌Лицензирование : Apache 2.0 License.


🟡Страница проекта
🟡Модель
🟡Demo (Chinese)
🖥Github


@ai_machinelearning_big_data

#AI #ML #MoE #LLM #XVERSE

Читать полностью…

Машинное обучение RU

GeoCalib 📸

Калибровка одного изображения с помощью геометрической оптимизации (ECCV 2024)

https://github.com/cvg/GeoCalib

@machinelearning_ru

Читать полностью…

Машинное обучение RU

🌟 PuLID+FLUX: перенос внешности на генерации в FLUX .

PuLID (Pure and Lightning ID Customization) - метод генерации на основе внешности для диффузных моделей с управлением текстовым промптом. Ключевое преимущество PuLID состоит в его способности генерировать изображения с высокой степенью соответствия заданной личности, следуя заданным стилю и композиции.

PuLID для SD существует относительно давно и неплохо работал с моделями SDXL. Теперь этот метод стал доступен для FLUX-dev:

🟢ID-кодер перенесен из структуры MLP в структуру Transformer;

🟢добавлены дополнительные блоки перекрестного внимания чередованием с DIT-блоками для взаимодействия между ID и DIT;

🟢SDXL-Lightning, который в оригинальном методе PuLID отвечал за первоначальную генерацию шума в латентном пространстве, в PuLID для FLUX опционален;

🟢добавлена поддержка fp8-версий FLUX для запуска на потребительских GPU;

🟢запуск bf16 на RTX 3090-4090 возможен с параметром --aggressive_offload, но генерация будет выполняться очень, очень, очень медленно.

В PuLID for FLUX есть два критически важных гиперпараметра:

timestep to start inserting ID. Этот параметр управляет там, в какой момент ID (лицо с входного изображения) будет вставлен в DIT (значение 0 - ID будет вставляться с первого шага). Градация: чем меньше значение - тем более похожим на исходный портрет будет результат. Рекомендованное значение для фотореализма - 4.

true CFG scale. Параметр, модулирующий CFG-значение. Исходный процесс CFG метода PuLID, который требовал удвоенного количества этапов вывода, преобразован в шкалу управления чтобы имитировать истинный процесс CFG с половиной шагов инференса.

Для возможности гибкой настройки результатов, разработчик оставил оба гиперпараметра : CFG FLUX и true CFG scale. Фотореализм получается лучше с применением true CFG scale, но если финальное сходство внешности с оригиналом не устраивает - вы можете перейти на обычный CFG.

Запуск возможен несколькими способами: GradioUI, Google Collab (free tier), Google Collab (pro tier) или с одним из имплементаций для среды ComfyUI:

🟠собственная реализация сообщества ComfyUI;
🟠diffusers-based implementation.

⚠️ Важно!

🟢проект находится в бета-версии, точность ID может быть невысокой для некоторых мужcких лиц, возможно, модель нуждается в дополнительном обучении;

🟢для FLUX-FP8 версия Pytorch >= 2.0, для остальных >=2.4.1

▶️Установка и запуск GradioUI:

# clone PuLID repo
git clone https://github.com/ToTheBeginning/PuLID.git
cd PuLID

# create conda env
conda create --name pulid python=3.10

# activate env
conda activate pulid

# Install dependent packages
# 1. For SDXL or Flux-bf16, install the following
pip install -r requirements.txt

# 2. For Flux-fp8, install this
pip install -r requirements_fp8.txt

# Run Gradio UI
python app.py


📌Лицензирование : Apache 2.0 License.


🟡Arxiv
🟡Demo
🟡Google Collab
🖥Github


@ai_machinelearning_big_data

#AI #ML #FLUX #GenAI #PuLID

Читать полностью…

Машинное обучение RU

🎮 Компания Tencent презентовала инновационный продукт под названием GameGen-O, который стал первым в мире генератором игр с открытым миром. Эта новая нейронная сеть способна создавать различные функции игрового движка, включая разработку персонажей, событий и динамического окружения без каких-либо ограничений.

GameGen-O обладает уникальной способностью генерировать видеоконтент, предоставляя пользователям возможность взаимодействовать с ним, предсказывать будущие события и автоматически генерировать последующие кадры. Например, если игрок поворачивает персонажа вправо, искусственный интеллект создает соответствующее окружение и продолжает генерировать контент в этом направлении.

Хотя некоторые моменты могут выглядеть размытыми, общий эффект все равно производит сильное впечатление.

🌐page: https://gamegen-o.github.io
🧬code: (coming soon) https://github.com/GameGen-O/GameGen-O/

@machinelearning_ru

Читать полностью…

Машинное обучение RU

⚡️ GitHub добавил gpt-o1-preview в Copilot

При работе GPT-4o придерживается очевидных решений и нуждается в помощи разработчика, чтобы направить Copilot на решение необходимых задачю

Результаты показывают, что логические возможности o1-позволяют получить более эффективный и качественный код и Луше справляются со сложными задачами.

https://github.blog/news-insights/product-news/openai-o1-in-github-copilot/

@machinelearning_ru

Читать полностью…

Машинное обучение RU

Новостной дайджест

✔️ Salesforce представила Industries AI: 100+ готовых возможностей искусственного интеллекта для решения задач в 15 отраслях бизнеса.

Salesforce Industries AI использует ИИ для автоматизации задач, специфичных для каждой отрасли: финансы, медицина, автотранспорт, энергетика, логистика т.д. Клиенты могут воспользоваться готовыми шаблонами и использовать ИИ с помощью моделей данных, релевантных для конкретной отрасли, а также собственных данных и метаданных - например, медицинских карт, баз данных доноров или телематических систем - для получения релевантных и контекстных результатов и выводов.

Помимо новых функций, Salesforce акцентирует доступность Industries AI, которая встроена в каждую из 15 отраслевых облачных платформ Salesforce. Большинство функций станут общедоступны к октябрю 2024 года и февралю 2025 года, при этом Salesforce планирует добавлять новые возможности в рамках трех ежегодных релизов.
salesforce.com

✔️ NotebookLM: экспериментальная RAG-функция Google, которая делает подкаст из любого документа, текста или URL.

Google NotebookLM позволяет загружать до 100 документов объемом до 200 000 слов каждый и генерировать на их основе : краткое содержание, FAQ, инструкцию по изучению темы и т. д.
С недавним обновлением, сервис получил усовершенствование: теперь Google NotebookLM может генерировать подкасты (с мужским и женским ведущим) из ваших файлов, текста или URL. Генерация ролевого подкаста доступна только для английского языка, качество генерации речи очень высокое.

Попробовать: зайдите на notebooklm.google.com, загрузите любой документ, текст или укажите URL материала. Затем нажмите Notebook Guide справа от поля ввода и выберите Generate в разделе Audio Overview.
techcrunch.com

✔️ Anthropic добавила "Workspaces" в консоли API для команд.

Рабочие пространства — это уникальные среды, позволяющие организовать ресурсы, упростить управление доступом и настроить индивидуальные лимиты расходов и скорости на более детальном уровне.

С помощью рабочих пространств пользователи могут устанавливать ограничения расходов на уровне рабочего пространства, группировать связанные ресурсы, управлять ограничениями скорости, оптимизировать управление доступом и отслеживать использование API.
anthropic.com

✔️ Adobe анонсировала генерацию видео в своих продуктах в этом году.

Adobe анонсировала набор инструментов для создания видео с использованием искусственного интеллекта, которые будут доступны как в Premiere Pro, так и на отдельном веб-сайте. 
Firefly Video, так называется модель, предлагает три основных функции: Generative Extend, Text to Video и Image to Video. Generative Extend добавляет к существующему видео два секунды, а Text to Video и Image to Video создают видео продолжительностью пять секунд на основе текстовых или изображений подсказок. 

Adobe не назвала точную дату запуска, но указала, что функции, основанные на модели Firefly Video, станут доступны до конца 2024 года.
techcrunch.com

✔️ Stanford Research: AI-ресечеры превосходят человеческих экспертов в генерировании новых идей.

Исследование, проведенное Стэнфордским университетом, сравнило способность больших языковых моделей и экспертов-людей генерировать инновационные научные идеи.

Идеи, генерируемые LLM, были признаны более новыми, чем идеи, предложенные экспертами-людьми. Этот вывод был сделан на основе масштабного эксперимента с участием более 100 специалистов по NLP.

Эксперты не только генерировали собственные идеи, но и оценивали как идеи, созданные ИИ, так и идеи, предложенные людьми, не зная их авторства. Результаты показали, что идеи, сгенерированные ИИ, получили более высокие оценки за новизну (p < 0,05) по сравнению с идеями, написанными людьми.

Важно отметить, что исследователи также обнаружили, что идеи ИИ были оценены как менее осуществимые, чем идеи, предложенные людьми. Это говорит о том, что, хотя ИИ может генерировать новые идеи, они могут быть не так легко реализуемы на практике.
arxiv.org


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Машинное обучение RU

🌟 VEnhancer: Генеративное улучшение синтезированного видео.

VEnhancer - генеративная система апсемлинга пространственно-временных характеристик, которая улучшает результаты существующих методов преобразования текста в видео путем добавления большего количества деталей в пространственной области и синтетического детализированного движения во временной области.
Он гибко адаптируется к различным коэффициентам апсемплинга в диапазоне 1x~8x.

VEnhancer устраняет артефакты и коллизии движения сгенерированных видео, используя диффузионную модель и дообученные модели ControlNet.

Несколько дней назад VEnhancer получил обновление:

🟢Поддержка длинных видео (путем разбиения видео на несколько фрагментов с перекрытиями);
🟢Быстрая выборка с 15 шагами без потери качества (путем установки --solver_mode 'fast' в команде скрипта);
🟢Использование временного VAE для уменьшения мерцания.

Эксперименты, проведенные во время разработки показывают, что VEnhancer превосходит существующие методы апсемплинга видео и современные методы улучшения синтезированных видео.

⚠️ Для обработки видео в 2K разрешении при fps=>24 требуется около 80 GB VRAM.

Использование VEnhancer возможно через CLI, с помощью GradioUI и в виде неофициальной ноды (WIP) для ComfyUI.

▶️Установка:

# Clone repo
git clone https://github.com/Vchitect/VEnhancer.git
cd VEnhancer

# Create environment
conda create -n venhancer python=3.10
conda activate venhancer

# Install requirments:
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2
pip install -r requirements.txt


▶️Установка пакета ffmpeg:

sudo apt-get update && apt-get install ffmpeg libsm6 libxext6  -y


▶️Инференс с помощью CLI:

bash run_VEnhancer.sh


▶️Инференс с помощью GradioUI:

python gradio_app.py



🟡Страница проекта
🟡Arxiv
🟡Модель
🟡Demo Video
🖥Github [ Stars: 224 | Issues: 8 | Forks: 13]


@ai_machinelearning_big_data

#AI #Text2Video #VEnchancer #ML

Читать полностью…

Машинное обучение RU

🚀 StableNormal: Reducing Diffusion Variance for Stable and Sharp Normal

git clone https://github.com/Stable-X/StableNormal.git
cd StableNormal
pip install -r requirements.txt

Github

@machinelearning_ru

Читать полностью…

Машинное обучение RU

📚 Справочник-шпаргалка по методологиям и паттернам на Python

Это обширный гайд на «Хабре», который расскажет о:

▪паттернах (порождающих, структурных, поведенческих);
▪разработке через тестирование (TDD);
▪разработке, основанной на описании поведения (BDD);
▪предметно-ориентированном проектировании (DDD).

🔗 Ссылка

@machinelearning_ru

Читать полностью…
Subscribe to a channel