🔊 Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation
Модель генерации реалистичных видео из Аудио. Фреймворк способен распознать природу звука и сгенерировать визуальный образ.git clone git@github.com:guyyariv/TempoTokens.git
🖥 Github: https://github.com/guyyariv/TempoTokens
📕 Paper: https://arxiv.org/abs/2309.16429v1
⭐️ Dataset: https://paperswithcode.com/dataset/audioset
ai_machinelearning_big_data
✨ DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation
A novel 3D content generation framework that achieves both efficiency and quality simultaneously.
DreamGaussian - новый фреймворк для генерации 3D-контента, позволяющий достичь одновременно эффективности и высокого качества генераций.
Работает на безе алгоритма преобразования трехмерных гауссианов в текстурированные сетки с применения файнтюнинга для улучшения деталей. Обширные эксперименты демонстрируют высокую эффективность и конкурентоспособное качество генерации предложенного подхода.
🖥 Github: https://github.com/dreamgaussian/dreamgaussian
☑️ Image-to-3D: https://colab.research.google.com/drive/1sLpYmmLS209-e5eHgcuqdryFRRO6ZhFS?usp=sharing
☑️ Text-to-3d: https://colab.research.google.com/github/camenduru/dreamgaussian-colab/blob/main/dreamgaussian_colab.ipynb
📕 Paper: https://arxiv.org/abs/2309.16653v1
⭐️ Dataset: https://paperswithcode.com/dataset/nerf
ai_machinelearning_big_data
🔎 Text-to-3D using Gaussian Splatting
Новый подход к созданию высококачественных 3D-объектов
- генерация текста в трехмерном пространстве на основе гауссова расслоения (GSGEN
).
🎇 GSGEN: Text-to-3D using Gaussian Splatting
🖥 Github: https://github.com/gsgen3d/gsgen
☑️ Project: https://gsgen3d.github.io/
📕 Paper: https://arxiv.org/abs/2309.16585v1
⭐️ Dataset: https://paperswithcode.com/dataset/nerf
ai_machinelearning_big_data
✏️ Deep Geometrized Cartoon Line Inbetweening
Method can effectively capture the sparsity and unique structure of line drawings while preserving the details during inbetweening.
Создание промежуточных кадров между двумя рисунками - трудоемкий и дорогостоящий процесс, новый фреймворк AnimeInbet позволяет автоматизировать эту задачу.
AnimeInbet, геометризирует растровые линейные рисунки в графы конечных точек, решая задачу слияния графов с перестановкой вершин.
🖥 Github: https://github.com/lisiyao21/animeinbet
☑️ Demo: https://youtu.be/iUF-LsqFKpI?si=9FViAZUyFdSfZzS5
📕 Paper: https://arxiv.org/pdf/2309.16643v1.pdf
⭐️ Dataset: https://drive.google.com/file/d/1SNRGajIECxNwRp6ZJ0IlY7AEl2mRm2DR/view?usp=sharing
ai_machinelearning_big_data
📚 С помощью Telegram-бота GigaChat можно искать IT-курсы
Сервис Сбера в ответ на запрос о курсах предлагает не только названия ресурсов, где их можно найти, но и ссылки. К примеру, на запрос о поиске курсов по kubernetes нейросеть предложила пять популярных сайтов.
@gigachat_bot также умеет писать тексты и генерировать картинки, создавать инструкции и отвечать на вопросы. Кроме того, бота можно добавлять в групповые чаты и пользоваться совместно.
Попробовать GigaChat можно, перейдя по ссылке.
ai_machinelearning_big_data
➕ fastMONAI: A low-code deep learning library for medical image analysis
Simplifying deep learning for medical imaging.
fastMONAI упрощает использование современных методов глубокого обучения в анализе трехмерных медицинских изображений для решения задач классификации, регрессии и сегментации. fastMONAI предоставляет пользователям функциональные возможности для поэтапной загрузки данных, предварительной обработки, обучения и интерпретации результатов.git clone https://github.com/MMIV-ML/fastMONAI
🖥 Github: https://github.com/MMIV-ML/fastMONAI
Project: https://fastmonai.no
📕 Paper: https://www.sciencedirect.com/science/article/pii/S2665963823001203
🖥 Colab: https://colab.research.google.com/github/MMIV-ML/fastMONAI/blob/master/nbs/10a_tutorial_classification.ipynb
ai_machinelearning_big_data
⭐️Scenimefy: Learning to Craft Anime Scene via Semi-Supervised Image-to-Image Translation
Фреймворк для автоматической высококачественной генерации аниме-сцен из изображений реального мира.git clone https://github.com/Yuxinn-J/Scenimefy.git
🖥 Github: https://github.com/Yuxinn-J/Scenimefy/tree/main
☑️ Demo: https://huggingface.co/spaces/YuxinJ/Scenimefy
📕 Paper: https://arxiv.org/abs/2308.12968
⏩Project: https://yuxinn-j.github.io/projects/Scenimefy.html
⭐️ Dataset: https://github.com/Yuxinn-J/Scenimefy/tree/main#open_file_folder-anime-scene-dataset
ai_machinelearning_big_data
Сбер расширяет географию своих ивентов: 6 октября в Тбилиси состоится первый технологический митап, посвящённый разработке рекомендательных систем 👨💻
На RecSys MeetUp вы познакомитесь с экспертами Сбера, станете частью одного из крупнейших IT-комьюнити и узнаете о:
✔️ Технологических трендах в области искусственного интеллекта и машинного обучения.
✔️ Устройстве современных стримингов компаний-партнёров Сбера.
Гарантируем: будет интересно и безумно полезно каждому DS-специалисту. Регистрируйтесь по ссылке, встречаемся 6 октября в 18:30 по адресу: Тбилиси, Ресторан на 6 этаже отеля «Golden Palace», переулок Агмашенебели 62 💚
❗️ Как устроены методы коллаборативной фильтрации для рекомендательных систем?
👉 Изучаем SVD алгоритм на открытом уроке 25 сентября в 17:30 мск — «Методы коллаборативной фильтрации для рекомендательных систем: изучаем SVD алгоритм»
🔹 На занятии мы обсудим один из самых мощных алгоритмов области рексис, основанный на сингулярном разложении матрицы (SVD)
📌 Результаты урока:
Вы примените на практике подход на основе SVD разложения матрицы для построения рекомендательной системы
👉 РЕГИСТРАЦИЯ
https://otus.pw/efun/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru. Вебинар пройдет в преддверии старта онлайн-курса «Machine Learning. Advanced» от OTUS.
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8JvLoA
Команда AGIMA приглашает вас на онлайн-митап «Чат-боты и языковые модели: автоматизируй, нанимай, упрощай, формализируй». Он пройдет 28 сентября.
Эксперты из СДЭК, Маруся ВК, РЖД и AGIMA.AI расскажут:
какие функции есть у чат-ботов и как они упрощают обслуживание клиентов;
как создать голосового помощника и внедрить его в бизнес-процессы;
зачем и как внедрять корпоративные боты;
как быстро внедрить умные чат-боты на основе GPT.
Участие бесплатное, регистрация — по ссылке выше.
Реклама. ООО "АГИМА ПРОДАКШН". ИНН 7707398117. erid: LjN8KMmqi
⚡️TokenFlow: Consistent Diffusion Features for Consistent Video Editing
Framework that harnesses the power of a text-to-image diffusion model for the task of text-driven video editing.
TokenFlow - это фреймворк, позволяющий последовательно редактировать видео, используя предварительно обученную модель диффузии текста в изображение, без дополнительного обучения и настройки.
Нейросеть генерирует анимации высокого качества, сохраняя расположение и динамику из исходого ролика.
🖥 Github: https://github.com/omerbt/TokenFlow
🤗HF: https://huggingface.co/spaces/weizmannscience/tokenflow
📕 Paper: https://arxiv.org/abs/2307.10373
⏩ Project: https://diffusion-tokenflow.github.io/
ai_machinelearning_big_data?boost - boost to see premium content
🏆 LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models
13B and 70B 32k models with the supervised fine-tuning, which is feasible for long context
LongLoRA - эффективный подход к файнтюнингу, позволяющий расширить размер контекста предварительно обученных больших языковых моделей (БЯМ) при ограниченных вычислительных затратах.
🖥 Github: https://github.com/dvlab-research/longlora
📕 Paper: https://arxiv.org/abs/2309.12307v1
⭐️ Demo: https://b3cfcf9e79ff42df5f.gradio.live/
⏩ Dataset: https://paperswithcode.com/dataset/pg-19
ai_machinelearning_big_data
🚀Break-A-Scene: Extracting Multiple Concepts from a Single Image
Given method can learn a distinct token for each concept, and use natural language guidance to re-synthesize the individual concepts or combinations of them in various contexts
Новый Фреймворк от Google для декомпозиции сцен из изображений .
🖥 Github: https://github.com/google/break-a-scene
📕 Paper: https://arxiv.org/abs/2305.16311
⏩ Project: https://omriavrahami.com/break-a-scene/
📌 Video: https://www.youtube.com/watch?v=-9EA-BhizgM
ai_machinelearning_big_data
😠 GPTFUZZER : Red Teaming Large Language Models with Auto-Generated Jailbreak Prompts
Fuzzer maintains over 90% attack success rate against ChatGPT and Llama-2 models.
Новый фреймворк для фаззинга , созданный на основе фреймворка AFL. Вместо ручного проектирования fuzzer автоматизирует генерацию шаблонов джейлбрейка для LLM.
🖥 Github: https://github.com/sherdencooper/gptfuzz
📕 Paper: https://arxiv.org/abs/2309.10253v1
⏩ Dataset: https://sites.google.com/view/llm-jailbreak-study
ai_machinelearning_big_data
📊 PAMS: Platform for Artificial Market Simulations
Artificial market simulation is a multi-agent simulation and run virtual markets on your computer.
Имитация искусственных рынков - это многоагентное моделирование и запуск виртуальных рынков на вашем компьютере. На искусственных рынках существуют виртуальные рынки и виртуальные агенты, имитирующие реальных трейдеров.
С помощью искусственного моделирования рынков мы можем анализировать механизмы того, что происходит на реальных рынках.$ pip install pams
🖥 Github: https://github.com/masanorihirano/pams
📕 Paper: https://arxiv.org/abs/2309.10729v1
⏩ Docs: https://pams.hirano.dev/
ai_machinelearning_big_data
🖥 40+ IT-компаний ищут студентов на оплачиваемую стажировку
На форуме “Найти IT” Сбер, Росатом, Kaspersky и другие топовые компании завалят вас предложениями о работе!
“Найти IT” — это:
🔹 Мастер-классы и кейсы от крутых компаний
🔹 Предварительные собеседования и Q&A со спикерами
🔹 Мерч, призы и вкусная еда
И все это бесплатно 😲 Нужно только прийти!
Выбирате город и регистрируйтесь 👇
📍 Москва: 3 октября
📍 Санкт-Петербург: 7 октября
📍 Новосибирск: 26 октября
Реклама. ООО "ФТ". ИНН 7731611424. erid: LjN8KUcKb
🔎 Датасет для анализа русскоязычных отзывов на организации
Яндекс опубликовал крупнейший русскоязычный датасет, в котором содержится 500 тысяч отзывов, собранных с января по июнь 2023 года. Туда входят адреса и названия организаций, список рубрик, оценки пользователей и отзывы. Датасет позволяет, к примеру, производить сентимент-анализ и лингвистический анализ.
Github: https://github.com/yandex/geo-reviews-dataset-2023
Habr: https://habr.com/ru/companies/yandex/articles/763832/
@ai_machinelearning_big_data
Опрос для опытных ИТ-специалистов.
Поделитесь мнением об ИТ-работодателях. Напишите, что вам нравится, а что — нет. Так компании смогут исправить ошибки, улучшить условия и присылать офферы, на которые хочется соглашаться.
Посмотрите, это займет не больше 10 минут
🤖 Machine Learning Tutorials Repository
Добро пожаловать в репозиторий учебников по машинному обучению. Примеры кода и поянения по:
1.🖥 Python
2.👁🗨 Computer Vision: Techniques, algorithms
3.🖋 NLP
4.📊 Matplotlib
5.🔢 NumPy
6.🐼 Pandas
7.🎇 MLOps
8.🧠 LLMs
9.🔥 PyTorch/TensorFlowgit clone https://github.com/patchy631/machine-learning
• Github
ai_machinelearning_big_data
🔊 Listen, Think, and Understand
AI model that has both audio perception and a reasoning ability.
LTU-AS - модель универсального восприятия звука , которая способна к рассуждению. В частности, благодаря интеграции Whisper в качестве модуля восприятия и LLaMA в качестве модуля рассуждений, LTU-AS может одновременно распознавать и совместно понимать устный текст, паралингвистику, практически все, что можно воспринять из аудиосигналов.
🖥 Github: https://github.com/YuanGongND/ltu
☑️ Demo: https://18c618fc8f07ec494e.gradio.live/
📕 Paper: https://arxiv.org/abs/2309.14405v1
🤗 HH: https://huggingface.co/spaces/yuangongfdu/ltu-2
⭐️ Dataset: https://paperswithcode.com/dataset/iemocap
ai_machinelearning_big_data
VK Data Meetup — митап об инструментах и людях, которые умеют работать с данными
⏰ Когда: 12 октября, 14:00 по Москве
📍 Регистрация
VK Data Meetup — это серия событий о практиках работы с данными на разных уровнях.
Митап 12 октября посвящен работе с большими данными и ML. Обсудим:
• Тренды работы с данными;
• Процессы взаимодействия со смежными подразделениями и внутри дата-команд;
• Новые инструменты, такие как Spark on Kubernetes и No Code AutoML-платформы;
• Кейсы решения практических бизнес-задач от ведущих российских компаний.
Митап будет интересен дата- и ML-инженерам, тимлидам и разработчикам платформ данных, архитекторам и специалистам по Data Science.
Присоединяйтесь к сообществу VK Data Meetup, чтобы узнать про работающие практики и поделиться своим опытом.
Зарегистрироваться
⭐️ Advanced NLP
Advanced NLP from Carnegie Mellon University.
Advanced NLP from MIT.
The course covers current state-of-the-art NLP techniques & algorithms.
Курс: Продвинутый NLP от Университета Карнеги-Меллон.
Курс: Advanced Natural Language Processing от MIT.
Курсы охватывают современные техники и алгоритмы NLP.
Одни из лучших курсов по НЛП в Интернете!
• CMU:📌Лекции | Курс
• MIT: 📌Лекции | Курс
ai_machinelearning_big_data
🎓 BayesDLL: Bayesian Deep Learning Library
New Bayesian neural network library for PyTorch for large-scale deep network
Новая библиотека байесовских нейронных сетей для PyTorch, предназначенную для работы с крупномасштабными глубокими сетями.
В библиотеке реализованы основные алгоритмы приближенного байесовского вывода: вариационный вывод, MC-dropout, стохастически-градиентный MCMC и аппроксимация Лапласа.
Основные отличия от других существующих библиотек байесовских нейронных сетей заключаются в следующем:
1) библиотека может работать с очень крупными моделями, в том числе с Vision Transformers
2) Практически не требует от пользователей модификации кода .
3)Позволяет использовать предварительно обученные веса модели в качестве средних значений, что полезно для проведения байесовских вычислений в крупномасштабных моделях типа ViTs, которые трудно оптимизировать с нуля на основе одних только исходных данных.
🖥 Github: https://github.com/samsunglabs/bayesdll
📕 Paper: https://arxiv.org/abs/2309.12928v1
⭐️ Dataset: https://paperswithcode.com/dataset/oxford-102-flower
ai_machinelearning_big_data
🔎Detect Every Thing with Few Examples
DE-ViT surpasses the few-shot SoTA by 15 mAP on 10-shot and 7.2 mAP on 30-shot and one-shot SoTA by 2.8 AP50.
Высокоточный детектор объектов, который в отличие от популярного подхода с открытым словарем, описывает каждую категорию объектов не языком, а несколькими опорными изображениями. DE-ViT демонстрирует новые достижения в области обнаружения объектов с открытым словарем, несколькими снимками и одним снимком в сравнении с COCO и LVIS .git clone https://github.com/mlzxy/devit.git
🖥 Github: https://github.com/mlzxy/devit
📕 Paper: https://arxiv.org/abs/2309.12969v1
⭐️ Dataset: https://paperswithcode.com/dataset/mscoco
ai_machinelearning_big_data
🗣 Leveraging In-the-Wild Data for Effective Self-Supervised Pretraining in Speaker Recognition
Продвинутый инструментарий и набор данных для задач распознавания говорящего. pip3 install wespeakerruntime
🖥 Github: https://github.com/wenet-e2e/wespeaker
📕 Paper: https://arxiv.org/abs/2309.11730v1
⏩ Demo: https://huggingface.co/spaces/wenet/wespeaker_demo
⭐️ Dataset: https://paperswithcode.com/dataset/wenetspeech
ai_machinelearning_big_data
🚀 Gold-YOLO: Efficient Object Detector via Gather-and-Distribute Mechanism
Gold-YOLO, which boosts the multi-scale feature fusion capabilities and achieves an ideal balance between latency and accuracy across all model scales.
Модель Gold-YOLO-N достигает выдающегося результата в обнаружении объектов и превосходит предыдущую модель SOTA YOLOv6-3.0-N с аналогичным FPS.
🖥 Github: https://github.com/huawei-noah/Efficient-Computing/tree/master/Detection/Gold-YOLO
📕 Paper: https://arxiv.org/abs/2309.11331v2
⏩ Dataset: https://paperswithcode.com/dataset/coco
ai_machinelearning_big_data?boost - boost to see premium content
Примите участие в AI Challenge - международном конкурсе по искусственному интеллекту для молодежи от Сбера
Это отличная возможность для школьников и выпускников до 18 лет получить знания и навыки в области искусственного интеллекта, а также приобрести друзей со всего мира.
Участники будут соревноваться в пяти направлениях: от медицины до креативных индустрий.
Отбор пройдет в 4 этапа: регистрация, командная работа, финальный этап с защитой перед экспертами и награждение. Призовой фонд разделят победители в каждом направлении.
Зарегистрироваться можно прямо сейчас на сайте конкурса.
🔥 Мы в Yandex for Developers запускаем четыре новых канала для разработчиков
Теперь Yandex for — это целая семья телеграм-каналов по разным направлениям: фронтенд, бэкенд, мобильная разработка и ML.
В каждом из них мы будем рассказывать всё о жизни определённого комьюнити инженеров внутри Яндекса — начиная с анонсов всех стековых мероприятий и заканчивая техническими подборками от разработчиков, интервью с инженерами и полезной информацией по найму. А в этом большом телеграм-канале мы продолжим рассказывать про главные события Яндекса для разработчиков, уже не боясь немножечко поднадоесть вам.
Давайте обсуждать технологии, знакомиться и развивать сообщество инженеров:
➡️ Yandex for Mobile
➡️ Yandex for Frontend
➡️ Yandex for Backend
➡️ Yandex for ML
В общем, переходите на наши каналы — всё самое интересное только начинается!
Подписывайтесь 👉 @Yandex4Developers
Реклама. ООО "Яндекс". erid: 2VtzqvyJJuX
❗️ Как стать высокооплачиваемым специалистом в ML?
👉 Совершенствуй мастерство ML в сообществе единомышленников на открытом уроке 26 сентября в 20:00 мск — «Алгоритм PCA как один из популярных Unsupervised алгоритмов ML»
🔹 Зачастую нам приходится проецировать многомерные данные на плоскость либо в пространство меньшей размерности. На открытом уроке вы узнаете, что из себя представляет задача снижения размерности
📌 Результаты урока:
Вы изучите основные техники снижения размерности и изучите метод PCA
👉 РЕГИСТРАЦИЯ
https://otus.pw/2w31/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KLmha