ai_machinelearning_big_data | Technologies

Telegram-канал ai_machinelearning_big_data - Machinelearning

27349

Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml

Subscribe to a channel

Machinelearning

Demystifying CLIP Data

MetaCLIP takes a raw data pool and metadata and yields a balanced subset over the metadata distribution.

Новый масштабируемый алгоритм MetaCLIP, работающий в конвейере обработки данных. MetaCLIP, примененная к CommonCrawl с 400 млн. пар данных "изображение-текст", превосходит данные CLIP по многим стандартным показателям. В классификации ImageNet точность MetaCLIP составляет 70,8%, что превосходит точность CLIP в 68,3% на моделях ViT-B.

🖥 Github: https://github.com/facebookresearch/metaclip

📕 Paper: https://arxiv.org/pdf/2309.16671v1.pdf

⭐️ Dataset: https://paperswithcode.com/dataset/laion-400m

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🖥 40+ IT-компаний ищут студентов на оплачиваемую стажировку

 
На форуме “Найти IT” Сбер, Росатом, Kaspersky и другие топовые компании завалят вас предложениями о работе!

Найти IT” — это:
🔹 Мастер-классы и кейсы от крутых компаний
🔹 Предварительные собеседования и Q&A со спикерами
🔹 Мерч, призы и вкусная еда

И все это бесплатно 😲 Нужно только прийти!

Выбирате город и регистрируйтесь 👇
📍 Москва: 3 октября
📍 Санкт-Петербург: 7 октября
📍 Новосибирск: 26 октября 

Реклама. ООО "ФТ". ИНН 7731611424. erid: LjN8KUcKb

Читать полностью…

Machinelearning

🔎 Датасет для анализа русскоязычных отзывов на организации

Яндекс опубликовал крупнейший русскоязычный датасет, в котором содержится 500 тысяч отзывов, собранных с января по июнь 2023 года. Туда входят адреса и названия организаций, список рубрик, оценки пользователей и отзывы. Датасет позволяет, к примеру, производить сентимент-анализ и лингвистический анализ.

Github: https://github.com/yandex/geo-reviews-dataset-2023
Habr: https://habr.com/ru/companies/yandex/articles/763832/

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

Опрос для опытных ИТ-специалистов.

Поделитесь мнением об ИТ-работодателях. Напишите, что вам нравится, а что — нет. Так компании смогут исправить ошибки, улучшить условия и присылать офферы, на которые хочется соглашаться.

Посмотрите, это займет не больше 10 минут

Читать полностью…

Machinelearning

🤖 Machine Learning Tutorials Repository
Добро пожаловать в репозиторий учебников по машинному обучению. Примеры кода и поянения по:

1.🖥 Python
2.
👁‍🗨 Computer Vision: Techniques, algorithms
3.
🖋 NLP
4.
📊 Matplotlib
5.
🔢 NumPy
6.
🐼 Pandas
7.
🎇 MLOps
8.
🧠 LLMs
9.
🔥 PyTorch/TensorFlow

git clone https://github.com/patchy631/machine-learning

Github

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔊 Listen, Think, and Understand

AI model that has both audio perception and a reasoning ability.

LTU-AS - модель универсального восприятия звука , которая способна к рассуждению. В частности, благодаря интеграции Whisper в качестве модуля восприятия и LLaMA в качестве модуля рассуждений, LTU-AS может одновременно распознавать и совместно понимать устный текст, паралингвистику, практически все, что можно воспринять из аудиосигналов.

🖥 Github: https://github.com/YuanGongND/ltu

☑️ Demo: https://18c618fc8f07ec494e.gradio.live/

📕 Paper: https://arxiv.org/abs/2309.14405v1

🤗 HH: https://huggingface.co/spaces/yuangongfdu/ltu-2

⭐️ Dataset: https://paperswithcode.com/dataset/iemocap

ai_machinelearning_big_data

Читать полностью…

Machinelearning

VK Data Meetup — митап об инструментах и людях, которые умеют работать с данными

⏰ Когда: 12 октября, 14:00 по Москве
📍 Регистрация

VK Data Meetup — это серия событий о практиках работы с данными на разных уровнях.

Митап 12 октября посвящен работе с большими данными и ML. Обсудим:
• Тренды работы с данными;
• Процессы взаимодействия со смежными подразделениями и внутри дата-команд;
• Новые инструменты, такие как Spark on Kubernetes и No Code AutoML-платформы;
• Кейсы решения практических бизнес-задач от ведущих российских компаний.

Митап будет интересен дата- и ML-инженерам, тимлидам и разработчикам платформ данных, архитекторам и специалистам по Data Science.

Присоединяйтесь к сообществу VK Data Meetup, чтобы узнать про работающие практики и поделиться своим опытом.

Зарегистрироваться

Читать полностью…

Machinelearning

⭐️ Advanced NLP

Advanced NLP from Carnegie Mellon University.
Advanced NLP from MIT.

The course covers current state-of-the-art NLP techniques & algorithms.

Курс: Продвинутый NLP от Университета Карнеги-Меллон.
Курс: Advanced Natural Language Processing от MIT.

Курсы охватывают современные техники и алгоритмы NLP.

Одни из лучших курсов по НЛП в Интернете!

CMU:📌Лекции | Курс
MIT: 📌Лекции | Курс

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🎓 BayesDLL: Bayesian Deep Learning Library

New Bayesian neural network library for PyTorch for large-scale deep network

Новая библиотека байесовских нейронных сетей для PyTorch, предназначенную для работы с крупномасштабными глубокими сетями.

В библиотеке реализованы основные алгоритмы приближенного байесовского вывода: вариационный вывод, MC-dropout, стохастически-градиентный MCMC и аппроксимация Лапласа.

Основные отличия от других существующих библиотек байесовских нейронных сетей заключаются в следующем:

1) библиотека может работать с очень крупными моделями, в том числе с Vision Transformers
2) Практически не требует от пользователей модификации кода .
3)Позволяет использовать предварительно обученные веса модели в качестве средних значений, что полезно для проведения байесовских вычислений в крупномасштабных моделях типа ViTs, которые трудно оптимизировать с нуля на основе одних только исходных данных.

🖥 Github: https://github.com/samsunglabs/bayesdll

📕 Paper: https://arxiv.org/abs/2309.12928v1

⭐️ Dataset: https://paperswithcode.com/dataset/oxford-102-flower

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔎Detect Every Thing with Few Examples

DE-ViT surpasses the few-shot SoTA by 15 mAP on 10-shot and 7.2 mAP on 30-shot and one-shot SoTA by 2.8 AP50.


Высокоточный детектор объектов, который в отличие от популярного подхода с открытым словарем, описывает каждую категорию объектов не языком, а несколькими опорными изображениями. DE-ViT демонстрирует новые достижения в области обнаружения объектов с открытым словарем, несколькими снимками и одним снимком в сравнении с COCO и LVIS .

git clone https://github.com/mlzxy/devit.git

🖥 Github: https://github.com/mlzxy/devit

📕 Paper: https://arxiv.org/abs/2309.12969v1

⭐️ Dataset: https://paperswithcode.com/dataset/mscoco

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🗣 Leveraging In-the-Wild Data for Effective Self-Supervised Pretraining in Speaker Recognition

Продвинутый инструментарий и набор данных для задач распознавания говорящего.

pip3 install wespeakerruntime

🖥 Github: https://github.com/wenet-e2e/wespeaker

📕 Paper: https://arxiv.org/abs/2309.11730v1

Demo: https://huggingface.co/spaces/wenet/wespeaker_demo

⭐️ Dataset: https://paperswithcode.com/dataset/wenetspeech

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🚀 Gold-YOLO: Efficient Object Detector via Gather-and-Distribute Mechanism

Gold-YOLO, which boosts the multi-scale feature fusion capabilities and achieves an ideal balance between latency and accuracy across all model scales.

Модель Gold-YOLO-N достигает выдающегося результата в обнаружении объектов и превосходит предыдущую модель SOTA YOLOv6-3.0-N с аналогичным FPS.

🖥 Github: https://github.com/huawei-noah/Efficient-Computing/tree/master/Detection/Gold-YOLO

📕 Paper: https://arxiv.org/abs/2309.11331v2

Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data?boost - boost to see premium content

Читать полностью…

Machinelearning

Примите участие в AI Challenge - международном конкурсе по искусственному интеллекту для молодежи от Сбера

Это отличная возможность для школьников и выпускников до 18 лет получить знания и навыки в области искусственного интеллекта, а также приобрести друзей со всего мира.

Участники будут соревноваться в пяти направлениях: от медицины до креативных индустрий.

Отбор пройдет в 4 этапа: регистрация, командная работа, финальный этап с защитой перед экспертами и награждение. Призовой фонд разделят победители в каждом направлении.

Зарегистрироваться можно прямо сейчас на сайте конкурса.

Читать полностью…

Machinelearning

🔥 Мы в Yandex for Developers запускаем четыре новых канала для разработчиков

Теперь Yandex for — это целая семья телеграм-каналов по разным направлениям: фронтенд, бэкенд, мобильная разработка и ML.

В каждом из них мы будем рассказывать всё о жизни определённого комьюнити инженеров внутри Яндекса — начиная с анонсов всех стековых мероприятий и заканчивая техническими подборками от разработчиков, интервью с инженерами и полезной информацией по найму. А в этом большом телеграм-канале мы продолжим рассказывать про главные события Яндекса для разработчиков, уже не боясь немножечко поднадоесть вам.

Давайте обсуждать технологии, знакомиться и развивать сообщество инженеров:

➡️ Yandex for Mobile

➡️ Yandex for Frontend

➡️ Yandex for Backend

➡️ Yandex for ML

В общем, переходите на наши каналы — всё самое интересное только начинается!

Подписывайтесь 👉 @Yandex4Developers

Реклама. ООО "Яндекс". erid: 2VtzqvyJJuX

Читать полностью…

Machinelearning

❗️ Как стать высокооплачиваемым специалистом в ML?

👉 Совершенствуй мастерство ML в сообществе единомышленников на открытом уроке 26 сентября в 20:00 мск —  «Алгоритм PCA как один из популярных Unsupervised алгоритмов ML»

🔹 Зачастую нам приходится проецировать многомерные данные на плоскость либо в пространство меньшей размерности. На открытом уроке вы узнаете, что из себя представляет задача снижения размерности

📌 Результаты урока:
Вы изучите основные техники снижения размерности и изучите метод PCA

👉 РЕГИСТРАЦИЯ
https://otus.pw/2w31/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KLmha

Читать полностью…

Machinelearning

🔊 Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation

Модель генерации реалистичных видео из Аудио. Фреймворк способен распознать природу звука и сгенерировать визуальный образ.

git clone git@github.com:guyyariv/TempoTokens.git

🖥 Github: https://github.com/guyyariv/TempoTokens

📕 Paper: https://arxiv.org/abs/2309.16429v1

⭐️ Dataset: https://paperswithcode.com/dataset/audioset

ai_machinelearning_big_data

Читать полностью…

Machinelearning

DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation

A novel 3D content generation framework that achieves both efficiency and quality simultaneously.

DreamGaussian - новый фреймворк для генерации 3D-контента, позволяющий достичь одновременно эффективности и высокого качества генераций.

Работает на безе алгоритма преобразования трехмерных гауссианов в текстурированные сетки с применения файнтюнинга для улучшения деталей. Обширные эксперименты демонстрируют высокую эффективность и конкурентоспособное качество генерации предложенного подхода.


🖥 Github: https://github.com/dreamgaussian/dreamgaussian

☑️ Image-to-3D: https://colab.research.google.com/drive/1sLpYmmLS209-e5eHgcuqdryFRRO6ZhFS?usp=sharing

☑️ Text-to-3d: https://colab.research.google.com/github/camenduru/dreamgaussian-colab/blob/main/dreamgaussian_colab.ipynb

📕 Paper: https://arxiv.org/abs/2309.16653v1

⭐️ Dataset: https://paperswithcode.com/dataset/nerf

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔎 Text-to-3D using Gaussian Splatting

Новый подход к созданию высококачественных 3D-объектов - генерация текста в трехмерном пространстве на основе гауссова расслоения (GSGEN).

🎇 GSGEN: Text-to-3D using Gaussian Splatting

🖥 Github: https://github.com/gsgen3d/gsgen

☑️ Project: https://gsgen3d.github.io/

📕 Paper: https://arxiv.org/abs/2309.16585v1

⭐️ Dataset: https://paperswithcode.com/dataset/nerf

ai_machinelearning_big_data

Читать полностью…

Machinelearning

✏️ Deep Geometrized Cartoon Line Inbetweening

Method can effectively capture the sparsity and unique structure of line drawings while preserving the details during inbetweening.

Создание промежуточных кадров между двумя рисунками - трудоемкий и дорогостоящий процесс, новый фреймворк AnimeInbet позволяет автоматизировать эту задачу.

AnimeInbet, геометризирует растровые линейные рисунки в графы конечных точек, решая задачу слияния графов с перестановкой вершин.

🖥 Github: https://github.com/lisiyao21/animeinbet

☑️ Demo: https://youtu.be/iUF-LsqFKpI?si=9FViAZUyFdSfZzS5

📕 Paper: https://arxiv.org/pdf/2309.16643v1.pdf

⭐️ Dataset: https://drive.google.com/file/d/1SNRGajIECxNwRp6ZJ0IlY7AEl2mRm2DR/view?usp=sharing

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📚 С помощью Telegram-бота GigaChat можно искать IT-курсы

Сервис Сбера в ответ на запрос о курсах предлагает не только названия ресурсов, где их можно найти, но и ссылки. К примеру, на запрос о поиске курсов по kubernetes нейросеть предложила пять популярных сайтов.

@gigachat_bot также умеет писать тексты и генерировать картинки, создавать инструкции и отвечать на вопросы. Кроме того, бота можно добавлять в групповые чаты и пользоваться совместно.

Попробовать GigaChat можно, перейдя по ссылке.

ai_machinelearning_big_data

Читать полностью…

Machinelearning

fastMONAI: A low-code deep learning library for medical image analysis

Simplifying deep learning for medical imaging.

fastMONAI упрощает использование современных методов глубокого обучения в анализе трехмерных медицинских изображений для решения задач классификации, регрессии и сегментации. fastMONAI предоставляет пользователям функциональные возможности для поэтапной загрузки данных, предварительной обработки, обучения и интерпретации результатов.

git clone https://github.com/MMIV-ML/fastMONAI

🖥 Github: https://github.com/MMIV-ML/fastMONAI

Project: https://fastmonai.no

📕 Paper: https://www.sciencedirect.com/science/article/pii/S2665963823001203

🖥 Colab: https://colab.research.google.com/github/MMIV-ML/fastMONAI/blob/master/nbs/10a_tutorial_classification.ipynb

ai_machinelearning_big_data

Читать полностью…

Machinelearning

⭐️Scenimefy: Learning to Craft Anime Scene via Semi-Supervised Image-to-Image Translation

Фреймворк для автоматической высококачественной генерации аниме-сцен из изображений реального мира.

git clone https://github.com/Yuxinn-J/Scenimefy.git

🖥 Github: https://github.com/Yuxinn-J/Scenimefy/tree/main

☑️ Demo: https://huggingface.co/spaces/YuxinJ/Scenimefy

📕 Paper: https://arxiv.org/abs/2308.12968

Project: https://yuxinn-j.github.io/projects/Scenimefy.html

⭐️ Dataset: https://github.com/Yuxinn-J/Scenimefy/tree/main#open_file_folder-anime-scene-dataset

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Сбер расширяет географию своих ивентов: 6 октября в Тбилиси состоится первый технологический митап, посвящённый разработке рекомендательных систем 👨‍💻

На RecSys MeetUp вы познакомитесь с экспертами Сбера, станете частью одного из крупнейших IT-комьюнити и узнаете о:

✔️ Технологических трендах в области искусственного интеллекта и машинного обучения.

✔️ Устройстве современных стримингов компаний-партнёров Сбера.

Гарантируем: будет интересно и безумно полезно каждому DS-специалисту. Регистрируйтесь по ссылке, встречаемся 6 октября в 18:30 по адресу: Тбилиси, Ресторан на 6 этаже отеля «Golden Palace», переулок Агмашенебели 62 💚

Читать полностью…

Machinelearning

❗️ Как устроены методы коллаборативной фильтрации для рекомендательных систем?

👉 Изучаем SVD алгоритм на открытом уроке 25 сентября в 17:30 мск — «Методы коллаборативной фильтрации для рекомендательных систем: изучаем SVD алгоритм»


🔹 На занятии мы обсудим один из самых мощных алгоритмов области рексис, основанный на сингулярном разложении матрицы (SVD)

📌 Результаты урока:
Вы примените на практике подход на основе SVD разложения матрицы для построения рекомендательной системы

👉 РЕГИСТРАЦИЯ
https://otus.pw/efun/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru. Вебинар пройдет в преддверии старта онлайн-курса «Machine Learning. Advanced» от OTUS.

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8JvLoA

Читать полностью…

Machinelearning

Команда AGIMA приглашает вас на онлайн-митап «Чат-боты и языковые модели: автоматизируй, нанимай, упрощай, формализируй». Он пройдет 28 сентября.

Эксперты из СДЭК, Маруся ВК, РЖД и AGIMA.AI расскажут:

какие функции есть у чат-ботов и как они упрощают обслуживание клиентов;
как создать голосового помощника и внедрить его в бизнес-процессы;
зачем и как внедрять корпоративные боты;
как быстро внедрить умные чат-боты на основе GPT.

Участие бесплатное, регистрация — по ссылке выше.

Реклама. ООО "АГИМА ПРОДАКШН". ИНН 7707398117. erid: LjN8KMmqi

Читать полностью…

Machinelearning

⚡️TokenFlow: Consistent Diffusion Features for Consistent Video Editing

Framework that harnesses the power of a text-to-image diffusion model for the task of text-driven video editing.

TokenFlow - это фреймворк, позволяющий последовательно редактировать видео, используя предварительно обученную модель диффузии текста в изображение, без дополнительного обучения и настройки.

Нейросеть
генерирует анимации высокого качества, сохраняя расположение и динамику из исходого ролика.

🖥 Github: https://github.com/omerbt/TokenFlow

🤗HF: https://huggingface.co/spaces/weizmannscience/tokenflow

📕 Paper: https://arxiv.org/abs/2307.10373

Project: https://diffusion-tokenflow.github.io/


ai_machinelearning_big_data?boost - boost to see premium content

Читать полностью…

Machinelearning

🏆 LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models

13B and 70B 32k models with the supervised fine-tuning, which is feasible for long context

LongLoRA - эффективный подход к файнтюнингу, позволяющий расширить размер контекста предварительно обученных больших языковых моделей (БЯМ) при ограниченных вычислительных затратах.

🖥 Github: https://github.com/dvlab-research/longlora

📕 Paper: https://arxiv.org/abs/2309.12307v1

⭐️ Demo: https://b3cfcf9e79ff42df5f.gradio.live/

Dataset: https://paperswithcode.com/dataset/pg-19

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🚀Break-A-Scene: Extracting Multiple Concepts from a Single Image

Given method can learn a distinct token for each concept, and use natural language guidance to re-synthesize the individual concepts or combinations of them in various contexts

Новый Фреймворк от Google для декомпозиции сцен из изобра
жений .

🖥 Github: https://github.com/google/break-a-scene

📕 Paper: https://arxiv.org/abs/2305.16311

Project: https://omriavrahami.com/break-a-scene/

📌 Video: https://www.youtube.com/watch?v=-9EA-BhizgM

ai_machinelearning_big_data

Читать полностью…

Machinelearning

😠 GPTFUZZER : Red Teaming Large Language Models with Auto-Generated Jailbreak Prompts

Fuzzer maintains over 90% attack success rate against ChatGPT and Llama-2 models.

Новый фреймворк для фаззинга , созданный на основе фреймворка AFL. Вместо ручного проектирования fuzzer автоматизирует генерацию шаблонов джейлбрейка для LLM.


🖥 Github: https://github.com/sherdencooper/gptfuzz

📕 Paper: https://arxiv.org/abs/2309.10253v1

Dataset: https://sites.google.com/view/llm-jailbreak-study

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📊 PAMS: Platform for Artificial Market Simulations

Artificial market simulation is a multi-agent simulation and run virtual markets on your computer.

Имитация искусственных рынков - это многоагентное моделирование и запуск виртуальных рынков на вашем компьютере. На искусственных рынках существуют виртуальные рынки и виртуальные агенты, имитирующие реальных трейдеров.

С помощью искусственного моделирования рынков мы можем анализировать механизмы того, что происходит на реальных рынках.

$ pip install pams

🖥 Github: https://github.com/masanorihirano/pams

📕 Paper: https://arxiv.org/abs/2309.10729v1

Docs: https://pams.hirano.dev/

ai_machinelearning_big_data

Читать полностью…
Subscribe to a channel