ai_machinelearning_big_data | Technologies

Telegram-канал ai_machinelearning_big_data - Machinelearning

27345

Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml

Subscribe to a channel

Machinelearning

fastMONAI: A low-code deep learning library for medical image analysis

Simplifying deep learning for medical imaging.

fastMONAI упрощает использование современных методов глубокого обучения в анализе трехмерных медицинских изображений для решения задач классификации, регрессии и сегментации. fastMONAI предоставляет пользователям функциональные возможности для поэтапной загрузки данных, предварительной обработки, обучения и интерпретации результатов.

git clone https://github.com/MMIV-ML/fastMONAI

🖥 Github: https://github.com/MMIV-ML/fastMONAI

Project: https://fastmonai.no

📕 Paper: https://www.sciencedirect.com/science/article/pii/S2665963823001203

🖥 Colab: https://colab.research.google.com/github/MMIV-ML/fastMONAI/blob/master/nbs/10a_tutorial_classification.ipynb

ai_machinelearning_big_data

Читать полностью…

Machinelearning

⭐️Scenimefy: Learning to Craft Anime Scene via Semi-Supervised Image-to-Image Translation

Фреймворк для автоматической высококачественной генерации аниме-сцен из изображений реального мира.

git clone https://github.com/Yuxinn-J/Scenimefy.git

🖥 Github: https://github.com/Yuxinn-J/Scenimefy/tree/main

☑️ Demo: https://huggingface.co/spaces/YuxinJ/Scenimefy

📕 Paper: https://arxiv.org/abs/2308.12968

Project: https://yuxinn-j.github.io/projects/Scenimefy.html

⭐️ Dataset: https://github.com/Yuxinn-J/Scenimefy/tree/main#open_file_folder-anime-scene-dataset

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Сбер расширяет географию своих ивентов: 6 октября в Тбилиси состоится первый технологический митап, посвящённый разработке рекомендательных систем 👨‍💻

На RecSys MeetUp вы познакомитесь с экспертами Сбера, станете частью одного из крупнейших IT-комьюнити и узнаете о:

✔️ Технологических трендах в области искусственного интеллекта и машинного обучения.

✔️ Устройстве современных стримингов компаний-партнёров Сбера.

Гарантируем: будет интересно и безумно полезно каждому DS-специалисту. Регистрируйтесь по ссылке, встречаемся 6 октября в 18:30 по адресу: Тбилиси, Ресторан на 6 этаже отеля «Golden Palace», переулок Агмашенебели 62 💚

Читать полностью…

Machinelearning

❗️ Как устроены методы коллаборативной фильтрации для рекомендательных систем?

👉 Изучаем SVD алгоритм на открытом уроке 25 сентября в 17:30 мск — «Методы коллаборативной фильтрации для рекомендательных систем: изучаем SVD алгоритм»


🔹 На занятии мы обсудим один из самых мощных алгоритмов области рексис, основанный на сингулярном разложении матрицы (SVD)

📌 Результаты урока:
Вы примените на практике подход на основе SVD разложения матрицы для построения рекомендательной системы

👉 РЕГИСТРАЦИЯ
https://otus.pw/efun/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru. Вебинар пройдет в преддверии старта онлайн-курса «Machine Learning. Advanced» от OTUS.

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8JvLoA

Читать полностью…

Machinelearning

Команда AGIMA приглашает вас на онлайн-митап «Чат-боты и языковые модели: автоматизируй, нанимай, упрощай, формализируй». Он пройдет 28 сентября.

Эксперты из СДЭК, Маруся ВК, РЖД и AGIMA.AI расскажут:

какие функции есть у чат-ботов и как они упрощают обслуживание клиентов;
как создать голосового помощника и внедрить его в бизнес-процессы;
зачем и как внедрять корпоративные боты;
как быстро внедрить умные чат-боты на основе GPT.

Участие бесплатное, регистрация — по ссылке выше.

Реклама. ООО "АГИМА ПРОДАКШН". ИНН 7707398117. erid: LjN8KMmqi

Читать полностью…

Machinelearning

⚡️TokenFlow: Consistent Diffusion Features for Consistent Video Editing

Framework that harnesses the power of a text-to-image diffusion model for the task of text-driven video editing.

TokenFlow - это фреймворк, позволяющий последовательно редактировать видео, используя предварительно обученную модель диффузии текста в изображение, без дополнительного обучения и настройки.

Нейросеть
генерирует анимации высокого качества, сохраняя расположение и динамику из исходого ролика.

🖥 Github: https://github.com/omerbt/TokenFlow

🤗HF: https://huggingface.co/spaces/weizmannscience/tokenflow

📕 Paper: https://arxiv.org/abs/2307.10373

Project: https://diffusion-tokenflow.github.io/


ai_machinelearning_big_data?boost - boost to see premium content

Читать полностью…

Machinelearning

🏆 LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models

13B and 70B 32k models with the supervised fine-tuning, which is feasible for long context

LongLoRA - эффективный подход к файнтюнингу, позволяющий расширить размер контекста предварительно обученных больших языковых моделей (БЯМ) при ограниченных вычислительных затратах.

🖥 Github: https://github.com/dvlab-research/longlora

📕 Paper: https://arxiv.org/abs/2309.12307v1

⭐️ Demo: https://b3cfcf9e79ff42df5f.gradio.live/

Dataset: https://paperswithcode.com/dataset/pg-19

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🚀Break-A-Scene: Extracting Multiple Concepts from a Single Image

Given method can learn a distinct token for each concept, and use natural language guidance to re-synthesize the individual concepts or combinations of them in various contexts

Новый Фреймворк от Google для декомпозиции сцен из изобра
жений .

🖥 Github: https://github.com/google/break-a-scene

📕 Paper: https://arxiv.org/abs/2305.16311

Project: https://omriavrahami.com/break-a-scene/

📌 Video: https://www.youtube.com/watch?v=-9EA-BhizgM

ai_machinelearning_big_data

Читать полностью…

Machinelearning

😠 GPTFUZZER : Red Teaming Large Language Models with Auto-Generated Jailbreak Prompts

Fuzzer maintains over 90% attack success rate against ChatGPT and Llama-2 models.

Новый фреймворк для фаззинга , созданный на основе фреймворка AFL. Вместо ручного проектирования fuzzer автоматизирует генерацию шаблонов джейлбрейка для LLM.


🖥 Github: https://github.com/sherdencooper/gptfuzz

📕 Paper: https://arxiv.org/abs/2309.10253v1

Dataset: https://sites.google.com/view/llm-jailbreak-study

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📊 PAMS: Platform for Artificial Market Simulations

Artificial market simulation is a multi-agent simulation and run virtual markets on your computer.

Имитация искусственных рынков - это многоагентное моделирование и запуск виртуальных рынков на вашем компьютере. На искусственных рынках существуют виртуальные рынки и виртуальные агенты, имитирующие реальных трейдеров.

С помощью искусственного моделирования рынков мы можем анализировать механизмы того, что происходит на реальных рынках.

$ pip install pams

🖥 Github: https://github.com/masanorihirano/pams

📕 Paper: https://arxiv.org/abs/2309.10729v1

Docs: https://pams.hirano.dev/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Открылась регистрация на международный чемпионат по программированию Yandex Cup с призовым фондом в 7,8 млн рублей

Участники могут выбрать среди шести направлений: аналитика, фронтенд- и бэкенд-разработка, мобильная разработка, машинное обучение и «Алгоритм», посвящённый спортивному программированию — последний пройдёт не только на русском, но и английском языке.

Задания Yandex Cup составляют сотрудники Яндекса на основе тех задач, с которыми сталкиваются в повседневной работе.
При этом чемпионат посетит большое количество опытных разработчиков, а участвовать могут разработчики разного уровня — участвовать могут как студенты, так и сеньоры.

ai_machinelearning_big_data

Читать полностью…

Machinelearning

⛓️🛠️ ChainForge: A Visual Toolkit for Prompt Engineering and LLM Hypothesis Testing

Среда визуального программирования с открытым исходным кодом для создания промптов, проведения экспериментов и оперативной оценки LLM.


pip install chainforge

🖥 Github: https://github.com/ianarawjo/ChainForge

⭐️ Project: https://chainforge.ai

📕 Paper: https://arxiv.org/abs/2309.09128v1

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🦙 LLaVA: Large Language and Vision Assistant

LLaVA - новая комплексная мультимодальная модель, которая подробно объяснит любое изображение

git clone https://github.com/haotian-liu/LLaVA.git
cd LLaVA


🖥 Github: https://github.com/haotian-liu/LLaVA

📕 Paper: https://arxiv.org/pdf/2309.09958v1.pdf

⭐️ Datasets: https://paperswithcode.com/dataset/mmlu

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🚀Breathing New Life into 3D Assets with Generative Repainting

Новая модель. которая переносит возможности генеративных моделей 2D-изображений, таких как Stable Diffusion, в 3D. Проект позволяет получить яркие генерации 3D-объектов в различных категориях форм.

🖥 Github: https://github.com/kongdai123/repainting_3d_assets

☑️ Demo: https://www.obukhov.ai/repainting_3d_assets

🖥 Colab: https://colab.research.google.com/drive/18mDpuYO5TuI6tSkQk9ls2rS9sciNpR-c?usp=sharing

📕 Paper: https://arxiv.org/abs/2309.08523v1

⭐️ Datasets: https://paperswithcode.com/dataset/shapenet

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥Free Certification Courses from Microsoft to try in 2023:

Бесплатные сертификационные курсы от Microsoft, которые можно пройти в 2023 году.

1. Get started with Microsoft data analytics
https://learn.microsoft.com/en-us/training/paths/data-analytics-microsoft

2. Prepare data for analysis with Power BI

https://learn.microsoft.com/en-us/training/paths/prepare-data-power-bi

3. Model data with Power BI
https://learn.microsoft.com/en-us/training/paths/model-data-power-bi

4. Build Power BI visuals and reports
https://learn.microsoft.com/en-us/training/paths/build-power-bi-visuals-reports

5. Data analysis in Power BI
https://coursya.com/product/microsoft-power-bi-data-analyst

6. Visualize data in Power BI
https://coursya.com/product/build-power-bi-visuals-and-reports-training

7. Model data in Power BI
https://coursya.com/product/power-bi-for-beginners-designing-a-data-model

8. Prepare data for analysis
https://coursya.com/product/prepare-data-for-analysis-training

9. Get started with Microsoft data analytics
https://coursya.com/product/get-started-with-microsoft-data-analytics-training

10. Microsoft Certified: Power BI Data Analyst Associate
https://coursya.com/product/microsoft-certified-power-bi-data-analyst-associate-certifications

ai_machinelearning_big_data

Читать полностью…

Machinelearning

VK Data Meetup — митап об инструментах и людях, которые умеют работать с данными

⏰ Когда: 12 октября, 14:00 по Москве
📍 Регистрация

VK Data Meetup — это серия событий о практиках работы с данными на разных уровнях.

Митап 12 октября посвящен работе с большими данными и ML. Обсудим:
• Тренды работы с данными;
• Процессы взаимодействия со смежными подразделениями и внутри дата-команд;
• Новые инструменты, такие как Spark on Kubernetes и No Code AutoML-платформы;
• Кейсы решения практических бизнес-задач от ведущих российских компаний.

Митап будет интересен дата- и ML-инженерам, тимлидам и разработчикам платформ данных, архитекторам и специалистам по Data Science.

Присоединяйтесь к сообществу VK Data Meetup, чтобы узнать про работающие практики и поделиться своим опытом.

Зарегистрироваться

Читать полностью…

Machinelearning

⭐️ Advanced NLP

Advanced NLP from Carnegie Mellon University.
Advanced NLP from MIT.

The course covers current state-of-the-art NLP techniques & algorithms.

Курс: Продвинутый NLP от Университета Карнеги-Меллон.
Курс: Advanced Natural Language Processing от MIT.

Курсы охватывают современные техники и алгоритмы NLP.

Одни из лучших курсов по НЛП в Интернете!

CMU:📌Лекции | Курс
MIT: 📌Лекции | Курс

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🎓 BayesDLL: Bayesian Deep Learning Library

New Bayesian neural network library for PyTorch for large-scale deep network

Новая библиотека байесовских нейронных сетей для PyTorch, предназначенную для работы с крупномасштабными глубокими сетями.

В библиотеке реализованы основные алгоритмы приближенного байесовского вывода: вариационный вывод, MC-dropout, стохастически-градиентный MCMC и аппроксимация Лапласа.

Основные отличия от других существующих библиотек байесовских нейронных сетей заключаются в следующем:

1) библиотека может работать с очень крупными моделями, в том числе с Vision Transformers
2) Практически не требует от пользователей модификации кода .
3)Позволяет использовать предварительно обученные веса модели в качестве средних значений, что полезно для проведения байесовских вычислений в крупномасштабных моделях типа ViTs, которые трудно оптимизировать с нуля на основе одних только исходных данных.

🖥 Github: https://github.com/samsunglabs/bayesdll

📕 Paper: https://arxiv.org/abs/2309.12928v1

⭐️ Dataset: https://paperswithcode.com/dataset/oxford-102-flower

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔎Detect Every Thing with Few Examples

DE-ViT surpasses the few-shot SoTA by 15 mAP on 10-shot and 7.2 mAP on 30-shot and one-shot SoTA by 2.8 AP50.


Высокоточный детектор объектов, который в отличие от популярного подхода с открытым словарем, описывает каждую категорию объектов не языком, а несколькими опорными изображениями. DE-ViT демонстрирует новые достижения в области обнаружения объектов с открытым словарем, несколькими снимками и одним снимком в сравнении с COCO и LVIS .

git clone https://github.com/mlzxy/devit.git

🖥 Github: https://github.com/mlzxy/devit

📕 Paper: https://arxiv.org/abs/2309.12969v1

⭐️ Dataset: https://paperswithcode.com/dataset/mscoco

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🗣 Leveraging In-the-Wild Data for Effective Self-Supervised Pretraining in Speaker Recognition

Продвинутый инструментарий и набор данных для задач распознавания говорящего.

pip3 install wespeakerruntime

🖥 Github: https://github.com/wenet-e2e/wespeaker

📕 Paper: https://arxiv.org/abs/2309.11730v1

Demo: https://huggingface.co/spaces/wenet/wespeaker_demo

⭐️ Dataset: https://paperswithcode.com/dataset/wenetspeech

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🚀 Gold-YOLO: Efficient Object Detector via Gather-and-Distribute Mechanism

Gold-YOLO, which boosts the multi-scale feature fusion capabilities and achieves an ideal balance between latency and accuracy across all model scales.

Модель Gold-YOLO-N достигает выдающегося результата в обнаружении объектов и превосходит предыдущую модель SOTA YOLOv6-3.0-N с аналогичным FPS.

🖥 Github: https://github.com/huawei-noah/Efficient-Computing/tree/master/Detection/Gold-YOLO

📕 Paper: https://arxiv.org/abs/2309.11331v2

Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data?boost - boost to see premium content

Читать полностью…

Machinelearning

Примите участие в AI Challenge - международном конкурсе по искусственному интеллекту для молодежи от Сбера

Это отличная возможность для школьников и выпускников до 18 лет получить знания и навыки в области искусственного интеллекта, а также приобрести друзей со всего мира.

Участники будут соревноваться в пяти направлениях: от медицины до креативных индустрий.

Отбор пройдет в 4 этапа: регистрация, командная работа, финальный этап с защитой перед экспертами и награждение. Призовой фонд разделят победители в каждом направлении.

Зарегистрироваться можно прямо сейчас на сайте конкурса.

Читать полностью…

Machinelearning

🔥 Мы в Yandex for Developers запускаем четыре новых канала для разработчиков

Теперь Yandex for — это целая семья телеграм-каналов по разным направлениям: фронтенд, бэкенд, мобильная разработка и ML.

В каждом из них мы будем рассказывать всё о жизни определённого комьюнити инженеров внутри Яндекса — начиная с анонсов всех стековых мероприятий и заканчивая техническими подборками от разработчиков, интервью с инженерами и полезной информацией по найму. А в этом большом телеграм-канале мы продолжим рассказывать про главные события Яндекса для разработчиков, уже не боясь немножечко поднадоесть вам.

Давайте обсуждать технологии, знакомиться и развивать сообщество инженеров:

➡️ Yandex for Mobile

➡️ Yandex for Frontend

➡️ Yandex for Backend

➡️ Yandex for ML

В общем, переходите на наши каналы — всё самое интересное только начинается!

Подписывайтесь 👉 @Yandex4Developers

Реклама. ООО "Яндекс". erid: 2VtzqvyJJuX

Читать полностью…

Machinelearning

❗️ Как стать высокооплачиваемым специалистом в ML?

👉 Совершенствуй мастерство ML в сообществе единомышленников на открытом уроке 26 сентября в 20:00 мск —  «Алгоритм PCA как один из популярных Unsupervised алгоритмов ML»

🔹 Зачастую нам приходится проецировать многомерные данные на плоскость либо в пространство меньшей размерности. На открытом уроке вы узнаете, что из себя представляет задача снижения размерности

📌 Результаты урока:
Вы изучите основные техники снижения размерности и изучите метод PCA

👉 РЕГИСТРАЦИЯ
https://otus.pw/2w31/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KLmha

Читать полностью…

Machinelearning

dall-e-3 is here !

https://openai.com/dall-e-3

Читать полностью…

Machinelearning

Правила и стратегии для обеспечения точных и надежных данных
X5 Tech проводит Data Quality Meetup

На митапе 27 сентября расскажут о том, как измеряется качество данных, для чего нужен этот показатель, почему специализированный инструмент Ataccama ONE недостаточно специализирован для нужд компании и как его дорабатывают.

🔹 В онлайн формате выступят спикеры X5 Tech: ведущие менеджеры по качеству данных Наталья Цой и Анастасия Щедрякова, а также Лилия Скляр, руководитель направления и по совместительству модератор события.

🔔 Старт в 18:00

Регистрация и подробности тут
Участие бесплатное

Реклама. ООО "Корпоративный центр ИКС 5", ИНН 7728632689 , erid: LjN8KSdBV

Читать полностью…

Machinelearning

Команда VK Cloud недавно запустила новый канал о работе с данными — Данные на стероидах.

В нем ребята публикуют подборки интересного контента по темам Data science, ML и Big Data. Например, рассказывают, про планирование и жизненный цикл ML-проектов, из-за чего происходят и как избежать утечек при работе с ML, или как создавать футуристичные графики с помощью Python.

Помимо прочего, в канале много полезной информации о работе с данными, архитектуре дата-решений и новостей российского и международного Data-сообщества.

👉🏻 Подписывайтесь на канал Данные на стероидах, будет интересно!

Читать полностью…

Machinelearning

SmartDev 2023 — большая конференция про технологии от Сбера

21 сентября в кинотеатре «Октябрь» пройдет технологическая конференция SmartDev 2023, организованная Сбером. На одной площадке соберутся ведущие инженеры и разработчики из Сбера, VK, Яндекса, Kaspersky и других компаний, чтобы обменяться опытом создания лучших технологических решений в мире.

Основные темы конференции:
– Машинное обучение и искусственный интеллект
– Архитектура программных решений
– DevOps
– Работа с большими данными
– Безопасность приложений
– Инновации и стратегии в разработке ПО

Помимо этого впервые в России можно услышать выступление генерального директора Gitee, китайского аналога GitHub.Yong Xu.
Также участники конференции смогут задать вопросы создателям нашумевших проектов от Сбера — сервиса GigaChat и нейросети Kandinsky.

Конференция соберёт 1500 участников в офлайне и несколько тысяч зрителей в онлайне.
Участие бесплатное, подробности и регистрация — на сайте конференции.

Читать полностью…

Machinelearning

🫦 HDTR: A Real-Time High-Definition Teeth Restoration Network for Arbitrary Talking Face Generation Methods

Talking Face Generation - новый проект для реконструкции движений лица для достижения высокой естественности движений губ из аудио.


🖥 Github: https://github.com/yylgoodlucky/HDTR-Net

📕 Paper: https://arxiv.org/abs/2309.07495v1

⭐️ Datasets: https://paperswithcode.com/dataset/lrs2

ai_machinelearning_big_data

Читать полностью…

Machinelearning

💥 MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning

MMICL is a multimodal vision-language model with the ability to analyze and understand multiple images, as well as follow instructions.

MMICL - это хорошо продуманная модель
с датасетом, которая позволяет беспрепятственно интегрировать визуальный и текстовый контекст в чередующемся виде для разработки
крупных мультимодальных моделей.

🖥 Github: https://github.com/haozhezhao/mic

📕 Paper: https://arxiv.org/abs/2309.07915v1

⭐️ Datasets: https://paperswithcode.com/dataset/mmbench
ai_machinelearning_big_data

Читать полностью…
Subscribe to a channel