bigdatai | Unsorted

Telegram-канал bigdatai - Big Data AI

17610

@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста

Subscribe to a channel

Big Data AI

🔥 Крутая Шпаргалка по языку Julia

Если вы хотите узнать, чем синтаксис Julia отличается от пайтоновского, то эта шпаргалка — отличный материал для быстрого изучения.

Содержит информацию об использовании:
▪️пакетов;
▪️операторов;
▪️векторов;
▪️разных функций;
▪️датафреймов.

Читать полностью…

Big Data AI

OmniFusion 1.1 представляет собой гибридную LLM, способную взаимодействовать с изображениями.

В дополнение к стандартному текстовому диалогу, OmniFusion 1.1 может отвечать на вопросы, основанные на изображениях. Например, она способна анализировать рукописные задачи, интерпретировать карты или предоставлять рецепты на основе фотографий продуктов.

Эта модель построена на базе Mistral, однако легко заменяема другими языковыми моделями.

Разработчики обеспечили доступ к модели как для некоммерческого, так и для коммерческого использования.

Модель доступна на платформе Hugging Face.

https://github.com/AIRI-Institute/OmniFusion

@bigdatai

Читать полностью…

Big Data AI

NVIDIA’s AI Puts You In a Video Game 75,000x Faster!

https://www.youtube.com/watch?v=CyIqd_HR6rY

@bigdatai

Читать полностью…

Big Data AI

🔥Подборка лучших обучающих каналов для программистов.

➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять

⚡Машинное обучение

Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат

🏆 Golang
Golang - изучи один из самых перспективных языков на ит-рынке
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест

💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность

🚀 Data Science

Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data

🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных

#️⃣C#

С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа

🐍 Python

Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги

☕ Java

Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги

💻 C++

C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии

⚡️ Frontend
Javascript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend

🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов

📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки

🇬🇧 Английский для программистов

🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence

🔥 DevOPs
Devops для программистов
Книги Devops

🌟 Docker/Kubernets
Docker
Kubernets

📓 Книги
Библиотеки Книг для программситов

💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend

Читать полностью…

Big Data AI

🎓 Курс квантового машинного обучения

Бесплатный курс от сообщества ODS, который содержит лекции разных уровней сложности и глубины.

Все объяснения идут с кодом.

@bigdatai

Читать полностью…

Big Data AI

📌Spotify тестирует ИИ-плейлисты

Spotify запустила бета-версию ИИ-плейлистов для пользователей из Великобритании и Австралии. С её помощью можно генерировать плейлисты с помощью подсказок на естественном языке.

@bigdatai

Читать полностью…

Big Data AI

⚡️ Большое обновление для бенчмарка Massive Text Embedding Benchmark (MTEB), призванное упростить поиск подходящей модели для эмбедингов!

Удобная фильтрация моделей, поиск, использование памяти, размер модели по параметрам.

Обновленный лидерборд: https://huggingface.co/spaces/mteb/leaderboard

@bigdatai

Читать полностью…

Big Data AI

DeepMind’s New AI: Assistant From The Future!

https://www.youtube.com/watch?v=Z_EliVUkuFA

@bigdatai

Читать полностью…

Big Data AI

⚡ динамический 4D рендеринг человека ⚡️

Новая модель динамической 4D визуализации человека.

- Проект: https://taohuumd.github.io/projects/SurMo/
- Docs: https://arxiv.org/abs/2404.01225
- Код: https://github.com/TaoHuUMD/SurMo

@bigdatai

Читать полностью…

Big Data AI

🔜 Intel планирует опередить TSMC в выпуске чипов 2 нм

Intel намерена обойти TSMC, став первопроходцем в производстве 2-нанометровых чипов. Однако возникают вопросы о сравнительном качестве их техпроцесса по сравнению с 3-нанометровым процессом TSMC. Несмотря на длительный период, когда Intel отставала от TSMC и Samsung в освоении новейших технологий производства, сейчас компания готовится к выпуску продукции на 2-нанометровом техпроцессе, опережая конкурентов.

Согласно последним отчетам, Intel планирует начать массовое производство своих процессоров Arrow Lake и Lunar Lake, используя новейшие технологии Intel 20A и 18A, уже до конца текущего года. Это сделает их первыми в мире чипами, изготовленными с использованием 2-нанометрового техпроцесса. В то время как TSMC, по всей видимости, начнет производство аналогичных чипов несколько позже.

По предварительным данным, TSMC планирует производить около 67 500 пластин в месяц, в то время как Intel сможет выпускать до 202 500 пластин. Однако стоит отметить, что, по имеющейся информации, Intel не будет производить все компоненты своих процессоров самостоятельно.

Некоторые источники утверждают, что процессорные плитки для Arrow Lake будут изготавливаться TSMC с использованием 3-нанометрового техпроцесса, что может указывать на то, что новейший техпроцесс Intel 20A все же уступает технологии конкурента, которая уже полгода присутствует на рынке.

@bigdatai

Читать полностью…

Big Data AI

Одно из лучших видео с объяснением работы Трансформеров

На канале 3Blue1Brown недавно было опубликовано новое видео из серии о глубоком обучении. В этот раз авторы рассматривают вопрос "Что такое GPT" и представляют визуальное введение в Трансформеров.

Рекомендуем посмотреть.

📌 https://www.youtube.com/watch?v=wjZofJX0v4M&ab_channel=3Blue1Brown

@bigdatai

Читать полностью…

Big Data AI

🔥 Сегодня выпущены два самых больших открытых набора данных для распознавания текста за всю историю 📜 📜

Набор данных содержит миллионы реальных документов, изображений и текстов для задач распознавания текста, анализа и разбора документов VQA.: https://huggingface.co/datasets/pixparse/idl-wds
Датасет дополнен аннотациями из проекта idl_data Бриттена и др. (https://arxiv.org/abs/2202.12985 )

PDFA: https://huggingface.co/datasets/pixparse/pdfa-eng-wds

@data_analysis_ml

Читать полностью…

Big Data AI

⚡️Новый метод, который позволяет удалить 40% слоев LLM без снижения точности.

Это делает их намного дешевле и быстрее.

Его протестировали это на различных моделях с открытым исходным кодом.

В каждом семействе моделей было максимальное количество слоев, которые можно было удалить без снижения точности:

- Mistral - 30%
- Lama 70B - 40%
- Lama 13B - 50%

Отличная статья.

https://arxiv.org/html/2403.17887v1

@bigdatai

Читать полностью…

Big Data AI

⚡️ Возможно, это самый большой сдвиг в парадигме Lms

В ходе двух независимых исследований удалось предварительно обучить 1,58-разрядные LMS, которые соответствуют производительности моделей FP16.

Нужно посмотреть, как он масштабируется (~ 30B), но мне очень интересны 1,58-битные модели Mamba и MoE.

https://huggingface.co/1bitLLM/bitnet_b1_58-3B

@bigdatai

Читать полностью…

Big Data AI

Продуктовые аналитики, отмечайте 6 апреля в календаре. Авито проводит Weekend Offer!

Мы предлагаем комфортные условия:
— работа на удаленке или гибрид в офисе;
— комьюнити из 300 аналитиков для обмена опытом;
— зарплата от 200 до 480 тысяч рублей в зависимости от грейда;
— развитая инфраструктура, всё готово к старту продуктивной работы и запуску A/B-тестов.

Один шаг до оффера: подайте заявку до 4 апреля и приходите на интервью.

Читать полностью…

Big Data AI

Весь опыт Data Science – в одном месте. Data Fusion в четвертый раз соберет DS-экспертов для диалога на кросс-индустриальной площадке. Конференция пройдет 17-18 апреля в Москве. Регистрация уже открыта: https://tglink.io/77b991229131 

Data Fusion 2024 – главное событие весны в области анализа больших данных и технологий ИИ. Исследованиям и практике посвящен первый день конференции.

– Известные ученые и эксперты по Data Science расскажут о трендах в различных направлениях машинного обучения и технологиях ИИ.
– Желающие еще глубже погрузиться в сферу искусственного интеллекта смогут посетить трек ML+, посвященный использованию машинного обучения на стыке с физикой, медициной и фармакологией и другими науками.

Второй день мероприятия будет посвящены бизнесу и стратегии.

В этом году конференция Data Fusion пройдет в московском технологическом кластере «Ломоносов». Регистрация здесь: https://tglink.io/77b991229131 

Читать полностью…

Big Data AI

⚡️  Пройди хардкорный тест по Компьютерному зрению и проверь свои знания.

Ответишь — пройдешь на продвинутый курс «Компьютерное зрение. Advanced» от OTUS по специальной цене🎁 .

👉  ПРОЙТИ ТЕСТ: 
https://otus.pw/Z67Hl/?erid=LjN8K2mAW

Читать полностью…

Big Data AI

Нам не нужен AGI.
Нам нужен только RAG 🧵


@bigdatai

Читать полностью…

Big Data AI

🔥 Новый огромный многоязычный датасет для LLM" [Удалено дублирование ~5,6 трлн токенов]. 🔥

✨ Доступно 75 языков (22 ТБ необработанных файлов, 11 ТБ дедуплированных файлов и 8,4 ТБ чистых файлов), которые представлены в формате JSON, сжатых с помощью zstd.

Для удобства данные разделены на несколько сегментов по несколько ГБ каждый. Количество фрагментов для каждого языка зависит от размера конкретного корпуса.

✨ Формат - JSONL, в котором каждая строка представляет собой допустимое значение JSON и полный документ с метаданными.

- Статья: https://arxiv.org/abs/2403.14009
- Страница проекта: https://hplt-project.org
- Датасет: https://hplt-project.org/datasets/v1.2

@bigdatai

Читать полностью…

Big Data AI

🖥 100 вопросов для подготовки к собесу Python

Держите супер полезную статью, которая поможет освежить в памяти самые основные концепции Python и во всеоружии предстать на собесе)
Детально разбираются все 100 вопросов, так что после прочтения всё должно уложиться по полочкам 🌟

📎 Статья

@bigdatai

Читать полностью…

Big Data AI

Нейросеть для генерации изображений YandexART стала доступна для тестирования внешним компаниям!

В режиме закрытого превью нейросеть уже попробовали несколько внешних компаний. Например, крупная e-com сеть тестирует YandexART для создания уникального дизайна подарочных карт. Клиенты сети смогут ввести текстовый запрос и самостоятельно выбрать собственное оформление для карты.

Теперь на облачной платформе Yandex Cloud с помощью YandexART компании смогут создавать визуалы для рекламы и социальных сетей, дизайн-макеты, иллюстрации для диджитала и книг. Нейросеть можно встроить через API в различные сервисы и веб-приложения.

Читать полностью…

Big Data AI

3 популярыных библиотеки 𝗟𝗟𝗠𝘀 ↓

1️⃣ Ggml на C++, 7 тыс. ⭐ : https://github.com/ggerganov/ggml
2️⃣ Candle на Rust, 9 тыс. ⭐: https://github.com/huggingface/candle
3️⃣ Vllm на Python, 8 тыс. ⭐: https://github.com/vllm-project/vllm

@bigdatai

Читать полностью…

Big Data AI

⚡️ ReFT: файнтюниг для больших языковых моделей

в 10-50 раз более эффективная настройка параметров, чем предыдущие современные методы точной настройки параметров

репозиторий: https://github.com/stanfordnlp/pyreft
abs: https://arxiv.org/abs/2404.03592

@bigdatai

Читать полностью…

Big Data AI

Ищем системных аналитиков и технических писателей в команду Riverstart!

Компания в IT с 2012 года, аккредитована Минцифры.

Наши преимущества:
● вы сами выбираете формат работы - парттайм, фултайм или попроектно;
● можно работать в удобное время из любой точки мира;
● сможете выбирать проекты в тех отраслях, которые любите;
● платим по рынку, даем премии и составляем план развития на каждые полгода;
● 1 собеседование - не мучаем вас сериями собеседований.

Поможем комфортно и плавно вкатиться в рабочий процесс. Организуем условия для развития и роста, назначим куратора, к которому можно обращаться по техническим вопросам.

Узнайте больше о вакансиях и оставьте отклик на сайте!

Читать полностью…

Big Data AI

✅ Какие техники и подходы есть в генерации Stable Diffusion?

Расскажет разработчик ИИ и тимлид Айнур Гайнетдинов на открытом уроке «Техники и Подходы в генерации Stable Diffusion» от Otus.

На этом уроке вы познакомитесь с принципами работы Stable Diffusion, узнаете о способах его применения через веб-интерфейс, научитесь дообучать модели на новые визуальные образы и освоите методы управления генерацией с помощью визуальных подсказок.

🔹Данный урок отличный выбор для IT-специалистов, желающих углубить свои знания в области компьютерного зрения, для дата-сайентистов, которые интересуются эффективными методами применения нейронных сетей в задачах обработки изображений

👉 Регистрация: 
https://otus.pw/PZ51/?erid=LjN8KXykp

Читать полностью…

Big Data AI

🤖Какая сертификация нужна для разработки медицинского ИИ?

Расскажет Николай Павлов — Advanced Project Engineer в SnkeOS GmbH. Встречаемся на бесплатном практическом уроке от OTUS, где разберём:

- кого и как сертифицируют в России и мире, чтобы продукт успешно вышел на рынок, а разработчик по пути не сел в тюрьму;
- по каким ключевым словам искать детализированную информацию, которой свойственно быстро меняться.

Кому нужен этот вебинар:

– IT-специалистам, которые работают или хотят работать в медицинских стартапах;
– разработчикам, желающим выйти на рынок медицинских устройств.

Занятие пройдёт 10 апреля в 20:00 мск и будет приурочено к старту курса «Искусственный интеллект (AI) в медицине».

💸Только до 7 апреля вы можете применить скидку 15% на оплату любого курса в честь дня рождения OTUS!

Регистрируйтесь прямо сейчас, чтобы занять место на открытом уроке и получить запись: https://otus.pw/sZkU/

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KLa4t

Читать полностью…

Big Data AI

⚡️ Это шокирует.

Facebook* продает Netflix все ваши личные сообщения в Messenger в обмен на историю просмотров, при этом Netflix платит им более 100 миллионов долларов за рекламу.

* принадлежит Meta, признанной в РФ экстремистской и запрещённой на территории страны.

Компания продает ваши данные с целью получения прибыли.

Источник

@bigdatai

Читать полностью…

Big Data AI

Факультет компьютерных наук НИУ ВШЭ расширяет сотрудничество с Яндексом для подготовки специалистов по ИИ и ML.

ФКН был основан ВШЭ совместно с Яндексом 10 лет назад. За время своего существования он стал одним из лидеров в подготовке разработчиков и специалистов по ИИ и ML, выпустив более 3 000 человек,

В следующие 10 лет Яндекс и ВШЭ:

- Увеличат количество выпускников факультета по программам Яндекса в 4 раза
- Откроют магистратуру по ИИ в маркетинге и продукте
- Создадут направления по генеративным технологиям на магистерской программе "Современные компьютерные науки"
- Запустят студенческий кемп по машинному обучению

Обратите внимание, если планируете стать студентом — ВШЭ занимает второе место среди российских университетов по количеству публикаций на конференциях A*.

Подробнее

@ai_machinelearning_big_data

Читать полностью…

Big Data AI

⚡️ Руководство по установке для проекта Dark GPT

DarkGPT - это помощник по искусственному интеллекту на базе GPT-4-200K, предназначенный для выполнения запросов к взломанным базам данных.

Это руководство поможет вам настроить и запустить проект в вашей локальной среде.

github.com/luijait/DarkGPT

@bigdatai

Читать полностью…

Big Data AI

⚡️ Третье поколение языковых моделей YandexGPT

В компании анонсировали линейку YandexGPT 3. Нейросеть YandexGPT 3 Pro стала первой языковой моделью, которую компании смогут самостоятельно дообучать на конретных задачах в сервисе ML-разработки Yandex DataSphere. Чтобы запустить процесс дообучения, нужно загрузить в DataSphere файл с примерами запросов и эталонными ответами на них. Такая нейросеть будет доступна только дообучившей её компании.

Работу YandexGPT 3 Pro можно оценить в демке и встроить в продукты бизнеса через API. Её стоимость для бизнеса снизилась почти в два раза. Плюс это базовая модель, которую сам Яндекс будет использовать в новых запусках и интеграциях генеративных технологий в продукты и инфраструктуру.

@bigdatai

Читать полностью…
Subscribe to a channel