Всё о Machine Learning простым языком. Предложить контент - @CryptoMakson Сотрудничество: @max_excel
🤔 Специалисты разобрали работу Self-Rewarding Language Models
NLP-инженеры Яндекса опубликовали в своем канале обзор языковой модели, которая сама создает инструкции, генерирует ответы и оценивает их качество. Они рассказали, чем ее обучение отличается от традиционных подходов и какие результаты в тестах она показала.
Machine Learning
NLP Researchers, отметьте в календаре 26 октября🌟
Всего за один день вы сможете пройти все этапы отбора, познакомиться с командой GigaCode и получить оффер.
Мы создаем AI ассистента разработчика – GigaCode. Наши модели помогают писать 80к строк кода ежедневно! Решаем задачи по различным подходам в NLP и PLP, проводим ресёрч-эксперименты и обучаем новые SOTA LLM.
В работе используем: NLP, DL, ML, Python, Pytorch, Transformers, FSDP, Deepspeed.
Чем предстоит заниматься?
✅ реализовывать дизайн экспериментов, формулировать гипотезы для улучшения NLP/PLP моделей и алгоритмов, планировать исследовательские эксперименты с выводами.
✅ проводить эксперименты, писать код, подготавливать датасеты и бенчмарки, проводить замеры и анализ результатов.
✅ обучать модели на кластере, включая обучение моделей с нуля и дообучение опенсорс моделей.
Если вы амбициозны и готовы к новым вызовам в PLP и/или NLP направлениях, регистрируйтесь на One Day Offer!
Будем делать важнейшие исследования вместе!💚
Хочешь разбираться в Linux?
Для тебя уже всё сделали.
🐧 Канал DevOps School делится полезными приёмами и лайфхаками Linux, DevOps и информационной безопасности.
Подписывайтесь и прокачивайте свои навыки: @devops_sc
Станьте разработчиком нейро-сотрудников на Python и зарабатывайте от 150.000р в месяц 🔥🔥🔥
Мы научим вас создавать топовых нейро-сотрудников на базе GPT-4 Omni, и вы сможете:
1️⃣ Устроиться разработчиком в крупную компанию и зарабатывать от 150 тысяч ₽ в месяц
2️⃣ Разрабатывать такие проекты на заказ и зарабатывать от 500 тысяч ₽ за проект
3️⃣ Создать нейро-сотрудника в вашей компании и вырасти на +30-100% в зарплате
Что будет на интенсиве?
🧬 Теория: как создаются нейро-сотрудники с GPT-4o на Python
🧬 Практика: мы создадим нейро-консультанта, нейро-HR, нейро-маркетолога и др.
Ведущий интенсива - Senior AI разработчик нейросетей и основатель Университета искусственного интеллекта
🔥 Регистрируйтесь на бесплатный интенсив! Встречаемся в ближайший четверг!
Ваш код и алгоритмы уже устарели, а вы даже не подозреваете об этом
Каждый день появляются новые подходы в Machine Learning и Data Science, а вы всё ещё используете старые методы?
Artificial Intelion — это ежедневные инсайты из мира ИИ, актуальные исследования и полезные фреймворки, которые вы сможете сразу применить в работе.
Прокачайте свои навыки и узнайте, как внедрить последние технологии в проекты, чтобы оставаться впереди конкурентов.
Удиви своих коллег знаниями по DS и ML: @artificial_intelion
GenAI в 2024 году — важный двигатель рынка и возможность продемонстрировать лидерство.
Узнайте о передовых инженерных подходах и лучших практиках от лидеров отрасли на GenAI-Meetup от МегаФона, который пройдет 17 октября в головном офисе компании в Москве.
Meetup делится на два блока: технологии и бизнес. Мы ждем специалистов обоих треков! А еще вас ждут:
— выступления практикующих AI-инженеров;
— инструменты создания GenAI-приложений;
— актуальные стратегии на рынке и реальные кейсы МегаФона, Яндекс Крауд, JSA Group и SberDevices.
Успейте зарегистрироваться👇🏻
Бизнес направление >>
Технологическое направление >>
🐋 Как распознать образы с помощью TensorFlow?
Целью работы является распознавание боковых зубов (маляров) на рентгеновских снимках с использованием нейронной сети. Для реализации цели необходимо выполнить несколько следующих этапов. Данные этапы составляют процесс настройки, обучения, тестирования нейронной сети с использованием TensorFlow.
Machine Learning
🔒 ML-задача на 30 минут: гадаем по cookie
Вопрос звучит так: сможем ли мы по цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь?
Machine Learning
🕶 Data-driven рост с помощью науки о данных и машинного обучения
Ведущие игроки на вашем рынке уже используют науку о данных и машинное обучение в частности для принятия более эффективных решений в области маркетинга, продаж и успешного обслуживания клиентов. Еще не поздно воспользоваться этой возможностью - технологические компании могут ускорить свой рост, приняв пять ведущих практик.
Machine Learning
ТОП 5 мест с бесплатными данными для машинного обучения и нейросетей
В этом видео автор подробно разбирает 5 лучших мест, где можно найти готовые датасеты или просто данные для ваших проектов в Data Science.
00:00 Зачем искать готовые данные
00:30 Google for datasets
02:12 Kaggle datasets
03:24 Ищем в ODS. ai
04:02 Сайты с подборками датасетов
04:33 Ищем датасеты в статьях
06:15 Лицензии на датасеты
Смотреть это видео на youtube: youtu.be/dGjgTflGdps
Machine Learning
🧵 3 инструмента для отслеживания и визуализации выполнения вашего кода Python
Эта статья предоставит вам инструменты, чтобы сделать легко решаемыми некоторые распостраненные ошибки.
Machine Learning
🙂 Жизненный цикл ML-модели
Будем называть ML-моделью объект, возвращающий прогноз для входящего набора признаков. Пусть для простоты это будет модель бинарной классификации.
В этой статье автор расскажет вам, как разрабатываются устойчивые ML-модели в суровых условиях изменчивого мира.
Machine Learning
🤖 Нейроредактор в Яндекс Браузере: как «прокачали» LLM-модель семейства YandexGPT для работы с текстом
Яндекс Браузер усовершенствовал нейроредактор на базе YandexGPT — теперь это отдельный ИИ-инструмент для создания текстов с нуля и улучшения готовых (исправление ошибок, переписывание в определенном стиле и формате). Это один из самых масштабных нейросетевых проектов Браузера, объединивший усилия команд фронтенда, бэкенда, менеджмента и ML-специалистов.
Для оценки разницы в версиях использовалась диффалка на Go, работающая на основе алгоритма поиска наибольшей общей подпоследовательности (LCS). Сравнивая результат модели с корректным вариантом от редактора, диффалка считает количество не исправленных ошибок и позволяет проверять гипотезы о качестве.
Эксперименты с обучением моделей для нейроредактора (переход к архитектуре Encoder-Decoder, curriculum learning с постепенным усложнением примеров, предобучение на "грязном" датасете с искусственными ошибками) дали ускорение генерации в 2 раза без потери качества и в среднем +10% качества на открытых датасетах. Нейроредактор также получил надежную поддержку Маркдауна благодаря обучению на размеченных текстах, восстановлению пропущенных символов разметки и переобучению.
Machine Learning
👷 Строим пайплайн в sсikit-learn — пошаговое руководство
В тексте упоминается scikit-learn — одна из самых популярных Python-библиотек для классического машинного обучения. Кроме большого числа алгоритмов машинного обучения, с помощью scikit-learn можно строить пайплайны.
Machine Learning
Создать резюме — This resume does not exist
Нейросеть использует шаблоны для резюме, созданные Enhancv для своих клиентов. Фотографии генерируются с помощью алгоритма StyleGAN от Nvidia, а тексты — TextgenRNN. Источником данных послужила информация с портала Indeed, где опубликовано 120 млн резюме. Создать новое резюме можно каждые 10 секунд.
Сервис создали разработчики болгарского сервиса по созданию резюме Enhancv.
Machine Learning
Многоклассовая и многозадачная классификация
Для того чтобы правильно понять их значимость, давайте разберемся, в чем заключается необходимость в этих двух подходах.
Machine Learning
♻️ Deep Fake Science, кризис воспроизводимости и откуда берутся пустые репозитории.
Ищите и найдете, стучите и откроется… Может быть… А может быть и нет.
Machine Learning
🤞 От дружелюбного ИИ к монетизации и одержимости имиджем: почему бывший стартап Илона Маска OpenAI предал свои идеалы
Компания хотела стать первой в создании безопасного искусственного интеллекта и выбрала закрытый и коммерческий путь вместо прозрачности и объединения усилий с другими разработчиками. Своё недоверие проекту высказал Илон Маск.
Machine Learning
❔ Как с помощью ML удалять объекты из видео
В новом исследовании, проведённом в Китае, сообщается о высоких результатах и впечатляющем росте эффективности новой системы ретуширования, позволяющей легко удалять объекты на видео.
Machine Learning
Выпустили джинна из бутылки: генеративный ИИ – катализатор роста
С момента появления генеративного ИИ многие компании пытаются понять, какую выгоду из него можно извлечь для развития бизнеса. Ответ может быть проще, чем кажется.
Machine Learning
🤟 Оценка структуры кредитного портфеля с помощью R.
В ходе обсуждений возникла «маленькая» задачка — построить динамику структуры кредитного портфеля (динамика кредитной карты, например). Есть важная специфика — необходимо применять метод FIFO для погашения займов. Т.е. при погашении первыми должны гаситься самые ранние займы. Это накладывает определенные требования на расчет статуса каждого отдельного займа и определения его даты погашения.
Machine Learning
🤖 Как Яндекс создавал мультимодальную нейросеть для поиска по картинкам в Нейро
Команда Яндекса разработала VLM, значительно улучшив возможности поиска по изображениям. Теперь пользователи могут не только узнать, что изображено на картинке, но и задать вопросы о конкретных деталях.
На Хабре появилась подробная статья от ML-разработчика Яндекса, раскрывающая суть визуально-текстовых мультимодальных моделей. Автор детально описывает их трехкомпонентную архитектуру, состоящую из LLM, картиночного энкодера и адаптера, а также освещает сложный процесс обучения, включающий этапы pretraining и alignment: SFT + RL (опционально).
В статье есть наглядное сравнение старого и нового пайплайнов Нейро. Разработчиком пришлось существенно доработать инфраструктуру, чтобы сделать весь пайплайн вычислительно эффективным.
Machine Learning
🤷♂️ Проблемы качества промышленных данных (временных рядов)
Большую часть работы по созданию моделей составляет работа с промышленными данными. В условиях стремительного роста объема информации важным аспектом становится качество таких данных. В то же время такие проблемы, как выбросы, пропуски, изменение частоты дискретизации, шум, искажают результаты или делают невозможным практическое использование данных для машинного обучения.
В этой статье автор разберет часто встречающиеся проблемы в промышленных данных типа временных рядов.
Machine Learning
🧛♂️ Самостоятельно изучите аналитику с помощью ChatGPT!
Теперь мы все начинаем изучать Data Science и машинное обучение, записываясь на онлайн-курсы.
Давайте признаем, некоторые из них действительно помогают в процессе обучения. Тем не менее, многие из них стали бесполезными после выпуска ChatGPT.
Machine Learning
Лучшие инструменты на основе GPT, которые могут помочь в написании и оптимизации кода для Python
Эти инструменты предлагают различные функции, от автоматического дополнения кода до генерации кода из инструкций на естественном языке, и могут значительно упростить и ускорить разработку на Python. Выбор определенного инструмента зависит от ваших конкретных потребностей и предпочтений в работе.
Machine Learning
🧩 Budibase
Low-code-платформа с открытым исходным кодом, объединяющая все необходимое для создания внутренних инструментов и пользовательских бизнес-приложений, включая дашборды, административные панели, приложения для утверждения и клиентские порталы.
Low-code-платформы, такие как Budibase, позволяют разработчикам создавать и поставлять внутренние инструменты и CRUD-приложения в кратчайшие сроки.
Machine Learning
🗞 Анализ временных рядов, применение нейросетей
В этой статье автор описывает некоторые основные понятия в теории анализа временных рядов, классические статистические алгоритмы прогнозирования, а также рассматривает применение моделей глубоких нейросетей для таких задач.
Machine Learning
🔥 Туториалы от Hugging Face
Это просто бомба! Тут в одном месте собраны материалы для всех основных задач в NLP, CV и Audio (см. картинку). Здесь есть примеры, видео с объяснениями, предобученные модели и даже датасеты.
Machine Learning
Маленький data-science для большого бизнеса
История о том, как команда школьников занималась разработкой сервиса геоаналитики для бизнеса.
Machine Learning
💸 Docker, VSCode, GitLab и Office: бесплатные альтернативы популярным сервисам для программирования и работы
В результате приостановки работы зарубежных компаний и отключения российских банков от платежных систем Visa и MasterCard многие программисты потеряли доступ к привычным инструментам. Рассказываем о бесплатных альтернативах продуктам, которые уже недоступны для российских пользователей по корпоративным подпискам или могут стать таковыми в ближайшее время.
Machine Learning