Всё о Machine Learning простым языком. Предложить контент - @CryptoMakson Сотрудничество: @max_excel
❔ Как с помощью ML удалять объекты из видео
В новом исследовании, проведённом в Китае, сообщается о высоких результатах и впечатляющем росте эффективности новой системы ретуширования, позволяющей легко удалять объекты на видео.
Machine Learning
Выпустили джинна из бутылки: генеративный ИИ – катализатор роста
С момента появления генеративного ИИ многие компании пытаются понять, какую выгоду из него можно извлечь для развития бизнеса. Ответ может быть проще, чем кажется.
Machine Learning
🤟 Оценка структуры кредитного портфеля с помощью R.
В ходе обсуждений возникла «маленькая» задачка — построить динамику структуры кредитного портфеля (динамика кредитной карты, например). Есть важная специфика — необходимо применять метод FIFO для погашения займов. Т.е. при погашении первыми должны гаситься самые ранние займы. Это накладывает определенные требования на расчет статуса каждого отдельного займа и определения его даты погашения.
Machine Learning
🔒 ML-задача на 30 минут: гадаем по cookie
Вопрос звучит так: сможем ли мы по цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь?
Machine Learning
🕶 Data-driven рост с помощью науки о данных и машинного обучения
Ведущие игроки на вашем рынке уже используют науку о данных и машинное обучение в частности для принятия более эффективных решений в области маркетинга, продаж и успешного обслуживания клиентов. Еще не поздно воспользоваться этой возможностью - технологические компании могут ускорить свой рост, приняв пять ведущих практик.
Machine Learning
🧵 3 инструмента для отслеживания и визуализации выполнения вашего кода Python
Эта статья предоставит вам инструменты, чтобы сделать легко решаемыми некоторые распостраненные ошибки.
Machine Learning
🧩 Budibase
Low-code-платформа с открытым исходным кодом, объединяющая все необходимое для создания внутренних инструментов и пользовательских бизнес-приложений, включая дашборды, административные панели, приложения для утверждения и клиентские порталы.
Low-code-платформы, такие как Budibase, позволяют разработчикам создавать и поставлять внутренние инструменты и CRUD-приложения в кратчайшие сроки.
Machine Learning
🔥 Туториалы от Hugging Face
Это просто бомба! Тут в одном месте собраны материалы для всех основных задач в NLP, CV и Audio (см. картинку). Здесь есть примеры, видео с объяснениями, предобученные модели и даже датасеты.
Machine Learning
Маленький data-science для большого бизнеса
История о том, как команда школьников занималась разработкой сервиса геоаналитики для бизнеса.
Machine Learning
💸 Docker, VSCode, GitLab и Office: бесплатные альтернативы популярным сервисам для программирования и работы
В результате приостановки работы зарубежных компаний и отключения российских банков от платежных систем Visa и MasterCard многие программисты потеряли доступ к привычным инструментам. Рассказываем о бесплатных альтернативах продуктам, которые уже недоступны для российских пользователей по корпоративным подпискам или могут стать таковыми в ближайшее время.
Machine Learning
Искусственный интеллект: помощник или игрушка?
Прошлый год можно назвать годом ИИ, особенно с учетом хайпа вокруг ChatGPT. Но действительно ли ИИ — панацея? Сможет ли он лишить работы людей? Давайте разберемся в этом вопросе.
Machine Learning
Искусственный интеллект в обрабатывающих производствах: инструмент форсирования технологической гонки
В этой статье автор поговорит о рынке, эффектах и кейсах, вызовах и проблематике применения технологий ИИ в обрабатывающих производствах.
Machine Learning
Крах Builder.ai: как «революционный ИИ-стартап» оказался скамом из сотен программистов из Индии
В мае 2025 года на рынке ИИ-стартапов разразился грандиозный скандал. Компания Builder. ai, на пике оцененная в $1,5 млрд и получившая инвестиции в размере $450 млн от таких гигантов как Microsoft, Softbank и Катарский инвестиционный фонд, объявила о банкротстве. Речь идет о потенциально самом масштабном мошенничестве на рынке ИИ-стартапов.
Machine Learning
RecSys R&D команда из Яндекса разработала новую рекомендательную систему на базе больших генеративных моделей
ARGUS (AutoRegressive Generative User Sequential modeling) — новое поколение рекомендательных моделей, которые способны предсказывать потребности пользователей и их отклик, а также находить сложные взаимосвязи между событиями. Это значительно повышает точность и качество рекомендаций. Алгоритмы анализируют агрегированные и обезличенные данные. Подобные системы сейчас внедрены всего у нескольких компаний в мире, включая Google и Netflix.
Архитектура Argus — двухбашенная модель, для которой, в отличие от target-aware постановки ранжирования в HSTU, можно в оффлайне пересчитывать векторы для миллионов пользователей и айтемов. Для оценки качества используется global temporal split, а на этапе предобучения смотрят прежде всего на значения функции потерь для задач next item prediction и feedback prediction. На этом же этапе сравнивают продовый градиентный бустинг, обученный на новых данных, с версией этого бустинга, в которую входит признак от ARGUS. И вместо абсолютных значений приводят относительный прирост метрики
Первыми новую модель интегрировали в Яндекс Музыку. В рекомендации сервиса внедрили модель с длиной истории 8192 (в терминах события в жизни пользователя). Это прецедентный случай внедрения модели подобных масштабов с такой длинной истории музыкальных рекомендаций. По статистике стриминга, слушатели Моей волны стали лайкать впервые услышанные треки на 20% чаще, а разнообразие рекомендаций возросло на 14%. При этом, генеративные нейросети в рекомендациях позволяют учитывать предпочтения пользователей не раз в сутки, а в режиме реального времени, что выводит качество персонализации на новый уровень.
Следом за Яндекс Музыкой, технологию интегрировали в Маркет. Со временем на рекомендательные алгоритмы нового поколения перейдут и другие сервисы компании.
🏋️♀️ Гиперпараметрический поиск и оптимизация моделей
При создании моделей машинного обучения существует одна важная составляющая, которая часто остается за кадром, но имеет решающее значение для достижения высокой производительности и точности — это гиперпараметры.
Machine Learning
Развивайся играя
Платформа Wikium — сервис для тренировки памяти, внимания и мышления. Система автоматически адаптируется под вашу успеваемость и составляет индивидуальную программу занятий. Всего 10-15 минут в день дают улучшение работоспособности, скорости обучения и концентрации.
Также вы можете овладеть конкретным навыком в короткие сроки на специализированном курсе:
• Развитие внимания;
• Скорочтение;
• Эмоциональный интеллект;
• Эффективное общение;
• И многие другие полезные курсы.
Занятия на Викиум — крайне полезная привычка, присоединяйтесь и вы: wikium.ru
Архив, который не требует обслуживания
ЭЛАРобот НСМ — долгосрочное хранение на оптических носителях. Решение, которое уже сегодня исключает из повестки:
— замену накопителей
— регулярную миграцию данных
— риски утери и компрометации данных
— избыточную инфраструктуру под "архив"
Факты для расчёта:
Срок хранения — 50+ лет
100% защита от перезаписи
• 0 затрат на апгрейды и плановую замену носителей
• ИИ для “умного” копирования данных
• Отечественное производство
📉 HDD и SSD — постоянные вложения.
📈 ЭЛАРобот НСМ — актив с фиксированной стоимостью и предсказуемой нагрузкой.
Решение уже доказало свою эффективность в задачах долговременного хранения в корпоративных и государственных системах.
👉 Запросить бесплатный расчет
🐋 Как распознать образы с помощью TensorFlow?
Целью работы является распознавание боковых зубов (маляров) на рентгеновских снимках с использованием нейронной сети. Для реализации цели необходимо выполнить несколько следующих этапов. Данные этапы составляют процесс настройки, обучения, тестирования нейронной сети с использованием TensorFlow.
Machine Learning
🤷♂️ Проблемы качества промышленных данных (временных рядов)
Большую часть работы по созданию моделей составляет работа с промышленными данными. В условиях стремительного роста объема информации важным аспектом становится качество таких данных. В то же время такие проблемы, как выбросы, пропуски, изменение частоты дискретизации, шум, искажают результаты или делают невозможным практическое использование данных для машинного обучения.
В этой статье автор разберет часто встречающиеся проблемы в промышленных данных типа временных рядов.
Machine Learning
Лучшие инструменты на основе GPT, которые могут помочь в написании и оптимизации кода для Python
Эти инструменты предлагают различные функции, от автоматического дополнения кода до генерации кода из инструкций на естественном языке, и могут значительно упростить и ускорить разработку на Python. Выбор определенного инструмента зависит от ваших конкретных потребностей и предпочтений в работе.
Machine Learning
🙂 Жизненный цикл ML-модели
Будем называть ML-моделью объект, возвращающий прогноз для входящего набора признаков. Пусть для простоты это будет модель бинарной классификации.
В этой статье автор расскажет вам, как разрабатываются устойчивые ML-модели в суровых условиях изменчивого мира.
Machine Learning
🗞 Анализ временных рядов, применение нейросетей
В этой статье автор описывает некоторые основные понятия в теории анализа временных рядов, классические статистические алгоритмы прогнозирования, а также рассматривает применение моделей глубоких нейросетей для таких задач.
Machine Learning
👷 Строим пайплайн в sсikit-learn — пошаговое руководство
В тексте упоминается scikit-learn — одна из самых популярных Python-библиотек для классического машинного обучения. Кроме большого числа алгоритмов машинного обучения, с помощью scikit-learn можно строить пайплайны.
Machine Learning
Создать резюме — This resume does not exist
Нейросеть использует шаблоны для резюме, созданные Enhancv для своих клиентов. Фотографии генерируются с помощью алгоритма StyleGAN от Nvidia, а тексты — TextgenRNN. Источником данных послужила информация с портала Indeed, где опубликовано 120 млн резюме. Создать новое резюме можно каждые 10 секунд.
Сервис создали разработчики болгарского сервиса по созданию резюме Enhancv.
Machine Learning
Метод оценки вероятности футбольных результатов для стратегии ставок с потенциалом достижения положительной доходности
В этой статье автор рассмотрит параметрическую модель, которая была адаптирована к данным английской лиги и кубка Англии по футболу за период с 1992 по 1995 год. Эта модель основана на стремлении использовать потенциальную неэффективность рынка ставок на футбол.
Machine Learning
Прогнозирование исходов футбольных матчей в реальном времени с помощью байесовской модели
Модели точечных процессов внесли значительный вклад в прогнозирование исходов футбольных матчей. Традиционно предполагается, что атакующие и оборонительные способности команд остаются постоянными в течение матча и оцениваются на среднем качестве игры всех других команд за прошлые периоды. В данной статье, опираясь на байесовский подход, предлагается модель динамической силы, которая снимает предположение о постоянстве силы команд и позволяет использовать информацию о текущем матче для их калибровки.
Machine Learning
Особенности индийского автострахования — какие insurtech-стартапы и технологии меняют его облик
В этом материале автор расскажет о примечательных индийских компаниях, развивающих системы ИИ и технологии компьютерного зрения, чтобы сделать страховые полисы доступными для широкой аудитории — от водителей электроскутеров до жителей сельских районов.
Machine Learning
Книга «Продвинутые алгоритмы и структуры данных»
Обзор на книгу, которая обещает познакомить вас с самыми необходимыми алгоритмами решения сложных задач программирования в области анализа данных, машинного обучения и графов.
Machine Learning
🍷 Сбор данных: этапы, методики и рекомендации
Хотя современный мир изобилует данными, сбор ценной информации включает в себя множество организационных и технических трудностей, которые мы и рассмотрим в этой статье.
Machine Learning
😅 Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных
ML сильно зависит от данных. Это самый критически важный аспект, благодаря которому и возможно обучение алгоритма; именно поэтому машинное обучение стало столь популярным в последние годы. Но вне зависимости от терабайтов информации и экспертизы в data science, если ты не можешь понять смысл записей данных, то машина будет практически бесполезной, а иногда и наносить вред.
Machine Learning