Как мы в Яндексе делаем роборуку с искусственным интеллектом
В этой статье я расскажу, как команда ML R&D в отделе робототехники Маркета создаёт роборуку и обучает нейросети, благодаря которым робот взаимодействует с физическим миром.
Читать | DATApedia | #DS_AI
ООП для типовых ML задач
В данной статье НЕ будет идти речи о способах построения продвинутых моделей с различными наворотами. Рассказ пойдет о том, как автоматизировать построение типовой модели.
Читать | DATApedia
5 лучших инструментов для разметки данных в 2024 году
В этом руководстве мы разберем самые популярные решения для разметки данных и разберём, какой стоит выбрать именно вам.
Читать | DATApedia | #DS_AI
Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии
Вы когда-нибудь задумывались, как нейросети учатся распознавать лица, управлять автомобилями или рекомендовать фильмы? За всем этим скрывается работа разметчиков данных — специалистов, которые буквально обучают ИИ видеть и понимать мир.
Сколько зарабатывают разметчики, какие навыки им нужны, и стоит ли вам задуматься о работе в этой индустрии? Раскроем все секреты профессии в нашей статье.
Читать | DATApedia
Простыми словами про метрики в ИИ. Регрессия. MSE, RMSE, MAE, R-квадрат, MAPE
Читать | DATApedia | #DS_AI
Контроль качества разметки на проекте: 4 секрета успеха
Как контролировать качество на проектах разметки максимально эффективно? Выстроить такие процессы непросто, но мы считаем, что у нас это получилось. Для того, чтобы гарантировать на каждом проекте высокое качество разметки, в Data Light существует отдел Контроля качества. Я, Евгений Шилкин, руководитель отдела, расскажу, что нам позволяет обеспечивать стабильно высокое качество на проектах и какие советы для эффективной валидации мы можем дать.
Читать | DATApedia
Как оценить качество LLM модели
В этой статье мы представим общий обзор текущего состояния исследований оценок LLM, а также расскажем о некоторых опенсорсных реализациях в этой области.
Читать | DATApedia | #DS_AI
«Магнит» совершенствует сервис доставки: новые алгоритмы определяют лучший магазин для вашего заказа
Когда вы заказываете товары на сайте и в приложении, сервис доставки привозит их из магазинов «Магнит». Раньше для сборки заказов выбирался ближайший к покупателю магазин. Причём ближайший в буквальном смысле — по прямой. Это позволяло экономить на курьерах, но во всех магазинах разное количество сотрудников и ассортимент: где-то заказы собирали дольше, а где-то, из-за отсутствия определенных товаров, позиции в заказе меняли на аналоги. Поэтому мы решили поменять логику выбора магазинов, провели в нескольких городах пилотный проект и делимся первыми результатами.
Читать | DATApedia
Полный гид по бенчмаркам LLM
В этом посте мы представим подробный каталог бенчмарков, разбитый на категории по сложности, динамике, целям оценки, спецификациям конечных задач и типам рисков. Понимание их различий поможет вам разобраться в бенчмарках LLM в условиях их стремительного развития.
Читать | DATApedia | #DS_AI
В OTUS стартует курс «Системный Аналитик. Team Lead», на котором студенты смогут обучиться особенностям и ключевым направлениям развития системного анализа за рубежом и международными сертификациями в этой области. На занятиях студенты изучат современные принципы и практики архитектуры систем, включая методологии построения архитектуры систем, облачные вычисления, монолитные и микросервисные системы, архитектуру данных и безопасность систем.
23 сентября в 20:00 по мск. приглашаем на открытый вебинар курса «Как создать высокопродуктивную команду системных аналитиков для успешных проектов». Вебинар посвящен эффективным методам взаимодействия и управления командой системных аналитиков. Участники узнают о ключевых аспектах работы в команде, как эффективно обучать и мотивировать специалистов, а также как наладить взаимодействие внутри команды для достижения максимальных результатов в проектах.
Мы обсудим, как создать продуктивную атмосферу в команде, наладить коммуникацию и оптимизировать процессы в команде.
Для участия пройдите регистрацию: https://otus.pw/7eGm/
При поступлении в группу обучения после вебинара вы получите специальную цену на курс, а так же разные способы оплаты и рассрочка платежа.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Data больше не Big: как данные перестали быть большими и почему это полезно для бизнеса
Большие данные мертвы. В той их части, которая характеризуется как “большие”. Так считает Джордан Тигани, основатель Google BigQuery, человек, который больше 10 лет рассказывал всем о пользе big data. Что он имеет в виду и что это значит для бизнеса? Давайте разбираться.
Перейти к статье | DATApedia
MLOps от Gucci и оценка уровня Data Driven’ности в компании
MLOps пробрался даже в fashion-индустрию. И не говорите после этого, что работа с большими данными и ML — это немодно!
Перейти к статье | DATApedia
Метаданные как обезбол при миграции
Статья о том, как команда аналитиков Skyeng решала проблемы, связанные с миграцией на новое хранилище данных. Автор рассказывает о том, как они использовали метаданные, чтобы понять, какие аналитические материалы используются, а какие нет, а также о том, как они автоматизировали сбор списка подключений.
Перейти к статье | SQLpedia
Краткий обзор LLM бенчмарков
За выходные я прочитал пару документов (см. ссылки в конце статьи) об оценке и бенчмаркинге LLM, и в этой статье подведу краткий итог прочитанного. Надеюсь, это будет хорошее введение для тех, кого интересует данная тема.
Читать | DATApedia | #DS_AI
Выбор СУБД: шпаргалка, чтобы не запутаться
Вопрос выбора СУБД для российской компании или госоргана — вопрос не праздный, тем более сейчас — когда с момента ухода с рынка западных вендоров прошло уже полтора года и пора что‑то решать. Но как не запутаться в номенклатуре СУБД и выбрать ту, которая лучше всего подходит?
Перейти к статье | DATApedia
Прокачиваем навыки в сфере ML — что изучать в 2024-м
Данная статья содержит подборку новых и высокооцененных специализированных курсов, книг и других тематических материалов для машинного обучения и инструментов для работы с ML-моделями
Перейти к статье | DATApedia
Ликбез по методологиям проектирования хранилищ данных
Хранилище данных — это информационная система, в которой хранятся исторические и коммутативные данные из одного или нескольких источников. Он предназначен для анализа, составления отчетов и интеграции данных транзакций из разных источников.
Рассмотрим сильные и слабые стороны самых популярных методологий.
Перейти к статье | DATApedia
Оголяем «данные» и что из этого вышло
Однажды я задался целью создать устройство, которое измеряло бы качество воздуха — не просто как-то, а с высокой точностью. Проект по разработке устройства привел к созданию NeboAir — недорогого датчика, который претендует на высокую точность. В этом материале я расскажу об испытаниях в реальных условиях и о том, что получилось в итоге.
Читать | DATApedia
Краткий гайд по квантованию нейросетей
В данной статье речь пойдет о дроблении, уменьшении и прямом урезании, иначе квантовании данных. Сам по себе процесс этот несложный с точки зрения всего, но подводные камни у операции есть.
Читать | DATApedia | #DS_AI
«А можно быстрее?»: практические советы по ускорению обучения нейросетей
Мы разберем несколько интересных исследований, которые демонстрируют эффективность различных подходов к ускорению нейросетей на разнообразных задачах и датасетах. Затем обсудим практические рекомендации по выбору и комбинированию методов оптимизации и расскажем, какие инструменты лучше использовать для профилирования и мониторинга процесса обучения. В довершение рассмотрим полезные библиотеки для быстрой и эффективной разработки.
Читать | DATApedia | #DS_AI
Corner-кейсы в разработке и разметке данных: что это такое, как с этим жить и при чем тут Достоевский?
Читать | DATApedia | #DS_AI
Сжатие данных в PostgreSQL: как различные методы влияют на хранение TOAST
В мире управления базами данных от эффективного хранения больших объемов информации зависит оптимизация производительности и использования дискового пространства. В этой статье разберем основные методы сжатия данных в TOAST.
Перейти к статье | SQLpedia
Не потеряться в данных: оптимизируем аналитику с помощью DataHub
Ниже расскажу о нашем опыте применения DataHub и ситуациях, в которых инструмент может пригодиться. Надеемся, будет полезно продуктовым и дата-аналитикам; руководителям, нацеленным на выстраивание порядка в процессах и всем, кто интересуется актуальным тулингом для ИТ-команд.
Читать | DATApedia
Компьютерное зрение и котики. Или алгоритмы против человека
Разберём основы компьютерного зрения на примерах с котиками, узнаем, почему CV на самом деле совсем не про зрение и научимся делать свёртку.
Читать | DATApedia | #DS_AI
Из лингвиста в дата-сайентисты: личный опыт и детальный трек
Освоить новую профессию и начать работать в сфере ИТ сейчас хотят многие. Моя история доказывает, что переквалифицироваться реально, хотя и очень сложно. Расскажу о своем входе в сферу Data Science с несколько нестандартной исходной точки.
Читать | DATApedia
Вам в хранилище или к озеру? Чем занимаются специалисты по работе с данными и как стать Data-инженером
В этой статье рассказывается о том, чем отличаются подходы к построению распределённых хранилищ данных Data Warehouse (DWH) и Data Lake и в чём специфика задач специалистов, работающих с данными.
Перейти к статье | DATApedia
Как обучить миллионы моделей прогнозирования временными сериями
В статье описывается, как была решена проблема производительности при обучении миллионов моделей прогнозирования временных серий с кроссвалидацией и выбором наиболее оптимальной модели.
Перейти к статье | DATApedia
💻 Хочешь работать с масштабными цифровыми продуктами? Учись обрабатывать большие данные
MLOps — все более популярный среди компаний способ повышения производительности и создания надежных моделей корпоративного уровня.
✅ Владение инструментами MLOps открывает новые карьерные горизонты специалистам ML, Data Scientist’ам и Software инженерам.
💪 Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на продвинутом курсе «MLOps» от OTUS.
Успей присоединиться к группе, курс стартует 28 августа!
✍️ ПРОЙТИ ТЕСТ: https://otus.pw/T77L/
Нативная интеграция. Информация о продукте www.otus.ru