ds_wiki | Unsorted

Telegram-канал ds_wiki - DATApedia | Data science

3571

Тут вы найдете всё, что связано с Data Science, AI и Machine Learning, как для начинающих, так и для бывалых специалистов. Также, для вас, мы переводим зарубежные статьи. Сотрудничество: @Seyfme

Subscribe to a channel

DATApedia | Data science

​​Как мы в Яндексе делаем роборуку с искусственным интеллектом

В этой статье я расскажу, как команда ML R&D в отделе робототехники Маркета создаёт роборуку и обучает нейросети, благодаря которым робот взаимодействует с физическим миром.

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​ООП для типовых ML задач

В данной статье НЕ будет идти речи о способах построения продвинутых моделей с различными наворотами. Рассказ пойдет о том, как автоматизировать построение типовой модели.

Читать | DATApedia

Читать полностью…

DATApedia | Data science

​​5 лучших инструментов для разметки данных в 2024 году

В этом руководстве мы разберем самые популярные решения для разметки данных и разберём, какой стоит выбрать именно вам.

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии

Вы когда-нибудь задумывались, как нейросети учатся распознавать лица, управлять автомобилями или рекомендовать фильмы? За всем этим скрывается работа разметчиков данных — специалистов, которые буквально обучают ИИ видеть и понимать мир.
Сколько зарабатывают разметчики, какие навыки им нужны, и стоит ли вам задуматься о работе в этой индустрии? Раскроем все секреты профессии в нашей статье.

Читать | DATApedia

Читать полностью…

DATApedia | Data science

Простыми словами про метрики в ИИ. Регрессия. MSE, RMSE, MAE, R-квадрат, MAPE

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Контроль качества разметки на проекте: 4 секрета успеха

Как контролировать качество на проектах разметки максимально эффективно? Выстроить такие процессы непросто, но мы считаем, что у нас это получилось. Для того, чтобы гарантировать на каждом проекте высокое качество разметки, в Data Light существует отдел Контроля качества. Я, Евгений Шилкин, руководитель отдела, расскажу, что нам позволяет обеспечивать стабильно высокое качество на проектах и какие советы для эффективной валидации мы можем дать.

Читать | DATApedia

Читать полностью…

DATApedia | Data science

​​Как оценить качество LLM модели

В этой статье мы представим общий обзор текущего состояния исследований оценок LLM, а также расскажем о некоторых опенсорсных реализациях в этой области.

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​«Магнит» совершенствует сервис доставки: новые алгоритмы определяют лучший магазин для вашего заказа

Когда вы заказываете товары на сайте и в приложении, сервис доставки привозит их из магазинов «Магнит». Раньше для сборки заказов выбирался ближайший к покупателю магазин. Причём ближайший в буквальном смысле — по прямой. Это позволяло экономить на курьерах, но во всех магазинах разное количество сотрудников и ассортимент: где-то заказы собирали дольше, а где-то, из-за отсутствия определенных товаров, позиции в заказе меняли на аналоги. Поэтому мы решили поменять логику выбора магазинов, провели в нескольких городах пилотный проект и делимся первыми результатами.

Читать | DATApedia

Читать полностью…

DATApedia | Data science

Когда эйчар спрашивает, готов ли я работать в режиме многозадачности

Читать полностью…

DATApedia | Data science

​​Полный гид по бенчмаркам LLM

В этом посте мы представим подробный каталог бенчмарков, разбитый на категории по сложности, динамике, целям оценки, спецификациям конечных задач и типам рисков. Понимание их различий поможет вам разобраться в бенчмарках LLM в условиях их стремительного развития.

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

Python Senior Developer

Читать полностью…

DATApedia | Data science

В OTUS стартует курс «Системный Аналитик. Team Lead», на котором студенты смогут обучиться особенностям и ключевым направлениям развития системного анализа за рубежом и международными сертификациями в этой области. На занятиях студенты изучат современные принципы и практики архитектуры систем, включая методологии построения архитектуры систем, облачные вычисления, монолитные и микросервисные системы, архитектуру данных и безопасность систем.

23 сентября в 20:00 по мск. приглашаем на открытый вебинар курса «Как создать высокопродуктивную команду системных аналитиков для успешных проектов». Вебинар посвящен эффективным методам взаимодействия и управления командой системных аналитиков. Участники узнают о ключевых аспектах работы в команде, как эффективно обучать и мотивировать специалистов, а также как наладить взаимодействие внутри команды для достижения максимальных результатов в проектах.
Мы обсудим, как создать продуктивную атмосферу в команде, наладить коммуникацию и оптимизировать процессы в команде.

Для участия пройдите регистрацию: https://otus.pw/7eGm/

При поступлении в группу обучения после вебинара вы получите специальную цену на курс, а так же разные способы оплаты и рассрочка платежа.

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Читать полностью…

DATApedia | Data science

​​Data больше не Big: как данные перестали быть большими и почему это полезно для бизнеса

Большие данные мертвы. В той их части, которая характеризуется как “большие”. Так считает Джордан Тигани, основатель Google BigQuery, человек, который больше 10 лет рассказывал всем о пользе big data. Что он имеет в виду и что это значит для бизнеса? Давайте разбираться.


Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​MLOps от Gucci и оценка уровня Data Driven’ности в компании

MLOps пробрался даже в fashion-индустрию. И не говорите после этого, что работа с большими данными и ML — это немодно!

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Метаданные как обезбол при миграции

Статья о том, как команда аналитиков Skyeng решала проблемы, связанные с миграцией на новое хранилище данных. Автор рассказывает о том, как они использовали метаданные, чтобы понять, какие аналитические материалы используются, а какие нет, а также о том, как они автоматизировали сбор списка подключений.

Перейти к статье | SQLpedia

Читать полностью…

DATApedia | Data science

​​Краткий обзор LLM бенчмарков

За выходные я прочитал пару документов (см. ссылки в конце статьи) об оценке и бенчмаркинге LLM, и в этой статье подведу краткий итог прочитанного. Надеюсь, это будет хорошее введение для тех, кого интересует данная тема.

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

Выбор СУБД: шпаргалка, чтобы не запутаться

Вопрос выбора СУБД для российской компании или госоргана — вопрос не праздный, тем более сейчас — когда с момента ухода с рынка западных вендоров прошло уже полтора года и пора что‑то решать. Но как не запутаться в номенклатуре СУБД и выбрать ту, которая лучше всего подходит?

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Прокачиваем навыки в сфере ML — что изучать в 2024-м

Данная статья содержит подборку новых и высокооцененных специализированных курсов, книг и других тематических материалов для машинного обучения и инструментов для работы с ML-моделями

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Ликбез по методологиям проектирования хранилищ данных

Хранилище данных — это информационная система, в которой хранятся исторические и коммутативные данные из одного или нескольких источников. Он предназначен для анализа, составления отчетов и интеграции данных транзакций из разных источников.
Рассмотрим сильные и слабые стороны самых популярных методологий.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Оголяем «данные» и что из этого вышло

Однажды я задался целью создать устройство, которое измеряло бы качество воздуха — не просто как-то, а с высокой точностью. Проект по разработке устройства привел к созданию NeboAir — недорогого датчика, который претендует на высокую точность. В этом материале я расскажу об испытаниях в реальных условиях и о том, что получилось в итоге.

Читать | DATApedia

Читать полностью…

DATApedia | Data science

​​Краткий гайд по квантованию нейросетей

В данной статье речь пойдет о дроблении, уменьшении и прямом урезании, иначе квантовании данных. Сам по себе процесс этот несложный с точки зрения всего, но подводные камни у операции есть.

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​«А можно быстрее?»: практические советы по ускорению обучения нейросетей

Мы разберем несколько интересных исследований, которые демонстрируют эффективность различных подходов к ускорению нейросетей на разнообразных задачах и датасетах. Затем обсудим практические рекомендации по выбору и комбинированию методов оптимизации и расскажем, какие инструменты лучше использовать для профилирования и мониторинга процесса обучения. В довершение рассмотрим полезные библиотеки для быстрой и эффективной разработки.

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Corner-кейсы в разработке и разметке данных: что это такое, как с этим жить и при чем тут Достоевский?

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Сжатие данных в PostgreSQL: как различные методы влияют на хранение TOAST

В мире управления базами данных от эффективного хранения больших объемов информации зависит оптимизация производительности и использования дискового пространства. В этой статье разберем основные методы сжатия данных в TOAST.

Перейти к статье | SQLpedia

Читать полностью…

DATApedia | Data science

​​Не потеряться в данных: оптимизируем аналитику с помощью DataHub

Ниже расскажу о нашем опыте применения DataHub и ситуациях, в которых инструмент может пригодиться. Надеемся, будет полезно продуктовым и дата-аналитикам; руководителям, нацеленным на выстраивание порядка в процессах и всем, кто интересуется актуальным тулингом для ИТ-команд.

Читать | DATApedia

Читать полностью…

DATApedia | Data science

​​Компьютерное зрение и котики. Или алгоритмы против человека

Разберём основы компьютерного зрения на примерах с котиками, узнаем, почему CV на самом деле совсем не про зрение и научимся делать свёртку.

Читать | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Из лингвиста в дата-сайентисты: личный опыт и детальный трек

Освоить новую профессию и начать работать в сфере ИТ сейчас хотят многие. Моя история доказывает, что переквалифицироваться реально, хотя и очень сложно. Расскажу о своем входе в сферу Data Science с несколько нестандартной исходной точки.

Читать | DATApedia

Читать полностью…

DATApedia | Data science

​​Вам в хранилище или к озеру? Чем занимаются специалисты по работе с данными и как стать Data-инженером

В этой статье рассказывается о том, чем отличаются подходы к построению распределённых хранилищ данных Data Warehouse (DWH) и Data Lake и в чём специфика задач специалистов, работающих с данными.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Как обучить миллионы моделей прогнозирования временными сериями

В статье описывается, как была решена проблема производительности при обучении миллионов моделей прогнозирования временных серий с кроссвалидацией и выбором наиболее оптимальной модели.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

💻 Хочешь работать с масштабными цифровыми продуктами? Учись обрабатывать большие данные

MLOps — все более популярный среди компаний способ повышения производительности и создания надежных моделей корпоративного уровня.

✅ Владение инструментами MLOps открывает новые карьерные горизонты специалистам ML, Data Scientist’ам и Software инженерам.

💪 Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на продвинутом курсе «MLOps» от OTUS.

Успей присоединиться к группе, курс стартует 28 августа!

✍️ ПРОЙТИ ТЕСТ: https://otus.pw/T77L/

Нативная интеграция. Информация о продукте www.otus.ru

Читать полностью…
Subscribe to a channel