Как нужно укомплектовать команду ML для решения задачи?
🔹Расскажем на открытом уроке «Структура и построение ML команды» про композицию ML команды, различные роли в ней и их зоны ответственности
✅ Поговорим о том, зачем нужны ролы Data Scientist, Data Analyst, BI Analyst, ML Engineer, Data Engineer. Как организовать работу команды и взаимодействие внутри нее.
Урок приурочен новому курсу «ML Team Lead» от Otus.
👉 Регистрация и подробности:
https://otus.pw/seJIf/?erid=LjN8KUyew
#реклама
О рекламодателе
Какую архитектуру конвейера данных следует использовать?
Данные извлекаются, обрабатываются и преобразуются в несколько этапов в зависимости от требований нижестоящей системы. Все этапы обработки и преобразования определяются в конвейере данных. В зависимости от требований конвейеры могут быть как простыми, состоящими из одного звена, так и сложными, включающими несколько этапов преобразования и обработки данных.
Читать | DATApedia
Stability AI представила Stable Diffusion 3.5: Тестируем новую модель на реальных задачах и сравниваем с SDXL и FLUX
Привет, друзья, 22 октября Stability AI представила долгожданное обновление своей флагманской модели — Stable Diffusion 3.5. После не самого удачного релиза SD3 Medium в июне этого года, команда взяла паузу для серьёзной переработки архитектуры. Вместо быстрых фиксов разработчики потратили четыре месяца на фундаментальные улучшения. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист и сейчас мы с вами вместе разберемся, что изменилось и действительно ли стоило так долго ждать.
Читать | DATApedia | #DS_AI
Краткий обзор LLM бенчмарков
За выходные я прочитал пару документов (см. ссылки в конце статьи) об оценке и бенчмаркинге LLM, и в этой статье подведу краткий итог прочитанного. Надеюсь, это будет хорошее введение для тех, кого интересует данная тема.
Читать | DATApedia | #DS_AI
Выбор СУБД: шпаргалка, чтобы не запутаться
Вопрос выбора СУБД для российской компании или госоргана — вопрос не праздный, тем более сейчас — когда с момента ухода с рынка западных вендоров прошло уже полтора года и пора что‑то решать. Но как не запутаться в номенклатуре СУБД и выбрать ту, которая лучше всего подходит?
Перейти к статье | DATApedia
Прокачиваем навыки в сфере ML — что изучать в 2024-м
Данная статья содержит подборку новых и высокооцененных специализированных курсов, книг и других тематических материалов для машинного обучения и инструментов для работы с ML-моделями
Перейти к статье | DATApedia
Ликбез по методологиям проектирования хранилищ данных
Хранилище данных — это информационная система, в которой хранятся исторические и коммутативные данные из одного или нескольких источников. Он предназначен для анализа, составления отчетов и интеграции данных транзакций из разных источников.
Рассмотрим сильные и слабые стороны самых популярных методологий.
Перейти к статье | DATApedia
Оголяем «данные» и что из этого вышло
Однажды я задался целью создать устройство, которое измеряло бы качество воздуха — не просто как-то, а с высокой точностью. Проект по разработке устройства привел к созданию NeboAir — недорогого датчика, который претендует на высокую точность. В этом материале я расскажу об испытаниях в реальных условиях и о том, что получилось в итоге.
Читать | DATApedia
Краткий гайд по квантованию нейросетей
В данной статье речь пойдет о дроблении, уменьшении и прямом урезании, иначе квантовании данных. Сам по себе процесс этот несложный с точки зрения всего, но подводные камни у операции есть.
Читать | DATApedia | #DS_AI
«А можно быстрее?»: практические советы по ускорению обучения нейросетей
Мы разберем несколько интересных исследований, которые демонстрируют эффективность различных подходов к ускорению нейросетей на разнообразных задачах и датасетах. Затем обсудим практические рекомендации по выбору и комбинированию методов оптимизации и расскажем, какие инструменты лучше использовать для профилирования и мониторинга процесса обучения. В довершение рассмотрим полезные библиотеки для быстрой и эффективной разработки.
Читать | DATApedia | #DS_AI
Corner-кейсы в разработке и разметке данных: что это такое, как с этим жить и при чем тут Достоевский?
Читать | DATApedia | #DS_AI
Сжатие данных в PostgreSQL: как различные методы влияют на хранение TOAST
В мире управления базами данных от эффективного хранения больших объемов информации зависит оптимизация производительности и использования дискового пространства. В этой статье разберем основные методы сжатия данных в TOAST.
Перейти к статье | SQLpedia
Не потеряться в данных: оптимизируем аналитику с помощью DataHub
Ниже расскажу о нашем опыте применения DataHub и ситуациях, в которых инструмент может пригодиться. Надеемся, будет полезно продуктовым и дата-аналитикам; руководителям, нацеленным на выстраивание порядка в процессах и всем, кто интересуется актуальным тулингом для ИТ-команд.
Читать | DATApedia
Компьютерное зрение и котики. Или алгоритмы против человека
Разберём основы компьютерного зрения на примерах с котиками, узнаем, почему CV на самом деле совсем не про зрение и научимся делать свёртку.
Читать | DATApedia | #DS_AI
Из лингвиста в дата-сайентисты: личный опыт и детальный трек
Освоить новую профессию и начать работать в сфере ИТ сейчас хотят многие. Моя история доказывает, что переквалифицироваться реально, хотя и очень сложно. Расскажу о своем входе в сферу Data Science с несколько нестандартной исходной точки.
Читать | DATApedia
FlexiPrompt: Удобное создание динамических промптов в Python
Эта статья будет полезна Python-разработчикам, работающим с языковыми моделями (LLM).
Читать | DATApedia | #DS_AI
Как оценить LLM модель
В этом блоге я предложу общую структуру, которая будет служить минимальной рекомендацией для тестирования приложений, использующих LLM, включая разговорные агенты, расширенную генерацию поиска и агентов и т. д.
Читать | DATApedia | #DS_AI
Как мы в Яндексе делаем роборуку с искусственным интеллектом
В этой статье я расскажу, как команда ML R&D в отделе робототехники Маркета создаёт роборуку и обучает нейросети, благодаря которым робот взаимодействует с физическим миром.
Читать | DATApedia | #DS_AI
ООП для типовых ML задач
В данной статье НЕ будет идти речи о способах построения продвинутых моделей с различными наворотами. Рассказ пойдет о том, как автоматизировать построение типовой модели.
Читать | DATApedia
5 лучших инструментов для разметки данных в 2024 году
В этом руководстве мы разберем самые популярные решения для разметки данных и разберём, какой стоит выбрать именно вам.
Читать | DATApedia | #DS_AI
Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии
Вы когда-нибудь задумывались, как нейросети учатся распознавать лица, управлять автомобилями или рекомендовать фильмы? За всем этим скрывается работа разметчиков данных — специалистов, которые буквально обучают ИИ видеть и понимать мир.
Сколько зарабатывают разметчики, какие навыки им нужны, и стоит ли вам задуматься о работе в этой индустрии? Раскроем все секреты профессии в нашей статье.
Читать | DATApedia
Простыми словами про метрики в ИИ. Регрессия. MSE, RMSE, MAE, R-квадрат, MAPE
Читать | DATApedia | #DS_AI
Контроль качества разметки на проекте: 4 секрета успеха
Как контролировать качество на проектах разметки максимально эффективно? Выстроить такие процессы непросто, но мы считаем, что у нас это получилось. Для того, чтобы гарантировать на каждом проекте высокое качество разметки, в Data Light существует отдел Контроля качества. Я, Евгений Шилкин, руководитель отдела, расскажу, что нам позволяет обеспечивать стабильно высокое качество на проектах и какие советы для эффективной валидации мы можем дать.
Читать | DATApedia
Как оценить качество LLM модели
В этой статье мы представим общий обзор текущего состояния исследований оценок LLM, а также расскажем о некоторых опенсорсных реализациях в этой области.
Читать | DATApedia | #DS_AI
«Магнит» совершенствует сервис доставки: новые алгоритмы определяют лучший магазин для вашего заказа
Когда вы заказываете товары на сайте и в приложении, сервис доставки привозит их из магазинов «Магнит». Раньше для сборки заказов выбирался ближайший к покупателю магазин. Причём ближайший в буквальном смысле — по прямой. Это позволяло экономить на курьерах, но во всех магазинах разное количество сотрудников и ассортимент: где-то заказы собирали дольше, а где-то, из-за отсутствия определенных товаров, позиции в заказе меняли на аналоги. Поэтому мы решили поменять логику выбора магазинов, провели в нескольких городах пилотный проект и делимся первыми результатами.
Читать | DATApedia
Полный гид по бенчмаркам LLM
В этом посте мы представим подробный каталог бенчмарков, разбитый на категории по сложности, динамике, целям оценки, спецификациям конечных задач и типам рисков. Понимание их различий поможет вам разобраться в бенчмарках LLM в условиях их стремительного развития.
Читать | DATApedia | #DS_AI
В OTUS стартует курс «Системный Аналитик. Team Lead», на котором студенты смогут обучиться особенностям и ключевым направлениям развития системного анализа за рубежом и международными сертификациями в этой области. На занятиях студенты изучат современные принципы и практики архитектуры систем, включая методологии построения архитектуры систем, облачные вычисления, монолитные и микросервисные системы, архитектуру данных и безопасность систем.
23 сентября в 20:00 по мск. приглашаем на открытый вебинар курса «Как создать высокопродуктивную команду системных аналитиков для успешных проектов». Вебинар посвящен эффективным методам взаимодействия и управления командой системных аналитиков. Участники узнают о ключевых аспектах работы в команде, как эффективно обучать и мотивировать специалистов, а также как наладить взаимодействие внутри команды для достижения максимальных результатов в проектах.
Мы обсудим, как создать продуктивную атмосферу в команде, наладить коммуникацию и оптимизировать процессы в команде.
Для участия пройдите регистрацию: https://otus.pw/7eGm/
При поступлении в группу обучения после вебинара вы получите специальную цену на курс, а так же разные способы оплаты и рассрочка платежа.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Data больше не Big: как данные перестали быть большими и почему это полезно для бизнеса
Большие данные мертвы. В той их части, которая характеризуется как “большие”. Так считает Джордан Тигани, основатель Google BigQuery, человек, который больше 10 лет рассказывал всем о пользе big data. Что он имеет в виду и что это значит для бизнеса? Давайте разбираться.
Перейти к статье | DATApedia