ds_wiki | Unsorted

Telegram-канал ds_wiki - DATApedia | Data science

3571

Тут вы найдете всё, что связано с Data Science, AI и Machine Learning, как для начинающих, так и для бывалых специалистов. Также, для вас, мы переводим зарубежные статьи. Сотрудничество: @Seyfme

Subscribe to a channel

DATApedia | Data science

​​«Квантовые облака»: как VK Cloud и разработчики делают квантовые вычисления ближе к бизнесу

Автор расскажет, что такое квантовые компьютеры, как Российский квантовый центр и сотрудники из организации S-Quantum придумали эмуляторы квантового процессора, почему решили разворачивать их в облаке и что в итоге получили.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Разговор об управлении компанией, искусственном интеллекте и ИТ-гигантах

Команда VK Cloud перевела расшифровку подкаста Harvard Business Review HBR IdeaCast. В нем Сундар Пичай, генеральный директор Google и его родительской компании Alphabet, рассказывает о генеративном ИИ и других вопросах, касающихся искусственного интеллекта и развития крупных ИТ-компаний в будущем.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

🔥Как аналитику данных правильно собрать требования?

Узнайте на открытом уроке от OTUS! Урок пройдёт 23 августа в 20:00. Вебинар приурочен к старту онлайн-курса "Аналитик данных"

⚡️Что разберём на уроке:

-Жизненный цикл задачи в анализе данных;
-Какие вопросы нужно обязательно задавать и как правильно фиксировать ответы;
-Как преодолевать возражения и не заработать ненужный стресс в процессе.

✨Урок будет полезен:

-Новичкам в области анализа данных, которые задумываются об углублении знаний;
-Специалистам, которые уже делают первые шаги в этой профессии;
-Аналитики, работающие с подготовкой ручной отчетности.

Продолжить обучение можно на онлайн-курсе "Аналитик данных",
который можно приобрести в рассрочку.

💪Для регистрации на урок пройдите тестирование:
https://otus.pw/x3iD/

Нативная интеграция. Информация о продукте www.otus.ru

Читать полностью…

DATApedia | Data science

​​Искусственный интеллект: сколько он стоит, куда идет и можно ли ему доверять

Команда VK Cloud перевела статью о том, что на самом деле сейчас происходит с искусственным интеллектом: чего от него ждут, сколько он стоит и как будет развиваться в будущем.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​S3 не сразу строилось

Вашему вниманию предлагается сокращённый перевод эпичного поста под авторством Энди Уорфилда, вице-президента и заслуженного инженера в компании Amazon, занятого разработкой S3.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Книга «Data Science в действии»

Эта уникальная книга содержит описание пяти практических проектов, включая отслеживание вспышек заболеваний по заголовкам новостей, анализ социальных сетей и поиск закономерностей в данных о переходах по рекламным объявлениям.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Как создавать качественные ML-системы. Часть 2: приручаем хаос

Команда VK Cloud перевела вторую статью из серии о создании ML-систем. Первую читайте по ссылке. Здесь поговорим о Data-centric ИИ, данных для обучения, разметке и очистке, синтетических данных и еще немного о Data Engineering и ETL.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Сможете ли вы отличить собаку от кошки, или Как объяснить проблемы дата-сайентиста коллегам. Часть 3

В предыдущей части вы узнали, что качество модели Data Science в первую очередь зависит от исходных данных.
В третьей, заключительной части статьи автор даст ответы по рисункам из предыдущей части. И для дата-сайентистов приведет общий код Python, который использовался для получения всех представленных ниже изображений.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Как сделать контекстное окно на 100K в большой языковой модели: обо всех фокусах в одном посте

В этой статье рассмотрены приёмы, позволяющие ускорить обучение больших языковых моделей (LLM) и нарастить в них вывод (inference).

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Сможете ли вы отличить собаку от кошки, или Как объяснить проблемы дата-сайентиста коллегам. Часть 2

В первой части автор остановился на проблемах дата-сайентистов и на моделях, а в конце показал пары картинок, где нужно было отличить кошку от собаки. В этой части автор приведет ответы и расскажет, что и в какой степени влияет на качество моделей.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Сможете ли вы отличить собаку от кошки, или Как объяснить проблемы дата-сайентиста коллегам. Часть 1

Этот материал начинает серию из трех постов о том, как объяснить проблемы дата-сайентистов сотрудникам вашей компании, которые ничего не понимают в data science. В первой части я доступно расскажу о нынешнем положении специалистов, их проблемах и типичных запросах, с которыми они сталкиваются.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Модели прогнозирования продаж в «Магните»: Легенда об Ансамбле

Статья рассказывает о моделях прогнозирования продаж в сети магазинов "Магнит". Авторы описывают типы и особенности используемых моделей, а также сложности, с которыми сталкиваются при прогнозировании товарных категорий, присутствующих в ассортименте ограниченный период времени в течение года.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

И з/п хорошую обещали

Читать полностью…

DATApedia | Data science

​​Сравниваем модели машинного обучения с применением статистических тестов

В этой статье рассмотрено три метода сравнения моделей.
Материал будет полезен для сравнения классических моделей, таких как регрессионные модели или модели классификации, на больших таблицах. Акцент в тексте сделан на методике сравнительного анализа, без учета оптимизации времени тестирования.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Академия Data Science от Тинькофф!

Учитесь у лучших экспертов Тинькофф и других ИТ-компаний в современном кампусе в центре Москвы. Подойдет студентам технических вузов, начинающим ИТ-специалистам и всем, кто мечтает о карьере в Data Science.
Подробнее здесь: https://o.tinkoff.ru/master_ds_2023

Читать полностью…

DATApedia | Data science

​​Преобразование табличных данных в Python

В статье рассказывается о выборе библиотек для работы с табличными данными в Python. Сравниваются четыре популярных фреймворка: Pandas, Polars, PyArrow и DuckDB. Обсуждаются такие аспекты, как документация и экосистема, производительность и удобство работы с кодом. В конце автор делится своим мнением о том, какой фреймворк лучше выбрать в зависимости от конкретной задачи.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

- Удобно сейчас созвониться на 10 минут?
- Да, конечно удобно

Читать полностью…

DATApedia | Data science

​​Как закалялась сталь: моделируем остывание рельса, чтобы сделать его прочнее

Статья рассказывает о том, как разработчики и дата-сайентисты ЕВРАЗа создали математическую модель остывания рельса, чтобы сделать его прочнее. В статье описывается процесс производства рельсов, проблемы, связанные с термоупрочнением, и как математическая модель помогает контролировать скорость охлаждения и добиться лучших механических свойств рельса.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​14 типов атак, которые должны выявлять системы лицевой биометрии

Различные слабые места биометрической системы можно использовать для атаки. В этой статье мы рассмотрим так называемые «атаки на визуальный образ» (Presentation Attack, PA).

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

QA рассказывает про свою профессию

Читать полностью…

DATApedia | Data science

​​Целостность, точность, согласованность: три фактора, обеспечивающие качество машинного обучения

Эффективность моделей машинного обучения напрямую зависит от обучающих данных. Если данные неполны или размечены неверно, то эти пробелы отразятся на прогнозах модели.
Но как выявлять высококачественные данные и обеспечивать их уровень уже в процессе работы над проектом? И что означает «качество данных» в контексте машинного обучения?

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Эффективная загрузка внешних данных в корпоративное хранилище: опыт «Магнита»

Сегодня я хотел бы поделиться с вами опытом, который мы приобрели в компании «Магнит» при загрузке данных из внешних источников в корпоративное хранилище данных. Расскажу о проблемах, с которыми мы столкнулись и решениях, которые нам помогли облегчить процесс загрузки, повысить эффективность и ускорить получение доступа к данным.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

🔥В OTUS открыт набор в группу курса “Язык R для анализа данных”. На серии открытых уроков преподаватели раскрывают возможности применения языка R и его особенности, а также делятся практическими советами.

Одна из сфер применения языка R — финансы. Поэтому мы решили посвятить этой теме следующее практическое занятие, участие в котором бесплатно.

📌14.08 в 20.00 (мск) приглашаем на вебинар “Анализ финансового портфеля с помощью языка R”, на котором разберем:

- как загружать и обрабатывать финансовые данные в R;

- способы сборки из данных портфелей;

- методы анализа построенного портфеля;

- характеристики портфеля.

Результат урока: вы научитесь работать с финансовыми данными в R. Построите финансовый портфель и узнаете какие есть подходы к анализу построенного портфеля.

👉Регистрация для участия https://otus.pw/ZzIE/

Не упустите возможность протестировать формат обучения и получить ценные знания. Приобретая курс, возможно оформить рассрочку на весь период обучения, а также получить скидку.

Нативная интеграция. Информация о продукте www.otus.ru

Читать полностью…

DATApedia | Data science

​​Теория вероятностей в разработке: где применяется и что можно изучить для более глубокого понимания темы

Часто приходится слышать, что математика, включая статистику и теорию вероятностей с комбинаторикой, не слишком нужна разработчику. Что ж, в некоторых случаях это действительно так. Но для представителей ряда направлений всё это нужно. Кому именно требуется теория вероятностей с сопутствующими дисциплинами и зачем? Об этом поговорим в статье

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Как создавать качественные ML-системы. Часть 1: каждый проект должен начинаться с плана

Команда VK Cloud перевела серию из двух статей о жизненном цикле ML-проекта, проектной документации, ценности для бизнеса и требованиях. О том, как начинать с малого и быстро отказываться от слабых идей. Руководство пригодится дата-сайентистам, специалистам по машинному обучению, руководителям отделов, техническим руководителям или тем, кто хочет дорасти до этого уровня.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Как аннотировать документы для обучения ИИ распознавания текста

В этой статье описываются проблемы, связанные с обработкой неструктурированных данных, и предлагаются решения, такие как использование многонациональных команд для сбора датасетов на разных языках, сервисы для сбора состязательных примеров и написание четких инструкций по аннотированию. Также обсуждаются задачи парсинга документов и извлечения сущностей

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Как мы снизили нагрузку на SAP HANA незаметно для пользователей

В статье рассказывается о том, как команда снизила нагрузку на SAP HANA незаметно для пользователей, используя простой и действенный способ, основанный на разделении данных по "температуре" - на “холодные”, “теплые” и “горячие”. Рассматриваются проблемы, с которыми сталкиваются средние и крупные бизнесы, когда объем информации в корпоративном хранилище данных начинает превышать запланированные изначально мощности. Описываются шаги и сценарии миграции для снижения нагрузки на SAP HANA.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

🤔 Что круче: аналитика данных или бизнес-аналитика?

Хотите перейти в аналитику? Первый шаг к успешной карьере — правильно выбрать направление внутри профессии и узнать, какие навыки освоить на старте. Разобраться поможет открытый диалог «Бизнес-аналитик vs дата-аналитик: кто круче? Сравним зарплатную вилку, задачи и спрос на рынке труда» 25 июля в 19:00 Мск.

Спикеры:
— Василий Ключарев, продуктовый аналитик, банк Точка;
— Максим Третьяков, предприниматель, ранее бизнес-аналитик в «Росатом», SBS Consulting, Strategy Partners;
— Ольга Дремова, эксперт по разработке и развитию продуктов в стартапах.

На трансляции вы узнаете:
🔹 кому подойдет бизнес-аналитика, кому — консалтинг, а кому — аналитика данных;
🔹 какие специалисты наиболее востребованы на рынке труда;
🔹 какие навыки нужны разным аналитикам и какие задачи они решают;
🔹 сколько получают специалисты на разных этапах карьеры и на каких условиях работают.

🗣 Трансляция пройдет в формате открытого диалога — спикеры ответят на все ваши вопросы, которые вы сможете задать как перед, так и во время встречи. Лучше отправить вопросы заранее при регистрации, чтобы эксперты успели подготовиться и дали еще больше ценной информации!

💬 Переходите по ссылке, чтобы зарегистрироваться: https://u.to/k1vRHw

Читать полностью…

DATApedia | Data science

​​Что такое Data science? Простыми словами о сложном

Впервые услышав о Data science, вам, скорее всего покажется это чем-то невероятно сложным и недоступным. Но стоит лишь немного разобраться в этой теме, вы откроете для себя эту дисциплину совершенно с другой стороны.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Аннотирование повреждений автомобилей для обучения искусственного интеллекта

Благодаря доступности систем компьютерного зрения на основе ИИ, способных автоматизировать большую часть процессов, в последние годы активно развивается сфера визуального контроля, связанного с технологиями страхования. При помощи мобильных приложений или веб-сайтов пользователи могут выполнять удалённую оценку повреждений и мгновенно получать расчёт цены, что упрощает процесс и сильно снижает стресс пользователей. Однако обучение систем визуального контроля при помощи ИИ имеет свои сложности, поскольку требует постоянного наполнения высококачественными и разнообразными данными.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…
Subscribe to a channel