Аномалии под нагрузкой в PostgreSQL: о чём стоит помнить и с чем надо бороться
Читать статью
SQL — востребованный язык программирования для разработчиков, аналитиков и тестировщиков. Пора освоить его магию! Волшебство продуктивной работы с базами данных теперь доступно всем на бесплатном мини-курсе по программированию. Расширите свой кругозор и сделаете первый шаг в IT!
Зарегистрируйтесь прямо сейчас и сразу получите первый из 5 полезных материалов: https://epic.st/YEsWHO
Что будем делать:
— Писать запросы на языке SQL.
— Проводить аналитику для бизнеса.
— Разрабатывать автоматизированную отчётность в Excel.
— Обрабатывать данные в Power Query.
— Визуализировать показатели в Excel: создавать красивые графики, диаграммы и отчёты.
— Применять инструменты Excel для анализа данных.
Спикер Мкртич Пудеян, специалист по анализу данных в «Газпромбанке». Сертифицированный SQL-разработчик от Microsoft.
🎉 Всех участников ждут подарки: персональная карьерная консультация, на которой мы определим ваши сильные стороны и поможем выбрать направление в разработке, 5 полезных статей по SQL и Excel, а также год бесплатного изучения английского языка.
🌟Учитесь с нами — откройте дверь в мир знаний!
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
Что нового в Greenplum 7?
💻Расскажет Вадим Заигрин – Team Lead команд инженеров данных, встречаемся на бесплатном открытом уроке от OTUS.
Наконец вышла седьмая версия популярной массово-паралельной СУБД для хранилищ данных с открытым кодом – Greenplum. На вебинаре узнаем, что нового ждёт нас в седьмой версии!
Урок будет полезен не только дата-инженерам, но и разработчикам, сисадминам и архитекторам.
Занятие пройдёт 8 февраля в 20:00 мск и будет приурочено к старту курса «Data Engineer». Доступна рассрочка на обучение!
👉Пройдите короткое тестирование прямо сейчас, чтобы занять место на открытом уроке и получить запись: https://otus.pw/dOzu/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Привет, на связи админ! Напишите в комментариях список тем, которые вы бы хотели, чтобы мы рассмотрели в наших постах.
Читать полностью…Функции дат и поиска MS Acess
1. Функция Format форматирует значение с указанным форматом.
2. Функция InStr возвращает позицию первого вхождения одной строки в другую.
3. Функция InstrRev работает аналогично функции InStr, но возвращает позицию первого вхождения строки в другую, начиная с конца строки.
SQL Server: GETUTCDATE
GETUTCDATE - это функция даты и времени в SQL Server, которая возвращает текущую дату и время в формате UTC. UTC - это стандартный формат времени, используемый для избежания расхождений часовых поясов и обеспечения согласованности в разных часовых поясах. В отличие от функции GETDATE, которая возвращает текущую локальную дату и время, GETUTCDATE всегда возвращает текущую дату и время в формате UTC.
Как работает GETUTCDATE?
GETUTCDATE - это недетерминированная функция, что означает, что она возвращает разное значение каждый раз при вызове, даже в рамках одного оператора. Она извлекает текущую дату и время из операционной системы сервера, на котором работает SQL Server, а затем преобразует его в формат UTC. Результатом является значение datetime с точностью 3,33 миллисекунды.
🕵♂Использование CROSS JOIN для задач поиска пересечений в исторических данных
🔵 CROSS JOIN (или полное соединение таблиц без условий) — декартова перемножение множеств. Говоря простым языком — для каждого варианта первого множества будет сопоставлены все варианты второго множества.
• Правильное использование этого типа соединения может помочь в решении сложных задач, например, нахождении пересечений в исторических данных.
• Структура таблиц представленных примеров в изображении 1.
📕 Допустим: клиент Сидоров Степан Павлович подал заявку на кредит. На некотором этапе рассмотрения потребовался анализ платежеспособности клиента андеррайтером.
Заявка автоматически распределилась на сотрудника Петрова Екатерина Павловна.
На первый взгляд ничего подозрительного нет — в ФИО людей совпадает только отчество, что является широко распространенной ситуацией.
❗️ Однако, при детальном анализе выясняется, что девичья фамилия андеррайтера и клиента совпадают (Сидорова / Сидоров) изображение 2.
В таком случае заявка клиента должна была распределиться на другого сотрудника, чтобы решение, вынесенное по заявке, было не предвзятым.
• Для решения данной задачи можно использовать простой запрос с CROSS JOIN изображение 3.
➡️ Продолжение
Как начать развиваться в профессии дата-инженера?
👨💻Освойте лучшие практики работы с данными на онлайн-курсе «Data Engineer» от OTUS.
➡️За 4 месяца вы научитесь собирать данные, разрабатывать архитектуру данных в компании и создавать сервисы для обработки данных больших объемов. Одна из фишек курса — метод кейсов. На занятиях разбираем примеры внедрений, использования инструментов, оптимизации производительности, а также возможные проблемы и ошибки.
💣 Пройдете тест и получите:
✔️ Живое общение с экспертами
✔️ Лучшие открытые уроки прошлых наборов курса
✔️ Продвинутые темы и практика на «боевых» задачах уровня Middle+
✔️ Скидку на прохождение онлайн курса «Data Engineer»
👉 ПРОЙТИ ТЕСТ
Приобрести курс возможно в рассрочку.Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Кто из айтишников зарабатывает миллион в месяц?
Вы удивитесь, но дата-сайентист GigaChat. Он управляет массивами данных и выбирает, чем «кормить» нейросеть. И это все его обязанности.
Если хотите так же выйти на шестизначную зарплату, быстрее открывайте эти каналы:
— Data Science | Machinelearning;
— About Python.
Узнаете, как легко добиться оффера в Data Science. Получите готовые модели данных и гайды, как их тестировать.
Нейросети — мусор без дата-сайентистов. Используйте тренд на благо своей карьеры:
— Data Science | Machinelearning;
— About Python.
🔊 Делимся «вредными советами» по работе с ClickHouse®
ClickHouse® — быстрая и масштабируемая колоночная база данных. Она известна своей высокой производительностью, возможностью обрабатывать аналитические запросы в режиме онлайн и строить аналитические витрины. Как и у любой другой технологии, у ClickHouse® есть свои особенности и нюансы, которые необходимо учитывать при работе.
В видео архитекторы Yandex Cloud поделятся распространёнными ошибками при использовании базы данных ClickHouse®, а также рекомендациями, как избежать этих ошибок и достичь максимально производительности БД ClickHouse.
🗣 Подробнее по ссылке.
Как эффективно работать с MySQL?
Расскажет Николай Лавлинский на бесплатном практическом уроке «MySQL 8.0: запуск GTID-репликации в Docker» от OTUS.
На вебинаре:
- разберём полный процесс запуска надежной репликации в MySQL 8.0 c использованием GTID
- используем контейнеры для запуска серверов баз данных
💻 Урок будет полезен начинающим и опытным сисадминам Linux, веб-разработчикам и всем, кто хочет разобраться в работе MySQL в контейнерах.
Занятие пройдёт 30 января в 19:00 мск и будет приурочено к старту курса «Administrator Linux. Professional». Доступна рассрочка на обучение!
Пройдите короткое тестирование прямо сейчас, чтобы занять место на открытом уроке:
https://clck.ru/38Lrpf
usql
usql – это мощный инструмент, который позволяет легко работать с базами данных SQL и NoSQL через командную строку. Созданный на основе популярного psql от PostgreSQL, usql предоставляет удобный интерфейс для выполнения запросов и манипуляций с данными.
Одной из главных особенностей usql является поддержка множества баз данных. Вы можете легко переключаться между разными базами данных, копировать данные между ними и выполнять другие операции без необходимости покидать командную строку.
usql также предоставляет множество удобных функций, таких как подсветка синтаксиса и завершение на основе контекста. Это помогает сделать процесс написания и отладки запросов более эффективным.
Как мы сокращаем время простоя при установке обновлений схемы базы данных. Советы разработчикам
Читать статью
🟡 Освойте одну из самых перспективных и интересных IT-профессий всего за 4 месяца
Computer Vision — дисциплина, которая позволит вам работать с визуальными данными и нейросетями на профессиональном уровне, играя важную роль в современных инновационных проектах.
💻 Вы изучите:
— Классификацию и сегментацию изображений
— Детекцию и отслеживание объектов на видео
— Обработку и анализ трехмерных сцен
— Распознавание лиц и людей по силуэту
— Генерацию и реконструкцию изображений
— Обучение, тестирование и оптимизацию нейросетей
— Развертывание моделей в продакшн
Есть рассрочка на комфортных условиях!
🔥 Оставьте заявку прямо сейчас и получите 4 полезных урока от экспертов курса в подарок: https://clck.ru/37s4QV
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Шпаргалка по MySQL
Шпаргалка по MySQL представляет собой лист со списком наиболее часто встречающихся функций и запросов. В шпаргалку включены список доступных функций, а также форматы данных. Также вы здесь найдете список функций PHP для работы с БД и некоторые примеры запросов.
По бокам шпаргалки расположены наиболее часто используемые функции (математические, дата и время и др.). Наверняка большинство из этих функций вы даже и не знали, либо использовали один-два раза.
#Вопросы_с_собеседования
Вы работаете с базой данных, где есть таблица Прод
ажи, включающая поля Дата_прод
ажи, Менеджер
_ID, Сумма_прод
ажи. Вам нужно выяснить, есть ли в базе данных дни, когда каждый менеджер совершал хотя бы одну продажу. Какой SQL-запрос вы бы использовали для решения этой задачи?
Ответ: Можно использовать следующий запрос:
SELECT Дата_продажи
FROM Продажи
GROUP BY Дата_продажи
HAVING COUNT(DISTINCT Менеджер_ID) = (SELECT COUNT(DISTINCT Менеджер_ID) FROM Продажи);
Дата_продажи
и использует условие HAVING
для фильтрации дней, в которые количество уникальных менеджеров, совершивших продажи, равно общему количеству уникальных менеджеров, работающих в компании. Если в компании работают менеджеры, которые не совершали продаж в какой-то из дней, эти дни отфильтровываются.
Читать полностью…
Простой и эффективный метод удаления дубликатов из таблицы
Предположим, у нас есть простая таблица с двумя столбцами: id – это первичный ключ и v простое целочисленное значение
Приведенный код создает таблицу и вставляет несколько значений. Выведем на экран все строки из нашей тестовой таблицы. Как видите, id имеет уникальные значения, но поле val имеет содержит дубликаты (фото 1).
Наша задача состоит в том, чтобы удалить строки с поввторяющимися значениями в столбце val и сохранить уникальные значения с минимальным значением идентификатора id.
Для начала попробуем найти дубликаты. Мы можем использовать простое LEFT JOIN таблицы самой с собой по полю val с дополнительным условием для предотвращения объединения идентичных строк (для наглядности дадим алиасы для таблицы и копии) (фото 2).
В конечном итоге видно, что уникальные строки с минимальным id имеют (null) в столбцах из copy_tbl. Это происходит потому что для минимального значения id в исходной таблице нет строк соответсвующих условию в таблице копии. Итак, нам нужно оставить строки в которых нет соответствия (уникальные) и удалить. Это можно осуществить следующим запросом (фото 2).
Вебинар Tarantool «Строим кэши и витрины данных»
Когда: 8 февраля, 16:00 МСК
Где: онлайн
Узнайте, как быстро и удобно разрабатывать кэши и витрины данных на основе коробочной СУБД для ускорения ИТ-систем — регистрируйтесь и подключайтесь к вебинару 8 февраля в 16:00 МСК.
Поговорим о следующем:
• Как быстро «из коробки» запустить, настроить и наполнить данными кластерную базу данных. Покажем демо Tarantool DB.
• Как выполнять CRUD-операции с данными на языке бизнес-приложения.
• Как обеспечить сохранность данных при кэшировании.
• Как обеспечить горизонтальное масштабирование без ущерба для производительности.
Также рассмотрим опыт крупных банков и телекома в создании хранилищ сессий, витрин для платежных данных, валютных операций и т. д.
Спикеры:
• Руслан Галиев, менеджер продукта Tarantool DB
• Артем Дубинин, старший программист Tarantool
• Евгений Афанасьев, архитектор Tarantool
Вебинар будет полезен архитекторам, инженерам DevOps и разработчикам высоконагруженных систем.
Регистрация
С чего начать изучение работы с RabbitMQ?
С бесплатного практического урока «Очереди сообщений и протокол AMQP» от OTUS.
На вебинаре разберём:
- возможности протокола AMQP;
- как подключаться к брокеру из вашего языка программирования;
- как отправить и принять сообщение;
- как организовать простейший RPC-сервис.
Встречаемся 6 февраля в 20:00 мск в рамках курса «RabbitMQ для разработчиков и администраторов». Доступна рассрочка на обучение!
Регистрируйтесь прямо сейчас, чтобы посетить бесплатный урок: https://clck.ru/38UapH
⚡️ Совет по работе с базами данных
Удаление сотен тысяч строк происходит медленно, влияет на производительность и не освобождает память.
Однако удалить старые данные можно очень эффективно, если разбить таблицу на временные диапазоны и удалить один из них.
Ультимативная дорожная карта для изучения SQL и баз данных в 2023 году + источники для знаний
Читать статью
#Вопросы_с_собеседования
Что такое соединения SQL и какие соединения SQL наиболее популярны?
Объединения являются фундаментальной частью управления данными в SQL. Они позволяют объединить две или более таблиц для создания единой таблицы, которую можно использовать для анализа данных. Они также предоставляют способ фильтрации результатов на основе критериев в одной таблице, что может быть полезно при попытке найти определенные строки или столбцы в большой таблице.
В SQL существует четыре основных типа соединений: ВНУТРЕННЕЕ СОЕДИНЕНИЕ, ВНЕШНЕЕ СОЕДИНЕНИЕ, ПЕРЕКРЕСТНОЕ СОЕДИНЕНИЕ и САМОСТОЯТЕЛЬНОЕ СОЕДИНЕНИЕ.
Как сэкономить свои нервы и деньги компании на перестроении структуры больших таблиц без простоя в PostgreSQL
Смотреть статью
#вопросы_с_собеседований
Равен ли NULL 0 в SQL?
Нулевое значение в SQL обозначает значение, которое недоступно или назначено. Пробел (‘ ‘) или ноль (0) не эквивалентны значению NULL. Вы не можете сравнить значение NULL с любым другим значением, используя операторы сравнения, такие как “=” или”>”, поскольку оно не может быть равно или неравно любому другому значению.