17610
@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста
🖥 Полезные приемы с кодом для аналитиков данных на Python
1. Python itertools groupby удобный способ группировки - https://www.youtube.com/watch?v=Rt1gl4fM62k
2. Полезные приемы в Pandas - https://www.youtube.com/watch?v=Sd2S5rXe8sY&t=165s
3. Раскройте потенциал Python Numpy: руководство для начинающих в науке о данных - https://www.youtube.com/watch?v=XX2XremQ0fg&t=12s
4. Data science c Python.Ускоряем Pandas в 120 раз- https://www.youtube.com/watch?v=-dAdaEv23vk&t=4s
5. 26 практических приёмов и хитростей Python - https://www.youtube.com/watch?v=vAMyfvtxxdQ&t=5s
6. 5 декораторов Python для Data Science проектов - https://www.youtube.com/watch?v=rxq11WHAlqU
7. ChatGPT + Midjouney на практике - https://www.youtube.com/watch?v=2gUqbc3Ikmo&t=5s
8. Разбор вопросов с собеседований Python - https://www.youtube.com/watch?v=4L1e-A3AOL4&t=5s
9. 15 полезных лайфхаков с кодом Машинного обучения на Python - https://www.youtube.com/watch?v=loOtlwcdiBA&t=4s
10. Декораторы Python, которые выведут ваш код на новый уровень - https://www.youtube.com/watch?v=qxrGAogl4iM
11. 7 инструментов Python, который должен знать каждый специалист машинного обучения - https://www.youtube.com/watch?v=RGEftBi0C9Y
12. Как загружать данные в SQL в 20 раз быстрее на Python - https://www.youtube.com/watch?v=eyeR1uWLnpM&t=2s
13. Data Science. Полезные советы по библиотеке Pandas - https://www.youtube.com/watch?v=neXc5Q-AWXY&t=3s
14. Data Science. Полезные советы по библиотеке Pandas - https://www.youtube.com/watch?v=neXc5Q-AWXY&t=3s
15. Дзен Python ООП: лучшие практики и шаблоны проектирования Python - https://www.youtube.com/watch?v=_MtX6QFJBRU
16. Python itertools. Хитрый способ избежать вложенных циклов - https://www.youtube.com/watch?v=TSvjYKIY01I&t=3s
17. Python. Генерация списка, словаря или множества в одну строку кода - https://www.youtube.com/watch?v=zS3HePvtxVc&t=10s
18. 8 крутых способов свести функции Python в одну строку - https://www.youtube.com/watch?v=jo3Q-rMggXk
19. Python itertools.compress. Удобный способ фильтрации данных - https://www.youtube.com/watch?v=8JGHID-_ApU&t=12s
20. Python Match/Case - https://www.youtube.com/watch?v=U_-NIKbKakM
21. Data Science. Советы по написанию эффективного кода на Python - https://www.youtube.com/watch?v=1Mcy-uatp_c&t=14s
22. Numpy векторизация вместо циклов в Python - https://www.youtube.com/watch?v=c7ypD2xet0E
🎞 uproger">Все видео по анализу данных
/channel/bigdatai
Шпаргалка по Matplotlib
Matplotlib — библиотека на языке программирования Python для визуализации данных двумерной и трёхмерной графикой.
Готовы исследовать ML и AI на практике? Присоединяйтесь к TechTrain 2023 Autumn.
В программе:
– LLMs: ускорение интерфейса и деплой;
– Программирование игр с ChatGPT (экспресс-хакатон);
– Обучение искусственного интеллекта психотерапии;
– Оптимизация рекомендательных систем: метрики, архитектура и практические советы;
– Эволюция и будущее NLP;
– Автоматизация разметки данных с помощью ML-моделей;
– Разбор успешного кейса: от Jupyter к MLOps;
– Conjoint-анализ: зачем нужен, как устроен, как использовать.
После каждого доклада – общение со спикерами в дискуссионной зоне. Там вы сможете получить ответы на вопросы и вдохновиться на новые идеи.
Фестиваль пройдет 30 августа, онлайн. Для участия достаточно зарегистрироваться
🔉Более 1,5 ТБ размеченых наборов аудиоданных
https://machinelearningmastery.ru/a-data-lakes-worth-of-audio-datasets-b45b88cd4ad/
bigdatai
📊Прогнозирование цен на акции с помощью моделирования методом Монте-Карло
Моделирование - мощный инструмент прогнозной аналитики в BI.
• Методы имитационного моделирования используются для моделирования сложных сценариев и принятия обоснованных решений.
• Имитационная модель многократно моделируется с разными входными данными и сценариями, что позволяет понять диапазон возможных результатов и связанные с ними вероятности.
• Существует несколько методов имитационного моделирования, включая агентное моделирование, дискретно-событийное моделирование, моделирование по теории игр и моделирование методом Монте-Карло.
• Мы используем моделирование методом Монте-Карло из-за его универсальности и способности решать сложные задачи с неопределенностью.# Import required libraries
import math
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import yfinance as yf#obtaining and printing data
#we have used the ticker 'AC.TO', which is Air Canada
data = yf.download('AC.TO','2020-01-01','2023-01-01')
data.head()
📌 Подробнее
bigdatai
🚀 Доступ к Spark-датасетам из разных приложений — Redis.
Apache Spark, универсальная платформа для крупномасштабной обработки данных, в сочетании с Redis способна обеспечить ускоренные расчеты в реальном времени для таких задач, как анализ временных рядов, прогнозы и рекомендации на основе машинного обучения и т. д.
Spark также способен извлекать датасеты в кэш-память кластера. Это невероятно полезно, когда приложению необходимо многократно запрашивать одни и те же данные. Если вы используете датасет, создание которого достаточно затратно, и который потом используется в вашем приложении не один раз, то этот датасет обязательно нужно кэшировать. Но если вы захотите получить доступ к этому датасету сразу из нескольких приложений, то вам придется поломать голову, как это сделать. Здесь на помощь приходит коннектор Spark-Redis.
Redis — это размещаемое в памяти хранилище структур данных с открытым исходным кодом (под лицензией BSD), используемое в качестве базы данных, кэша и брокера сообщений. Оно поддерживает множество разных структур данных, таких как строки, хэши, списки, сэты и так далее.
Redis Labs недавно опубликовала в общий доступ пакет “spark-redis”. Как следует из названия, это коннектор Redis для Apache Spark, который обеспечивает доступ для чтения и записи ко всем основным структурам данных Redis в виде RDD (Resilient Distributed Datasets, в терминологии Spark), что позволяет Spark использовать Redis в качестве одного из источников данных. Этот коннектор предоставляет Spark структуры данных Redis, тем самым обеспечивая значительный прирост производительности для всех типов расчетов. Он также позволяет нам организовать совместный доступ к DataSet/DataFrame/RDD Spark из сразу нескольких разных приложений.
Но прежде чем мы сможем использовать коннектор Spark-Redis, нам сперва нужно позаботиться о наличии нескольких ключевых элементов, а именно: Apache Spark, Scala, Jedis и Redis.
Чтобы без особой необходимости не растягивать этот пост, предположим, что о всем вышеперечисленном вы уже позаботились. Поэтому давайте сразу перейдем к делу — как запустить эту мощную комбинацию. Включите указанные ниже зависимости в свой проект вместе со Spark:
•spark-redis
•jedis
📌 Читать дальше
bigdatai
Как маленькая нейроязыковая модель победила серверные подсказки
Автор, разработчик Яндекс Клавиатуры, поделился опытом создания модели и рассказал, какое качество можно получить из маленькой нейроязыковой модели и насколько она лучше n-граммной.
И вообще, почему выбрали CNN-эмбеддинг, а не Word Embedding или Byte Pair Encoding. Все тонкости в статье.
📌 Читать
bigdatai
🆓 10 лучших бесплатных курсов Udacity для мл специалистов.
1. Machine Learning by Georgia Tech
Отличный курс по машинному обучению для начинающих.
2. Introduction to Machine Learning Course
Udacity научит вас основам и тому, как использовать машинное обучение для решения реальных задач.
3. Intro to Artificial Intelligence
Узнайте об интеллектуальных агентах, алгоритмах поиска и игровых программах. Вы словно окажетесь в научно-фантастическом фильме!
4. Artificial Intelligence for Robotics
Вы узнаете, как роботыпринимают решения, понимают, где они находятся и как передвигаются.
5. What is Programming?
Познакомит вас с популярными языками программирования, переменными, циклами и условиями.
6. Intro to HTML and CSS
Никакого опыта не требуется! Вы изучите основы веб-разработки и сможете создавать классные вещи в Интернете!
7. Introduction to Computer Vision
Компьютерное зрение подобно волшебству - оно позволяет компьютерам понимать изображения и видео. Узнайте об обработке изображений, распознавании объектов и многом другом!
8. Intro to Data Science
Наука о данных - это поиск скрытых закономерностей в данных. Исследуйте данные и принимайте разумные решения как эксперт в области данных!
9. SQL for Data Analysis
Анализ данных может быть интересным с помощью SQL. Станьте мастером данных с помощью этого важного навыка!
10. Data Wrangling with MongoDB
Узнайте, как организовать и преобразовать данные как профессионал с помощью MongoDB.
bigdatai
🔎 Exposing the Troublemakers in Described Object Detection
Новый, размеченный набор данных для обнаружения объектов.pip install ddd-datasetfrom d_cube import D3🖥 Github: https://github.com/shikras/d-cube
d3 = D3(IMG_ROOT, PKL_ANNO_PATH)
all_img_ids = d3.get_img_ids() # get the image ids in the dataset
all_img_info = d3.load_imgs(all_img_ids) # load images by passing a list of some image ids
img_path = all_img_info[0]["file_name"] # obtain one image path so you can load it and inference
🔗 Docs: https://github.com/shikras/d-cube/blob/main/doc.md
📕 Paper: https://arxiv.org/pdf/2307.12813.pdf
🔥 Dataset: https://paperswithcode.com/dataset/description-detection-dataset
bigdatai
Научим применять искусственный интеллект в передовых проектах по биотеху!
На магистратуре ПИШ ИТМО х АГНИ х Татнефть «Искусственный интеллект в биотехнологических системах».
— обучение в передовом биотехнологическом научно-образовательном центре АГНИ
— часть модулей будут проходить в Университете ИТМО (перелёты будут оплачиваться)
— стипендиальная поддержка студентов от 20 до 40 тыс. руб.
— возможность трудоустройства в ПАО «Татнефть»
Количество бюджетных мест: 20
Варианты поступления:
— конкурс портфолио без сдачи вступительных испытаний (закрывается 25 июля)
— дистанционный экзамен 10 августа в письменно-устной форме
👉🏼 Узнать больше о направлении и подать документы можно до 1 августа
Яндекс Практикум и Томский государственный университет запускают совместную программу магистратуры «Дата-аналитика для бизнеса».
Поможем стать уверенным middle-специалистом и получить степень магистра ТГУ за 2 года. Если вы уже работаете аналитиком, то сможете учиться на кейсах вашей компании.
— Обучение онлайн 20-25 часов в неделю — удобно совмещать с работой
— Диплом государственного образца по направлению «Прикладная информатика»
— Преподаватели — действующие аналитики данных
— 6 месяцев практики и 30 проектов в резюме
— Системное развитие софтскилов
Мы готовим специалистов широкого профиля, которые подкованы в аналитике, бизнесе и коммуникациях. Первый и второй семестр заложат базу: программирование, экономика, менеджмент, математика. В третьем семестре можно будет выбрать специальность: продуктовая, маркетинговая или бизнес-аналитика.
Подавайте заявку и растите в T-shaped специалиста.
Испытайте себя в роли Data Scientist на бесплатном онлайн-интенсиве 24–26 июля. За 3 дня вы освоите основные рабочие инструменты и узнаете, с чем сталкиваются в работе специалисты по данным. Решите несколько реальных задач и поймёте, интересна ли вам эта профессия.
Заполните форму и получите полезный материал по Data Science на почту: 🔜 https://epic.st/wymEm
В нём вы найдёте список навыков, необходимых для прохождения собеседования, и советы, где искать первые заказы для портфолио.
На интенсиве вы:
✔️ построите модели для прогнозирования данных;
✔️ узнаете, как использовать язык Python для data-аналитики;
✔️ научитесь применять Data Science в бизнесе;
✔️ изучите техники исследования данных и разберёте реальные задачи;
✔️ создадите проект, который высоко оценят потенциальные работодатели в 2023 году;
✔️ разберётесь, для чего нужны нейросети и как начать работу с ChatGPT.
🎁 Всем участникам, дошедшим до финала интенсива, подарим электронную книгу издательства МИФ. Подключайтесь к прямым эфирам, задавайте вопросы и получите сертификат на скидку 10 000 рублей на любой курс Skillbox.
Скорее записывайтесь!
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
🔥Открываем новые горизонты в машинном обучении!
Присоединяйтесь 25 июля в 20:00 к открытому уроку «TD Learning и Q-learning».
Это возможность протестировать новый онлайн-курс «Reinforcement Learning» в OTUS и начать изучать это перспективное направление.
📌Вместе с экспертом-практиком мы:
— погрузимся во временно-разностное обучение и Q-learning;
— поговорим об основных идеях обучения с подкреплением, которые делают алгоритм RL более гибким и эффективным;
— разберем алгоритм SARSA с различными примерами реализации;
— обсудим сильные и слабые стороны каждого решения.
👉🏻Регистрация для участия https://otus.pw/yDbA/
Урок будет полезен DS/ML/DL специалистам, IT-специалистам, которые хотят погрузиться в обучение с подкреплением.
После вебинара курс можно приобрести удобным для вас способом.
Нативная интеграция. Информация о продукте на сайте www.otus.ru
Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней.
Ближайшее мероприятие:
• 22-23 июля — Fast Track для Oracle-разработчиков, с опытом работы на PL/SQL или тех, кто готов перейти. Офер за 2 дня в команду HR Tech.
Зарегистрироваться
💣Есть знания, которые постоянно требуют актуализации, а есть - база!
Убедитесь в этом 20 июля в 17:00 мск на бесплатном вебинаре в OTUS. Вебинар приурочен к старту онлайн-курса «Математика для программистов».
🔥На бесплатном вебинаре «Логические исчисления, и как они связаны с языками программирования» мы:
— разберём, что общего между программистом и математиком, и в чём разница.
— будет показано, что языки программирования строятся на тех же принципах, что и доказательства математических теорем, а выразительные способности языков программирования ограничиваются понятиями полноты и непротиворечивости.
Ведущий — Евгений Тюменцев, опытный директор компании по разработке программного обеспечения.
После вебинара полный курс можно приобрести в том числе в рассрочку.
Нативная интеграция. Информация о продукте www.otus.ru
🔥Приглашаем на базовый открытый урок по Machine Learning от OTUS
Тема: "Введение в Machine Learning"
Дата: 17 августа, 20:00. Вебинар приурочен к старту онлайн-курса "Machine Learning"
Что будет на уроке:
- История Machine Learning
- Основные понятия и типы задач машинного обучения
- Общий подход к решению задач
✨Занятие подойдёт:
- IT-специалисту, который хочет перейти в Data Science;
- Начинающему Data Scientist и специалисту по машинному обучению, желающему углубиться в профессию;
- Тому, кто самостоятельно изучает Data Science;
- Тому, кто хочет войти в IT, но не знает, что выбрать.
Продолжить обучение после вебинара можно на курсе "Machine Learning" доступном в рассрочку.
👉Регистрация: https://otus.pw/duj7/
Нативная интеграция. Информация о продукте www.otus.ru
🔥 Большой список сайтов с практическимим задачами для программистов.
Codeforces — платформа для алгоритмических соревнований. Проводит контесты и раунды с 5 задачами на 2 часа. Есть система рейтинга и два дивизиона. Задачи можно решать и проверять после соревнования. Также есть доступ к тренировкам с задачами с прошлых соревнований.
HackerRank - сайт будет больше интересен продвинутым программистам, которые уже многое умеют. На этом сайте собрано множество задач на самые разные разделы Computer Science: традиционная алгоритмика, ИИ, машинное обучение и т.д. Если вы решите много задач, то вами могут заинтересоваться работодатели, регуляторно мониторящие эту платформу.
Codewars — популярный cборник задач на разные темы, от алгоритмов до шаблонов проектирования.
LeetCode — известный сайт с задачами для подготовки к собеседованиям. Можно пообщаться и посмотреть решения других программистов.
Timus Online Judge — русскоязычная (хотя английский язык также поддерживается) платформа, на которой более тысячи задач удачно отсортированы по темам и по сложности.
TopCoder - популярная американская платформа. Она проводит алгоритмические контесты, а также соревнования по промышленному программированию и марафоны, где задачи требуют исследования и нет единого верного алгоритма. Участникам даются недели на решение таких задач.
informatics.mccme.ru - платформа с теоретическим материалом и задачами, удобно разделенными по категориям. Большая база задач с олимпиад школьников также доступна.
SPOJ - большой англоязычный сайт с 20000+ задачами на разные темы: DP, графы, структуры данных и др. Иногда проводят неинтересные контесты, если не из страны их проведения.
CodeChef — менее крупный аналог Codeforces и TopCoder, тоже с огромным архивом задач и регулярными контестами.
Project Euler - сборник 500 задач, проверяющих знание математических алгоритмов. Часто используется на собеседованиях, чтобы оценить алгоритмическую подготовку кандидата.
Kaggle - соревнования по анализу данных.
Golang tests - канал с тестами по Go
CodinGame - сайт для программистов и геймеров, предлагающий большую коллекцию видеоигр, оформленных в виде задач на программирование.
Al Zimmermann’s Programming Contests — платформа, на которой регулярно проводятся контесты с задачами на исследование и оптимизацию. Интересен тем, что писать программу необязательно — даются только тестовые данные. Ответы можно расчитывать вручную, или просто гадать их на кофейной гуще.
Programming Praxis — сайт, где можно найти много интересных задач.
CheckIO — сайт с задачами для программистов всех уровней, который вы проходите в виде игры.
Ruby Quiz — сайт с задачами для программистов на Ruby, но решения можно писать и на других языках.
Prolog Problems — Подборка задач для программистов, использующих Prolog.
Сборник задач от СppStudio - задачи на С++, но их можно и на других языках.
Operation Go — практика написания кода на Go в форме браузерной игры.
Empire of Code — сайт для программистов, где необходимо писать код, реализующий стратегию и тактику виртуальных бойцов.
/channel/bigdatai
Большая Шпаргалка по pandas, библиотеке на языке Python для обработки и анализа данных
Читать полностью…
📌 Подборка шпаргалок по matplotlib от лёгкого до высокого уровня
#cheatsheet #python
⚡️Маст-хэв список для программистов, каналы с последними книжными новинками, библиотеками, разбором кода и актуальной информацией, связанной с вашим языком программирования.
Лучший способ получать свежие обновлении и следить за трендами в разработке.
Машинное обучение: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
C#: t.me/csharp_ci
C/C++/ t.me/cpluspluc
Data Science: t.me/data_analysis_ml
Devops: t.me/devOPSitsec
Go: t.me/Golang_google
Базы данных: t.me/sqlhub
Rust: t.me/rust_code
Javascript: t.me/javascriptv
React: t.me/react_tg
PHP: t.me/phpshka
Android: t.me/android_its
Мобильная разработка: t.me/mobdevelop
Linux: t.me/+A8jY79rcyKJlYWY6
Big Data: t.me/bigdatai
Хакинг: t.me/linuxkalii
Тестирование: /channel/+F9jPLmMFqq1kNTMy
Java: t.me/javatg
💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка машинное обучение: /channel/addlist/_FjtIq8qMhU0NTYy
📕 Бесплатные Книги для программистов: /channel/addlist/YZ0EI8Ya4OJjYzEy
🎞 YouTube канал: uproger" rel="nofollow">https://www.youtube.com/@uproger
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
Курс по соревновательному Data Science👨💻
🏆 Хочешь покорить Kaggle и научиться выигрывать соревнования по анализу данных? Тогда курс "Введение в соревновательный Data Science" - это именно то, что тебе нужно!
🎯 В отличие от большинства курсов по машинному обучению, этот курс сконцентрирован на практике, а не на теории. Поэтому на нем будет более 200 практических заданий, интервью с Kaggle Grand Masters и, конечно же, внутренние соревнования для отработки техник.
⚡️В программе курса тебя ждет:
* Продвинутая работа с pandas и numpy
* Генерация, визуализация и фильтрация признаков
* Модуль про SOTA градиентные бустинги и то как их тюнить
* Стекинг и блендинг моделей
* Ускорение вычислений и оптимизация памяти
* Парсинг данных из открытых источников
* Работа с Kaggle Api и различными облачными вычислительными сервисам
* Нейронки для табличных данных
* Интервью с Kaggle Grand Masters и многое другое
🚀 Еще ребята проводят еженедельные открытые вебинары, на которых разбирают решения победителей с чемпионатов, делают обзоры предстоящих соревнование и рассказывают про необычные техники, с которыми сталкиваются на практике.
🔗 Записаться на курс и ознакомится с его подробной программой можно на странице курса. Так же подписывайся на их телеграмм канал, чтобы следить за новостями курса и открытыми вебинарами. Кстати, в закрепе канала ты найдешь промокод на 10%.
⚡️ ConvertCSV — крутой универсальный инструмент для работы с CSV
ConvertCSV отлично подойдёт для обработки и конвертации CSV-файлов, поддерживая также формат TSV и прочие популярные разделители
При этом обработка данных происходит непосредственно на вашем компьютере, что обеспечивает безопасность пользовательских данных
Также сервис поддерживает работу с Excel и предлагает инструменты для командной строки и настольные приложения
Стоимость: #бесплатно
#data #CSV #данные
bigdatai
Думаете о международной карьере, но боитесь, что не хватит английского? Практикуйте его в разговорных клубах для IT-специалистов.
За пять дней вы:
- узнаете, как готовиться к собеседованию на английском
- попробуете использовать фреймворк STAR на примере собеседования
- потренируетесь вести дискуссию и вежливо отстаивать свою точку зрения
- получите подарки от Яндекс Практикума
Формат: закрытый телеграм-канал и два воркшопа в Zoom. В канале вы получите чек-листы и будете решать упражнения. На воркшопах — сможете попрактиковаться с преподавателем и другими студентами.
Ведущая: Василиса Шеромова. Преподаватель на курсах английского для работы в IT. Опыт преподавания: больше 10 лет. Пять лет работала менеджером по маркетингу в IT-компаниях.
Собрание бесплатных курсов по Python и машинному обучению.
1. Основы Python для анализа данных — программирование на Python.
2. Ускоренный курс по машинному обучению — видеолекции от исследователей Google.
3. Основы R — как обрабатывать, анализировать и визуализировать данные.
4. Введение в Data Science и аналитику — основы Data Science и Data Science Life Cycle.
5. Линейная регрессия — как применять R для осуществления линейной регрессии.
6. Визуализация — принципы визуализации данных и применение ggplot2.
7. Введение CS50 в программирование на Python, май 2023 г.
8. Python для всех: Getting Started with Python от Coursera, этот курс для начинающих знакомит с программированием на Python через пошаговые учебные пособия и практические упражнения. Курс ведет известный преподаватель доктор Чарльз Северанс.
🚀 Podman Desktop
Графический интерфейс для создания, запуска и управления контейнерами Kubernetes.
Удобный интсрумент, который позволяет создавать, запускать, тестировать и публиковать микросервисы и приложения, разрабатываемые для систем контейнерной изоляции.
▪ Github
bigdatai
🖥 Подробная Шпаргалка SQL на 2023 год
Руководство о всех SQL-запросах и примерах их использования.
Этот пост постоянно обновляется и дополняется, сохраняйте пост себе и делитесь ссыслкой с друзьями.
Ставьте ❤️, если хотите больше подобного материала.
✔️ Шпаргалка
bigdatai
⭐️ Flourish Studio — инструмент для создание интерактивных визуализаций данных без кодинга
Это отличный вариант, если вам нужно быстренько и красиво визуализировать собранные данных без необходимости программировать
С помощью инструмента вы сможете создавать динамичные и привлекательные графики, диаграммы, карты и другие визуальные элементы
У Flourish Studio есть широкий набор готовых шаблонов и анимаций, интуитивный визуальный редактор, возможность добавлять интерактивность и настраивать анимации
Стоимость: #бесплатно (но есть платные тарифы).
#данные #диаграммы
bigdatai
🤔 10 аргументов “за” и “против” SQL
• Вторая по обсуждаемости тема в среде специалистов по SQL: как произносить то, что большинство людей называют Sequel ([сиквел] вместо [эс кью эл]). Это удивительно, поскольку язык существует более 40 лет.
• Но, пожалуй, самая обсуждаемая тема, связанная с SQL, — это вопрос о том, считается ли он языком программирования.
Почему SQL не является языком программирования
🟢 Создание и выполнение запросов, а не скриптов
🟢 Не изменяет состояние
🟢 Отсутствие циклирования
🟢 Репутация в отрасли
Почему SQL является языком программирования
🟣 Соответствие критерию Тьюринга
🟣 Переменные, условная логика, определения функций
🟣 Возможность создавать приложения (хотя это сложно)
🟣 Так считают в Google
Подробное разъяснение читай тут
bigdatai
🦙 LONGLLaMA: языковая модель, для обработки длинных контекстов из 256 000 токенов
Новый метод Focused Transformer (FOT) позволяет дообучать большие языковые модели для расширения эффективного понимания контекста.
Для демонстрации метода исследователи дообучиили open source модели OpenLLaMA 3B и 7B, результирующая модель LONGLLAMA показала прогресс в точности в задачах, требующих понимания длинного контекста. Модель LONGLLAMA-3B достигла точности 94,5% при 100 тысячах токенов и 73% при 256 тысячах токенов, в то время как базовая модель OpenLLAMA не способна обрабатывать контексты, превышающие ее длину обучения в 2 тысячи токенов.
•Код
•Colab
bigdatai
Два продвинутых SQL-метода, которые могут значительно улучшить ваши запросы
SQL — это основа для каждого специалиста по работе с данными. Неважно, являетесь ли вы аналитиком данных, специалистом по данным или инженером по обработке данных, вам необходимо иметь четкое представление о том, как писать чистые и эффективные SQL-запросы.
Это связано с тем, что за любым тщательным анализом данных или любой сложной моделью машинного обучения стоят базовые данные, и эти данные должны откуда-то поступать.
Cегодня мы рассмотрим две новые техники SQL, которые вы можете добавить в свой набор инструментов, чтобы вывести ваши запросы на новый уровень. Эти методы называются Обобщённое табличное выражение (CTE) и Оконные функции.
Читать