7668
Мультидисциплинарный канал о науке и технологиях. Data Science, Bioinformatics, Biology, Mathematics, Physics, IT, Computer Science. @sberlogabio био и дата сайнс @sberlogasci математика, физика и ДС https://www.youtube.com/c/SciBerloga
🧠 Лайв-стрим — 23 июля
В 18:00 по немецкому времени (19:00 по Киеву/Москве) у нас в гостях —
Михаил Коробко, старший научный сотрудник Института квантовой механики Университета Гамбурга и популяризатор науки.
Telegram-канал Михаила: @homeostatic_universe
📡 Стрим открытый — можно слушать, задавать вопросы и участвовать в разговоре.
🔬 Поговорим о теоретической и экспериментальной физике, квантовых технологиях, академической жизни и научной карьере в Германии.
Возможно, затронем междисциплинарные темы — философию науки и стыки с другими областями знаний.
📍Присоединиться можно будет 23 июля в указанное время — кнопка «Присоединиться к стриму» появится вверху этого канала.
🗓️ Отметьте у себя в календаре — будет интересно не только физикам.
От наших друзей с песней и юмором и о науке:
Читать полностью…
🚀 Уважаемые коллеги, кому интересна математика и машинное обучение, приглашаем Вас принять участие в неформальном научном проекте.
Мы разрабатываем новые методы и опен-соурс библиотеку CayleyPy, которая на основе МЛ/РЛ методов позволяет решить математические задачи, которые были не доступны ранее. Как пример наша система уже по всем параметрам на порядки превсходит аналогичные методы в системе компьютерной алгебры GAP (де-факто стандарт) - использующую алгоритмы доработанные самим Д. Кнутом.
Если у Вас желание поучаствовать в проекте, есть знание Питона и несколько свободных часов в неделю - то присоединяйтесь к нам - при активной работе - Вы будете соавтором научных публикаций. (Напишите @alexander_v_c - к.ф.-м.н. Александр Червов).
Краткая суть задачи может быть описана несколькими способами - нахождение пути на графе размером 10^20-10^200 (из-за размера обычные методы не применимы - только МЛ/РЛ). Решение пазла типа кубика Рубика, задача сортировки, математически - разложение элемента группы по образующим - все это в реальности одна и та же задача. Задача близка к прошедшему конкурсу Каггл Санта 2023. Более общо - это задача планирования - типичная для реинфорсмент ленинг - спланировать действия так чтобы кумулятивный эффект давал лучший результат - управлением манипулятором робота, системы АльфаГо, АльфаТензор, успех DeepSeek - это задачи - тесно связанные с тем, что мы делаем.
А зачем это нужно биологам ? А чтобы превращать людей в мышей ))) (А капусту в репу). Так назвал свои статьи известный биоинформатик П.Певзнер - оказывается эволюционная дистанция - соответствует дистанции на определенных графах - и наша цель улучшить ее оценку через МЛ/РЛ. Зачем нужно нужно в сетях - задержка сигнала (latency) сети определяется диаметром сети - оценка диаметра графов - одна из наших целей. В теории квантовых вычислений тоже нужны подобные графы и приложения этим не ограничены. И, кроме того, а знаете чем знаменит Билл Гейтс ?)) Он отлично сортировал блины ! Наша задача - побить его - через МЛ/РЛ)))
В нашем коллективе есть профессора математики, Каггл градмастеры, и легендарные иностранные специалисты - Tomas Rokicki , Herbert Kociemba - Вам будет у кого поучиться.
Подробнее о проекте вы можете узнать в наших статьях https://arxiv.org/abs/2502.18663 https://arxiv.org/abs/2502.13266 и в нашей группе /channel/sberlogasci/1 и ⭐ СТАВЬТЕ СТАРС ⭐ (звездочки) на наш гитхаб: https://github.com/cayleypy/cayleypy
⚡️ AlphaGenome — революция в геномике или очередной пшик?
🧬 Два дня назад исследователи из Google DeepMind выпустили AlphaGenome. AI-модель умеет для поданной на вход последовательности ДНК (до 1 Мб) предсказывать с однонуклеотидным разрешением сразу кучу модальностей. Например, эффекты вариантов в некодирующих областях, сайты сплайсинга, экспрессию генов, модификации гистонов etc. Модель превзошла другие методы почти во всем по бенчам. Перед нами реальный прорыв в понимании «темной материи» генома или... нет?
🔥 Уже в это воскресенье 29 июня в 18:00 мск @blastim проводит открытый онлайн-семинар, где биоинформатик и машинлернер Александр Декан сделает обзор передовой модели от Google, сравнит ее с другими нашумевшими AI-тулами и даже покажет, как ей можно пользоваться прямо сейчас.
🔗 Записывайтесь на встречу, если резонирует: https://sbsite.pro//5day_marathone_1
Точно зайдет естественникам, айтишникам и всем интересующимся сферой AI в биоинформатике. Лучший вариант полезно провести летний воскресный вечер 😎
Все говорят об искусственном интеллекте и машинном обучении по 10 раз на дню. У неспециалистов порой возникает жгучее ощущение, что нужно просто закинуть данные в черную коробку с надписью «Машинлернинг» и получить на аутпут конфетку! Цитирования статей и размер грантов сразу умножатся на 10, а пациенты излечатся от всех болезней...
Но это не так! В эту среду, 25 июня в 19:00 (МСК) состоится откровенный вебинар «Как НЕ решить вашу задачу с помощью машинного обучения» с биоинформатиком Владимиром Шитовым, который знает о чем говорит 😱
Спикер расскажет и покажет:
📌 Когда ML бесполезно, а то и вредно
📌 Почему тупой подход «закинул данные — получил результат» не работает
📌 Худшие практики, которые гарантированно позволят вам сделать лажу в красивой обертке
📌 Реальные кейсы, где всё пошло не так (и почему)
Записаться по ссылке: https://sbsite.pro//5day_marathone_1
После регистрации вы попадаете в закрытый чат, где будет проходить неделя машинного обучения от @blastim — это еще больше фактов об ML, которые от вас скрывали
Боишься, что ИИ займет твое место? Лучше подумай, чем занять его самого!
Искусственный интеллект — все-таки не конкурент, а помощник. Если ты тоже хочешь:
🔩 делегировать нейросетям скучные и рутинные рабочие операции
🔩 перестать выгорать и тратить время на то, что GPT делает за минуту
🔩 ускорить анализ статей, поиск инфы для литобзора, написание отчетов
🔩 получить овервью всех популярных нейросеток
🔩 создать персонального бота-саммаризатора
🔩 а также узнать больше о главном тренде 2025 — ИИ-агентах
То приходи вечером 8 июня на вебинар от @blastim. На встрече реальные исследователи ИИ расскажут, как эффективнее использовать нейросети и делать это без подписок, VPN и кода.
После веба ты внедришь ИИ в свою работу, никто из коллег и не заметит — а это 5–10 сэкономленных часов в неделю для жизни и отдыха
🔗 Подробности и запись тут: https://agency.blastim.ru/start_ai
🎁 Кстати, сразу после регистрации ты получишь доступ к AI Call Analyzer — умному ассистенту от Бластим
PS А если ты до сих пор думаешь, что ИИ — лишь игрушка, чтобы генерить картинки котиков, то читай пост, как нейросеть помогла биологам из Имперского Колледжа Лондона сделать открытие
🤑 Хотите увидеть зарплатные вилки в биотехе, которые скрывают компании? А научиться программировать и анализировать данные?
🤩 Комбо! Уже в этот вторник 29 апреля @blastim устраивает беспрецедентный воркшоп «От сырой таблицы до инсайтов: твоя первая обработка данных на R за один вечер». На бесплатной онлайн-встрече опытный статистик Иван Поздняков научит анализировать данные на примере реального датасета с зарплатами, выгруженными из карьерного портала blastim.ru
На вебинаре:
📌 Вы получите доступ к эксклюзивным данным о зп в российском биотехе, которых нет в открытом доступе
📌 Вы с нуля выучите синтаксис базового R и познакомитесь с tidyverse
📌 Вы проведете своими руками анализ зарплатных трендов под руководством Ивана, даже если никогдашеньки не кодили
📌 Вы построите свои первые графики с помощью ggplot2 и научитесь делать волшебные отчёты в Quarto
📌 Вы узнаете все скрытые тенденции рынка биотеха и полезные приемы от Ивана Позднякова
На выходе: знания о реальных зарплатах в сфере лайфсайенс и навыки программирования и анализа данных на R
❓Почему R, а не Python? R — популярнейший язык программирования, специально заточенный под анализ данных в науке. В нем широкие возможности для визуализации данных и непревзойденный инструментарий для проведения стат-тестов. Это те навыки, который полезно иметь при себе любому ученому
🗓 Когда? 29 апреля, 19:00 мск
🆓 Вход: бесплатный
🔗 Регистрация: /channel/BlastimR_bot?start=222577
🕖 Длительность: около 3 часов
Поспешите зарегистрироваться, пока все места не заняли эйчары 😏
⚡️Анализируем продажи на Wildberries с помощью Python
С каждым днем все больше бизнесов выходят на маркетплейсы, а значит еще более ценными становятся аналитики, которые умеют с ними работать. Хотите за несколько часов собрать интересный кейс для своего портфолио?
Андрон Алексанян - эксперт по аналитике с 8 летним опытом и по совместительству CEO Simulative в прямом эфире проанализирует продажи на Wildberries с помощью Python.
Что будет на вебинаре:
🟠Напишем скрипт на Python, который каждый час собирает статистику о ранжировании карточки на WB по ключевым запросам;
🟠Построим наглядные визуализации для отслеживания динамики ранжирования.
Важно досмотреть вебинар до конца, чтобы узнать как упаковать этот кейс в портфолио своих проектов.
😶Зарегистрироваться на бесплатный вебинар
🚀 @SBERLOGABIO webinar on bionformatics and data science:
👨🔬 L. Peshkin (Harvard Medical School) "Principal Compounds: A scalable Pharmaco-biology + Machine Learning approach to Reverse Engineering of Molecular Circuits underlying Macro-Phenotypes"
⌚️ 19 Марта Среда, 19.00 по Москве (17.00 CET)
Add to Google Calendar
Доклад будет посвящен некоторой задаче на стыке фармакологии, машинного обучения, теории информации и кодирования , решение которой будет иметь практические применения для тестирования и понимания эффекта компаундов.
Следующие публикации рекомендуются к прочтению:
https://pubmed.ncbi.nlm.nih.gov/24707051/
https://www.biorxiv.org/content/10.1101/2020.09.26.312348v1
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
Добрые и мудрые, нежные и прекрасные, весёлые и надёжные — дорогие наши девушки!
Поздравляю вас с Международным женским днём! ✨💐
Вы — настоящее украшение этого мира!
Пусть крепкое здоровье, искренние улыбки и весеннее настроение сопровождают вас каждый день! 🌸🌼💖
В 2005 году Джон Иоаннидис опубликовал статью "Why Most Published Research Findings Are False", в которой представил аргументированное обоснование того, почему большая часть научных результатов не является истинной. Эта работа вызвала значительный резонанс в научном сообществе, так как поставила под сомнение надежность большого числа исследований.
Факторы риска
Автор утверждает, что вероятность ложных результатов в научных публикациях можно доказать математически. Он рассматривает ключевые факторы, которые влияют на истинность исследовательских данных. Одним из важнейших параметров является статистическая мощность исследования: чем меньше выборка, тем выше вероятность того, что результаты окажутся случайными. В свою очередь, маленький размер эффекта также снижает вероятность того, что исследование отразит реальную зависимость.
Еще одним важным фактором является соотношение истинных и ложных гипотез в конкретной научной области. Если в данной области большинство исследуемых гипотез ложны, вероятность получения ложноположительного результата возрастает. Кроме того, гибкость в дизайне исследования, выборе методики анализа и интерпретации данных также способствует получению предвзятых результатов. Изменение методик на ходу или манипуляции с анализом данных могут приводить к тому, что отрицательные результаты превращаются в положительные. Это особенно актуально в условиях конкуренции, когда публикации с "интересными" результатами получают больше внимания.
Финансовые и другие предвзятости также оказывают значительное влияние на научные исследования. Автор подчеркивает, что чем больше финансовых или иных заинтересованных сторон в научной области, тем выше вероятность того, что результаты исследований будут искажены. Этот эффект усиливается в областях с высокой конкуренцией, где ученые стремятся публиковать наиболее "сенсационные" результаты, даже если их достоверность сомнительна.
Иоаннидис вводит понятие bias, определяя его как совокупность факторов, приводящих к появлению научных результатов там, где их быть не должно. Это может включать не только методологические ошибки, но и сознательную или подсознательную предвзятость исследователей. В таких условиях положительное прогностическое значение (PPV), то есть вероятность того, что опубликованный результат действительно отражает истину, оказывается низким. Автор подчеркивает, что во многих научных областях PPV настолько мало, что заявленные эффекты могут просто отражать уровень предвзятости, а не реальную связь между переменными.
Конкретные примеры
Примеры ложных или сомнительных исследований можно найти во многих научных областях. Например, в исследованиях молекулярных предикторов размер выборки часто оказывается слишком малым, что делает их результаты ненадежными. В кардиологии, напротив, проводятся крупные рандомизированные контролируемые исследования, включающие тысячи пациентов, что увеличивает вероятность истинности их выводов. Исследования связи генетических факторов с мультигенными заболеваниями, такими как диабет или шизофрения, часто показывают относительный риск 1,1–1,5, что значительно ниже, чем в исследованиях, посвященных влиянию курения на рак (относительный риск 3–20). Это говорит о том, что небольшие эффекты сложнее подтвердить, а вероятность случайных находок выше.
Еще одним важным аспектом является количество проверенных связей. В подтверждающих исследованиях, таких как метаанализы или крупные клинические испытания фазы III, вероятность истинности результатов выше. В экспериментах, направленных на генерацию гипотез, напротив, часто проверяется множество возможных взаимосвязей, что увеличивает вероятность ложноположительных результатов. Например, если ученые тестируют сотни различных гипотез без строгого отбора, большинство их находок будут случайными.
Приносим извинения, у докладчика форс мажор, доклад сегодня не состоится.
Читать полностью…
🎓 Дорогие ученые и студенты МГУ!
270 лет – это не просто цифра, это целая эпоха российского образования и науки! Московский университет – сердце интеллектуальной России, кузница талантов и генератор передовых идей. Вы продолжаете великую традицию, заложенную Ломоносовым, и двигаете науку вперед.
С юбилеем, alma mater! 🇷🇺✨
Пусть ваши исследования будут смелыми, открытия – революционными, а дух науки – непобедимым!
🚀 @SBERLOGACOMPETE webinar on data science:
👨🔬 Никита Бухал "Введение в ДПО"
⌚️ Cреда 19.00 (по Москве), 15 Января
Обсудим Direct Preference Optimization - метод, который выступает в качестве альтернативы RLHF / PPO в задачах алаймента языковых моделей.
Суть работы достаточно проста:
- Берем датасет попарных сравниений ответов (плохой/хороший)
- Берем модель Bradley–Terry (BT) в качестве "рейтиговой" модели.
- Хотим написать такую loss функцию которая бы увеличивала "рейтинги" ответов нашей модели
Последний пункт ключевой - в отличии от PPO это НЕ RL-вый метод, а просто Loss.
Утверждается кстати что этот DPO "победитель" NeurIPS 2023 (не знаю правда на сколько это важно и какие там у них критерии отбора):
https://the-decoder.com/neurips-2023-these-are-the-top-papers-and-award-winners-at-the-largest-ai-conference/
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
🪐💞🐍 Космограф виджет для Python!
Предновогодний сюрприз для дата-сайентистов работащих с Python. Мы аносируем публичный бета релиз Cosmograph Jupyter Widget для визуализации больших графов и AI эмбеддингов! Виджет еще умеет не все, что умеет приложение и JavaScript библиотека, но он обязательно научится!
О том как работать с виджетом можно узнать в документации на нашем сайте. Или просто посмотрите эти Colab ноутбуки:
- Сosmograph Widget
- Mobius in Cosmograph Widget
- Clusters in Cosmograph
🛸 Не забывайте — это бета-релиз и в нем наверняка есть баги (я уже нашел). Не стесняйтесь, пишите в https://github.com/cosmograph-org/py_cosmograph/issues, мы поправим!
🎄 И, напоследок, поделитесь, пожалуйста, этой новостью с вашим дата-сайенс другом. Кто знает, может быть ему нечем заняться в праздники...
@dataviznews
Дорогие друзья, специально для вас! Желаем вам отличных выходных и, как сказано в этом видео, таки следующий шикарный физмат-лайв-стрим с супер-крутыми гостями 23-го июля.
Официальный анонс
#LiveStream #НастроениеСубботы #Culture
@easy_about_complex
Вдогонку к предыдущему посту и лекции о том, что машинное обучение – не серебряная пуля, поделюсь ещё одним занимательным примером. Учёные смоделировали 10 миллионов солнечных систем. Без каких-либо ухищрений – просто поставили в центр каждой системы звезду, вокруг поместили планеты разных масс и запустили всё это дело вращаться по закону Ньютона. Возможно, на седьмой день они почили от дел своих, но в статье об этом не упоминается
Дальше на каждую из солнечных систем натравили нейросеть-трансформер. Она должна была предсказывать движения планет. Похожим образом тренируется модель в основе ChatGPT. Справилась ли нейросеть? Да, предсказание траекторий планет было идеальным. Но вот законы, которые она предложила для объяснения движения – совсем не похожи на тот, что вы учили в школе. Например, один из них выглядит как cos(cos(m)). Возможно, именно по этому закону сейчас вращается в могиле Ньютон
Кроме того, несмотря на идеальное предсказание траектории планет, предсказанные силы у нейросети выглядят ну очень абсурдно. На видео силы показаны стрелками: слева – настоящий закон, справа – предсказанный трансформером. Для других солнечных систем предсказания, как правило, вовсе не работали
Стартапер в области ИИ утверждает, что 10 миллионов примеров – это слишком мало. Физик отвечает, что у Ньютона был один
Помимо физиков и программистов, случай обсуждают и биологи. Сейчас много шума вокруг моделей, обещающих решить все проблемы биологии, если научиться предсказывать поведение генов. Верно ли это предположение? Как показывает этот пример (и ещё больше в статье), даже отличные предсказания не означают понимание
#программирование@chelovek_nauk #физика@chelovek_nauk #биология@chelovek_nauk
Ваше лето — святое 😎 И Бластим это ценит
Поэтому команда @blastim сделала курс «Машинное обучение на Python для решения биоинформатических задач» специально для тех, кто хочет быть на фронтире науки, но и не упустить летний отдых:
➢ Учитесь в отпуске/на даче/когда удобно — записи занятий навсегда, гибкий график по домашкам💎 Что на выходе:
➢ Самые актуальные темы суперпонятным языком — бэкпроп, дропаут, аттеншн, эмбеддинги прочно войдут в ваш обиход
➢ Разбор на практике всех популярных методов — от линейной регрессии до вариационных автоэнкодеров, диффузионных моделей и LLM
➢ Бессрочный чат — поддержка от комьюнити даже через год
➢ Море биологии — работа с базами данных NCBI и Ensembl, модели для NGS и single cell + Evo2, AlphaFold
➢ Реальные инструменты — деплой моделей в Telegram-бота, анализ биомедицинских данных, полезный Python (sklearn, pytorch, biopython)
➢ Крутые преподаватели из Helmholtz Munich, OpenAI, Сколтеха — асы в биоинформатике и ИИ
🌌 ИИ, который читает статьи за вас
В npj Computational Materials вышла статья: Agent-based multimodal information extraction for nanomaterials
На повестке — автоматизация научного чтения. Не в смысле «реферат за 3 секунды», а в смысле: вытащить формулы, каталитические параметры, и кристаллические системы из PDF так, как это делает химик с блокнотом и часом свободного времени. Только здесь — без блокнота и без химика.
🧠 Что внутри nanoMINER
Система мультиагентная:
— Main-агент (GPT-4o) управляет процессом,
— NER-агенты (Mistral-7B, Llama-3-8B) достают параметры из текста,
— Vision-агент (YOLOv8 + GPT-4o) разбирает графики и неформатные таблицы.
Агенты работают на основе ReAct подхода: синхронизируются, уточняют друг у друга информацию, и выдают единый JSON на выходе.
📊 Зачем всё это?
Чтобы снимать экспериментальные параметры (в том числе по нанозимам) из текста, даже если они:
• только в подписях к графикам,
• разбросаны по разным разделам,
• не указаны явно (например, crystal system — система угадывает её по формуле с точностью 86%).
💥 Результаты впечатляют:
• precision до 0.98 на параметрах активности нанозимов,
• recall до 0.86 на наноматериалах,
• F1 score выше, чем у GPT-4.1, o3-mini и o4-mini.
(просто скармливали PDF без координации — и всё сломалось)
📎 А зачем человеку?
Это шаг к полноценным машиночитаемым статьям, где вместо ручной разметки — автоматическое заполнение баз знаний. Подход масштабируется на медицину, биохимию, фарму и любые области, где не хочется руками копировать цифры из графиков.
📂 Код: github.com/ai-chem/nanoMINER
🔮 Моделька предсказала crystal system по формуле — просто так
Это не feature, это баг… или всё-таки emergent reasoning? 😉 В статье пишут, что система предсказывает тип кристаллической решётки, даже если она не указана, с 86% точностью. Возможно, это эффект обучения на корпусах, где такие ассоциации частотны. Но в любом случае — повод переосмыслить, насколько хорошо LLM умеют химическую интуицию.
ПС
А также подписывайтесь на канал автора статьи Карины Романовой - /channel/nadlskom
Боишься, что тебя уволит Гендир? Скорее это сделает GenAI
AI-агенты — это главный тренд в сфере искусственного интеллекта в 2025 году. Агенты способны автономно выполняют массу работы: поддержка клиентов, отчётность, аналитика и даже принятие сложных бизнес-решений. Это не просто чат-боты, отвечающие на вопросы, а полноценные сотрудники, способные заменить реальных людей. Они пришли всерьез и надолго.
Страшно, что тебя заменит AI? Лови страховку: научись сам делать AI-агентов и даже зарабатывать на них. Крутые и стоящие заказы на создание AI-помощников от топовых компаний России (Газпром, Сибур, Росатом) уже сейчас размещаются на платформе «Профессионалы 4.0».
👥 Ты тоже можешь туда попасть — сразу после AI-курса от команды @blastim, который стартует уже сегодня, 17 июня.
Что ты получаешь:
➤ Все ключевые ИИ-сервисы для науки и бизнеса
➤ Навыки создания AI-агентов на основе LLM (ChatGPT и прочие)
➤ Понимание архитектуры и логики работы «умных» помощников
➤ Проекты в портфолио и доступ к непубличным задачам на П4.0
➤ Поддержку и работу в команде опытных ML-инженеров
➤ Вход в элитное AI-сообщество с реальными кейсами
🛠 После курса ты выходишь с полным пониманием и шаблонами, как создавать своих агентов и монетизировать свои навыки. Преподаватели Бластим объясняют на практике, без стресса, (почти) без кода
Активируй промокод AIBERLOGA на скидку 10%.
🚨 Запрыгнуть в последний вагон
💎NANOMINER: MULTIMODAL INFORMATION EXTRACTION FOR NANOMATERIALS
Была я тут на ICLR неделю назад, мне лично было очень весело. Естественно мне запомнились доклады, статьи и тд, но соберу я это в пост явно не сейчас. Первое, что хочу запостить сюда по этой теме – это тот факт, что вообще-то я туда приезжала не только пить, изучать интересные статьи и смотреть город, а еще стоять со своим постером!
Мы с коллегами❤️ из ИТМО подались хайпу LLM агентов и прочего, но при этом решили важную проблему
Наш доменный эксперт Сабина:
С точки зрения химика, главная проблема — не в недостатке ИИ, а в том, что большинство инструментов не понимают, как устроены научные статьи. Чтобы спланировать синтез и проверить свойства вещества, приходится вручную вычитывать десятки источников, искать куски данных, раскиданные по графикам, таблицам и тексту. LLM тут часто бессильны: они не умеют отличать разные серии экспериментов или связать численные параметры с описанием синтеза.
Cancer 3D — это открытая научная инициатива по изучению и моделированию процессов опухолевой инвазии, миграции и метастазирования. Проект основан админами и редакторами Медача, совместно работавшими над недавней статьей в Cancers. По сути – это масштабное продолжение той статьи и её переосмысление.
Наша миссия заключается в разработке цифровых двойников опухолей и анализе детальных микротомографических и гистологических изображений. На основе этих данных в рамках данного проекта будет выполнено моделирование процессов инвазии, метастазирования и коллективной миграции опухолевых клеток.
Проект не является коммерческим и использует открытые данные, предоставляемые его участниками.
Все участники проекта, внесшие достаточный вклад в разработку, анализ или написание статей, становятся равноправными соавторами научных публикаций и патентов.
White paper проекта
Подать заявку
Ты когда-нибудь замечал, как директор смотрит на твой график и говорит: «А можно попроще?»
Мы знаем, как это бывает! Поэтому собрали для тебя топ материалов по BI-аналитике, которые помогут не только визуализировать данные, но и объяснить их даже котику. Ну или директору 🤭
📕Сохраняй карточки с подборкой лучших книг: от подготовки данных до дашбордов, крутой визуализации, сторителлинга, секретах управления компанией и бизнес-аналитиками. Кстати, на «Оконные функции в T-SQL» дарим скидку 15 и 25% (оставили в комментариях!)
📎Ну и парочка SQL тренажеров(must-have навык для любого аналитика!):
• Интерактивный тренажер на создание SQL-запросов от Stepik
• Короткий тренажер с интересными сценариями от Stepik
• Всесторонний курс, который навсегда изменит твое отношение к SQL от SQL Academy
• Упражнения от sql-ex для тех, кто хочет стать мастером запросов
• Здачи по Python, SQL, программированию и Data Science от IT Resume
• Master Coding for Data Science от StrataScratch (напоминает leetCode, есть бесплатная версия)
⚡️У президента США рассеянный склероз. На пресс-конференции журналистка спрашивает, будет ли он вновь баллотироваться. Глава государства кладет руки в карманы и улыбается. Он идет на выборы…
📰 Нет-нет, это не очередная утка из новостной ленты. Это окончание второго сезона культового американского телесериала «Западное крыло». Его пилотный эпизод вышел аж четверть века назад. Сериал повествует о повседневной рутине администрации вымышленного президента Джеда Бартлета (на фото слева). Экранные герои работают на вершине власти, а параллельно в сюжете разворачиваются их личные перипетии. Одно из центральных лиц первых сезонов — замдиректора по коммуникациям Белого Дома, Сэм Сиборн (справа). Сэм пишет речи для президента, он из числа его основных советников. Он идеалист и перфекционист. Из-за переписывания текста поздравительной открытки министру Сэм даже отменяет свидание с девушкой 🤯
Подождите, Сиборн? Что-то знакомое? И вы не ошиблись: одна крутая библиотека в Python названа в честь героя саги. Выпускник Стэнфорда, нейросаейентист и машинлернер Майкл Вэскoм был поклонником политической драмы и назвал свой тул для визуализации в честь киногероя — Seaborn! А многие программисты ломают голову, почему при импорте библиотеки import seaborn as sns название нелогично сокращается до sns? Оказывается, это просто инициалы персонажа — Samuel Norman Seaborn. Ну, питонисты, ну, шутники.
📈 Несмотря на весь юмор, Seaborn — реально удобный инструмент для датавиза: с его помощью в одну строчку кода можно построить вполне сносный график, а при желании довести его до эстетического совершенства самостоятельно или воспользовавшись множеством готовых шаблонов. Идеальное для науки. Наверное, это передался перфекционизм киношного персонажа. Эх, сколько свиданий можно отменить, завязнув в улучшайзинге графиков для статьи 🤓
🐍 А вы кодите на Python? Питон — полезный, а еще и прикольный язык, который интересно ботать и каждый день узнавать что-то новое [ведь папа питона Гвидо Ван Россум тоже «прикольнулся» и нарек язык программирования в честь любимой комик-группы «Монти Пайтон»]. Сегодня питон становится невероятно популярен среди биоинформатиков, в нем найдется ПО под любые нужды: анализ NGS, сингл-селл, молекулярное моделирование, AI в биологии…
🧬 Если вы хотите начать вкатываться в питон и датасайенс нескучно и с уклоном в лайфсайенс, то обратите внимание на образовательную программу @blastim «Python для анализа данных в науке». Это необходимый и достаточный курс для биологов, медиков и всех новичков. За 1,5 месяца вы познаете синтаксис и семантику языка, освоите популярные библиотеки, выполните первые проекты в портфолио, познакомитесь с комьюнити. Преподаватель: Александр Ильин, биоинформатик, машинлернщик, выпускник Сколтеха. Подробности по ссылке: clck.ru/3HaTvm
🎁 Спецпредложение: скидка 15% по промокоду BERLOGAPYTHON действует до 20 марта
Make Bioinformatics Great Again
Гибкость в дизайне исследований также играет ключевую роль. Например, если в клиническом испытании можно менять критерии включения и исключения пациентов или анализировать данные разными способами, то вероятность получения "положительного" результата возрастает, даже если эффект отсутствует. Это особенно заметно в области исследований новых лекарственных препаратов, где компании могут выбирать методики анализа, которые показывают их продукт в наилучшем свете.
Финансовые интересы оказывают мощное влияние на результаты научных исследований. Например, фармацевтические компании заинтересованы в том, чтобы их препараты демонстрировали положительные результаты, что может приводить к предвзятости в выборе данных или методов анализа. Аналогичная ситуация наблюдается и в пищевой промышленности: исследования, финансируемые производителями сахара, часто приходят к выводу, что жиры вреднее сахара, тогда как независимые исследования показывают обратное.
В "горячих" научных областях с большим числом исследовательских групп конкуренция за публикации также ведет к снижению надежности результатов. Например, в области геномных исследований шизофрении десятки групп работают над выявлением генов, связанных с заболеванием. Даже если отдельное исследование демонстрирует статистически значимую ассоциацию, вероятность ее истинности остается низкой. Если десять групп независимо проведут такие же эксперименты, вероятность того, что хотя бы одна из них найдет "значимый" результат, высока просто из-за случайности.
Что делать?
Для решения этой проблемы Иоаннидис предлагает несколько подходов. Важно увеличивать мощность исследований за счет проведения крупных выборок или мета-анализов с низким уровнем предвзятости. Регистрация исследований до их проведения позволит снизить вероятность избирательной публикации только "интересных" результатов. Также необходимо более осмысленно подходить к оценке гипотез перед началом исследования и повышать стандарты научных работ.
Основной вывод статьи заключается в том, что современная научная практика требует пересмотра. Одного лишь достижения статистической значимости недостаточно для подтверждения гипотезы. Необходимо учитывать вероятность истинности результатов и критически относиться к опубликованным данным. Иоаннидис призывает научное сообщество к более строгим стандартам исследований и отказу от слепой погони за сенсациями, чтобы наука могла выполнять свою основную функцию — поиск объективной истины.
Наши коллеги по Сберлоге запустили новый проект - удобные вещи для айтишников. Где еще вы найдет толстовки "Модель худи C#" и "Модель худи Python" - только у наших коллег - подписывайтесь на их канал: /channel/rybe_store и заходите на их веб-сайт .
Их цель - получить не просто "мерч с принтами", а что-то реально лучше. Они вслепую сравнивали образцы тканей, чтобы выбрать ту самую (плотную, как шкура дракона), они 4 раза просили перешить тестовый образец и раз за разом перепридумывали детали.
Люверсы для пропуска — бейдж больше не будет болтаться на шнурке.
Отсек для наушников — чтобы не искать их по всей сумке.
Салфетка для экрана/очков — встроена в карман, потому что ну а чем ещё их протирать?
Сейчас это альфа — первая маленькая серия, всего 21 штука. Каждая толстовка со своим уникальным номером.
Если вам интересно
Заходите на сайт: https://rybe.store/?utm_medium=tg&utm_content=sciberloga
Подписывайтесь на канал: /channel/rybe_store
🚀 @SBERLOGASCI webinar on data science:
👨🔬 Алексей Трепецкий "Введение в RL алгоритм Actor-Critic"
⌚️ Среда (29 января 2025) 19.00 (по Москве)
Actor-Critic — популярная концепция в обучении с подкреплением, позволяющая увеличить эффективность получаемых данных и сократить время обучения политике, основанная на объединении policy и value подходов.
На семинаре мы подробно разберем, как устроен метод Actor-Critic, зачем необходимо совместное обучение политики и функции ценности и как это улучшает алгоритм REINFORCE.
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
Стать ML-щиком в биотехе за неделю… нереально, но можно пройти бесплатный 🔥 ML Bootcamp от OpenBio! 🔥
С 3 по 9 февраля канал проекта «Машинное обучение в биологии и биомедицине» превратится в тренировочную площадку, где ваши умы будут кипеть, а клавиатуры — дымиться. ;)
В течение недели на канале будут опубликованы фрагменты материалов из курса «Машинное обучение в биологии и биомедицине», один день — один модуль.
Используйте возможность изучить часть материалов платного курса, пока они в открытом доступе! 😱
Курс «Машинное обучение в биологии и биомедицине» стартует 25 февраля.Читать полностью…
А для тех, кто хочет записаться на программу уже сейчас, мы подготовили скидку 15% по промокоду SBERLOGA.
Оставьте заявку на сайте, и наши менеджеры проконсультируют вас. Подробнее о сроках обучения, программе и спикерах по ссылке.
Поздравляем с Новым 2025 годом🎉
Пусть он принесет радость и исполнение желаний! 💫
А мы как всегда, будем стараться поддерживать теплую и дружескую атмосферу, а также ваши исследовательские начинания. 🚀
🚀 @SBERLOGASCI webinar on data science:
👨🔬 Obozov M.A. "PPO и не только в приложении к графам (продолжение)"
⌚️ Четверг 19 декабря 19.30 по Москве
В прошлый раз мы вспомнили PPO и поговорили о приложениях RL алгоритмов к NP-полным графовым задачам.
В качестве продолжения серии докладов мы пополним наш арсенал методов! Рассмотрим actor-critic(A2C) и его вариации, сравним их с PPO, а затем обсудим новые примеры NP-полных графовых задач и их решения RL методами. В конце разберемся с моментами реализации и затронем потенциальные применения в рамках графов Кэли и нашей задачи про кубики!
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe