7668
Мультидисциплинарный канал о науке и технологиях. Data Science, Bioinformatics, Biology, Mathematics, Physics, IT, Computer Science. @sberlogabio био и дата сайнс @sberlogasci математика, физика и ДС https://www.youtube.com/c/SciBerloga
Нашу статью взяли на NeurIPS 2025!
arxiv:2502.13266
Статья "A Machine Learning Approach That Beats Large Rubik's Cubes" про то как находить путь на больших графах в принципе, и про то как with zero human knowledge собирать Кубик Рубика 3x3, 4x4, 5x5, пятнашки до 6x6, ... и другие перестановочные пазлы в частности. Для понимания масштаба: кубик 5x5 это 10⁷⁴ состояний, а мы там находим достаточно короткий (лучший из опубликованных) путь сборки. Код к статье доступен на git cayleypy-cube.
Забавно что для меня это началось с этого поста 2 года назад, а потом списались с @Alexander_V_C (огромное ему спасибо) и как-то так и пошла интернет коллаборация. Собственно про метод писал здесь, и потом ещё подробнее напишу. Красиво, что просто немного случайно блуждая по графу, можно обучить модель очень хорошей эвристике, достаточной для ориентирования на широком классе графов.
Мне очень давно хотелось, чтобы какой-нибудь такой сюжет существующий из любопытства в рамках хобби добрался до рецензий. А тут не просто добрался, но и на A* конференцию, ещё и выдвинули на spotlight (топ 15% от принятых работ).
Воот)
— Сейчас статистику посчитаем, а потом гипотезу придумаем!
— Почему бы не убрать все выбросы? И p-value маленьким станет...
— Давай проведем побольше тестов и выберем тот, где результат значим?
🚩 Если вас не смущают такие фразы, то это красный флаг 🚩
И сигнал, что в пятницу 12 сентября в 18:30 (мск) однозначно стоит посетить встречу с преподавателем R и статистики Еленой Убогоевой.
Спикер расскажет про статистические манипуляции, нелепицы и заблуждения, вызывающие мурашки по коже и фейспалм у профессионалов. Самое волнующее — разговор про НОРМАЛЬНОСТЬ. Что если ваши данные не нормально распределены: какой тест брать? идти в непараметрику? как интерпретировать результат?
Вебинар подойдет тем, кто:
📌 стремится избегать p-хакинга, черри пикинга и прочего мошенничества
📌 готов впитывать практические советы от экспертов, которые набили шишки
📌 сам профессионал, но ищет место для дискуссий
Топология против рака толстой кишки
Топология изучает устойчивые свойства форм и целых структур. Именно такой взгляд нужен, когда важно увидеть не отдельные клетки, а «архитектуру» ткани целиком и понять, где она теряет порядок.
В толстой кишке в норме всё организовано: клетки выстроены, роли распределены, структура держится. При мутациях этот порядок ломается — исчезают регулярные рисунки, рвутся связи, ткань ведёт себя иначе. По характеру таких сбоев патологи судят о наличии рака, его подтипе и о том, какое лечение выбирать.
🤖Прими участие в закрытом тестировании ИИ от Медача
Медач запускает собственный ИИ-ассистент для врача и нам нужна ваша помощь! За участие - PRO подписка на год.
IQDOC– это интеллектуальный ассистент врача, который помогает ему на всех этапах работы: от приема пациента и до заполнения документации. Мы проводим закрытое бета-тестирование одного из компонентов – умного поиска по клиническим рекомендациям.
Мы делаем не очередной мод ChatGPT, а создаем собственную экосистему ориентированную на российского врача:
– Обучаем собственные модели под специфику русского языка и особенности российской медицины
– Полная и актуальная база нормативных медицинских документов
– Создано врачами для врачей: фокус на реальную помощь в клинической практике
– Полное соответствие законам РФ: персональные данные не отправляются за рубеж, а сам ИИ работает в парадигме российского здравоохранения
Что вы получите как тестер:
✅ Ранний доступ к ИИ без лимитов.
✅ Возможность влиять на развитие: вы можете предлагать улучшения и фичи, и ваш голос будет услышан
✅ Бесплатную PRO-подписку после запуска + упоминание в сообществе.
Мы ищем более 100 активных врачей разных специальностей и регионов. Участие: 1-2 часа в неделю, фидбек через кнопки в боте или чат.
Заинтересованы? Заполните короткую форму и получите приглашение на бета-тест. Места ограничены — присоединяйтесь, чтобы сделать жизнь врача лучше вместе!
Подписывайтесь также на телеграм-канал IQDOC, чтобы следить за обновлениями проекта
#medach #iqdoc #медицина #ai #ии
#ИИ #фарма #подкасты
Фарма, генеративный искусственный интеллект (ИИ) и стартапы
С каждым годом фармацевтические компании инвестируют миллионы долларов в стартапы сферы искусственного интеллекта (ИИ) в медицине. Это логично: разработка лекарств — очень долгий и дорогой процесс, а ИИ, как ожидают все игроки рынка здравоохранения, может сильно удешевить и ускорить вывод новых препаратов на рынок.
Как фармацевтические компании выбирают стартапы для финансирования? Какие направления ИИ им наиболее интересны? Могут ли рассчитывать на поддержку от фармы стартапы в России? На все эти вопросы в новом эпизоде подкаста «Искусственный интеллект в здравоохранении» ответит Василий Светлов, лидер по развитию политик в сфере цифрового здравоохранения и доступа к данным компании «Рош»
Этот выпуск будет полезен как профессионалам в области здравоохранения, так и всем, кто интересуется внедрением инновационных технологий в медицинскую практику. Слушайте, чтобы узнать больше о том, как ИИ может изменить будущее медицины и повысить уровень здоровья и благополучия людей по всему миру.
Слушайте на Яндекс.Музыке и смотрите на популярных площадках видеоконтента:
📹RuTube
📹VK
Делитесь подкастом с друзьями и берите полезное на заметку!
Жду обратной связи от вас, эксперты.
@medicalksu
Представляем один из крупнейших независимых каналов в научно-образовательном сегменте отечественного Телеграма – «Наука и университеты» (/channel/naukauniver).
Канал легендарный, на его автора оказывали давление, но он остался несгибаем. С искренним восхищением рекомендуем Вам этот канал !
Ежедневные информационные и аналитические материалы о правовых, кадровых, организационных и методических проблемах науки и образования .
Среди более 40 тысяч подписчиков канала – преподаватели колледжей и вузов, научные работники, аспиранты и студенты, менеджеры в сфере науки и образования.
Советуем подписаться!
🧠 Лайв-стрим — 23 июля
В 18:00 по немецкому времени (19:00 по Киеву/Москве) у нас в гостях —
Михаил Коробко, старший научный сотрудник Института квантовой механики Университета Гамбурга и популяризатор науки.
Telegram-канал Михаила: @homeostatic_universe
📡 Стрим открытый — можно слушать, задавать вопросы и участвовать в разговоре.
🔬 Поговорим о теоретической и экспериментальной физике, квантовых технологиях, академической жизни и научной карьере в Германии.
Возможно, затронем междисциплинарные темы — философию науки и стыки с другими областями знаний.
📍Присоединиться можно будет 23 июля в указанное время — кнопка «Присоединиться к стриму» появится вверху этого канала.
🗓️ Отметьте у себя в календаре — будет интересно не только физикам.
От наших друзей с песней и юмором и о науке:
Читать полностью…
🚀 Уважаемые коллеги, кому интересна математика и машинное обучение, приглашаем Вас принять участие в неформальном научном проекте.
Мы разрабатываем новые методы и опен-соурс библиотеку CayleyPy, которая на основе МЛ/РЛ методов позволяет решить математические задачи, которые были не доступны ранее. Как пример наша система уже по всем параметрам на порядки превсходит аналогичные методы в системе компьютерной алгебры GAP (де-факто стандарт) - использующую алгоритмы доработанные самим Д. Кнутом.
Если у Вас желание поучаствовать в проекте, есть знание Питона и несколько свободных часов в неделю - то присоединяйтесь к нам - при активной работе - Вы будете соавтором научных публикаций. (Напишите @alexander_v_c - к.ф.-м.н. Александр Червов).
Краткая суть задачи может быть описана несколькими способами - нахождение пути на графе размером 10^20-10^200 (из-за размера обычные методы не применимы - только МЛ/РЛ). Решение пазла типа кубика Рубика, задача сортировки, математически - разложение элемента группы по образующим - все это в реальности одна и та же задача. Задача близка к прошедшему конкурсу Каггл Санта 2023. Более общо - это задача планирования - типичная для реинфорсмент ленинг - спланировать действия так чтобы кумулятивный эффект давал лучший результат - управлением манипулятором робота, системы АльфаГо, АльфаТензор, успех DeepSeek - это задачи - тесно связанные с тем, что мы делаем.
А зачем это нужно биологам ? А чтобы превращать людей в мышей ))) (А капусту в репу). Так назвал свои статьи известный биоинформатик П.Певзнер - оказывается эволюционная дистанция - соответствует дистанции на определенных графах - и наша цель улучшить ее оценку через МЛ/РЛ. Зачем нужно нужно в сетях - задержка сигнала (latency) сети определяется диаметром сети - оценка диаметра графов - одна из наших целей. В теории квантовых вычислений тоже нужны подобные графы и приложения этим не ограничены. И, кроме того, а знаете чем знаменит Билл Гейтс ?)) Он отлично сортировал блины ! Наша задача - побить его - через МЛ/РЛ)))
В нашем коллективе есть профессора математики, Каггл градмастеры, и легендарные иностранные специалисты - Tomas Rokicki , Herbert Kociemba - Вам будет у кого поучиться.
Подробнее о проекте вы можете узнать в наших статьях https://arxiv.org/abs/2502.18663 https://arxiv.org/abs/2502.13266 и в нашей группе /channel/sberlogasci/1 и ⭐ СТАВЬТЕ СТАРС ⭐ (звездочки) на наш гитхаб: https://github.com/cayleypy/cayleypy
⚡️ AlphaGenome — революция в геномике или очередной пшик?
🧬 Два дня назад исследователи из Google DeepMind выпустили AlphaGenome. AI-модель умеет для поданной на вход последовательности ДНК (до 1 Мб) предсказывать с однонуклеотидным разрешением сразу кучу модальностей. Например, эффекты вариантов в некодирующих областях, сайты сплайсинга, экспрессию генов, модификации гистонов etc. Модель превзошла другие методы почти во всем по бенчам. Перед нами реальный прорыв в понимании «темной материи» генома или... нет?
🔥 Уже в это воскресенье 29 июня в 18:00 мск @blastim проводит открытый онлайн-семинар, где биоинформатик и машинлернер Александр Декан сделает обзор передовой модели от Google, сравнит ее с другими нашумевшими AI-тулами и даже покажет, как ей можно пользоваться прямо сейчас.
🔗 Записывайтесь на встречу, если резонирует: https://sbsite.pro//5day_marathone_1
Точно зайдет естественникам, айтишникам и всем интересующимся сферой AI в биоинформатике. Лучший вариант полезно провести летний воскресный вечер 😎
Все говорят об искусственном интеллекте и машинном обучении по 10 раз на дню. У неспециалистов порой возникает жгучее ощущение, что нужно просто закинуть данные в черную коробку с надписью «Машинлернинг» и получить на аутпут конфетку! Цитирования статей и размер грантов сразу умножатся на 10, а пациенты излечатся от всех болезней...
Но это не так! В эту среду, 25 июня в 19:00 (МСК) состоится откровенный вебинар «Как НЕ решить вашу задачу с помощью машинного обучения» с биоинформатиком Владимиром Шитовым, который знает о чем говорит 😱
Спикер расскажет и покажет:
📌 Когда ML бесполезно, а то и вредно
📌 Почему тупой подход «закинул данные — получил результат» не работает
📌 Худшие практики, которые гарантированно позволят вам сделать лажу в красивой обертке
📌 Реальные кейсы, где всё пошло не так (и почему)
Записаться по ссылке: https://sbsite.pro//5day_marathone_1
После регистрации вы попадаете в закрытый чат, где будет проходить неделя машинного обучения от @blastim — это еще больше фактов об ML, которые от вас скрывали
Боишься, что ИИ займет твое место? Лучше подумай, чем занять его самого!
Искусственный интеллект — все-таки не конкурент, а помощник. Если ты тоже хочешь:
🔩 делегировать нейросетям скучные и рутинные рабочие операции
🔩 перестать выгорать и тратить время на то, что GPT делает за минуту
🔩 ускорить анализ статей, поиск инфы для литобзора, написание отчетов
🔩 получить овервью всех популярных нейросеток
🔩 создать персонального бота-саммаризатора
🔩 а также узнать больше о главном тренде 2025 — ИИ-агентах
То приходи вечером 8 июня на вебинар от @blastim. На встрече реальные исследователи ИИ расскажут, как эффективнее использовать нейросети и делать это без подписок, VPN и кода.
После веба ты внедришь ИИ в свою работу, никто из коллег и не заметит — а это 5–10 сэкономленных часов в неделю для жизни и отдыха
🔗 Подробности и запись тут: https://agency.blastim.ru/start_ai
🎁 Кстати, сразу после регистрации ты получишь доступ к AI Call Analyzer — умному ассистенту от Бластим
PS А если ты до сих пор думаешь, что ИИ — лишь игрушка, чтобы генерить картинки котиков, то читай пост, как нейросеть помогла биологам из Имперского Колледжа Лондона сделать открытие
🤑 Хотите увидеть зарплатные вилки в биотехе, которые скрывают компании? А научиться программировать и анализировать данные?
🤩 Комбо! Уже в этот вторник 29 апреля @blastim устраивает беспрецедентный воркшоп «От сырой таблицы до инсайтов: твоя первая обработка данных на R за один вечер». На бесплатной онлайн-встрече опытный статистик Иван Поздняков научит анализировать данные на примере реального датасета с зарплатами, выгруженными из карьерного портала blastim.ru
На вебинаре:
📌 Вы получите доступ к эксклюзивным данным о зп в российском биотехе, которых нет в открытом доступе
📌 Вы с нуля выучите синтаксис базового R и познакомитесь с tidyverse
📌 Вы проведете своими руками анализ зарплатных трендов под руководством Ивана, даже если никогдашеньки не кодили
📌 Вы построите свои первые графики с помощью ggplot2 и научитесь делать волшебные отчёты в Quarto
📌 Вы узнаете все скрытые тенденции рынка биотеха и полезные приемы от Ивана Позднякова
На выходе: знания о реальных зарплатах в сфере лайфсайенс и навыки программирования и анализа данных на R
❓Почему R, а не Python? R — популярнейший язык программирования, специально заточенный под анализ данных в науке. В нем широкие возможности для визуализации данных и непревзойденный инструментарий для проведения стат-тестов. Это те навыки, который полезно иметь при себе любому ученому
🗓 Когда? 29 апреля, 19:00 мск
🆓 Вход: бесплатный
🔗 Регистрация: /channel/BlastimR_bot?start=222577
🕖 Длительность: около 3 часов
Поспешите зарегистрироваться, пока все места не заняли эйчары 😏
⚡️Анализируем продажи на Wildberries с помощью Python
С каждым днем все больше бизнесов выходят на маркетплейсы, а значит еще более ценными становятся аналитики, которые умеют с ними работать. Хотите за несколько часов собрать интересный кейс для своего портфолио?
Андрон Алексанян - эксперт по аналитике с 8 летним опытом и по совместительству CEO Simulative в прямом эфире проанализирует продажи на Wildberries с помощью Python.
Что будет на вебинаре:
🟠Напишем скрипт на Python, который каждый час собирает статистику о ранжировании карточки на WB по ключевым запросам;
🟠Построим наглядные визуализации для отслеживания динамики ранжирования.
Важно досмотреть вебинар до конца, чтобы узнать как упаковать этот кейс в портфолио своих проектов.
😶Зарегистрироваться на бесплатный вебинар
🚀 @SBERLOGABIO webinar on bionformatics and data science:
👨🔬 L. Peshkin (Harvard Medical School) "Principal Compounds: A scalable Pharmaco-biology + Machine Learning approach to Reverse Engineering of Molecular Circuits underlying Macro-Phenotypes"
⌚️ 19 Марта Среда, 19.00 по Москве (17.00 CET)
Add to Google Calendar
Доклад будет посвящен некоторой задаче на стыке фармакологии, машинного обучения, теории информации и кодирования , решение которой будет иметь практические применения для тестирования и понимания эффекта компаундов.
Следующие публикации рекомендуются к прочтению:
https://pubmed.ncbi.nlm.nih.gov/24707051/
https://www.biorxiv.org/content/10.1101/2020.09.26.312348v1
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
Первую статью нашего проекта CayleyPy приняли на NIPS (наиболее престижная конференция и публикация в области машинного обучения)
https://openreview.net/forum?id=31CaYYw1Xz
Более того это spotlight - что примерно 3% от всех представленных статей (688 из 25000+).
Продолжаем и присоединяйтесь !
Все кому интересен МЛ, математика, биоинформатика...
См. предыдущий пост: /channel/sberlogabig/581
А также пост одного из соавторов:
Ваши данные не должны ждать в чужой очереди 🙅♂️
Результаты NGS-экспериментов уже лежат на диске, но у лабного биоинформатика свой «список приоритетов»? Когда дойдет дело до ваших ридов, никто не знает. Такими темпами конкурирующая группа вас точно заскупит... Или вы пишете грант и понимаете, что NGS-анализ сделал бы его сильнее? Только вот реализовать это некому...
Если вы устали зависеть от чужой помощи, курс «Анализ NGS-данных» от @blastim станет палочкой-выручалочкой. На нем вы погрузитесь во все ключевые направления работы с данными секвенирования 2 и даже 3 поколения и сразу примените знания на своих задачах.
С чем разберетесь ❓
• QC и картированием ридов
• Анализом данных WGS и WES
• Сборкой геномов и филогенетикой
• Мета- и эпигеномикой
• RNA-seq и single-cell
Почему именно курс от Бластим ❗️
• Преподаватели — практикующие биоинформатики из топ-вузов
• Почти 400 выпускников за 3 года
• Диплом гособразца
• Формат обучения очно в Москве или онлайн
• Поддержка кураторов и комьюнити выпускников навсегда
🔗 Все детали и программа: agency.blastim.ru/ngs
🎁 Для подписчиков канала действует промокод SBERLOGABIG на скидку 10%Пора взять свой проект под свои пальцы
P.S: Сейчас проходит розыгрыш гранта от Кситест на бесплатное обучение на курсе «Анализ NGS-данных» от Blastim, успейте принять участие, заполнив форму 👈
🔬 Бесплатный вебинар по NGS-анализу митохондриальной ДНК!
Тема: От ридов к интерпретации: анализ NGS-данных митохондриальной ДНК
📅 Дата: 13 августа
⏰ Время: 19:00 (мск)
👩🔬 Лектор: Дарья Бородко — биоинформатик, сотрудник НИИ общей патологии, специалист в эпигенетике и анализе древней ДНК. Автор пайплайнов для сравнения метилирования древней и современной ДНК.
Что будет на вебинаре:
✔️ Готовый пайплайн анализа NGS-данных
✔️ Обзор полезных веб-сервисов
✔️ Практические советы по написанию скриптов
🔗 Регистрация: clck.ru/3Nbhei
Формат: прямой эфир с интерактивом и ответами на вопросы, запись будет доступна всем зарегистрированным участникам⚠️
Продолжительность: 2–2,5 ч
Вебинар пройдет в рамках курса «Анализ NGS-данных» от Blastim.
Мечтаете о зарплате как у айтишников, но никогда не подключались к серверу и не слышали об API? Этот пост для вас
ИИ-агенты — главный тренд 2025. В отличие от чат-ботов, агенты автономно решают задачи и используют разные сторонние инструменты. Компании активно ищут разработчиков, умеющих настраивать агентов. Но обучиться этому ремеслу не так просто, а в сети информация отрывочна.
Поэтому @blastim запустил доступный мини-курс по конструированию агентов на n8n — без кода, блоками как LEGO. Навыки пригодятся в бизнесе, науке и помогут вкатиться в IT.
Вы научитесь:
🔹 создавать Tg-ботов с LLM и другими сервисами
🔹 работать с API, JSON и векторными хранилищами
🔹 автоматизировать анализ табличек Google Sheets
Пришло время агентурной работы
Читать полностью…
Каталог каталогов по ML и ИИ.
1. Мини-проекты по машинному обучению с Python
Небольшие проекты для понимания основных концепций. Создание моделей машинного обучения с Scikit-learn для регрессии и классификации.
2. Анализ данных и библиотека проектов машинного обучения
Учебные материалы, код и наборы данных для проектов анализа данных и машинного обучения.
3. Идеи для проектов машинного обучения
Идеи проектов: машинное обучение, НЛП, компьютерное зрение, рекомендательные системы.
4. 500+ проектов машинного обучения и ИИ с кодом
500+ реальных проектов: машинное обучение, глубокое обучение, компьютерное зрение, НЛП.
5. Проекты генеративного ИИ
Современные проекты и сервисы генеративного ИИ. Инструменты для генерации текста, изображений, аудио, видео.
6. Инструменты и проекты LangChain
Инструменты и проекты с фреймворком LangChain для приложений на основе больших языковых моделей и ИИ-агентов.
7. Решения Kaggle
Решения и идеи соревнований Kaggle. Лучшие подходы к решению задач машинного обучения.
8. Топ проектов глубокого обучения на GitHub
Популярные проекты глубокого обучения, ранжированные по количеству звезд. Фреймворки, инструменты и ресурсы.
9. Справочник по машинному обучению
Ссылки, учебные материалы и ресурсы по машинному обучению и глубокому обучению.
10. Ресурсы глубокого обучения
Учебники, проекты, книги и сообщества по глубокому обучению. Нейронные сети, обучение с подкреплением, исследования ИИ.
Обычно такое не люблю, но тут реально собраны тысячи полезных ссылок.
Тут и обучение и фреймворки и инструменты.
Все что может пригодиться в мире ИИ.
Подборки курируемые с десятками, а иногда и сотнями контрибьюторов.
И всё бесплатно. Лет на 5 обучения хватит.
#обучение #каталоги
———
@tsingular
Интерполяции здорового человека. Я более-менее дописал обещанный несколько месяцев назад текст про интерполяции и делюсь им с дорогими пампищиками. Замечания, рекомендации и предложения are welcome. Текст ещё будет расширяться в смысле библиографии и возможно будет дописан кусочек про тригонометрические интерполяции, но, думаю, что в текущем виде уже можно показывать :-)
Что в тексте. Я проповедую идею, что на все интерполяционные задачи полезно смотреть с точки зрения сопряженного пространства. Идея в том, что «данные для интерполяции» нужно понимать как линейные функционалы. То есть как базис сопряженного пространства. Затем подбирать к ним дуальный базис в исходном пространстве функций (тех, при помощи которых интерполируем) и собирать уже из этих многочленов интерполирующие функции.
Тут есть два важных момента.
1. Формулы получаются символьные, а значит универсальные.
2. Не особо важно какими функциями интерполировать. Можно полиномами (как в обычных сплайнах и интерполяционном многочлене Лагранжа), а можно тригонометрическими функциями, можно и какими-нибудь экспоненциальными даже. Или даже смешанными наборами. В общем чем угодно — не важно. Формулы позволяют.
Есть очевидная трудность с вычислением самих базисных функций. Но, с другой стороны, при выбранной схеме интерполяции эта сложная задача решается один раз. А дальше за счёт символьной природы формул — просто подставляем нужные значения параметров.
Ну и немного эксклюзива.
Можно поиграться с формулами самостоятельно, я сделал проект в colab. Не ругайтесь, весь код сгенерирован при помощи #AI и, вероятно, ужасен :-)
1. Про базис тригонометрических функций тут.
2. Про интерполяцию тригонометрическими функциями тут.
3. Вычисления для сплайнов 5-го порядка здесь.
Надеюсь, что будет полезно и популярно. #научпоп
Дорогие друзья, специально для вас! Желаем вам отличных выходных и, как сказано в этом видео, таки следующий шикарный физмат-лайв-стрим с супер-крутыми гостями 23-го июля.
Официальный анонс
#LiveStream #НастроениеСубботы #Culture
@easy_about_complex
Вдогонку к предыдущему посту и лекции о том, что машинное обучение – не серебряная пуля, поделюсь ещё одним занимательным примером. Учёные смоделировали 10 миллионов солнечных систем. Без каких-либо ухищрений – просто поставили в центр каждой системы звезду, вокруг поместили планеты разных масс и запустили всё это дело вращаться по закону Ньютона. Возможно, на седьмой день они почили от дел своих, но в статье об этом не упоминается
Дальше на каждую из солнечных систем натравили нейросеть-трансформер. Она должна была предсказывать движения планет. Похожим образом тренируется модель в основе ChatGPT. Справилась ли нейросеть? Да, предсказание траекторий планет было идеальным. Но вот законы, которые она предложила для объяснения движения – совсем не похожи на тот, что вы учили в школе. Например, один из них выглядит как cos(cos(m)). Возможно, именно по этому закону сейчас вращается в могиле Ньютон
Кроме того, несмотря на идеальное предсказание траектории планет, предсказанные силы у нейросети выглядят ну очень абсурдно. На видео силы показаны стрелками: слева – настоящий закон, справа – предсказанный трансформером. Для других солнечных систем предсказания, как правило, вовсе не работали
Стартапер в области ИИ утверждает, что 10 миллионов примеров – это слишком мало. Физик отвечает, что у Ньютона был один
Помимо физиков и программистов, случай обсуждают и биологи. Сейчас много шума вокруг моделей, обещающих решить все проблемы биологии, если научиться предсказывать поведение генов. Верно ли это предположение? Как показывает этот пример (и ещё больше в статье), даже отличные предсказания не означают понимание
#программирование@chelovek_nauk #физика@chelovek_nauk #биология@chelovek_nauk
Ваше лето — святое 😎 И Бластим это ценит
Поэтому команда @blastim сделала курс «Машинное обучение на Python для решения биоинформатических задач» специально для тех, кто хочет быть на фронтире науки, но и не упустить летний отдых:
➢ Учитесь в отпуске/на даче/когда удобно — записи занятий навсегда, гибкий график по домашкам💎 Что на выходе:
➢ Самые актуальные темы суперпонятным языком — бэкпроп, дропаут, аттеншн, эмбеддинги прочно войдут в ваш обиход
➢ Разбор на практике всех популярных методов — от линейной регрессии до вариационных автоэнкодеров, диффузионных моделей и LLM
➢ Бессрочный чат — поддержка от комьюнити даже через год
➢ Море биологии — работа с базами данных NCBI и Ensembl, модели для NGS и single cell + Evo2, AlphaFold
➢ Реальные инструменты — деплой моделей в Telegram-бота, анализ биомедицинских данных, полезный Python (sklearn, pytorch, biopython)
➢ Крутые преподаватели из Helmholtz Munich, OpenAI, Сколтеха — асы в биоинформатике и ИИ
🌌 ИИ, который читает статьи за вас
В npj Computational Materials вышла статья: Agent-based multimodal information extraction for nanomaterials
На повестке — автоматизация научного чтения. Не в смысле «реферат за 3 секунды», а в смысле: вытащить формулы, каталитические параметры, и кристаллические системы из PDF так, как это делает химик с блокнотом и часом свободного времени. Только здесь — без блокнота и без химика.
🧠 Что внутри nanoMINER
Система мультиагентная:
— Main-агент (GPT-4o) управляет процессом,
— NER-агенты (Mistral-7B, Llama-3-8B) достают параметры из текста,
— Vision-агент (YOLOv8 + GPT-4o) разбирает графики и неформатные таблицы.
Агенты работают на основе ReAct подхода: синхронизируются, уточняют друг у друга информацию, и выдают единый JSON на выходе.
📊 Зачем всё это?
Чтобы снимать экспериментальные параметры (в том числе по нанозимам) из текста, даже если они:
• только в подписях к графикам,
• разбросаны по разным разделам,
• не указаны явно (например, crystal system — система угадывает её по формуле с точностью 86%).
💥 Результаты впечатляют:
• precision до 0.98 на параметрах активности нанозимов,
• recall до 0.86 на наноматериалах,
• F1 score выше, чем у GPT-4.1, o3-mini и o4-mini.
(просто скармливали PDF без координации — и всё сломалось)
📎 А зачем человеку?
Это шаг к полноценным машиночитаемым статьям, где вместо ручной разметки — автоматическое заполнение баз знаний. Подход масштабируется на медицину, биохимию, фарму и любые области, где не хочется руками копировать цифры из графиков.
📂 Код: github.com/ai-chem/nanoMINER
🔮 Моделька предсказала crystal system по формуле — просто так
Это не feature, это баг… или всё-таки emergent reasoning? 😉 В статье пишут, что система предсказывает тип кристаллической решётки, даже если она не указана, с 86% точностью. Возможно, это эффект обучения на корпусах, где такие ассоциации частотны. Но в любом случае — повод переосмыслить, насколько хорошо LLM умеют химическую интуицию.
ПС
А также подписывайтесь на канал автора статьи Карины Романовой - /channel/nadlskom
Боишься, что тебя уволит Гендир? Скорее это сделает GenAI
AI-агенты — это главный тренд в сфере искусственного интеллекта в 2025 году. Агенты способны автономно выполняют массу работы: поддержка клиентов, отчётность, аналитика и даже принятие сложных бизнес-решений. Это не просто чат-боты, отвечающие на вопросы, а полноценные сотрудники, способные заменить реальных людей. Они пришли всерьез и надолго.
Страшно, что тебя заменит AI? Лови страховку: научись сам делать AI-агентов и даже зарабатывать на них. Крутые и стоящие заказы на создание AI-помощников от топовых компаний России (Газпром, Сибур, Росатом) уже сейчас размещаются на платформе «Профессионалы 4.0».
👥 Ты тоже можешь туда попасть — сразу после AI-курса от команды @blastim, который стартует уже сегодня, 17 июня.
Что ты получаешь:
➤ Все ключевые ИИ-сервисы для науки и бизнеса
➤ Навыки создания AI-агентов на основе LLM (ChatGPT и прочие)
➤ Понимание архитектуры и логики работы «умных» помощников
➤ Проекты в портфолио и доступ к непубличным задачам на П4.0
➤ Поддержку и работу в команде опытных ML-инженеров
➤ Вход в элитное AI-сообщество с реальными кейсами
🛠 После курса ты выходишь с полным пониманием и шаблонами, как создавать своих агентов и монетизировать свои навыки. Преподаватели Бластим объясняют на практике, без стресса, (почти) без кода
Активируй промокод AIBERLOGA на скидку 10%.
🚨 Запрыгнуть в последний вагон
💎NANOMINER: MULTIMODAL INFORMATION EXTRACTION FOR NANOMATERIALS
Была я тут на ICLR неделю назад, мне лично было очень весело. Естественно мне запомнились доклады, статьи и тд, но соберу я это в пост явно не сейчас. Первое, что хочу запостить сюда по этой теме – это тот факт, что вообще-то я туда приезжала не только пить, изучать интересные статьи и смотреть город, а еще стоять со своим постером!
Мы с коллегами❤️ из ИТМО подались хайпу LLM агентов и прочего, но при этом решили важную проблему
Наш доменный эксперт Сабина:
С точки зрения химика, главная проблема — не в недостатке ИИ, а в том, что большинство инструментов не понимают, как устроены научные статьи. Чтобы спланировать синтез и проверить свойства вещества, приходится вручную вычитывать десятки источников, искать куски данных, раскиданные по графикам, таблицам и тексту. LLM тут часто бессильны: они не умеют отличать разные серии экспериментов или связать численные параметры с описанием синтеза.
Cancer 3D — это открытая научная инициатива по изучению и моделированию процессов опухолевой инвазии, миграции и метастазирования. Проект основан админами и редакторами Медача, совместно работавшими над недавней статьей в Cancers. По сути – это масштабное продолжение той статьи и её переосмысление.
Наша миссия заключается в разработке цифровых двойников опухолей и анализе детальных микротомографических и гистологических изображений. На основе этих данных в рамках данного проекта будет выполнено моделирование процессов инвазии, метастазирования и коллективной миграции опухолевых клеток.
Проект не является коммерческим и использует открытые данные, предоставляемые его участниками.
Все участники проекта, внесшие достаточный вклад в разработку, анализ или написание статей, становятся равноправными соавторами научных публикаций и патентов.
White paper проекта
Подать заявку
Ты когда-нибудь замечал, как директор смотрит на твой график и говорит: «А можно попроще?»
Мы знаем, как это бывает! Поэтому собрали для тебя топ материалов по BI-аналитике, которые помогут не только визуализировать данные, но и объяснить их даже котику. Ну или директору 🤭
📕Сохраняй карточки с подборкой лучших книг: от подготовки данных до дашбордов, крутой визуализации, сторителлинга, секретах управления компанией и бизнес-аналитиками. Кстати, на «Оконные функции в T-SQL» дарим скидку 15 и 25% (оставили в комментариях!)
📎Ну и парочка SQL тренажеров(must-have навык для любого аналитика!):
• Интерактивный тренажер на создание SQL-запросов от Stepik
• Короткий тренажер с интересными сценариями от Stepik
• Всесторонний курс, который навсегда изменит твое отношение к SQL от SQL Academy
• Упражнения от sql-ex для тех, кто хочет стать мастером запросов
• Здачи по Python, SQL, программированию и Data Science от IT Resume
• Master Coding for Data Science от StrataScratch (напоминает leetCode, есть бесплатная версия)
⚡️У президента США рассеянный склероз. На пресс-конференции журналистка спрашивает, будет ли он вновь баллотироваться. Глава государства кладет руки в карманы и улыбается. Он идет на выборы…
📰 Нет-нет, это не очередная утка из новостной ленты. Это окончание второго сезона культового американского телесериала «Западное крыло». Его пилотный эпизод вышел аж четверть века назад. Сериал повествует о повседневной рутине администрации вымышленного президента Джеда Бартлета (на фото слева). Экранные герои работают на вершине власти, а параллельно в сюжете разворачиваются их личные перипетии. Одно из центральных лиц первых сезонов — замдиректора по коммуникациям Белого Дома, Сэм Сиборн (справа). Сэм пишет речи для президента, он из числа его основных советников. Он идеалист и перфекционист. Из-за переписывания текста поздравительной открытки министру Сэм даже отменяет свидание с девушкой 🤯
Подождите, Сиборн? Что-то знакомое? И вы не ошиблись: одна крутая библиотека в Python названа в честь героя саги. Выпускник Стэнфорда, нейросаейентист и машинлернер Майкл Вэскoм был поклонником политической драмы и назвал свой тул для визуализации в честь киногероя — Seaborn! А многие программисты ломают голову, почему при импорте библиотеки import seaborn as sns название нелогично сокращается до sns? Оказывается, это просто инициалы персонажа — Samuel Norman Seaborn. Ну, питонисты, ну, шутники.
📈 Несмотря на весь юмор, Seaborn — реально удобный инструмент для датавиза: с его помощью в одну строчку кода можно построить вполне сносный график, а при желании довести его до эстетического совершенства самостоятельно или воспользовавшись множеством готовых шаблонов. Идеальное для науки. Наверное, это передался перфекционизм киношного персонажа. Эх, сколько свиданий можно отменить, завязнув в улучшайзинге графиков для статьи 🤓
🐍 А вы кодите на Python? Питон — полезный, а еще и прикольный язык, который интересно ботать и каждый день узнавать что-то новое [ведь папа питона Гвидо Ван Россум тоже «прикольнулся» и нарек язык программирования в честь любимой комик-группы «Монти Пайтон»]. Сегодня питон становится невероятно популярен среди биоинформатиков, в нем найдется ПО под любые нужды: анализ NGS, сингл-селл, молекулярное моделирование, AI в биологии…
🧬 Если вы хотите начать вкатываться в питон и датасайенс нескучно и с уклоном в лайфсайенс, то обратите внимание на образовательную программу @blastim «Python для анализа данных в науке». Это необходимый и достаточный курс для биологов, медиков и всех новичков. За 1,5 месяца вы познаете синтаксис и семантику языка, освоите популярные библиотеки, выполните первые проекты в портфолио, познакомитесь с комьюнити. Преподаватель: Александр Ильин, биоинформатик, машинлернщик, выпускник Сколтеха. Подробности по ссылке: clck.ru/3HaTvm
🎁 Спецпредложение: скидка 15% по промокоду BERLOGAPYTHON действует до 20 марта
Make Bioinformatics Great Again