7668
Мультидисциплинарный канал о науке и технологиях. Data Science, Bioinformatics, Biology, Mathematics, Physics, IT, Computer Science. @sberlogabio био и дата сайнс @sberlogasci математика, физика и ДС https://www.youtube.com/c/SciBerloga
🚀 @SBERLOGASCI webinar on data science:
👨🔬 Obozov M.A. "PPO и не только в приложении к графам"
⌚️ Четверг 12 декабря 19.30 по Москве
Продолжим цикл докладов по RL методам в приложении к графам, а в особенности к графам Кэли!
Первая часть доклада посвящена краткому, но как обычно формальному напоминанию актуальных для нас методов. Затем мы начиная с более классических приложений затронем их применение к графовым задачам, к задачам с большими дискретными пространствами. Наконец, оценим их потенциальную эффективность в фреймворке перестановок, обсудим моменты реализации и поговорим о стохастичных вариантах методов с возможностью "раздувания" изначального пространства. В конце, для особенно заинтересованных слушателей, мы обсудим подобные RL методы в реальности LLM.
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe
🎉Анонс IV Математической студенческой школы НИЯУ МИФИ 2024!
С 9-го по 20-ое декабря Национальный исследовательский ядерный университет "МИФИ" проводит IV Математическую студенческую школу под названием
"Математическая кейс-лаборатория 2024"!
В рамках тематики Школы “Математика в действии: концепции, методы и их применение” перед участниками выступят известные популяризаторы и математики страны.
В частности, 9 декабря Школу откроет доктор физико-математических наук, профессор МФТИ и директор Физтех-школы прикладной математики и информатики Райгородский Андрей Михайлович с лекцией "Комбинаторика и теория чисел"!)
А 16 декабря с лекцией "Теория игр вокруг нас: искусство стратегического мышления" выступит доктор физико-математических наук, профессор МФТИ, член-корреспондент РАН Савватеев Алексей Владимирович!
Формат школы смешанный, занятия планируются очные, но будет доступна трансляция занятий.
Даты проведения Школы: 09.12.2024-20.12.2024
Начало занятий: 16:00
По итогам обучения в секции участники получат сертификат.
Регистрация доступна по ссылке https://it.mephi.ru/webform/2211 и продлится до 08.12.2024.
Мы ждём всех желающих, вне зависимости от курса обучения!
Вам тоже трудно решать такие задачи?
🤔 Как быстро отрисовать графики, чтобы вставить их в отчет для босса
🤔 Как одновременно препроцессировать 20 эксель-табличек с данными?
🤔 Стоит ли сразу дропать все NA?
🤔 Сколько надо сделать повторностей, чтобы уловить различия между группами?
Мы тоже сталкивались с этими проблемами, поэтому мы Blastim создали курс по статистике и R
💎 Этот курс выкристаллизовался из реальных запросов ученых, делается учеными и для ученых. Мы собрали обалденную команду R-щиков — биоинформатиков, физиков, когнитивных психологов. Каждый поделится опытом, как решает задачи в своем домене с помощью кода.
А еще на курсе мы:
📌 объясним, как пользоваться GitHub
📌 расскажем о лучших научных практиках и стандартах в индустриальных DS-проектах
📌 поделимся пайплайном на R для обработки NGS-данных
📌 поможем проанализировать ваши данные, которые вы принесете!
Формат курса: 9 дней, очно в Москве и онлайн.
👉 Заинтересовало? Переходите по этой ссылке, чтобы познакомиться с программой курса подробнее
🚀 @SBERLOGASCI webinar on data science:
👨🔬 "Прогресс в применение МЛ к теории групп" А.Червов, Е. Урванов, И. Кольцов, В. Замковой, Д. Нагиев, В. Гордей, Р. Гордеев
⌚️ Среда 25 Сентября, 19.00 (по Москве)
Мы достигли стабильной решаемости для группы размера 10ˆ40 (кубик 444) несколькими вариантами нейро-сеток. Главные герои недели - Иван Кольцов и Джалал Нагиев - Иван закодил продвинутый алгоритм beam-seach использующий десяток дополнительных улучшений к классическому beam-search , а также придумал модификацию метрики Хемминга, такую, что она позволяет собирать кубик 333 без МЛ моделек. Джалал написал сетку которая собирает кубик 444 и имеет меньше параметров чем сетка Кирилла Хоружего, а также заметил, что надо исправить в ноутбуке с наиболее простыми вариантом сетки (Алексея Романова) , и теперь у нас есть три сетки которые стабильно собирают кубик 444.
Направление работ - какая архитектура сеток - наиболее оптимальна для данной задачи ? Какое минимальное время тренинга позволит решать кубик 444 - сейчас это 2 часа. Какое минимальное время инференса мы можем достичь для кубика 444 - сейчас это 28.7 секунд. Как качество масштабируется при увеличении а) числа парметров б) размера трейн сета в) измнение архитектуры г) изменение режима обучения - ленинг рейт, его режим изменения д) замена простого beam-search на продвинутые варианты и тд. е) какую наименьшую длину решения можно достигнуть - текущий рекорд 55.1 (Кирилл Хоружий, луч - 1 миллион, 8 миллионов параметров модель). Текущие результаты анализа собраны в таблице в скриншоте.
Другие направления - работа с группами размера 10ˆ75, анализ параметров бим-серча - какие наиболее важны.
========
Мы продолжаем проект по применению МЛ к теории групп, кому интересно присоединиться - пишите @Alexander_v_c
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
Небольшой анонс от коллег из сообщества ITMO.OpenSource. Они продолжили свой цикл опенсорс-исследований новым материалом под названием «Использование ML/Data-опенсорса в России»: https://opensource.itmo.ru.
Кратко об исследовании от авторов:
Внутри ― мнения экспертов из бигтеха и не только, анализ открытых данных в GitHub и смежных сервисов, рейтинги и топы, графики и таблицы, советы и рекомендации. Авторы исследования ― сотрудники исследовательского центра «Сильный ИИ в промышленности», студенты и аспиранты ИТМО.
Надеемся, будет полезно и интересно. Обратную связь можно дать в нашем чате, а следить за анонсами - в канале Научный опенсорс.
День рождения Семашко!
Сегодня особенная дата, которую стоит отмечать, как день современного медработника. И я уверен, что если бы кофаундер или сооснователь советского здравоохранения Николай Александрович Семашко был бы жив, то к нему бы пришли на день рождения следующие каналы (на которые рекомендую подписаться):
Поясни за мед рассказал бы Николаю Александровичу, как сейчас отклонились в Минздраве от его вектора. Где кому не доплачивают, а кто и сам может содержать 2-3 врачебных кабинета с 15 операций, а кто бренды врачам делает.
Анча Баранова рассказала бы, как хорошо в США: как там капиталисты то болезнями обезьян болеют, то как лихорадка Денге топчет Лос Анджелес. А мы бы послушали профессора!
ФармАналитика пояснила бы, каких препаратов не хватает, какие хорошо продаются, а какие — плохо. Помогла бы сориентироваться в рынке. Всё-таки аналитика про фармацевтику №1 в телеграме — подписка обязательна.
Независимая Национальная Академия Доказательной Медицины поразила бы своим существованием, длиннейшим названием и эффективностью подходов. Вот кто-то, а Семашко бы заценил концепт. Данные — актуальные, мероприятия — полезные, подписка.
Наука и университеты опишут инфраструктуры лучших вузов и провалы — худших. Админы подпишут на себя Николая Александровича, чтобы тоже был в теме и всегда на университетской новостной волне.
Флеболог Астафьева проверила бы, всё ли в порядке с венами на ногах и разъяснила, что с ними так/не так. Подпишитесь, чтобы тоже быть в курсе, а ещё подпишите своих родственников, чтобы обращались к знающему специалисту.
Ночная охота пояснила за анестезиологию, реаниматологию, феминизм и подарила бы свою книгу "Мой телефон 03" с автографом. Чтобы было понятно, к чему пришло здравоохранение в художественном эквиваленте.
Алло, это фарма? записала бы подкаст с НА Семашко, хотя обычно пишется с людьми из фармацевтической индустрии. Контент — на канале.
(sci)Berloga Всех Наук и Технологий расскажет обо всех науках и технологиях и о вакансиях в лабораториях и R&D. Всё-таки Семашко многое пропустил в sci, надо нагнать за пару часиков.
Орфанное радио расскажет Семашке о льготных программах на миллионные препараты, которые действуют в России, а самое главное — в чьих интересах. Расскажет, конечно же, с горящим сердцем и глазами.
Уроки истории медицины взяли бы у Семашко открытый урок о том, как на самом деле они строили здравоохранение. Расстреливали ли больничных бухгалтеров, главных врачей, например. Тоже интересно.
НЕВОЛИН тоже запишет подкаст с Николаем Семашко, где они будут ругать людей на местах или журналистов, весело, с интонацией уставших от практики докторов.
Икона Фармы — я, фарм-доказательно-троллинговый канал про политику здравоохранения, буду просто стоять с рацией и координировать действия окружающих и раздавать всем шампанское и метформин за 150 рублей — и удовольствие, и долгую жизнь, так сказать, как и всем моим подписчикам.
Всех с Днём Рождения отца-основателя!
#возвращаясь_к_напечатанному
Всем, всем, всем!
Как мы недавно писали, фирма "Международный издатель", предлагающая купить соавторство в научных статьях за деньги, в качестве "архива исполненных заказов" разместила на своем сайте... списки из множества статей российских авторов, которые: 1) совершенно точно не продавали никакого соавторства и 2) благополучно опубликовались в хороших журналах. По сути дела, людей просто оклеветали, приписав им крайне неодобряемое в научных кругах деяние. Вот здесь выложена таблица из всех этих статей - желающие могут поискать себя (скорее всего, найдете, если публиковались в хороших журналах).
К борьбе против этих деятелей уже подключился депутат Госдумы профессор РАН Мажуга @MAGnit80, который направил обращение в Генпрокуратуру. Практически сразу нам написал ректор Мордовского государственного университета @DmitriiGlushko, который подключил к работе команду сильных юристов, за что ему большое спасибо. Они подготовили коллективное обращение, под которым уже оставили свои подписи несколько десятков пострадавших ученых.
Коллеги из МГУ Огарева ведут сбор подписей. Если вы пострадали от действий "Международного издателя" - присоединяйтесь!
Алгоритм действий:
1) Прочитайте, распечатайте и подпишите обращение
2) Найдите свои работы на сайте "Международного издателя" и сделайте скрины
3) Отправьте скан и скрины Александру Давыдкину, проректору МГУ Огарева по научной работе: @aldavydkin
4) В идеале (если есть время и возможность) - отправьте оригинал подписанного обращения почтой: 430005, Республика Мордовия, г. Саранск, ул. Большевистская, д. 68, для Давыдкина А.М.
Чтобы избежать лишней бумажной работы, старайтесь собрать под каждым сканом максимум подписей от пострадавших коллег.
Распространите информацию как можно шире - чем больше ученых присоединится к обращению, тем лучше.
Ваши,
Смотрители @ivoryzoo
Привет, друзья! 👋
Недавно мы провели вебинар, посвященный введению в Uplift-моделирование от эксперта в области, Артема Савельева.
Публикуем запись вебинара:
🎥 YouTube | Яндекс.Диск
В нашем курсе Продвинутые методы машинного обучения Uplift-моделированию посвящен объемный модуль, состоящий из 10 уроков! Приглашаем вас присоединиться к курсу и погрузиться в тему Uplift-моделирования! И не только в нее 🙂 В курсе мы рассказываем о различных нетривиальных и не всегда простых, но важных приложениях классического машинного обучения к решению практических задач.
В течение этого месяца на курс действует промокод.
P.S. В ближайший месяц мы планируем опубликовать серию небольших статей в telegraph, посвященных обзору различных прикладных задач машинного обучения, и начнем с Uplift!
Хорошего дня! 🌞
Напишу и подборку смешных историй из мира науки, чтобы сбалансировать настроение
😅 После стажировки мне нужно было отдать рабочий компьютер, на котором хранились обработанные данные для будущей научной статьи. На нём стоял пароль, который тоже пришлось сказать постдоку. Для безопасности этот пароль был не слишком важен, потому что компьютер стоял в закрытом офисе и, если уж какой-то хакер настолько сильно захотел взломать институт, что пробрался в здание, вряд ли бы его остановил сложный пароль. Поэтому он был коротким и легко печатаемым: pumparam. Было очень неловко передавать его постдоку. Она ещё не поняла эту фразу и с английским акцентом переспросила: „пампарэйм?“
👨💻 А за 3 месяца до этого, на второй рабочий день, я забыл этот пароль из-за перегрузки информацией в начале работы и 2 часа пытался взломать свой компьютер. В конце стажировки руководитель сказал, что было очень приятно со мной работать, потому что стажёры обычно довольно глупые. Он не знал, что я начал стажировку, забыв то, что сам же и придумал
💊 В одной фармкомпании собрали сотрудников на важное совещание. В лабораторию часто заказывали реактивы, а потом передумывали и возвращали заказ обратно. Само по себе это не было проблемой, но руководство собрало сотрудников, чтобы попросить писать причину возврата более осмысленно. В пример привели следующие фразы, указанные в документах:
- Упс
- Упси
- Лаженька вышла
Фармкоррекция ночного апноэ и причём тут психоделики
Важная тема, особенно часто пропускается из виду у пациентов, которые жалуются на то, что не высыпаются и поэтому спят весь день. Психологи находят в этом избегание проблем, некий копинг, а психиатры в силу трудности диагностики такого состояния, т.к. нужен свидетель апноэ (супруг, родственник), либо запись полисомнографии, часто списывают на депро-тревоги.
А схема достаточно простая. Сначала идут интраназальные ГКС (мометазон чаще всего используется/дешев, флутиказона пропионат лучше всего работает), а вот затем опции поинтереснее, с учётом предполагаемого механизма действия. Несколько исследований выявили высокий уровень альдостерона во время сна, что связывают с отёком тканей шеи и верхних дыхательных путей, поэтому предлагают использовать антагонисты минералокортикоидных рецепторов типа спиронолактона, что собственно и помогает в некоторых случаях, особенно если есть сопутствующая артериальная гипертензия. Хотя тут может быть подмена причины и следствия, т.к. существуют данные, что именно хроническая периодическая гипоксия вызывает спазм сосудов почки и стимуляцию секреции гормонов надпочечников через активацию ренин-ангиотензин-альдостероновой системы, но факт эффективности надо иметь ввиду и использовать по ситуации. Снижение массы тела работает, но механика апноэ не всегда связана с анатомическим дефектом, поэтому подходит не всем, но в целом худая шейка меньше сдавливает верхние дыхательные пути. Там же затесались и фентермин с топираматом, но мне кажется, что тут и сам фентермин может давать повышение тонуса и улучшение нейроконтроля дыхания во сне, но это моя гипотеза. Умные дяди и тёти придумали экзотический коктейль из спиронолактона и атомоксетина и назвали ato-spiro. Идея состоит в том, что норадреналин регулирует тонус мышц, в том числе, назофарингеальных и повышение его концентрации позволяет этот тонус поддерживать на достаточном уровне во время сна, причём эта комбинация работает и в отсутствии спиронолактона, так что говорить, что это кофаундинг рано, надо бы детальнее исследовать этот инструмент. Это интересный офф-лейбл о котором мало говорят. Там вообще много чего интересного в плане контроля нейтротрансмиттерами тонуса мышц во время сна и респираторного драйва. Несколько работ показали положительный эффект ( снижение индекса апноэ/гипопноэ - AHI) от комбинации флуоксетин +ондансетрон (на 30%), флу в моно, L-триптофана и буспирона, но самый мощный эффект был зафиксирован от комбинации атомоксетин + оксибутинин (на 60 % AHI снижался) [такое тоже можно собрать из аптеки]. Отсюда мы плавно перетекаем к вопросу, а причем тут психоделики. Известно, что система 5HT2A регулирует порог пробуждения и поэтому блокаторы, которые еще и ингибиторы SERT, типа тразодона также демонстрируют положительный результат за счёт двойного механизма действия. Сами по себе агонисты могут этот порог вообще поломать, поэтому сон будет похож на агональное дыхание с частными глубокими вдохами, когда уровень pCO2 уже достаточно высок и пора бы подышать, но тебе просто похуй. При этом с тонусом то все в порядке, т.к. агонисты тормозят переход в глубокие фазы сна и ты как бы спишь поверхностно. В общем, взаимосвязи там сложные, как-нибудь на бусти распишу. Эффект схож на опиоды чем-то. Кстати, частая причина детской смерти это остановка дыхания во сне. Есть данные, что у таких детей обнаружен дефектный 5HT2A, отсюда они как бы поворачивают головушку в подушку и все, мозг сигнала голову перевернуть на другой бок не дает и ребеночек тихо задыхается. Стоит расширить списочек регуляторами дыхательного цикла, который управляется как всякими хемосенсорами, так и системами типа 5HT2 рецепторы на дыхательных ядрах. На первые можно повлиять через буферные системы, например используя ацетозоламид. При этом седативы: типа бензов/барби/алко усугубляют клинику апноэ, кроме зопиклона и эсзопиклона, о чём стоит помнить, когда пациент с паттерном инсомния+апноэ. Материал закреплю картиночками, для разминки глаз.
Кружок Пейпеца | Дзен
Кружок Пейпеца | Boosty
🚀 @SBERLOGASCI webinar on data science:
👨🔬 Кирилл Хоружий, Егор Урванов " Апдейты про проекту применения МЛ к теории групп"
⌚️ Четверг, 29 Сентября, 18.00 по Москве
Обсудим текущий прогресс.
Нам уже удалось превзойти SOTA для кубика 333 по длине решения, при меньшем времени.
Кирилл расскажет ноутбук с решением: https://www.kaggle.com/code/ka1242/beamsearch-with-solution-for-rc3
Егор расскажет о организации процесса - Конфлуенсе и Жира.
————————
Напоминаем, что мы продолжаем наш проект по применению МЛ/RL методов к математическим задачам теории групп и графов Кэли. Если Вы хотите присоединиться - напишите @Alexander_v_c - мы всем рады !
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
О кратчайшем пути на графе III
(или о том что случайные блуждания как оценка расстояния до целевой вершины работает)
Кажется вместе с @sberlogasci мы вышли на SOTA уровень по сборке кубика 3x3x3 (вроде NP-complete problem) на основе этого подхода (without human knowledge)! В таблице красным выделен лучший опубликованный результат AlphaCube (14M parameters) и синим наш результат (4M parameters).
Поиграться с моделями и посмотреть на решения можно на kaggle.
// но для 333 это не столь содержательно, так как тут и тут предпосчитали большой Pattern Databases, на котором можно за 2с имея 200GB ram найти решение :)
🚀 @SBERLOGABIO webinar on biology :
👨🔬 Елизавета Минина "CAR-T: механизмы, плюсы и минусы, перспективы. Часть 2. "
⌚️ Пятница, 22 Августа, 17.00 (по Москве)
Add to Google Calendar
Две недели назад мы разбирали, что такое CAR-T и в чем плюсы и минусы этой клеточной технологии терапии рака. Многие из существенных ограничений CAR-T препаратов, одобренных FDA, можно обойти, экспрессируя рецептор CAR не в T-клетках, а в других лейкоцитах – NK-клетках, NKT-клетках, макрофагах и других. На этой лекции мы разберем, чем функционально различные группы лейкоцитов с экспрессией CAR могут превосходить «классические» CAR-T, какие ограничения присутствуют в каждом случае и как обстоят дела с клиническими испытаниями у каждой группы лейкоцитов с экспрессией CAR.
О докладчике: Елизавета Минина - молекулярный биолог и автор замечательного телеграм канал "Liza loves biology" - /channel/liza_loves_biology - обязательно подписывайтесь !
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
Самая провокационная и последняя летняя подборка телеграм-каналов
Я решила сделать это и наконец по-честному описала каждый канал, который читаю, с оттенками, которые не всем приятны.
Анча Баранова — остроумный профессор, который разбирается в биомед повестке и поражает подписчиков своей продуктивностью в просвещении. Наверное, у неё тоже есть свои скелеты в шкафах, а точнее — скелеты закошмаренных аспирантов. Возможно, она расскажет об этом.
Уроки истории медицины — тг-канал, где из истории медицины выбивают пыль своими постами, например — рисунок 100-летней давности детской поликлиники глазами художницы из США. Выглядит так, как говорят на России-1 про сегодняшние штаты.
Поясни за мед — врач-борец, борется за взгляды Семашко, того самого министра, который основал здравоохранение СССР, будучи другом Ленина в эмиграции (!!wtf!!). Отстаивает взгляды плотно, вступает в дискуссии с капиталистами (мной например). Пока сам как организатор здравоохранения соорганизовал nocode-сервиc и запустил чат-бот @poyasnizamedbot.
Независимая Национальная Академия Доказательной Медицины (ННАДМ) — канал для тех, кто хочет разобраться в нюансах доказательной медицины. Разбирают разные типы смещений и ошибок, ссылаются на российские и зарубежные публикации в хороших журналах. Не стыдно показать маме, папе и научному руководителю.
Флеболог Астафьева — доверенный флеболог, который работает руками над чьими-то ногами с торчащими венами. В прошлом месяце отправился мой друг с торчащими венками, вернулся — только с красивыми.
(sci)Beloga Всех наук и Технологий — наши отношения только начались, мы пока не определились с админом "на ты" или "на вы". Канал про машинное обучение, про молекулярную медицину и про всё трендовое и fresh в широком смысле слова. А я читаю такое.
Ночная Охота. Врач-писатель на тропе рефлексии своей работы в ОРИТ. Пожалуй, лучший пост в ответ на "Традиционные ценности защитят от оспы обезьян". Трудится в НИИ Склифосовского и активно работает над реамемационными шпаргалками.
НЕВОЛИН — женатый медик, который пишет подкасты про медицину, а поддерживает его некая Арина согласно тем самым подкастам. Не скрепно, не традиционно, но интересно. Рекомендую ознакомиться с творчеством, в том числе — на Яндекс.Музыке.
МедФарм — одинаково ровно сообщает как о суперсенсациях, так и о новостях, которые значимы только для двух отделов фармацевтических компаний-конкурентов. Зато всегда интрига, какая новость на самом деле важная, а какая — so-so.
Школа деда — оксюморон заключается в том, что деда опять отправляют в школу. Ведёт врач-гериатр, делает много эфиров и активно трудится на гериатрическими цифровыми решениями, например, как это, по деменциям. Сдавайте ему на консультацию всех лиц старше 65 лет.
Как живёт детский хирург — эмоциональные качели и бурный профессиональный рост и.о. заведующего отделением одной из ведущих детских больниц. Можете узнать и что-то новое, и что самые красивые мужчины — разведённые триатлонисты.
Зоопарк из Слоновой кости — канал про политику в академическом мире и про академический мир — в политическом. Периодически видят русофобию там, где она бывает.
Новости нейронаук и технологий — не пишут о том, о чём не пишут и другие СМИ. Но и не должны! Редакторы: Нейроиишница и Алексей Паевский, "всегда двое их — учитель и ученик". Когда-то кто-то кого-то 😵, но это не точно.
Подводит черту Медицинская Россия — классическое тарантиновское медицинское СМИ с мощным чатом, где врачи искусно высказываются о том, что думают обо всём происходящем. Рекомендую читать на транках, не рекомендую — беременным. По слухам иногда сам Дмитрий М. пишет посты в две руки с редакторами.
Вот так, всё честно и искренне, как обычно, в Иконе фармы. Никаких больше подборок до середины сентября.
Позвольте Вам порекомендовать канал нашего коллеги:
Дима Ирешев - руководитель проектного офиса в e-com и автор канал Управление проектами и продуктами. С воем канале Дима публикует результаты исследований, подборки мероприятий в ИТ, статьи и видео на тему управления командой и проектами.
Могу порекомендовать посты
🔵 ТОП-15 бесплатных курсов по управлению проектами
🔵 Зарплаты в IT в первом полугодии 2024 года
🔵 Тренды в проектном управлении
🔵 Как устроены крупные ИТ компании
"Я начинал вести свой канал с простой гипотезы: "всё что мне показалось интересным, может оказаться полезным кому-то ещё". Я до сих пор продолжаю лично отбирать материалы: да, я все это читаю и смотрю."
👉 Подписывайтесь на канал /channel/dmitrii_ireshev_Agile_PMP
https://arxiv.org/abs/2412.04529
Саша с Антоном опубликовали классную статью про CAFA5! А я в соавторах. Много умных слов и понятных картинок. Год назад мы участвовали в соревновании на kaggle, в котором надо было определить функции белка по его аминокислотному составу и таксономии. Соревнование отличалось высоким порогом входа, поскольку таргеты, коих было десятки тысяч, были организованы иерархически и метрика расчитывалась пропагацией по этому дереву. Отдельно стоит отметить разметку, где 1 означала наличие функции у белка, но 0 не означал, что функции нет, она просто еще не была обнаружена, возможно.
Мы заняли 2 место 🎉, уступив профессионалам в области, которые в том числе парсили выходящие во время соревнования статьи про новые экспериментально обнаруженные функции белков. Последующее тестирование решений на еще более свежих данных подтвердило, что распределение мест не было случайностью. Организаторы соревнования настоящие ученые, измерили множество метрик и провели полноценное исследование полученных решений.
В статье показываем подход ProtBoost, в основе которого Py-Boost, линейки и mlp, а так же графовые нейросетки в качестве умного ансамбля (помните про иерархические таргеты?). В качестве признаков эмбединги последовательностей и мета-информация о происхождении белка. Обнаружили, что не все эмбединги одинаково полезно и хайпово не значит лучше.
Соревнования шло 3 месяца, а статья выходит спустя год. Это вам не бустинги стекать 🙈
Из каггл-выводов:
* pyboost хорош, особо хорош, когда таргетов много и бустинги в принципе можно успешно применять на эмбедингах.
* GCN стекер можно применять не только здесь.
* иногда ошибки приводят к интересным открытиям, перепутав айдишники моделей, получили интересную аугментацию.
* если соревнование про науку, то где-то в интернете хранятся разные полезные датасеты и код, но коду организаторов слепо верить не стоить
#обозревая_происходящее
Участники первого чемпионата мира среди шахматных программ встретились 50 лет спустя
Когда-то давным-давно в Стокгольме произошло историческое событие - первый чемпионат мира по шахматам среди компьютерных программ. В нем приняли участие 13 программ из 8 стран, и победила советская команда под руководством Владимира Арлазарова со своим детищем "Каисса".
Прошло 50 лет, и герои былых ИИ-сражений встретились в Испании на XXVII Европейской конференции по искусственному интеллекту (ECAI). Джонатан Шеффер, создатель Chinook - первой компьютерной программы, завоевавшей титул чемпиона мира в состязании с человеком; Дейвид Леви, шахматный журналист, международный мастер по шахматам и один из организаторов чемпионата мира в Стогкольме; Тони Марслэнд, исследователь игр и разработчик программы Awit/Wita, участвовавшей в нескольких чемпионатах Северной Америки и мира по компьютерным шахматам, и Монти Ньюборн, бывший президент Международной ассоциации компьютерных шахмат и соавтор шахматной программы Ostrich. Ну, а Россию все так же представляет Владимир Арлазаров. В 74м ему было 35, и он был молодым кандидатом наук, а сейчас это членкор РАН и директор по науке компании Smart Engines (и завкафедрой на Физтехе, между прочим).
Комментарий проф. Арлазарова:
"На заре искусственного интеллекта шахматные программы разрабатывались учеными по всему миру. Поэтому нами руководил в первую очередь научный интерес, а не конкуренция. Мы были коллегами и друзьями со многими членами сообщества компьютерных шахмат и воспринимали первый чемпионат мира как площадку для обмена опытом. Разумеется, мы достигли значительных успехов в задаче, над которой тогда работали многие ученые. Этот успех тогда был признан мировым научным сообществом - и остается таковым сегодня"
🐍 А вы готовы научиться укрощать питона?
Вы знали, что Python - второй по популярности язык программирования в мире? На нем можно делать почти что-угодно в программировании: писать нейросетки, обрабатывать большие массивы данных и писать бэкенд и фронтенд программ, если потребуется.
Освоить этот универсальный инструмент можно на нашем курсе «Машинное обучение на Python для решения биоинформатических задач». Он пройдет с 15 октября по 30 ноября!
🍋Зачем стоит идти на курс:
- Вы увеличите свою конкурентоспособность на рынке труда, ведь вы узнаете, как на практике обращаться с новым инструментом.
- Откроете новые варианты развития карьеры, ведь Python можно применять в огромном количестве сфер.
- Сможете продолжать заниматься любимой наукой, только с более прокачанными навыками.
⭐️Что будем изучать:
- Научимся работать с библиотеками для анализа данных в Python: Pandas и Numpy
- Освоим классические инструменты машинного обучения и азы работы с нейросетками
- Научимся подбирать гиперпараметры и оценивать качество моделей
- Пройдем методы кластеризации и снижения размерности
- Поймем, зачем брать производную и что такое градиентный спуск
- Повторим статистику, но в этот раз на питоне.
🕸 Но это еще не все. Вот, что останется с вами после курса Blastim:
- Постоянные встречи в формате рандом-кофе с такими же студентами, как и вы. Вы узнаете, кто учился вместе с вами и заведете несколько полезных знакомств. Кто знает, может это ваш будущий коллега?
- Устроим онлайн-встречу с преподавателями курса.
- Встреча с карьерным консультантом. Он обьяснит, где можно наиболее выгодно применить новые полученные навыки.
- Онлайн-сообщество в Telegram. Если будут трудности, то сразу можно задать вопрос в беседе и у кого-нибудь обязательно найдется ответ.
Кстати, по промокоду 📌PYTHON5📌 вам доступна скидка 5000 рублей при оплате до 10 октября.
👉 Переходите по ссылке. Здесь будет самая подробная информация о курсе. Ждем всех :)
Третий закон мертв: математики показали, что экстремальные черные дыры реальны
В изучении Вселенной ученые часто обращаются к ее самым экстремальным проявлениям, стремясь раскрыть фундаментальные законы природы. Черные дыры, одни из самых загадочных объектов во Вселенной, уже десятилетиями служат инструментом для исследования границ наших представлений о гравитации, пространстве и времени. Согласно общей теории относительности Эйнштейна, внутри черной дыры материя сжата настолько плотно, что ничто не может покинуть ее пределы.
Однако даже среди черных дыр существуют экстремальные случаи. Экстремальные черные дыры - это особый класс объектов, достигающих максимально возможного заряда или скорости вращения для своей массы. Их уникальное свойство заключается в том, что их поверхностная гравитация на горизонте событий равна нулю. Это означает, что объекты на поверхности такой черной дыры не испытывают гравитационного притяжения, но малейший импульс в направлении центра приведет к их падению внутрь.
Читать материал на моем блоге на HABR
По просьбам подписчиков появилось ещё несколько каналов с ежедневными подборками статей. Если кому-то ещё пригодится – пользуйтесь на здоровье 🙂
• Computational methods for single-cell data
• Computational structural biology
• Antibody design
• Protein Design and ML in proteomics
• Immune repertoires, AI for drug discovery, Personalized medicine and immunotherapy
• Image-based cell profiling
• Epigenetic clock algorithms
• Brain transcriptomic and epigenetics
• Population genomics
• Ancient DNA and ancient metagenomics
• Microbiome and virome of ixodid ticks and malaria mosquitoes
• Chromaffin tumors and Adrenocortical cancer
• Extracellular vesicles, exosomes, and microvesicles
• Neurofibromatosis and genotype-phenotype correlation
• Cattle selection
• Quantum chemistry, DFT, coacervate catalysis, and ML in chemistry
А также всегда можно написать админу, чтобы заказать подборку по своим интересам. Поддержка ботов требует денег, а настройка – времени, поэтому буду благодарен поддержке. Пока не знаю как это организовать, но можно присылать звёзды в телеграме
Пост будет обновляться. Также работаем над тем, чтобы сделать код открытым
Современная наука оперирует такими объемами данных, которые невозможно обработать вручную в разумные сроки. (Страшный сон: делать вручную регрессионный анализ на стотысячную выборку.) Массивы информации требуют не только математических знаний, но и инструментов, при помощи которых можно эффективно работать с данными и автоматизировать рутинные задачи.
Для подростков и молодых людей 13-20 лет Яндекс Лицей запустил бесплатные курсы, где можно научиться анализу данных, работе с большими данными, основам машинного обучения и другим специализациям. Интенсивное обучение продлится три месяца: будут лекции, домашние задания и защита проекта.
Курсы подходят тем, кто уже знаком с основами программирования и хочет углубить свои знания. Заявки на обучение принимаются до 24 сентября.
Коллеги, хотелось бы поделиться с Вами информацией из известного многим канала "Зоопарк из слоновой Кости"
Читать полностью…
🚀 @SBERLOGASCI webinar on mathematics and data science:
👨🔬 Sergei Gukov "What makes math problems hard for reinforcement learning: a case study"
⌚️ 19 September, Thursday 19.00 Moscow time
Add to Google Calendar
Can AI solve hard and interesting research-level math problems? While there is no mathematical definition of what makes a mathematical problem hard or interesting, we can provisionally define such problems as those that are well known to an average professional mathematician and have remained open for N years. The larger the value of N, the harder the problem. Using examples from combinatorial group theory and low-dimensional topology, in this talk I will explain that solving such hard long-standing math problems holds enormous potential for AI algorithm development, providing a natural path toward Artificial General Intelligence (AGI).
The talk is based on a recent paper: https://arxiv.org/abs/2408.15332
О докладчике: Сергей Гуков - профессор КалТех, выпускник МФТИ и Принстона, один из наиболее известных специалистов по теории струн и математической физике, в последние годы занимающийся применением методов Reinforcement Leaning к задачам математики и физики.
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga and in telegram: /channel/sberlogasci/19688 - subscribe !
Анонс на твиттер:
https://x.com/sberloga/status/1835702457260765359
Ваши лайки и репосты - очень welcome !
Коллеги рекомендуем Вам широко известный канал про все что связано с нейро-психо-фармакологией - Кружок Пейпица /channel/Papez_club
Всем кому интресна эта тема - подписывайтесь !
🚀 @SBERLOGABIO webinar on bionformatics and biology:
👨🔬 Баль Наталья, к.б.н., "Изменение экспрессии генов в гиппокампе после обучения у грызунов"
⌚️ Четверг,12 Сентября 18.00 по Москве
Add to Google Calendar
Обучение - это сложный биологический процесс, одним из компонентов которого является изменение экспрессии генов в некоторых областях мозга. Гиппокамп представляет собой участок мозга, в котором происходят активные изменения в нейронах во время формирования некоторых видов памяти, включая память на события в определённой обстановке. В докладе я расскажу о литературных данных, в которых исследованы изменения экспрессии генов в гиппокампе после обучения животных в модели обстановочного условно-рефлекторного замирания, а также о собственных исследованиях в этой области, в которых мы анализировали дифференциальную экспрессию генов в отдельных зонах гиппокампа после обучения.
О докладчике: Баль Наталья, к.б.н., н.с. Института высшей нервной деятельности и нейрофизиологии Российской академии наук
Также автор замечательного канала по нейробиологии: /channel/neuronsandsynapses - подписывайтесь !
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
Коллеги,
Тем кто ищет вакансию/стажировку или наоборот ищет кандидатов
(биология , биоинформатика)
может быть полезна голосовалка:
/channel/sberlogabio/79269
ПС
Поиск работы/стажей не всегда прост.
Возможно телеграм голосовалки, дают еще одну возможность для такого поиска.
Те кто ищут (пункт 2) - смогут связаться с теми, у кого есть что предложить (пункт 1)
и возможно, кто-то найдет для себя что-то полезное.
Привет, Друзья!!
Мы рады сообщить вам, что у нас есть специальный канал, где вы можете найти актуальные вакансии, а также разместить своё резюме.
Присылай свои CV с указанием области интересов, попробуем помочь Вам найти интересную работу.
Уважаемый HR-ы, также ожидаем и вашего активного участия 😊
Контакт @Zabis13
🚀 @SBERLOGASCI webinar on data science:
👨🔬 Eгор Урванов "Confluence and Jira для проекта ML для графов Кэли" (18.00 -18.20)
👨🔬 Нурсултан Нарынбаев , Владислав Замковой "Модели на основе трансформера для графов Кэли" (18.20-19.00)
⌚️ Четверг, 22 августа, 18.00 (по Москве)
Add to Google Calendar
Егор Урванов расскажет о Confluence and Jira и как ими пользоваться.
Нурсултан и Владислав расскажут о моделях на основе трансформеров для нахождения путей на графах Кэли. В частности, и модель которая использовалась на Kaggle Santa 2023. Как удалось выяснить данная модель использует полиси подход , а не валуе (как у нас), то есть предсказание хода, а не оценка позиции. Кроме того в данном ноутбуке было предложено использование этой модели для укорачивания уже существующего пути, а не поиск с чистого листа (как у нас). Детали алгоритмов не до конца понятны и мы попробуем их разобрать. https://www.kaggle.cojm/competitions/santa-2023/discussion/472606
Вариант трасформера от Нурсултана - с валуе подходом:
https://www.kaggle.com/code/nursmen/santaintorch/
Вариант трасформера от Нурсултана - с полиси подходом:
https://www.kaggle.com/code/kanavis/transformer-notebook
Апвотуты приветсвуются !
————————
Напоминаем, что мы продолжаем наш проект по применению МЛ/RL методов к математическим задачам теории групп и графов Кэли. Если Вы хотите присоединиться - напишите @Alexander_v_c - мы всем рады !
Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
Это грустно, но лишь 1 из 3 ML моделей доходит до продакшена. А приносят стат значимо метрик в АВ еще меньше моделей
Какие-то модели решают не те бизнес задачи (дают вероятность оттока, а не кому/когда/какой промокод дать), другие - оптимизируют не те метрики (заказы, а не прибыль), третьи - не интерпретируемы и поэтотому никогда не попадут в прод (диагностика заболеваний)
В общем, путь от ML модели до реальной пользы компании крайне тернист. Почитать про классические и необычные ошибки на таком пути можно почитать на канале @ml4value
Например, про то, как оптимизация метрик поиска роняет деньги
NTRK-ингибиторы в терапии глиобластом: клинические случаи
Недавно наткнулась на клин.случай успешного (для глиобластомы это можно назвать успешно) применения энтректиниба у пациента с рецидивирующей глиобластомой с GOPC-ROS1 фьюжном .
Пациенту 68 лет была диагностирована глиобластома в январе 2020 . Он получил стандартное лечение : резекция опухоли, химиолучевая терапия и 12 курсов темозоломида до ноября 2021.
Уже в январе 2022 по МРТ был выявлен рецидив заболевания.
Тогда образец опухоли отправили на NGS ( FoundationOne CDx). Помимо типичных находок для глиобластомы (PTEN loss, CDKN2A/B loss, мутация промотера TERT , мутации EGFR) , был выявлен фьюжен GOPC-ROS1 . Стоит заметить, что по данным ИГХ ранее образец был ROS-1 негативен .
Учитывая данную находку, пациент был включен в клиническое исследование с энтректинибом , получал его 600 мг ежедневно . После двух месяцев терапии был зарегистрирован частичный ответ согласно критериям RANO , а после 4 месяцев терапии - полный ответ , продолжавшийся следующие полгода. Серьезной токсичности отмечено не было.
В январе 2023 вновь был выявлен рецидив заболевания в виде появление нового очага в головном мозге. Пациенту проведено оперативное вмешательство, терапия
энтректинибом остановлена . На момент написания случая пациент получает симптоматическую терапию.
В литературе ранее также были описаны подобные кейсы:
▶️Один из первых клин. случаев эффективности NTRK ингибиторов при опухолях ЦНС был опубликован в 2018 году. 3-летней пациентке спустя 4 месяца после прогрессирования на стандартной терапии в виде резкого клинического ухудшения (рвота, сонливость, трудности при ходьбе) , а также появление опухолевых узлов в головном мозге, учитывая наличие ETV6-NTRK3 фьюжена, был назначен ларотректиниб . Через 4 недели применения, у пациентки прекратились вышеописанные симптомы и противоотечная терапия дексаметазоном была прекращена. К 8 неделе она бегала, танцевала и продолжала осваивать новые слова и речь. Побочных эффектов, связанных с приемом ларотректиниба, не наблюдалось. МРТ, проведенная через 8 недель терапии, показала уменьшение увеличения супраселлярной массы, уменьшение всех метастатических узлов. МРТ через 5 месяцев подтвердила положительный эффект. На момент написания статьи, через 9 месяцев после начала приема ларотректиниба, пациентка продолжала лечение без каких-либо побочных эффектов.
▶️Специалистами НМИЦ Рогачева был опубликован клин. случай терапии энтректинибом у ребенка с глиомой высокой степени злокачественности, обладающей ETV6-NTRK3 фьюженом. Энтректиниб был назначен пациенту во 2 линии терапии, в дозе 100 мг ежедневно, был достигнут полный ответ, длившейся по меньше мере 8 месяцев (на момент публикации статьи).
🔬 Исследование энтректиниба 1/2 фазы STAR TREK-NG (NCT02650401) продемонстрировало обнадеживающие результаты у пациентов с опухолями ЦНС младше 22 лет, с NTRK или ROS1-фьюженом.
▶️Среди взрослых пациентов первый случай успешного применения энтректиниба был описан у пациента с рефраткерной глиобластомой с BCR-NTRK2 фьюженом. Спустя 15 месяцев применения у пациентки зарегистрировано прогрессирование заболевания .
🧬 Ретроспективный анализ полногеномного секвенирования выявил только два релевантных события - это мутация гена BRAF и слияния NTRK (ESCAT I-II). Клинических данных по эффективности NTRK ингибиторов немного, но эффективность и переносимость такого лечения обнадеживает 🙏
Статья о первом клиническом случае будет в комментариях