как запихнуть ген тихоходки в человека, чтобы не помирал от космической радиации
а от рака мозга
Is the sequence of earthquakes in Southern California, with aftershocks removed, Poissonian?
chad abstract
Анонс события в братском матклубе, присоединяемся
«в эту пятницу обсуждаем статью "Down With Determinants!", Axler S.
Смущало ли вас когда-нибудь насколько внезапно и необоснованно вводится понятие определителя? Ну вот вы не одни. Всегда казалось "вумные деды всё знают, значит так надо", но оказывается, что нет, совсем не обязательно. В этой статье автор демонстрирует как можно построить курс линейной алгебры без использования определителя или хотя бы с более обоснованным введением его.
Прочитать самостоятельно к пятнице, 8 декабря, 19:00 по Москве.
Если поставите в мероприятии "интересно", то как начнётся встреча вам придёт уведомление.
https://discord.gg/f9ARFWDn?event=1180018361913057340»
https://www.youtube.com/watch?v=Z_L1oN8y7Bs
Просто красивое видео про то, как пытаются читать обугленные свитки Геркуланума с помощью мл и томографии
Как нейросети могут быть применимы в математике?
Большие языковые модели (LLM) уже давно показали способность к математическим выводам: доказательство несложных теорем, решение задач с подробным объяснением. Стоит отметить давнюю работу MathBERT для анализа мат.формул, а также Minerva для мат.ризонинга.
Недавно была представлена модель Llemma на 34 млрда параметров: в основе её архитектуры лежит Code Llama, инициализирована весами модели Llama 2 и оригинальным способом дотренирована на расширенном датасете Proof-Pile-2 (55 млрд токенов), который содержит программный код на 17 ЯП из GitHub, статьи из arxiv и OpenWebMath.
В итоге Llemma умеет следующее:
1. Solving Math Problems. Prompt: постановка математической задачи на естественном языке. Ответ: Пошаговое описание решения, записанное на LateX, а затем его имплементация на Python.
2. Informal-to-formal. Prompt: доказательство на естественном языке. Ответ: запись на формальном языке доказательства теорем (proof assistant) Isabelle .
3. Formal-to-formal. Prompt: доказательство на формальном языке Lean. Ответ: разбиение доказательства из prompt в последовательность шагов с подробным описанием на том же языке Lean.
Интригующие результаты в применении инструментов компьютерной алгебры и средств формального доказательства теорем удалось добиться с помощью добавления большого объема данных, связанных с программированием математики, символьными вычислениям итд; авторы назвали эту часть собранного датасета - AlgebraicStack. Утверждается, что Llemmа по точности бьёт все прошлые подходы: Minerva (540 млрд параметров и не open-sourse), Code Llama; при этом исходный код, веса модели и датасет в открытом доступе.
видео-лекция с подробным описанием работы от Sean Welleck на New Technologies in Mathematics Seminar, в рамках этого семинара затрагивают и много других интересных тем: формальное математическое объяснение успеха механизма Attention или статистическая механика в нейросетках.
пока писал этот текст, вышла статья LEGO-Prover про док-во теорем с помощью LLM.
"how the cell collective knows what to build and when to stop?"
Вышла новая моделька NCA: из порождающего множества и правил в прикольные структуры (мера прикольности, видимо, в узнаваемости)
Growing Neural Cellular Automata (2020)
Isotropic Neural Cellular Automata (2023)
Burning (2016)
Документальный фильм о математике Элияху Рипсе.
В возрасте 20 лет он совершил протестный перформанс против советской оккупации Чехословакии: поджег себя в центре Риги. Он выжил, но на два года попал в психушку. Сегодня Рипс считается крупным математиком.
Узким кругам он широко известен своими попытками найти зашифрованные послания в Торе.
Functional bioengineered models of the central nervous system
(Ревью: почему моделировать ЦНС сложно, давайте посмотрим, где мы сейчас)
недавно приходил вопрос в голову, а у Тао уже давно есть статья про это, удобно
When is correlation transitive?
если X и Y имеют корреляцию близкую к 1, то X и Z должны быть положительно скоррелированы тоже:
(X,Y) = (Y,Z)(Z,X) - sqrt{(1-(Y,Z)^2)(1-(Z,X)^2)}
(Y,Z)^2 + (Z,X)^2 > 1
а вот и окружность.
Topological and geometric analysis of cell states in single-cell transcriptomic data
"Here, we aim to explore the usage of TGDA tools, specifically graph curvature and persistent homology, for stablishing structure-function relationships in scRNA-seq to predict cell properties from the underlying structures of the data."
The study of plasticity has always been about gradients
(проблема только в том, что целевых функций не одна, а много и синапс участвует в приближении многих сразу и этот выбор может меняться (а не "Mathematically, this is equivalent to asking what the derivative of the performance function is with respect to each synapse"), поэтому оптимизация в мозге идет не столь очевидным образом, как в ИНС, которые аппроксимируют одну функцию из конкретного класса в процессе обучения)
Abstract: The experimental study of learning and plasticity has always been driven by an implicit question: how can physiological changes be adaptive and improve performance? For example, in Hebbian plasticity only synapses from presynaptic neurons that were active are changed, avoiding useless changes. Similarly, in dopamine-gated learning synapse changes depend on reward or lack thereof and do not change when everything is predictable. Within machine learning we can make the question of which changes are adaptive concrete: performance improves when changes correlate with the gradient of an objective function quantifying performance. This result is general for any system that improves through small changes. As such, physiology has always implicitly been seeking mechanisms that allow the brain to approximate gradients. Coming from this perspective we review the existing literature on plasticity-related mechanisms, and we show how these mechanisms relate to gradient estimation. We argue that gradients are a unifying idea to explain the many facets of neuronal plasticity.
4-й фильм Р.М. - "Поедем с тобой в Макао" про отношения отца и сына, в киноленте достаточно реалистично показана подпольная покерная жизнь, лудоманские трипы и структура покерной игромании.
Сопутствующие и частично показанные в самом фильме материалы - это The Topology of Poker, статья Р.М про топологическое богатство Техас Холдема (разновидность покера). Допустим, у нас есть симплициальный комплекс K_x, построеннный на X вершинах, где X соответствует множеству пар карт (всем раздачам), всего их 1326, и отношениям между ними. Отношение на множестве пар возникает из заранее известной вероятности выиграть одной пары у другой (априорно мы предполагаем, что Карабас 3♣️5♣️ проигрывает паре A♣️2♣️ с вероятностью 0.591), но интересный момент в том, что оно образует сферу, т.к. оно не всегда иерархично (как в игре "камень-ножницы-бумага"). Важно заметить, что вся эта структура не образует ЧУМ.
Основной результат - это Теорема, утверждающая, что K_x содержит S^4 в качестве подкомплексов. Такой комплекс K_x чем-то похож на диаграмму Хасса, но в которой на одном уровне возможны связи и нет транзитивной редукции.
Работа выглядит интересной, по модулю того, что в тексте есть небольшие ошибки, группы гомотопий обозначены как группы гомологий. И конструкция, похожая на их симплициальный комплекс, по всей видимости, была изобретена ранее под названием directed flag complexes (и в ней уже пытались вычислять устойчивые гомологии).
в дополнение к статье Акслера: на канале "Математическая свалка Сепы" была серия постов про определитель через внешнюю алгебру
Читать полностью…Inflection reflection: images in mirrorswhose curvature changes sign (M V Berry 2021)
https://michaelberryphysics.wordpress.com/category/gallery-images/
Это просто сайт какого-то немца, который решил написать код для построения самых мудреных флагов, например Ирана или Непала (кстати, его форма называется двоенным треугольным вымпелом). Если на его платформе покопаться, то можно найти сортировку флагов по странным пропорциям
Читать полностью…https://doi.org/10.1073/pnas.2309082120
Согласно новому исследованию, даже кишечная палочка может кое-что запомнить и передать будущим поколениям. Исследователи из Техасского университета и Университета Делавэра обнаружили потенциальную систему памяти, которая позволяет бактерии «помнить» прошлый опыт в течение нескольких часов и последующих поколений.
Такие выводы они сделали, проанализировав более 10 000 случаев «роения» бактерий. В ходе этих экспериментов проверялось, смогут ли клетки E. coli на чашке объединиться в одну мигрирующую массу, чтобы найти себе место получше. Выяснилось, что многое здесь зависит от железа внутри клеток: чем его меньше, тем быстрее бактерии снимаются с насиженных мест, а если его много, то формируют биоплёнку и никуда не идут. Первое поколение E. coli роилось без особого энтузиазма, но уже второе при низком уровне железа роилось быстрее. К седьмому поколению бактерии забыли, что надо делать.
https://udlbook.github.io/udlbook/
свежий вводный учебник по DL с не очень аутдейтед примерами
Два обзора (2019 и 2023 годов) о взаимодействии двух ключевых нейронных процессов - эксперессии генов и синаптической пластичности
1. R.R. Campbell, M.A. Wood, How the epigenome integrates information and reshapes the synapse, Nat. Rev. Neurosci. 20, 133–147 (2019). https://doi.org/10.1038/s41583-019-0121-9
2. H. Ma et al., Excitation–transcription coupling, neuronal gene expression and synaptic plasticity, Nat. Rev. Neurosci. 24, 672–692 (2023). https://doi.org/10.1038/s41583-023-00742-5
Логика - это наука о сосудах. Finally
Так что если встретите, как вам кажется, пьянствующего логика, помните, он не синячит, он исследует бутылки.
Из книги Никифорова А. Л. "Логика и теория аргументации"
How to solve a maze without AI
Проходим двумерный лабиринт используя Лапласиан https://www.seamplex.com/feenox/examples/maze3.png
Помимо стандартного TDA авторы смотрели еще и на геометрию данных, например, на Ollivier-Ricci curvature на графах
DISCRETE OLLIVIER-RICCI CURVATURE
жулики научились подсовывать левые ссылки на этапе внесения метаданных научных публикаций в CrossRef, чтобы накрутить цитирования и остаться незамеченными https://arxiv.org/abs/2310.02192
We report evidence of an undocumented method to manipulate citation counts involving 'sneaked' references. Sneaked references are registered as metadata for scientific articles in which they do not appear. This manipulation exploits trusted relationships between various actors: publishers, the Crossref metadata registration agency, digital libraries, and bibliometric platforms. By collecting metadata from various sources, we show that extra undue references are actually sneaked in at Digital Object Identifier (DOI) registration time, resulting in artificially inflated citation counts. As a case study, focusing on three journals from a given publisher, we identified at least 9% sneaked references (5,978/65,836) mainly benefiting two authors. Despite not existing in the articles, these sneaked references exist in metadata registries and inappropriately propagate to bibliometric dashboards
Is the cell really a machine? (почему надо помнить, что красивые схемки метаболических путей внутри клетки — упрощение, а на самом деле там стохастичный суп, в котором плавают туда-сюда белки меняя постоянно свою геометрию, реагируя с множеством других молекул и не являются включенными только в одну функциональную пару типа "ключ-замок", что позволяет им быть участником сотни метаболических путей, и именно такая лабильность и изменчивость лежат в основе адаптационного успеха живых систем)
Abstract: It has become customary to conceptualize the living cell as an intricate piece of machinery, different to a man-made machine only in terms of its superior complexity. This familiar understanding grounds the conviction that a cell’s organization can be explained reductionistically, as well as the idea that its molecular pathways can be construed as deterministic circuits. The machine conception of the cell owes a great deal of its success to the methods traditionally used in molecular biology. However, the recent introduction of novel experimental techniques capable of tracking individual molecules within cells in real time is leading to the rapid accumulation of data that are inconsistent with an engineering view of the cell. This paper examines four major domains of current research in which the challenges to the machine conception of the cell are particularly pronounced: cellular architecture, protein complexes, intracellular transport, and cellular behaviour. It argues that a new theoretical understanding of the cell is emerging from the study of these phenomena which emphasizes the dynamic, self-organizing nature of its constitution, the fluidity and plasticity of its components, and the stochasticity and non-linearity of its underlying processes.