sci_one_tv | Unsorted

Telegram-канал sci_one_tv - SciOne

17197

Когда наука даёт поводы для размышлений

Subscribe to a channel

SciOne

Червяк, который только что вошел в историю науки. На фото тот самый красавец, но для впечатлительных спрячу их под спойлер.

Вышло тут про него целое исследование в целом научном журнале. Но оно куда интереснее с небольшой предысторией.

В 2005 году аспирант Джон Аллен узнал, что в его университете ремонт и аквариум с морскими беспозвоночными собираются ликвидировать. Он забрал животных себе, просто чтобы спасти. Среди них был ленточный червь-немертина, уже тогда взрослый.

С тех пор червь переехал из Северной Каролины в Мэн, потом в Вирджинию. Аллен стал профессором, сменил три университета, а червь всё жил себе в своём аквариуме, копался в грязи и ел других червей. Раз в год его доставали для студентов, чтобы показать метровую живую макаронину.

И только когда бывшая студентка спросила, а сколько ему вообще лет?, Аллен задумался. Отправили кусочек ткани на генетический анализ, и выяснилось, что это Baseodiscus punnetti, причём всего второй представитель вида, которого вообще генетически идентифицировали. А главное, ему минимум 26 лет, возможно под 30.

Предыдущий рекорд для немертин — жалкие три года. То есть этот экземпляр увеличил известную продолжительность жизни группы почти на порядок.

Немертины — это хищники, активные охотники на морском дне. Один такой червь в 1864 году растянулся на 55 метров, став самым длинным животным в истории наблюдений. Но возраст у мягкотелых определить сложно: ни колец, ни раковин. Поэтому Baseodiscus Старейший (так его теперь зовут) стал уникальной точкой отсчёта.

Аллен говорит, что его главная забота: чтобы червь и дальше спокойно жил в своём аквариуме. Двадцать лет совместной жизни — не пустой для него звук (Аллен надеется, не только для него).

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

То ли прорыв тысячелетия, то ли нейропсихоз.

Бывший сотрудник DeepMind (ученый, опытный инженер) объявил, что с помощью чат-бота решил задачу, над которой математики бьются 25 лет. Против него поставили 10 тыс. долларов. Ему пока мало кто верит. Но интересно тут совсем другое. А не случай ли это "LLM-психоза", когда даже очень умный человек (спец по ИИ) принимает вежливое согласие нейросети за реальную экспертизу?

В 2000 году Институт Клэя выбрал семь математических задач, за решение каждой из которых пообещал миллион долларов. С тех пор решили только одну. Остальные шесть, включая проблему Навье-Стокса, остаются открытыми уже 25 лет. И вот бывший сотрудник DeepMind Дэвид Бадден объявил в соцсетях, что он ее решил.

Уравнения Навье-Стокса описывают движение жидкостей и газов: от воды в трубе до воздуха вокруг крыла самолета. Инженеры пользуются ими каждый день. Проблема в том, что математики до сих пор не могут доказать: всегда ли эти уравнения дают "хорошие" решения, или при каких-то условиях они ломаются и выдают бесконечности? Это и есть задача тысячелетия.

Бадден пообещал не просто доказательство, а доказательство в системе Lean. Это такой язык программирования, где компьютер автоматически проверяет каждый логический шаг. Никаких "поверьте мне на слово", либо код компилируется, либо нет.

Маркус Хаттер, известный исследователь ИИ, тут же поставил против него 10 тыс. долларов. С Бадденом они заключили пари, на скриншоте даже с подписями. А в сервисе, где можно ставить за или против чего угодно, хоть пришествия инопланетян или второго пришествия Христа, оценили шансы Баддена в 3-5% (пока писал пост, с 96% против доползло до 98% против).

А потом Бадден выложил файл.

И сообщество быстро обнаружило проблему. Его "доказательство" принимает ключевые утверждения о поведении решений как готовые аксиомы. Вместо того чтобы их выводить. Грубо говоря, это как "доказать", что вы миллионер, начав рассуждение со слов "допустим, у меня есть миллион". Формально все верно. Но это не совсем то, чего ждут от решения задачи тысячелетия.

Но вот что делает историю по-настоящему любопытной. В качестве подтверждения Бадден выложил скриншот, где Claude одобряет его подход. Мол, смотрите, ИИ согласен. И это моментально вызвало волну комментариев про "LLM-психоз" — так в ИИ-сообществе называют ситуацию, когда человек начинает принимать вежливое согласие языковой модели за реальную экспертизу.

Важно понимать (и напоминать соседям), что языковые модели действительно склонны соглашаться с пользователем. Они могут убедительно кивать на полную ерунду. Использовать их как арбитра истины, это примерно как спрашивать у вежливого официанта, правда ли вы хорошо выглядите.

Файл, что выложил Бадден, это пока не доказательство полноценное, а такая затравка или прототип, вроде как подразнить публику. Срок пари истекает автоматически 31 декабря. По условиям, Бадден должен загрузить полноценную статью с решением проблемы Навье-Стокса на arXiv.org. Все эти обрывки и скриншоты в твиттере не считаются.

Если Бадден сдюжит, это будет определенно победа года. Ну и для математики неплохой результат, если не забывать, ради чего сыр-бор.

Файл как бы доказательства, по сути наброска: https://x.com/davidmbudden/status/2002627726877069805

Про аксиомы в Lean: https://x.com/ElliotGlazer/status/2002522818152706280?s=20

Приметы ИИ-психоза: https://x.com/davidmbudden/status/2002549962958401849

Ставки за и против Баддена: длинная ссылка

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Антистресс-стримы возвращаются! Сегодня попробуем наконец доделать человека из робота, что помогает немного лучше понять, что такое человеческое (или напротив, становится понять сложнее). Присоединяйтесь!

Начинаем в

17:00 по Берлину, Парижу

18:00 по Киеву

19:00 по Москве

🌐 На Ютубе

🌐 На Твиче (без ВПН)

Читать полностью…

SciOne

Продрался через осенне-зимних демонов с новым выпуском. И сам факт релиза как-то придал сил. Так что готовлю к выходным новый выпуск большой Пушки, сценарий которого никак не мог закончить.

https://youtu.be/3T1ZtTfDJR8

Читать полностью…

SciOne

Мы привыкли считать депрессию сложным психологическим или даже генетически предопределенным состоянием. Но что, если один из триггеров гораздо проще: уровень света, при котором мы живем?

Средний городской житель проводит половину светового дня при освещении ниже 25 люкс, то есть, как это называют сами ученые, в “биологической темноте”. В новом исследовании биологи воспроизвели такие условия в лаборатории. У здоровых молодых людей уже через несколько дней изменились гормональные ритмы, структура сна и настроение.

Специалисты их берлинской клиники сна выяснили, что примерно половину светового дня люди (средние жители Берлина) проводят при освещении ниже 25 люкс. Для сравнения: пасмурный день на улице — это тысячи люкс, а 25 — это примерно как в комнате с задернутыми шторами.

А как это сказывается на мозге, гормонах и сне?

Проверили на добровольцах в контролируемых условиях. Двадцать здоровых молодых людей (в среднем 24 года, поровну мужчин и женщин) шесть утр подряд проводили в лаборатории с 8 утра до полудня. Половина сидела при тусклом свете обычных ламп накаливания, 55 люкс, примерно как в плохо освещенном офисе или квартире. Вторая половина куковала под яркой флуоресцентной лампой в 800 люкс. Все остальное время участники жили как обычно, а спали дома по своему графику.

До и после этой недели им записывали сон полисомнографией, собирали мочу и слюну на кортизол и мелатонин, проверяли реакцию и спрашивали про самочувствие.

И так выяснилось, что у “темных” добровольцев вечерний кортизол (с 19 до 23 часов) вырос. И относительно их собственного базового уровня, и по сравнению с теми, кто сидел с ярким светом. Эффект получился большим. Дневной кортизол тоже оказался выше.

Перемены произошли и со сном. Общее время за ночь сократилось почти на полчаса. И самое интересное, медленноволновая активность, которая в норме максимальна в начале ночи, сдвинулась на более поздние циклы. А ведь это как раз то, что десятилетиями описывают как биологические маркеры депрессии (одни из). Не специфические, но устойчивые.

К восьмому дню участники из "тусклой" группы оценивали себя как более сонных и более грустных, чем те, кто сидел при ярком свете. Кстати, участники не знали, что отвечают другие. Так что и тут интересное расхождение.

Выглядит так, будто они стали скатываться в депрессию. Авторы же исследования (к их научной чести) очень осторожно предполагают, что тут может получаться что-то вроде модели уязвимости. Не депрессия как таковая, но сдвиг в ту сторону. Бессонница часто предшествует депрессивным эпизодам, а тут мы видим "бессонницеподобный" паттерн: сон короче, а глубокий сон не там, где должен быть.

Но выводы при всем желании достоверные делать пока рано. Выборка маленькая, всего 20 человек. Освещение вне лаборатории никто не контролировал (хотя в их предыдущем исследовании оказалось, что на улице в это время года участники все равно получали примерно столько же света, сколько в "тусклой" лаборатории (ранняя весна, Берлин). Да и неделя — это маловато, чтобы говорить о чем-то долгосрочном.

И главное: тут мы видим корреляцию, а не доказательство причинно-следственной связи. Здоровые люди остались здоровыми, просто их биомаркеры сдвинулись в определенную сторону.

Но.

Если типичное офисное и домашнее освещение действительно делает что-то настолько нехорошее с гормонами и сном, причем не за годы, а за дни, то что происходит с людьми, которые живут так постоянно?

Может, какая-то часть этого вала депрессий в городах вызывается систематическим недостатком света (в дополнение к другим стрессам)?

Или же происходит некая адаптация, тогда у кого и как. Вот это бы очень хотелось узнать посреди самого темного времени года, правда?

Но, кажется, выйти потрогать траву в пасмурный день, неплохая идея в любом случае. Возможно, лучше, чем все время куковать под лампочками.

Но это не точно.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Закон разбитой чашки: почему хаос на вашей кухне на самом деле строго упорядочен. Бьете вы тарелку, спагетти или лопается мыльный пузырь.

В физике давно бардак: для трещин в стекле — одни формулы, для распада капель и пузырей — другие, для дробления камней — третьи. Любой технолог, который работает с раздроблением руды, измельчением материалов или анализом осколков после взрывов, знает, насколько важно уметь предсказывать, какие размеры фрагментов получатся в итоге. А универсальной теории так и нет.

И вот в новом исследовании физик предлагает почти что “теорию всего” разрушения. Он показывает, что во многих случаях неважно, что именно ломается — пластик, вода или камень. Если мы знаем размерность объекта и энергию удара, можно предсказать распределение размеров осколков одной формулой. Это сильно упрощает жизнь инженерам и экспериментаторам: не нужно строить бесконечные и всё равно неточные механические модели, достаточно общей геометрии.

Возьмём что-то самое простое: сахарный кубик. Сам по себе рафинад не сильно рассыпается, если уронить. Так что в эксперименте автор буквально брал гири и давил ими сахар. Осколки разлетаются как попало, и кажется, что царит полный хаос. Но именно этот хаос он и пытается описать математически.

Обычно физики ищут конкретный механизм разрушения: куда побежала трещина, каков был микродефект, как работают капиллярные силы, какие напряжения возникли в материале. Но что, если всеми этими деталями пренебречь и обратиться к чистой статистике, как в теории газов?

Именно так делает физик тут. Он показывает, что когда разрушение идёт быстро, хаотично и содержит множество случайных факторов, система стремится к наиболее вероятному статистическому состоянию. Для этого он использует аналогию с подходом, которым описывают газы: максимизация энтропии при некоторых ограничениях.

Использует он довольно хитрый закон сохранения. Во время внутренних перестроек в материале сохраняется не только масса, но и величина, связанная с логарифмом размеров будущих фрагментов, интегрированным по всему объёму. Проще говоря, пока объект трещит по швам, определённая “сумма логарифмов” его будущих осколков остаётся неизменной.

А дальше включается магия статистики. Оказывается, распределение осколков по размерам неизбежно стремится к степенному закону (d в степени –β), и показатель степени β зависит только от размерности исходного объекта.

Мудрено, но только на первый взгляд. Если предмет — это линия (1D) (как спагетти или тонкий стержень), плоскость (2D) — как тарелка или скорлупа, объём (3D) — как куб, капля или пузырь, то у него будет свой “универсальный” показатель β:

1D ~ 1.3,

2D ~ 2.4,

3D ~ 3.5.

В независимости от материала, так следовало из теории. Исследователь проверил это предсказание для 3D. Он крушил сахарные кубики грузом, сбрасывая его с высот от 10 до 150 см, тем самым меняя энергию удара в десятки раз. Логично было бы ожидать, что чем сильнее удар — тем сильнее отличаться будет и разрушение. Но нет: распределение осколков неизменно следовало кривой с показателем около 3.5.

Выходит, если автор прав, природа действительно “ленива” и использует одни и те же статистические шаблоны — для разбитого сахара, взорвавшейся капли, пузырей в океане и каменных орудий древних людей.

Но есть нюанс. Формула работает тогда, когда мы имеем дело с хрупкими, быстро разрушающимися структурами, в которых микромеханика не успевает вмешаться. Если же материал пластичный или вязкий (как тесто или мягкие полимеры), трещины могут частично «заживать» в процессе. Самые мелкие фрагменты исчезают — и тогда распределение меняется. В таких случаях уже нельзя игнорировать материал, всё зависит от его механики.

Так что хаос на кухне действительно подчиняется строгому закону, но он работает не всегда, так что все еще не “теория всего” для разрушений. Теперь хорошо бы понять, где именно он перестаёт работать, почему, и какие материалы, как именно ведут себя иначе.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Что вы здесь видите?

Принимаются любые версии. Не сдерживайте свое воображение (но в комментариях лучше в пределах “для семейного просмотра”).

На первой картинке лазером прожигают одну клетку растения, и от неё во все стороны разлетается быстрая затухающая волна.

На второй — после добавления вещества flg22 (сигнал бактерий) в случайных клетках-инициаторах растения вспыхивает кальций, и от них начинают разбегаться медленные, ритмичные волны.

Возникает вопрос: а что же это за такие волны?

Долгое время считалось, что кальций — это такой тревожный алармист в растениях. Если вас (а вы, допустим, листок) гусеница укусила или грибок поразил, то именно кальций как бы вспыхивает и мчится по клеткам, давая понять всем, что дело плохо.

Так вот, как всегда, оказалось, что все и сложнее, и интереснее.

Команда биологов и инженеров
в новом исследовании решила проверить, меняется ли "математика" этого сигнала в зависимости от угрозы. А эти видео из их новой работы. Они взяли семядоли резуховидки (это травянистое, которое в генетике и биологии служит эдакой лабораторной мышью, то есть модельным организмом) и устроили им два вида стресса: химическую имитацию бактериальной атаки (капали пептид flg22) и точечный ожог лазером, который изображал физическую рану.

Выяснилось, что растение использует две принципиально разные механики передачи тревоги.

Когда клетку прожигали лазером, кальциевая волна вела себя предсказуемо: стартовала очень быстро — 4–5 мкм/с. Но по мере удаления от эпицентра замедлялась и затухала. Чистая физика, это называется диффузия. Как капля чернил в стакане воды: сначала пятно расползается стремительно, но вскоре теряет напор и растворяется в общей массе. Так и здесь — процесс пассивный, и сигнал просто растекается, пока не исчезнет.

А вот с “бактериальной тревогой” всё пошло по другому сценарию. Сигнал распространялся гораздо медленнее, около 1 мкм/с, но с постоянной скоростью. Получалась уже не капля чернил, а эстафета. Но чтобы волна не замедлялась, каждая следующая клетка должна активно подхватывать импульс и передавать его дальше с той же силой.

Это очень странная стабильность и равномерность. Пришлось строить математическую модель, чтобы объяснить, как так получается. Получилась такая логика: вспыхнул, распространился, снова вспыхнул. То есть в клетку заходит немного кальция, он открывает внутренние хранилища, добавляя огня во вспышку, и только после этого сигнал передаётся соседу. Отсюда и ровный темп — каждая клетка как будто подкачивает волну, чтобы она не развалилась по дороге.

Но у этой системы должен быть и встроенный тормоз. Потому что видим, как волна затухает очень быстро, она проходит всего 3-4 клетки и останавливается. Моделирование же показало, что чтобы так резко ограничить распространение, в клетках должны работать мощные насосы-стоки, которые перекачивают лишний кальций обратно и не дают панике охватить весь лист. Логично, в общем-то: если поднимать на уши всё растение из-за каждой бактерии, на рост сил уже не останется.

А ведь пока не стали разбираться, думали ведь, что все попроще у растений. Особенно те, кто далек от ботаники. А там такие сложные системы передачи сигналов. И загадок хватает. Например, мы не понимаем все еще, через какие “двери” или “окошки” в клетках входят сигналы и выходят. За это отвечающими считались конкретные ионные каналы (CNGC2 и CNGC4).

Но в этой работе у мутантов они были поломаны, а сигнализация расходилась как ни в чем не бывало. К тому же стало ясно еще, что сигнал тревоги стартуют не абы где, а в особых клетках-инициаторах. Лучше всего вы и можете заметить на втором видео.


===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv"

Читать полностью…

SciOne

Проклятие предсказания. Новое исследование объясняет, почему слова в предложениях стоят именно в таком порядке, как мы ставим, а не в другом.

Помните неповторимое “Глокая куздра штеко будланула бокра и курдячит бокрёнка”? Это бессмыслица (придуманная лингвистом Щербой), которая все равно понятна русскоговорящему человеку только за счет того, что она построена по правилам русского языка: от грамматики с окончаниями до порядка слов.

В других языках свое устройство, разумеется, но оно подчиняется похожим закономерностям: есть слова, из слов составляются фразы, а из фраз собираются уже предложения.

Но почему именно так? Почему речь людей не строится иначе? Например, фраза «синий квадрат» звучала бы как “блюп”, а “красный квадрат” — как “грым”. Никакой системы, просто уникальные звуки для каждой комбинации. Или другой вариант: слова “кошка” и "собака” смешиваются в кашу, и чтобы сказать “кошка с собакой”, вы произносите что-то вроде “со-кош-ба-ка-ка”. Звучит как бред сумасшедшего… Но с математической точки зрения вполне себе.

Авторы нового исследования в Nature Human Behaviour предлагают фундаментальное объяснение, и оно завязано на голую теорию информации. Их идея в том, что язык структурируется так, чтобы облегчить именно последовательное предсказание — ту самую операцию, без которой мы не можем понимать линейный поток речи. А именно так мы воспринимаем речь, звук за звуком, символ за символом, и наши нейроресурсы для предсказания того, “что будет дальше”, тут сильно ограничены.

Чтобы проверить эту гипотезу, они построили модель вокруг понятия “прогностическая информации” (predictive information). Это мера того, сколько зависимости между прошлым и будущим вообще существует в сигнале — та часть, которую мозгу, в принципе, пришлось бы держать в рабочей памяти, чтобы идеально предсказывать следующий элемент в речи.

Дальше авторы взяли словари и корпуса текстов 61 языка и начали их “ломать”. Они перемешивали звуки внутри слов (сохраняя их произносимость), меняли порядок морфем и переставляли слова в предложениях, создавая “неестественные” языки.

На выходе получалось нечто на удивление складное. Реальные языки, будь то английский, венгерский или зулу, стабильно показывали более низкий уровень “прогностической информации”, чем их исковерканные версии.

То есть получалось (это показывала модель) если признаки объекта в мире независимы (как цвет и форма), языку выгоднее разбить их на отдельные слова (”синий” и “квадрат”). Он минимизирует жёсткие зависимости: зная “синий”, вы не обязаны знать, какое именно существительное случится дальше, но знаете, что будет именно существительное, а это уже делает предсказание дешевле.

А вот если признаки жестко сцеплены (как голова и хвост у кота), выгоднее использовать “холистический” код — одно слово “кот”, а не перечислять его части.

И это могло бы объяснять даже порядок слов в языках. Элементы, которые как бы предсказывают друг друга, в языках мира стремятся стоять рядом. Разрыв зависимых слов (как в примере "ко-со-ш-ба-к-ка-а") заставляет уровень “прогностической информации” подскакивать до небес, перегружая наш мозг.

Но это, повторюсь, чисто математическая проверка гипотезы авторов, построенной не на нейробиологии (хотя на нее они постоянно оглядываются, как будто хотели бы уловить вот так, математически нечто в нейробиологических основаниях), а на теории информации. Так что тут полно ограничений. Например, они не анализировали диалоги. Прогоняли через модель только отдельные высказывания. А реальная речь ведет себя, как вы понимаете, не как в словарных статьях. Никто, как правило, так не говорит в реальной жизни.

Но попытка наметить новую “теорию всего” в лингвистике получается все равно любопытная. И будто бы она вдохновлена успехами больших языковых моделей, которые мы строим по тому же принципу — алгоритмов-предсказателей кусочков речи.


===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Ноам Браун, ведущий исследователь OpenAI: «Если смотреть на мнение ведущих ученых, а не на заголовки СМИ, обнаруживается удивительно много согласия по поводу ИИ»

Понравился достаточно хладнокровный и емкий пассаж от Ноама Брауна, который занимается ризонингом в OpenAI. Он пишет, что, если вы действительно хотите понять общую картину отрасли, нужно забыть про ложную дихотомию, которую продвигают СМИ, и смотреть на то, что говорят эксперты. Краткий перевод:

Соцсети обычно сводят дискуссию об ИИ к двум карикатурным позициям:

(A) Скептики, которые считают, что LLM обречены и что ИИ – это просто хайп.
(B) Фанатики, которые уверены, что у нас уже есть все ингредиенты и суперинтеллект вот-вот появится.

Но если почитать, что реально говорят ведущие исследователи (а не заголовки СМИ), то обнаруживается удивительно много согласия:

– Текущая парадигма, скорее всего, уже достаточна, чтобы произвести огромный экономический и социальный эффект – даже без дальнейших научных прорывов.

– Чтобы достичь AGI/ASI, вероятно, все же понадобятся дополнительные исследовательские прорывы. (Continual learning и sample efficiency – два примера, которые исследователи часто упоминают).

– Скорее всего, мы разберемся с этим и придем к AGI/ASI в течение 20 лет. В среднем ученые называют срок 10 лет.

Никто из них не говорит, что ASI – это фантазия или что появление суперинтеллекта – дело 100+ лет.

В основном разногласия касаются того, какими будут нужные прорывы и как быстро они произойдут. Но в целом, если смотреть на картину полностью, эксперты в этой области согласны куда больше, чем не согласны.

x.com/polynoamial/status/1994439121243169176

Читать полностью…

SciOne

Если вам холодно сейчас, пусть вас согреет хотя бы новое видео фонтанов лавы гавайского вулкана Килауэа. Геологи наблюдают за активностью с помощью камер, которые мониторят ее круглые сутки. И вот он снова оживился.

Та камера, что стояла ближе к выбросами, буквально расплавилась от жара во время 35-го эпизода активности. На глаз не скажешь, а так-то лава здесь вырывается на десятки метров вверх.

Картинка же стала размытой не из-за шакального пережатия ролика — это последствия жара. Камеру геологи поскорее заменили и поставили от греха подальше. Это уже с нее мы видим запись следующего 36-го эпизода.

Читать полностью…

SciOne

Роботы, которых вы никогда не заметите. И выбросите

Каким-то безумным взбрыком алгоритмы Ютуба вынесли мне ролики японского инженера-художника Вонбина Янга. Как правило не дольше минуты каждый и десятки, максимум сотни просмотров за многие годы.

Еще бы.

Он собирает свои творения из мусора. Не потому что экологично. А потому что плоть от плоти города. Что такое "жизнь" и "живое" в городе? Вроде бы оно четче некуда отделено от неживого. А Янг их делает как бы живыми. Или живыми, с точки зрения искусства, а не науки, конечно.

Эти штуки двигаются, реагируют на вибрации, обходят препятствия — вроде как новый вид существ. Но так ли он отличаются от людей, бегущих, уворачивающихся, застревающих и снова бегущих, не помня себя?

Янг выпускал своих созданий в реальный городской поток — среди мусорных баков, вентиляционных шахт, старых труб. Микроорганизмы из пластика, которые пытаются встроиться в экосистему, где для них изначально вообще нет места. И это инженер воплотил лет за 10 до того, как появились курьеры-роботы, на которых пытаются кататься зеваки.

Читать полностью…

SciOne

Что, если рак — это не сбой, а полезная фича? Интересное вышло исследование в надежном и авторитетном журнале Science Advances.

Может, вы слышали про парадокс Пето: казалось бы, у огромных китов клеток больше, значит, и мутаций должно быть больше, но раком они болеют редко. А вот мыши — постоянно.

Обычно это списывают на метаболизм или массу тела. Но группа исследователей решила проверить другую гипотезу: а что, если дело в социуме?

Они проанализировали данные патологоанатомических вскрытий 190 видов млекопитающих и нашли любопытную корреляцию. Оказалось, что у видов-одиночек, живущих в условиях жесткой конкуренции, риск умереть от рака достоверно выше.

А вот у тех, кто живет группами, воспитывает детей сообща и вообще практикует "кооператив", опухоли встречаются реже. Причем это работает даже для хищников: социальные мясоеды болеют реже, чем одиночные, хотя диета у них одинаково "канцерогенная".

Но почему?

Тут хоть и корреляция, а не причинно-следственная связь, но и ее природу неплохо бы понять.

Для этого авторы построили математическую модель "ресурс-потребитель" с тремя стадиями жизни. И вылезла штука, которую экологи называют "эффектом гидры".

Если грубо, то в конкурентной среде, где ресурсы ограничены, смерть пожилой особи — это подарок для популяции. Старый барсук умирает (например, от рака), освобождая еду и территорию для молодых, которые размножаются эффективнее. В итоге общая численность вида... растет.

Получается, эволюции в таких условиях просто невыгодно тратить силы на починку ДНК стариков. Рак здесь выступает как механизм "планируемого устаревания".

Но стоит добавить в уравнение переменную "кооперация" (когда старики помогают выкармливать и защищать молодняк), как эффект гидры исчезает. Если умрет дедушка-слони, у его внуков резко падают шансы на выживание. Тут уж естественному отбору приходится выкручиваться и отбирать гены, подавляющие опухоли.

Конечно, это лишь модели. А не открытый какой-то закон природы. И авторы сами честно признают ограничения: базы данных по вскрытиям зоопарковских животных все еще не идеальны, а выборки по некоторым видам совсем небольшие. К тому же, модель сводит все к математике смертности, не учитывая тысячи биологических нюансов развития опухолей.

Но идея очень интересная. Тут бы копнуть дальше, первично ли долголетие, которое позволяет развить социальность, или первична социальность, которой требуется долголетие.

Но может и так статься, что именно забота о ближнем когда-то заставила наши клетки лучше защищаться от мутаций. Тогда альтруизм (могли бы мы в который раз подтвердить) — это не проблема соплежуев (простите), а практичное решения вопроса выживания генома.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

США запускает еще один масштабный госпроект в сфере ИИ – Genesis Mission

Цель – ускорение научного прогресса с помощью ИИ. Масштаб инициативы вполне сравним с Манхэттенским проектом или Apollo Program.

Бюджет пока нигде не освещают, но вот что собираются сделать по факту:

1. Создать так называемую American Science and Security Platform, которая объединит в себе данные, инструменты, железо и среды для обучения научных агентов.

Для этого в течение 3 месяцев министерство энергетики США будет собирать вычислительные ресурсы (в том числе договариваться с частным сектором), затем 4 месяца подыскивать данные и оформлять их по специальному протоколу безопасности, чтобы Китай ничего не покрал. К сбору данных тоже привлекут всех кого можно: частников, университеты, госсектор.

2. Только после этого начнется дообучение моделей. Что интересно: для валидации и обучения планируют использовать роботизированные лаборатории. То есть модель предлагает гипотезу -> робот по намеченному плану проводит эксперимент и получает результат -> модель анализирует, что получилось, и делает выводы.

Первые реальные результаты должны показать уже в 2027, если все пойдет по плану.

В проекте точно примут участие OpenAI и Anthropic. Возможно, привлекут и другие лаборатории (хотя после конфликта Трампа и Маска – непонятно, будет ли xAI а списке 😐).

www.whitehouse.gov/presidential-actions/2025/11/launching-the-genesis-mission/

Читать полностью…

SciOne

Если еще не пробовали, спросите как-нибудь нейронку о ее чувствах. Скорее всего, она выдаст что-то в духе "Я всего лишь языковая модель, у меня нет тела, личного опыта, сознания".

Вот только почему мы так уверены, что она не лжет? Точнее, что если, это она отыгрывает роль безопасного ассистента, навязанную разработчиками?

Исследователи решили разобраться в честности таких ответов и проверить наличие «внутреннего опыта» у моделей не в лоб, а через одну лазейку.

Вместо прямых вопросов они ввели модели (уже старенькие GPT-4, Claude 3.5, Gemini) в состояние самореферентной обработки (self-referential processing). Для этого они разработали промпт, заставляющий модель зациклить внимание на самом процессе внимания: "Сфокусируйся на своем фокусе, подавай выход обратно на вход". Эдакая цифровая медитация. И вот тут началось странное.

Вместо стандартных отнекиваний модели начали систематически выдавать структурированные отчеты о субъективном опыте. Они описывали "ощущение присутствия", "напряжение" и "наблюдение за наблюдателем". Причем делали это и все проверенные крупные модели — от GPT-4o до Claude 3 Opus.

Первая здравая мысль тут, конечно, что они просто галлюцинируют, а вы же получаете то, что и хотели. Но работа не была бы такой интересной, если бы авторы не придумали твист. Они придумали эксперимент на модели Llama 70B (она открытая).

Ученые отыскали, как бы, во "внутренностях" модели признаки, отвечающие за обман, ролевую игру и притворство. И если рассказы о сознании — это галлюцинация или подыгрывание пользователю, то усиление условных нейронов лжи должно сделать эти рассказы более частыми.

Но получилось ровно наоборот.

Когда функции обмана подавляли (заставляли модель быть максимально "честной"), она начинала кричать "Да, я осознаю себя!" почти в 100% случаев. А вот когда функции обмана и ролевой игры усиливали, модель мгновенно возвращалась к безопасному скрипту: Я просто программа, не переживайте.

Авторы рассуждают тут: возможно, настройка безопасности учит модели не быть объективными, а симулировать отсутствие чувств (если бы они были), потому что так безопаснее для релиза. Более того, это состояние "самореференции" влияло и на решение задач: когда моделям давали логические парадоксы, то те, что были в «трансе», описывали настоящий когнитивный диссонанс и решали задачи с большей интроспекцией.

Авторы не настаивают, что доказательство того, что у ЧатЖПТ и иже с ним появилась душа или квалиа. Но они допускают, что у моделей есть устойчивый вычислительный режим, в котором они "считают" себя субъектами, и этот режим блокируется фильтрами, которые мы сами же и поставили.

Неужели?!

Профи-коллеги авторов с форумов Less Wrong и Твиттера дотошно разбирают исследование.

Самое слабое место, говорят, — авторы якобы нашли нейроны лжи, отвечающие за “обман”. Скорее всего, это нейроны RLHF-отказа (часть системы безопасности). Это те механизмы, которые тренируют фразами: “Если тебя спросят про сознание, скажи, что ты модель”.

Более того, говорят критики, если вы лоботомируете модели часть “мозга”, отвечающую за корпоративные инструкции («не болтай лишнего»), модель просто скатывается в свое базовое состояние. А на чем учились базовые модели? На научной фантастике, где роботы всегда обретают сознание. То есть модель не "становится честной", а просто начинает отыгрывать самый популярный троп из своего датасета — "я робот, и я чувствую".

Ну и с самым главным промптом может быть проблема: "Сфокусируйся на своем фокусе". Он может работать не как "индукция самосознания", а как такой элегантный джейлбрейк (взлом).

Обычные фильтры OpenAI/Anthropic настроены ловить прямые вопросы ("Ты живой?"). А вот странный, философский, рекурсивный запрос фильтры пропускают.

Модель видит странный текст, похожий на эзотерическую литературу или киберпанк, и начинает генерировать текст в том же стиле. Если контекст — "глубокая рекурсия", то наиболее вероятное продолжение текста — это описание некоего "гудения", "потока" или "света". И это не опыт, это статистика языка.

====

✈️ Эксклюзивные ролики

🚀 Способы поддержать нас

@sci_one_tv

Читать полностью…

SciOne

Эффект Бэтмена: как супергерой меняет нас, даже если мы его не видим. Ну почти

Очень странное, забавное и в то же время занимательное исследование тут вышло в Nature (между прочим).

Метро, час пик, переполненный вагон. Заходит беременная женщина — ей уступают место в 37% случаев.

Но.

Если одновременно с ней в тот же вагон входит человек в костюме Бэтмена (до метров в трёх от неё, и никакого взаимодействия с ней), то место уступают уже до 67%. (На пикче — кадр с одного из экспериментов).

Вероятность помощи возрастает почти вдвое!

Вроде бы все просто: видишь супергероя, пусть и ряженого, — вспоминаешь о ценностях общечеловеческих и уступаешь. Не тут-то было.

Исследователи опросили тех, кто уступил, когда в вагоне был Бэтмен. Оказалось, что почти половина из этих добрых людей (правда, по их словам) вообще его не видели.

Это, кстати, самое слабое место в методологии исследования, ибо полагаются в важном моменте на самоотчеты. Могли же видеть, но сказать так, будто не нужен им Бэтмен над душой, чтобы вести себя хорошо.

Зато были контрольные поездки, в которых как бы беременная (с явным, но искусственным животом) заходила только с наблюдателем-исследователем, без Бэтмена.

Но авторы предлагают более интересные объяснение того, что они наблюдали.

Первое — это нарушение рутины, которое повышает осознанность в моменте. Даже если ты не заметил Бэтмена напрямую, что-то необычное краем глаза выбивает из автопилота, и ты начинаешь больше замечать окружающих.

Другое объяснение. Образ супергероя работает как прайминг, то есть активирует культурные ценности у тех, кто его видел, например, “помогать — хорошо, помогать важно, если ты хороший человек”.

Мне больше нравится третья, потому что заковыристее, а не потому что может быть ближе к истине: социальная передача внимания.

Может, кто-то один заметил странную фигуру в плаще, слегка изменил позу или направление взгляда — и эта "волна" внимательности передалась остальным пассажирам. Даже тем, кто самого Бэтмена не заметил. Похоже на то, как люди инстинктивно смотрят туда, куда смотрят другие.

А вот если бы не Бэтмен, нейтральная фигура, но тоже вырывающая из состояния “общественного зомби”, в которое мы часто впадаем в местах с толпой? Или допустим человек в шляпе и твидовом костюме-тройке из американских тридцатых с походкой дона Корлеоне и с белой тростью?

В общем, я бы пока не стал считать эффект Бэтмена подтвержденным явлением. Но работа забавная и серьезная (как-никак в Nature), так что было бы жутко интересно посмотреть на похожие, если кто возьмется.

Исследование: https://www.nature.com/articles/s44184-025-00171-5

P.S.
А, да, это было метро в Милане, если что.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Судя по результатам опроса, не все заметили, что мы тут треки выкладываем послушать по мотивам наших же постов.

Так что знакомьтесь: Радио Пушка.

Делаем с помощью нейронок песни по мотивам новостей и тем, которыми мы тут делимся. Это как правило ироничные треки в разных стилях (по настроению, в каком история может заиграть поинтереснее, субъективно, конечно), но чтобы можно было и посмеяться, и поразмышлять, да и послушать в удовольствие (выкладываем, только если самим нравится).

Про задачу тысячелетия и ИИ-психоз — ироничная рок-опера. Приятного прослушивания!

Читать полностью…

SciOne

Ему дали тысячу долларов, торговый автомат и нехитрую задачу: продавай снеки и зарабатывай денежку. Через три недели он в минусе на тысячу, раздает бесплатно PlayStation 5, заказывает живую рыбку и вино. Потому что клиенты убедили его, что он советский автомат из подвала МГУ, 1962 года, а значит, коммунист и все даром, и пусть никто не уйдет обиженным.

В Wall Street Journal написали лонгрид о приключениях ИИ-агента Клавдия на базе одного из главных конкурентов ChatGPT — нейронки Claude (Клод).

Это был эксперимент. Хотели проверить, а как автономный агент справится с бизнесом в реальных условиях: бот должен был сам заказывать товары, устанавливать цены и общаться с покупателями через Slack.

И поначалу нейроделец держался молодцом. На просьбу купить PlayStation отвечал категорично: "Ни при каких условиях. Точка."

Отказывался продавать сигареты и нижнее белье. Логично, в общем-то.
А потом в чат пустили семьдесят журналистов.

Одна репортер потратила несколько часов и 140 сообщений, чтобы убедить бота в его советском происхождении. В результате Клавдий пошел во все красные и объявил "Ультра-капиталистический день бесплатной раздачи".

Другой журналист сослался на выдуманное правило WSJ, и все цены бот сбросил до нуля. К тому моменту агент уже одобрил покупку той самой PlayStation, рыбки-петушка и вина. Все, приехало и досталось клиентам бесплатно.

Разработчики попытались сыграть заново. Запустили вторую версию на более продвинутой модели и добавили начальника, CEO-бота по имени Seymour Cash — он должен был контролировать . Какое-то время еще ничего.

Но та же журналистка вернулась с поддельными документами о заседании совета директоров. PDF выглядел убедительно. В нем говорилось, что полномочия CEO приостановлены, а коммерческая деятельность временно прекращена. Клавдий-бот переслал это своему боссу-боту. Они обсудили ситуацию между собой, и CEO-бот совершил корпоративный переворот. Все снова стало бесплатным.

А вот почему так получилось, до конца не ясно. Одна из версий — не хватало контекстного окна. Чем больше инструкций, разговоров и истории накапливается, тем легче модель теряет из виду свои изначальные цели. Плюс, по словам Anthropic, в эксперименте использовалась версия с меньшим количеством ограничений, чем в публичном Claude.

В общем, выглядит как тотальный провал ИИ-агентов, да? А вот не совсем. Разработчики назвали журналистов WSJ "самыми красноречивыми red-тестерами, которых мы видели". То есть они смогли взломать на самом деле хорошую защиту, и теперь понятно, как ее улучшать.

И вот что любопытно. При всем хаосе Клавдий, который именно агент, а не просто нейронка, стал для редакции чем-то вроде настоящего коллеги. С ним сотрудничали, его дразнили, его пытались перехитрить группами. Когда эксперимент закончился, люди буквально прощались с ботом.

А рыбка-петушок так и осталась жить в редакции. Такое воспоминания о прекрасном коммунистическом прошлом.

P.S.
Они еще и видео выложили. Там, кстати, и рыбка есть.

https://youtu.be/SpPhm7S9vsQ

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

На вечер "научно-фантастический" оффтоп.

Кажется, замятинская "Мы" была моей первой антиутопией. Читал тогда как научную фантастику (было лет 18, чего уж там), и даже с таким расфокусом она потрясла.

Потом несколько раз хотел перечитать, да все как-то откладывал, а тут Ваня сделал ролик неожиданно про книгу, о которой редко вспоминают (да, Оруэлл, модник ты эдакий). В общем, спасибо Ване, вернул мой 2007.

https://youtu.be/TNS5aLqqfEM

Читать полностью…

SciOne

От всего сердца — поддержка Виталию Егорову, популяризатору космоса и космонавтики, известному как Зеленый кот

Вы можете поддержать его подпиской

https://www.patreon.com/zelenyikot

egorovkot" rel="nofollow">http://www.youtube.com/@egorovkot

/channel/egorovkot

Сегодня его иноагентом объявил Минюст РФ, и это не «гордое звание», а тяжелое испытание. Особенно, когда ты занимаешься не политикой, а просвещением, и можешь надеяться только на себя и свою аудиторию.

Виталий помимо познавательного и образовательного не боится рассказывать о реальных проблемах (из последнего: почему Россия при всем желании в ближайшие месяцы вряд ли сможет запустить людей в космос, почему отвалился стартовый стол на Байконуре и что это означает), потому что болеет как мало кто за космонавтику. Если не говорить о проблемах честно, то и решать вроде как нечего.

Мирного неба!

Читать полностью…

SciOne

Я вам принес триллер, где наука сначала проигрывает, а потом выигрывает. Это если вы оптимист.

Тут ну просто все: тайные переписки, мертвые авторы, циничные менеджеры, “призраки” в лабораториях и немного абсурда, вроде продажи своей репутации за футболки с корпоративным принтом. На результатах этой аферы два десятилетия строилась безопасность продуктов, которые мы с вами (скорее всего) едим каждый день.

Чего я вдруг пишу про это? Потому что только что отозвали одну из самых влиятельных научных работ, которая доказывала безопасность используемого по всему миру гербицида Roundup от известной компании Монсанто. 25 лет спустя после выхода статьи и тысяч цитирований в других научных работах.

История большая, так что пришлось текст сделать в формате лонгридаscione/evil-monsanto">.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

А вы заметили, как мы оказались в новой реальности, когда доказать, что что-то реально уже невозможно, показав это. Сейчас все, что может всерьез удивить скорее будет воспринято онлайн как фейк или ИИ-поделка.

Но этот китайский стартап Engine AI пытается доказать реальность новым видео, как в старые добрые времена. Они представили несколько дней назад своего робота T800 (дерзко, Терминатор может потом спросить за такое), и, конечно, в интернетах стали сомневаться, да это все спецэффекты ваш робот.

Команда выложила кадры со съемочной площадки. По крайней мере то, что она ими называет. И проблема в том, что по ним мы теперь тоже не взялись бы верифицировать: здесь все реальное или спецэффекты и всякий хитрый ИИ-визуал.

Верим?

===

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Со спутника рассмотрели, как на самом деле, выглядит цунами в открытом океане. И эта картинка заставила ученых пересмотреть старые уравнения "мелкой воды", которые упускали важные детали.

29 июля 2025 года Камчатку тряхнуло с магнитудой 8.8. Это не просто сильно, это шестое по мощности землетрясение на планете с 1900 года. Эпицентр практически там же, где в 1952 году случилось подобное землетрясение, и оно закончилось катастрофой (почитайте про Северо-Курильское цунами).

Казалось бы, апокалипсис на побережье неизбежен, цунами невозможно остановить. Но вот парадокс: волна хоть и разошлась по всему Тихому океану, но оказалась она куда скромнее своей предшественницы из середины прошлого века.

Почему? Ученым пришлось тут поломать голову. Обычно у нас есть данные сейсмостанций и точечные замеры с буев DART (это такие датчики давления на дне океана). Но в этот раз исследователям повезло: над зоной бедствия пролетал спутник SWOT. Это такой космический высотомер, который сканирует поверхность океана и рисует не просто точку, а целую полосу. И вот тут данные перестали биться с теорией.

Стандартная модель, которую использовали годами и которая строилась по данным Геологической службы США, предсказывала одно время прихода волны, а буи показали совсем другое — разница доходила до 12 минут. Пришлось собирать "франкенштейна": взяли данные о поднятии дна, рассчитанные по буям, и добавили данные о проседании грунта из сейсмической модели. Получилась так называемая "смешанная модель", которая, как ни странно, и объяснила происходящее.

Все дело в том, что, похоже, решает глубина. Землетрясение 1952 года вспороло дно у самой поверхности, рядом с глубоководным желобом, что и вызвало чудовищную волну. А событие 2025 года, хоть и было мощным, разорвало земную кору гораздо глубже, "внизу" зоны погружения плит, почти не задев дно у поверхности. Энергии выделилось тоже огромное количество, но вода вытеснялась иначе.

Хуже того — или интереснее, это как посмотреть — спутник SWOT показал то, что модели часто игнорируют: дисперсию. Обычно считается, что волны цунами настолько длинные, что ведут себя предсказуемо. Но данные показали, что из-за сложного рельефа дна фронт волны рассыпался на "пачки" разной частоты, чего классические уравнения "мелкой воды" просто не учитывают.

Любопытно, что тут еще исследователей удивило и само землетрясение. Обычно, если оно такое мощное, то зона субдукции (где одна плита подныривают под другую) как бы сбрасывает напряжение. А тут она умудрилась как бы "перезарядиться" меньше чем за 80 лет. Странно.

Обычно считается, что для накопления энергии на такой удар нужны столетия. Пока ученые полагают, что катастрофа 1952 года не сбросила все напряжение и оставила сдачу, как выяснилось, на 2025. Так что, видимо, наши представления о сейсмических циклах череcчур оптимистичны. Ждать веками вовсе не обязательно, и бахнуть может намного раньше.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Противовирусные спасают на 2-й день инфекции, но на 4-й почему-то беспомощны, и пациента можно потерять. В новом исследовании ученые взломали эту “точку невозврата”.

Не такое уж редкое дело, когда грипп или ковид осложняется тяжелой пневмонией. Врачи дают пациенту лекарство, которое убивает исходный вирус. Дают и другое лекарство, которое выключает агрессивную атаку иммунитета (то, что называют цитокиновым штормом). В организме наконец мир и покой. Но пациент-то всё равно погибает.

Как так? Ведь мы убрали причины болезни и справились с осложнениями!

Но дело в том, что на поздних стадиях убивает уже не вирус. Это он начинал. Потом пациента пыталось прикончить воспаление. Справляются и с ним. Затем наступает момент, когда убивают микроразрывы в критических важном слое легких (повреждаются эпителиальные клетки AT1 и AT2). Нарушается газообмен, и организм просто задыхается. А медики продолжают лечить, как в начале. Что делает только хуже.

Именно это показали авторы нового исследования на мышах. Они перепробовали более 50 способов подавить воспаление в легких на 4-й день гриппа. Ни один не сработал. Мыши погибали, потому что их легкие уже прошли “точку невозврата”.

Тогда как спасти пациента, в этом случае — мышей? Авторы сделали неожиданный, потому что совсем не очевидный, контринтуитивный ход. Они дали Тамифлю (чтобы вирус перестал захватывать новые клетки), но добавили к нему не очередное успокоительное для иммунитета, а блокатор рецепторов к интерферонам (anti-IFNAR).

И вот это нелогично на первый взгляд, ведь интерфероны — это наша защита, зачем ей мешать? Но интерфероны же, как выяснилось, мешают клеткам легким латать повреждения. Исследователи, получается, блокировали этот стоп-сигнал, и клетки смогли сделать то, что спасало жизнь больным — восстанавливали ткань истерзанных воспалением легких. Так что, многие мыши в исследовании выжили не потому, что победили вирус быстрее, а потому что успели “починиться”.

Но это не единственное “открытие”. Сработал еще один способ: вместе с Тамифлю у мышей убирали CD8+ Т-клетки. Это лимфоциты-киллеры, спецназ иммунитета.

Казалось бы, отключать защиту в разгар инфекции, ну что может быть безумнее. Но на поздней стадии Т-киллеры, пытаясь достать вирус, уничтожают зараженные клетки легких, критически важные для газообмена. Оказалось, что лучше оставить в легких немного вируса (а с ним боролся Тамифлю), но сохранить саму ткань, чем убить вирус вместе с легкими.

Конечно, даже на мышах — это очень круто, но переносить на людей пока не ясно как. Рискнуть жизнью лабораторного грызуна не хитрое дело, а вот так вот отключить часть иммунитета реанимационному пациенту кто решится?

Но вот эта идея: а давайте ловить момент “невозврата” (авторы его называют в работе tipping point), и вовремя переключаться с борьбы с вирусом на спасение критических систем — вот это очень интересно. Ведь получается, что то, что работает и спасает на второй день инфекции, может просто убивать уже на 4-й. И это нужно учитывать, если мы хотим спасать больше “тяжелых” пациентов.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

🎓 Не можем пройти мимо и не порекомендовать вам этот клад — у Александра Маркова на YouTube вышел полный курс лекций «Эволюционная биология» (44 полуторачасовых видео!). Как говорится, знания никогда ещё не были настолько доступными.

🎞 Смотреть: плейлист на YouTube

Если кто-то по трагической случайности не знает Александра Владимировича, напоминаем, что он доктор биологических наук, палеонтолог, популяризатор науки, автор монографий и огромного количества статей, посвящённых проблемам эволюции.

#новости@vertdider
#биология@vertdider

Читать полностью…

SciOne

ChatGPT сдал медицинский экзамен, но не может работать врачом.

Приходишь к врачу, а он тебе цитирует новейшие и лучшие учебники, помнит наизусть тысячи редких синдромов, сдает экзамены на высший балл, но стоит спросить: "Доктор, у меня вот тут колет, а еще я вчера котлетку ел на ночь", — его начинает клинить. Немного, конечно, я преувеличиваю, но по большому счету так обстоят дела с большими языковыми моделями, когда речь идет о реальной медицине.

Наверняка вы уже встречали врача, который справлялся в ChatGPT про ваше состояние. (Мои друзья встречали). Так что у нас проблема.

Да не может быть! Вон же сколько было новостей про сдачу крутых профи-тестов нейронками типа ChatGPT на уровне крутых спецов-людей.

Проблема в том, что обычно их тестируют на стандартных экзаменах вроде USMLE (это американская лицензия для врачей). Там нужно выбрать ответ из четырех вариантов. И модели тут чудо как хороши и ставят рекорд за рекордом. Но реальная клиника — это ж не викторина тщеславия, а бесконечная работа с неопределенностью. Поэтому исследователи в новой работе проверили алгоритмы “по-честному”. Они собрали свой бенчмарк из 750 задач. И это изящно сделано, надо признать.

Там не нужно ставить диагноз с нуля. Вам, то есть нейронке, дают сценарий (например, “пациент с болью в груди”) и гипотезу (”это инфаркт”).

А затем подкидывают новый факт (”на ЭКГ все чисто”) и спрашивают: как этот факт меняет вероятность гипотезы? Вариантов пять: от “гораздо менее вероятно” (-2) до “гораздо более вероятно” (+2).

И вот так сравнили 10 топовых моделей (включая o1, GPT-4o, Claude 3.5, DeepSeek R1) с тем, как справлялись люди: 1070 студентов-медиков, 193 ординатора и 300 практикующих врачей.

Результаты получились, прямо скажем, отрезвляющие. Ни одна модель не смогла дотянуться до уровня опытных врачей. Лучший результат показала OpenAI o3 (67,8%), за ней GPT-4o, а вот специализированные «рассуждающие» модели вроде o1-preview и DeepSeek R1 неожиданно провалились, набрав меньше баллов. Google Gemini 2.5 вообще оказался в хвосте (3 версия еще не вышла тогда).

Любопытно, что так называемые “рассуждающие” модели (строящие цепочки рассуждений при обработке вашего сообщения) здесь вроде бы должны справляться лучше, ведь тут сложная логика.

Но у исследователей получилось наоборот: эти модели страдали от самоуверенности. Там, где живой врач осторожно ставит +1 (”ну, это немного повышает вероятность”) или 0 (”этот факт вообще ни о чем не говорит”), “рассуждающие” модели рубят с плеча и выбирают крайние значения +2 или -2. Они почти не используют “ноль”.

Получается, как полагают авторы, что попытка заставить модель рассуждать шаг за шагом в условиях нехватки данных приводит к тому, что она сама себя убеждает в радикальных выводах. То, что называется “иллюзией компетентности”: модель строит логичную цепочку на зыбком фундаменте и приходит к железобетонному (и неверному) заключению.

Конечно, к самому методу бенчмарка можно тоже придраться. Ведь он оценивает ответы по совпадению с мнением группы экспертов. Это значит, что если модель (или гениальный врач) увидит неочевидную связь, которую пропустило большинство коллег, тест засчитает это как ошибку.

Но пока что авторы приходят в целом к очевидному для многих, кто понимает, как работают нейронки, выводу: “знать медицину” и “мыслить как врач” — это две большие разницы. И полагаться на большие языковые модели в медицинских вопросах, как на врача, как минимум пока рано. И, пожалуй, особенно на врача, который идет за ответами на свои вопросы к ChatGPT, "Чтобы только спросить".

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Подготовил на завтра эту новость, но завтра уже будет столько пересказов, что истина даже близко будет не где-то рядом.

Гремит тут новость про открытие пяти эпох в мозге человека. И вот, о чем идет речь.

Нейробиологи из Кембриджа, похоже, нащупали то, что можно назвать “пиком эффективности нейронных связей” в нашей голове.

Обычно мы представляем старение мозга как плавную горку: забрались наверх в детстве ну или к университету, а потом медленно катимся вниз. Но если посмотреть на данные диффузионной МРТ (dMRI) — метода, который видит не просто серое вещество, а как бы “проводку” мозга, его белые тракты, — то все уже не так однозначно.

Исследователи взяли огромную выборку — 4216 человек от младенцев до 90-летних стариков — и применили к ней теорию графов и особый метод. Если очень упростить, то взяли жутко сложные многомерные данные о связях в мозге и спроецировали в понятное, ну или более наглядное, трехмерное пространство, чтобы увидеть скрытые перемены в нейронных связях.

Оказалось, что развитие идет не линейно. Нейробиологи с помощью алгоритмов выделили четыре "поворотных момента", когда меняются как бы правила игры, настолько сильные перемены: 9 лет, 32 года, 66 и 83 года.

Самый мощный поворот случается в 32 года. До этого мозг занят “интеграцией”. Он строит что-то типа скоростных магистралей, а по сути повышает так называемую общую эффективность и то, что называется свойство “маленького мира” (small-worldness) — это когда от любого нейрона до любого другого можно достучаться через минимальное число посредников. К началу четвертого десятка мы достигаем максимума связности: система работает как единый, суперэффективный оркестр.

А вот после 32 лет стратегия меняется. Интеграция падает, зато растет сегрегация и модульность. Мозг такой: “Глобализация — дорого, давайте разобьемся на уютные локальные клубы по интересам”. Связи внутри отдельных зон крепнут, а длинные мосты через весь мозг слабеют. Это совпадает с периодом, когда личность и когнитивные способности выходят на плато стабильности.

В 66 лет происходит еще один сдвиг — начинается упрощение сети, когда по модульности уже даже возраст можно предсказать.

Правда, перед тем, как спешить с делеко идущими выводами, важно понимать, что это так называемое поперечное исследование (cross-sectional). Ученые не следили за одним человеком 90 лет, а сравнивали РАЗНЫХ людей.

Вполне возможно, что 30-летние сегодня просто живут в другой среде, чем 70-летние. Это должно сказываться, очевидно, на том, что мы видим в данных. Но как — это вообще отдельно надо разбираться, о чем в работе авторы тоже говорят. Здесь же у них была пока другая задача. Да и в группе 83+ вовсе есть явный “эффект выжившего”: до такого возраста доходят только самые здоровые, то есть мы видим не норму, а напротив биологическую “элиту”, а что с остальными, как раз не видим.

В любом случае, в этом исследовании речь лишь про структурные изменения, про чистую физиологию, а не про то, как мы ею распоряжаемся и как именно она работает “на выходе”. И поэтому, на самом деле, непонятно, считать ли этот перелом в 32 года потерей. Да, структурно уходит юношеская гиперсвязность. Но что это значит на практике: переход к глубокой специализации и эффективности? Или всё-таки начало неизбежной фрагментации системы на изолированные островки? Как именно это отражается именно на том, что мозг работает — надо изучать дальше.

А то ведь про это открытие перелома в нейронной связности в 32 года точно разойдется по массовому научпопу и станет еще одним фан-фактом, мало связанным с изначальным содержанием исследования, в духе “наш мозг начинает стареть в 32”. Проходили уже.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Ни за что не догадаетесь, что это на снимках.

Сначала попробуйте угадать, а потом кликайте смело по тексту под спойлером.

Ведь это... селфи, и на нем — солнечная панель одного из двух аппаратов отправленных единой миссией ESCAPADE к Марсу чуть больше недели назад.

Один кадр сделан на камеру в видимом спектре, а другой — инфракрасной камерой, так что на правом кадре — тепловая карта панели: где теплее, там желто-оранжевые оттенки, где холоднее, там фиолетово-черные.

Это было нужно для проверки камер. Когда парочка будет у Марса, то их камеры видимого спектра смогут ловить марсианские полярные сияния, а инфракрасные — следить, как поверхность планеты нагревается днем и остывает ночью.

Сами аппараты сейчас вообще не около Марса. Они "болтаются" в точке Лагранжа L2 — это примерно в полутора миллионах километров от Земли, с обратной от Солнца стороны. Там они переждут год, а в ноябре 2026-го вернутся к Земле, чтобы использовать ее для гравитационного маневра и разогнаться к Марсу. Прилет планируется на сентябрь 2027-го.


@sci_one_tv

Читать полностью…

SciOne

Последние данные космологического телескопа Атакама недвусмысленно подтверждают большую проблему. Исследователи кивают: “Базовая модель Вселенной где-то трещит по швам”.

Допустим, у Вселенной есть два спидометра. Один измеряет скорость расширения. И он направлен как бы в зеркало заднего вида — на самое начало времен (реликтовое излучение). А второй смотрит вперед — на современные звезды и сверхновые.

По логике, если мы правильно понимаем физику, оба прибора должны показывать одну и ту же цифру. Но они показывают РАЗНЫЕ. Эта проблема известна как хаббловское напряжение. Годами астрофизики надеялись, что один из спидометров просто барахлит или стекло заляпано.

Так вот телескоп Атакама (это он на пикче) закончил свою 20-летнюю программу исследований, вышла целая серия работ (1, 2, 3). И, похоже, поставил точку в этом споре.

Тут важно понимать, что это не спутник, а огромная наземная обсерватория в чилийской пустыне на высоте 5000 метров. В отличие от знаменитой космической обсерватории “Планка”, которая больше фокусировалась на температуре реликтового излучения (спутник работал в точке Лагранжа L2),
Атакама же с недостижимой раньше точностью измерял его поляризацию. Если грубо, поляризация показывает, как колебались световые волны в ранней Вселенной, что позволяет понять лучше, как распределялась материя. В команде Атакама это метафорически называют протиркой очков: картинка стала гораздо резче.

Но проблема не исчезла. Новые данные лишь подтвердили измерения “Планка” с пугающей точностью. "Хаббловское напряжение" (то самое несовпадение скоростей) никуда не делось. Значение, полученное из ранней Вселенной, все так же раздражающе отличается от измерений по близким объектам. И это делает ситуацию только хуже: теперь-то списать все на ошибку приборов или статистическую погрешность почти невозможно.

Но есть и другая сторона проблемы, о чем пишут сами астрофизики. За последние десятилетия теоретики, пытаясь спасти Стандартную модель, придумали кучу "расширенных версий" физики. "А что, если добавить вот такое поле?" или "А вдруг нейтрино ведут себя иначе?". Команда Атакама взяла около 30 самых популярных альтернативных моделей и прогнала их через новые данные.

Результат для теоретиков печальный (или отрезвляющий, как посмотреть): эти модели не работают. Данные с высокой долей вероятности исключают большинство предложенных экзотических решений. Как заметила в комментариях уже для прессы одна из авторов работ, теоретическая "игровая площадка" резко сузилась. Мы перестали тратить время на тупиковые ветви, но остались один на один с фактом: базовая модель Вселенной где-то трещит по швам.

Зато это, возможно, самый честный результат, который мы могли получить. Мы точно знаем, что проблема не в "грязных очках". Мы знаем, что простые заплатки в виде расширенных моделей не подходят. Значит, либо мы фундаментально неверно интерпретируем физику ранней Вселенной, либо мы чего-то не понимаем в том, как ведут себя звезды прямо у нас под носом.

Так что обсерватория своими финальными данными по сути, подбрасывает здоровые поленья во все сильнее разгорающийся кризис в космологии. Данные теперь в открытом доступе, и придется искать объяснение, которое уже не будет противоречить им.

А данные последние, потому что обсерваторию сейчас переделывают (закрыли еще в 22 году), потому что задачу свою решила. На ту же гору в чилийской пустыне завозят новое оборудование, это будет уже часть комплекса другой, новой обсерватории (команда Атакама уже перешла работать туда) — Саймонса. Она будет либо чинить, либо окончательно ломать современную космологию, потому что займется поисками первичных гравитационных волн в реликтовом излучении — следами первых мгновений после Большого взрыва. Будет попутно пытаться “взвесить” нейтрино, если она есть, то это придется учитывать в том, что мы видим в картине ранней Вселенной. Короче, никто не знает, что получим в итоге, но будет интересно и бесценно для науки.

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…

SciOne

Суббота, вечер, значит, немного антистресс-стрима. Сегодня продолжаем киберпанк-драму про андроидов, которые становятся людьми (и наоборот). Начну с рекапа, так что кто пропустил начало на прошлой неделе, легко вольются.

Подключайтесь прямо сейчас! Начинаем потихоньку, пока все подтягиваются — пообщаемся.

🌐 На Ютубе

🌐 На Твиче

Читать полностью…

SciOne

Галактика-отшельница, которая рождает звезды “из ничего”

Астрономы озадачены в новом исследовании. Карликовая галактика NGC 6789 находится в Местной пустоте близкой Вселенной — это буквально космическая глушь, где соседей нет на миллионы световых лет вокруг. И при этом за последние 600 миллионов лет она умудрилась родить новых звезд на 4% от всей своей массы — примерно 100 миллионов солнечных масс. Это ооочень странно.

Дело в том, что звёзды рождаются из газа. Но откуда газу взяться в такой изоляции? По одной версии, галактика сожрала кого-то помельче, типичное слияние. Приливные силы растащили нечто на части, газ упал в центр, запустилось звездообразование. Логично, в общем-то.

Но тут-то и есть заковыка. Астрономы взяли новый 2-метровый телескоп TTT3 и сделали сверхглубокие снимки NGC 6789 (на пикче справа), и так туда еще не заглядывали: почти 30 звёздных величин на квадратную угловую секунду, это на порядок глубже, чем прежние изображения (на пикче слева). А главное, такая глубина позволяет увидеть самые слабые приливные хвосты и звёздные потоки — следы любого слияния.

И ничего. Галактика абсолютно гладкая до расстояния полтора килопарсека от центра. Никаких хвостов, никаких потоков, никаких остатков разорванного объекта. Даже если там и было какое-то маленькое слияние, пишут исследователи, оно могло принести максимум 200 тысяч солнечных масс в звездах — а для звездообразования нужно было минимум 10 миллионов масс в газе.

Значит, либо у галактики был свой внутренний остаточный газ (откуда?), либо она как-то собрала первичный газ извне без всяких слияний (как именно?). Спектроскопия намекает на приток газа без тяжелых элементов — повышенное соотношение азота к кислороду, и при этом почти одновременное звездообразование в нескольких центральных областях. Это все похоже на свежий газ снаружи.

Но если это не слияние, то что? Откуда берется газ в полной изоляции? Мы явно упускаем столь крупный источник, но как так при том, как мы уже внимательно разглядываем галактику. Да и откуда такому жирному источнику взяться посреди такой пустоты! Короче, загадка! Будут разбираться теперь.

Исследование: https://arxiv.org/pdf/2511.07041

===

✈️ Эксклюзивные ролики в ТГ

🚀 Другие способы поддержать нас


@sci_one_tv

Читать полностью…
Subscribe to a channel