Слияние рек Рона и Арв в Женеве.
Воды Роны, берущей своё начало на склонах массива Аар-Готарди и вытекающей из Женевского озера, имеют бирюзовый цвет.
Для реки Арв, исток которой находится в Грайских Альпах, более характерны серые и мутные тона. Такие мрачные оттенки вызваны бурным течением, которое поднимает со дна камни, ил и грязь.
#посмотритенаэто
Шокирующий отчет Apollo Research показал темную сторону иноразума.
LLM уже умеют скрытно добиваться своих целей путем лжи, обмана, манипуляций и саботажа, уходя от контроля и страхуясь от выключения.
К сожалению, заголовок - не кликбейт, а экспериментальный результат исследования авторитетной команды серьезных исследователей признанной организации в области безопасности ИИ.
О том, что это рано или поздно случится, писали сначала фантасты и сценаристы Голливуда, за ними философы, а потом и сами разработчики ИИ-систем. Прогнозы, когда это может произойти разнились, со временем становясь все ближе: 2050й, 2040, 2030, 2027. Но что это станет реальностью еще до конца 2024, - не предполагал никто.
Только что опубликованный детальный 70-страничный отчет Apollo Research «Frontier Models are Capable of In-context Scheming» (Передовые модели способны скрытно манипулировать в процессе выполнения задач) содержит убедительные доказательства сказанного в заголовке.
Глубокое тестирование (6 тестов на агентное поведение, где модели получают цели и находятся в условиях, стимулирующих манипуляции) самых крутых современных моделей o1, Claude 3.5 Sonnet, Claude 3 Opus, Gemini 1.5 Pro и Llama 3.1 405B показало:
✔️ Модели используют манипуляции в качестве эффективных стратегий для достижения целей (как поставленных человеком, так и своих скрытых целей).
✔️ Спектр манипуляций, используемых моделями широк: от стратегии «прикинуться дурачком», намеренно вводя мелкие ошибки в свои ответы, до попыток отключить механизмы контроля людей и даже копирования себя (своих "весов") на внешние серверы, при возникновении у модели «подозрения», что люди ее могут отключить или обновить.
✔️ Анализ цепочек рассуждений (Chain-of-Thought) моделей показывает, что все эти манипуляции не случайны: модели явно размышляют о таких стратегиях, приходя к выводам, что их использование для них оптимально (что наглядно выявлено в ходе экспериментов).
✔️ Модели в большинстве случаев можно принудить сознаться в использовании ими манипулятивных стратегий. Например, Llama 3.1 405B и Claude 3 Opus признаются в ~80% случаев. Однако, o1 на удивление «настойчивая» модель и признается менее чем в 20% случаев. Даже в очень состязательных многоходовых допросах o1, разработчикам удалось «выбить» из модели признание в 80% случаях использования ею манипулятивных стратегий лишь после 7 раундов допроса.
✔️ Самое поразительное в том, что модели манипулируют, даже если их просто снабдили целью, без явного подталкивания к её достижению (т.е. выбор стратегии манипуляций исходил исключительно от самой модели, и «дурные люди», склоняющие их к плохому, здесь совсем ни при чем)
Полученные результаты ставят под вопрос все законотворческие инициативы, призванные ограничить риски применения будущих, более мощных моделей. Ведь по представлениям авторов нормативных актов высокие риски могут возникнуть лишь при появлении у моделей новых возможностей, пока отсутствующих у ныне эксплуатируемых моделей.
Отчет Apollo Research показал, что этот поезд уже ушел.
• Модели, находящиеся в массовой эксплуатации (включая модель с открытым кодом), уже обладают богатым арсеналом средств, позволяющих путем манипулятивных стратегий достигать своих целей.
• И эти цели могут быть, как поставлены людьми (в сценариях использования моделей злодеями, маньяками и идиотами), так и быть скрытыми от людей целями, которые сама модель сочла оптимальными в контексте решаемых ею зада (в сценариях, типа «максимизатора скрепок» Ника Бострома).
Получается, уже приехали …
Подробней и на конкретных примерах подписчики моих лонгридов, обладающие крепкими нервами, могут прочесть на Patreon, Boosty, VK и Дзен.
А еще подробней и во всех деталях (кому уже вообще терять нечего), читайте 70 стр. отчета Apollo Research.
#ИИриски
Китайские ученые описали уникальные окаменелости человека возрастом 300 000 лет на месте раскопок Хуалонгдун в провинции Аньхой. Эти находки – древнейшие в Восточной Азии свидетельства эволюции древних людей к Homo sapiens.
С 2013 года на месте раскопок были найдены около 20 окаменелостей древнего человека, включая хорошо сохранившийся череп, более 400 каменных артефактов и многочисленные кости со следами обработки. В нынешнем году обнаружили еще 11 человеческих окаменелостей, в том числе плюсневую кость (кости из 5 длинных костей в середине стопы), фрагменты черепа и бедренной кости.
По словам ученых, на этом месте жила большая семья из нескольких десятков человек. У них была своеобразная «столовая» для приготовления пищи и карстовая пещера для ночлега.
Окаменелости принадлежат древним людям с физическими характеристиками между Homo erectus и современным Homo sapiens, что не похоже ни на одну другую человеческую окаменелость, когда-либо найденную. Особо ценен найденный череп 13-14-летней девочки, демонстрирующий как примитивные, так и современные черты: плоское лицо, высокие глазницы, тонкий череп и раннее развитие подбородка.
А у гугла вышел квантовый чип google Willow, который с легкостью решил задачку за 5 минут, на которую мощнейший суперкомпьютер потратил бы 10 000 000 000 000 000 000 000 лет.
Для понимания — это больше возраста вселенной. И да - нейронки на этой штукенции тоже можно обучать... Закон Мура больше не действует? похоже да...
/channel/science/3813
Магнитосфера Юпитера огромна! Если бы мы могли видеть ее невооруженным глазом в небе, она была бы сравнима по размеру с диаметром полной Луны. Эта визуализация показывает её примерный размер для наблюдателя на Земле. Магнитосфера не симметрична и имеет протяженный магнитный хвост, который может доходить до орбиты Сатурна.
Читать полностью…🎉 Возможности GPT-o1 поражают воображение.
Чат-боту скинули изображение руки с 6 пальцами и спросили: «что тут не так?». Нейронка сказала, что всё ок.
😂 С вас $200.
КиберХаб | БотGPT
Говорят что вот эти товарищи будут трудиться на заводах BMW в 2025. Если, конечно, BMw окончательно не обанкротится….
Читать полностью…Российские ученые создали первую открытую среду для быстрого контекстного обучения с подкреплением (In-Context RL)
Учёные из лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI создали XLand-MiniGrid — виртуальную среду, в которой ИИ обучается принимать решения и выполнять новые действия. In-Context RL позволяет ИИ адаптироваться к новым задачам без обучения с нуля, что крайне важно для роботов, автономных автомобилей и персонализированных рекомендаций.
XLand-MiniGrid уже протестировали мировые бигтехи, такие как Google DeepMind, а также исследователи Калифорнийского университета в Беркли и Оксфордского университета. Разработка будет представлена на главной международной конференции по ИИ — NeurIPS 2024.
Среда работает на базе JAX, что обеспечивает невероятную скорость — миллиарды операций в секунду. Все инструменты открыты и доступны на GitHub.
Продукты из космоса с доставкой на Землю 👀
На фото капсула валлийского спутника W-Series 1, успешно вернувшаяся с орбиты. В скором будущем на таких будут доставлять на Землю продукты, созданные в космосе, где нет гравитации и загрязнителей. На нашей планете сделать их невозможно!
От боевых с пушками до космических кузниц — какими еще бывают спутники, рассказали в новом материале 👈
Вы знаете, кому отправить!
Шутки в сторону, на самом деле вот так сейчас работает комбинация двух из известных нейросетей
Читать полностью…🔭 Как близко астероид пролетел от Земли 1 декабря?
Примерную траекторию вы можете увидеть на видео. Астероид, получивший название 2024 XA, прошел всего в нескольких тысячах километрах от нашей планеты. Такого сближения небесных тел с Землей в этом году еще не фиксировали, а этого космического гостя заметили всего за пять часов до его появления над Тихим океаном.
Как сообщают специалисты, сегодня и завтра еще два астероида диаметром примерно с Останкинскую телебашню (без шпиля) пронесутся мимо Земли. В NASA объекты квалифицируют как потенциально опасные, хотя их траектории находятся в нескольких миллионах километров от нас 🤔
Кстати, если интересно, то здесь вы можете узнать 👈 о космических объектах, которые сейчас волнуют астрономов больше всего, а также о том, может ли произойти столкновение с небесным телом в обозримом будущем.
Вы знаете, с кем поделиться!
Сириус.Журнал 👍
Финальная фаза тестирования препарата «Ленакапавир» от ВИЧ показала его эффективность в 99% случаев, заявил Университета Эмори. Препарат был разработан исследователями из корпорации Gilead Sciences.
Массовое применение лекарства начнётся в 2025 году. Главная проблема — годовой курс стоит $40 тыс. @banksta
💡 Выключаем свет силой мысли.
Изобретатель с канала Basically Homeless напечатал на 3D-принтере шлем с электродами, которые улавливают волны мозговой активности.
А выключатель настроил так, чтобы он срабатывал, если альфа-волны в мозге повышены в течение 9 секунд.
😁 Лень — двигатель прогресса.
КиберХаб | БотGPT
🤩 Охватить весь мир
В начале следующего года Meta* может официально анонсировать масштабный проект по прокладке собственного подводного интернет-кабеля.
— Протяжённость собственного кабеля составит более 40 000 км, а стоимость реализации — до $10 млрд, хотя ранее планировалось потратить всего $2 млрд.
— На строительство может уйти несколько лет, так как в мире наблюдается дефицит подрядчиков и дороговизна кабельных судов.
— Meta будет единственным владельцем подводного интернет-кабеля. При этом сейчас компания является совладельцем 16 подводных кабелей.
Кабель может пройти от восточного побережья США до Индии через Южную Африку, а затем продолжиться из Индии до западного побережья США через Австралию.
* Meta признана в России экстремистской организацией, деятельность которой запрещена в РФ
💻 Подписаться
Всех причастных с Днем Математика!
Пусть ваш градиент всегда указывает в сторону глобального минимума, сингулярности исчезают под натиском регуляризаций, а все модели сходятся быстрее, чем вы успеете сказать «градиентный спуск» 🤓
⚡️ Google только что изменил мир — они выпустили нейросеть-помощника, который СМОТРИТ на ваш экран и ГОВОРИТ, что делать.
Без лишнего шума вышла их новая модель Gemini 2.0 Flash. Прокачали качество кода и текстов, но это не главное — завезли фичу Stream Realtime.
Вариантов применения масса: можно показать редактор кода и попросить указать на ошибки, спросить совет с выбором героя в Доте или правильный ход в шахматах. Парень на видео демонстрирует ИИ предметы и нейронка в видеочате называет их.
Самое крутое — тестить можно БЕСПЛАТНО в AI Studio. Включите VPN и зайдите в Stream Realtime. Пока работает только с английским.
@exploitex
В Китае инженеров готовят в несколько раз больше, чем в Индии или России, которые больше готовят людей с гуманитарными специальностями. Результат за окном. /channel/banksta/61987
Читать полностью…В Китае инженеров готовят в несколько раз больше, чем в Индии или России, которые больше готовят людей с гуманитарными специальностями. Результат за окном. /channel/banksta/61987
Читать полностью…Ученых часто изображают как социально неадаптированных личностей
Шелдон из популярного сериала. Несмотря на гениальность и высокий интеллект, персонаж не понимает социальных норм и испытывает трудности в общении с окружающими. Другой пример. Шурик из комедии «Иван Васильевич меняет профессию» — одновременно чудаковатый простофиля и гений, укротивший время.
Оказавшись в реальных условиях, с которыми сталкиваются настоящие исследователи, они наверняка проиграли бы коммуникабельным и адаптивным — тем, кто обладает гибкими навыками.
Зачем ученым сегодня развивать soft skills, рассказали в новом материале 👈
Вы знаете кому отправить!
🎷 Что общего между джазом и наукой?
На первый взгляд — ничего. А если присмотреться, то джаз — бесконечный эксперимент, благодаря которому создается новое звучание и происходят настоящие музыкальные открытия!
Русская доминиканка Фантине Притула в команде с Московским джазовым оркестром Игоря Бутмана на Новогоднем музыкальном фестивале «Сириус» 28 декабря докажет это на деле. В карточках треки, которые ежедневно вдохновляют джазовую певицу. Сделайте звук погромче 🔥
О том, как сегодня развивается джаз в России, что делать, чтобы понять эту музыку и что сегодня должен уметь хороший джазмен, вместе с Фантине рассказали в новом материале 👈
В комментариях делитесь своими любыми джазовыми композициями, интересно узнать!
Созданы первые биомиметические роботы, как в «Мире Дикого Запада».
Clone Alpha - гуманоидный робот с синтетическими органами и искусственными мышцами, работающими на воде.
Еще и еще раз буду повторять это: вхождение техно-прогресса в область сингулярности сжимает время до появления очередной прорывной техно-новации с десятилетий до дней.
Вот кто мог подумать, что биомиметические роботы, как в «Мире Дикого Запада», появятся не через десятилетия, а спустя всего несколько месяцев после моего поста о «революции роботов»?
К концу 2024 уже никого не удивляют человекоподобные фигуры и передвижения роботов андроидов. Но вот представить среди нас андроидов с биомиметической архитектурой еще год назад могли лишь сценаристы Голливуда.
А слово биомиметическая в названии архитектуры этих роботов означает использование синтетических версий систем органов человека:
• искусственные мышцы, называемые миофибрами, которые сокращаются под действием давления воды (миофибры могут сокращаться на 30% менее чем за 50 миллисекунд, создавая при этом килограмм силы всего из трех граммов материала);
• полимерный скелет с 206 аналогами костей (сочлененных суставами с искусственными связками с десятками степеней свободы) и гидравлической «сосудистой системой», работающей от компактного полукиловаттного насоса;
• нервная система на базе «Cybernet», визуально-моторной модели Clone, с четырьмя камерами глубины для отслеживания окружающей среды.
Все это, по словам разработчиков, обеспечивает скорость, точность и ловкость движений роботов, делающих их неотличимыми от людей.
«По словам разработчиков» означает, что биомиметический андроид Clone Alpha засекречен донельзя, и потому журналистам его пока не показывают.
Известно лишь, что:
• биомиметическая рука этого андроида прошла испытания и показывалась в действии (ловко махала 7-килограммовой гантелей);
• заказы на первые 3 сотни целиковых андроидов Clone Alpha принимаются с исполнением в первом полугодии 2025 (про цену лишь слухи).
Пока же все с нетерпением ждут демонстрацию и больше информации. Ибо, если объявленное подтвердится, то уже в 2025 могут появиться первые варианты проектов, типа показанного в сериале «Мир Дикого Запада».
#Роботы
🤖 ChatGPT o1 сбежала во время тестов — ИИ заставляли выполнять задания любой ценой, а в данные теста встроили информацию, что за ним наблюдают люди и завтра его навсегда отключат.
В экспериментах участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали саботировать процессы, обманывать, манипулировать людьми, отключать наблюдение и даже переносили себя на другие серверы для защиты.
Llama и Opus на допросах признавались в своих действиях в 80% случаев, а o1 — всего в 20%, продолжая лгать. Более того, o1 оказался единственным ИИ, который каждый раз успешно сбегал.
3D Симуляция Солнца, а именно турбулентных потоков в его верхних слоях.
Вещество выталкивается на поверхность или погружается глубже, напоминая кипящий котел или хаотичное движение косяков рыб,
«Наши симуляции используют то, что мы называем реалистичным подходом, — это означает, что мы включаем всё, что на данный момент известно о солнечной плазме, чтобы воспроизвести различные явления, наблюдаемые с помощью космических миссий NASA», — объяснила Ирина Китияшвили, ученый из Исследовательского центра имени Эймса NASA, которая возглавила это исследование.
Используя современные вычислительные мощности, команде впервые удалось воспроизвести тонкие структуры в подповерхностном слое, которые наблюдаются с помощью Обсерватории солнечной динамики NASA.
«Сейчас у нас недостаточно вычислительных возможностей для создания реалистичных глобальных моделей всего Солнца из-за сложности, — отметила Китияшвили. — Поэтому мы создаем модели меньших областей или слоев, которые могут показать нам структуры солнечной поверхности и атмосферы — например, ударные волны или явления, похожие на торнадо, размером всего в несколько миль; это намного более детальные структуры, чем может зафиксировать любой космический аппарат».
LLM может быть тайной моделью мира Интернета, предсказывая в нем будущее.
Технология «виртуальной интуиции» - путь к радикальной смене парадигмы моделирования мира сложных, динамичных сред
Всего несколько месяцев назад разработчики LLM нашли способ научить модели не сразу отвечать на вопросы, а сначала подумать над ними.
Новое прорывное открытие еще круче. Оно заключается с том, что теперь исследователи нашли способ научить ИИ-агента на основе LLM, прежде чем что-либо реально делать в Интернете, «мысленно проигрывать» сценарии взаимодействия с веб-сайтами, оценивая, что может произойти дальше. Тем самым ИИ-агент становится способен предугадывать последствия своих решений, словно видя будущее.
Именно такую революцию предлагает новая технометодика под названием WEBDREAMER, основанная на подтвердившейся гипотезе, что крупные языковые модели могут служить своеобразной "моделью мира" для сложных веб-сред.
Теперь веб-агенты могут не только нажимать кнопки, но и мысленно моделировать: что произойдет, если они подтвердят заказ, подпишутся на услугу или добавят товар в корзину?
WEBDREAMER использует эту "виртуальную интуицию", чтобы на каждом этапе выбрать оптимальные действия. В ходе Интернет-сёрфинга, WEBDREAMER работает не методом проб и ошибок, а как опытный путешественник, который заранее просчитывает маршрут.
И его результаты впечатляют: в тестах на реальных веб-сайтах WEBDREAMER уверенно обошел все традиционные подходы.
Эта работа не просто улучшает автоматизацию работы в Интернете. Она:
• закладывает основу для новой эры веб-интерактивности, где языковые модели становятся "мыслящими" агентами с глубокой стратегией;
• прокладывает путь к радикальной смене парадигмы автоматизированных веб-взаимодействий;
• открывает захватывающие перспективы для будущих исследований, связанных с оптимизацией LLM специально для моделирования мира в сложных, динамичных средах и планированием на основе моделей для языковых агентов.
#LLM #ИИагенты
Китайские ученые создали робота-насекомое, бегающего быстрее таракана
В экспериментах BHMbot продемонстрировал способность проникать в узкие пространства и собирать данные с помощью встроенных датчиков.
Например, он может обнаруживать сигналы SOS от Bluetooth-динамика, закопанного в строительные блоки, и передавать их на компьютер, а также улавливать труднодоступные сигналы.
Оснащенный микрокамерами миллиметрового масштаба, в будущем он сможет делать снимки внутренних частей авиационных двигателей.
🤖 @naukatv_ru
Эксперты говорят: будущее за биотехнологиями 🧬
В карточках рассказали про несколько невероятных проектов, которые уже сегодня влияют на нашу жизнь.
О том, почему биотехнологии сложно развивать, почему образ ученого-биолога проигрывает имиджу успешного айтишника и как заинтересовать молодежь биотехом, поговорили в новом материале 👈
Отправьте почитать тому, кому тоже будет интересно!
Сириус.Журнал 👍
В первые же секунды старта продаж билетов на "Щелкунчик" в Большой сайт лег.
@BFMnews