2047
личный канал про ИИ
в эволюционной биологии вывели правило 4 F: базовые инстинкты, необходимые для выживания - это борьба, бегство, питание и размножение; как несложно заметить, массовая культура эти инстинкты массово же эксплуатирует; теперь это добралось до роботов
• в Шэньчжэне основана первая в мире лига боев человекоподобных роботов (1 картинка), призом будет пояс из чистого золота стоимостью 111 миллионов рублей
• там же представили первого "биомиметического" робота, который в том числе поддерживает комфортную для человека температуру своего тела (2 картинка)
стоит отметить, что некоторые люди испытали эффект зловещей долины от этого представления из-за неестественных движений, а тут как раз компания Xiaomi представила модель, которая должна обеспечивать естественные движения для роботов
в связи с последним настоятельно рекомендую главу V "Из воспоминаний Йона Тихого" ("Стиральная трагедия"), впрочем этот цикл можно читать целиком
@valuableai
всем привет, новый выпуск Капитанского мостика, за штурвалом как всегда я и Дмитрий Колодезев
#КапитанскийМостик
В этом подкасте Валентин Малых и Дмитрий Колодзев обсуждают различные аспекты технологий, включая исторические моменты, влияние искусственного интеллекта на науку, вопросы энергетики и обвинения в адрес OpenAI. Они анализируют, как компании, такие как Microsoft и Google, используют деньги для продвижения своих продуктов и как это влияет на пользователей. В этом разговоре обсуждаются ключевые аспекты технологической войны между Китаем и США, а также влияние на развитие технологий в Армении и России. Упоминаются планы по созданию дата-центров в Армении и суперкомпьютеров в России, а также изменения в профессии разработчика в свете новых технологий. Обсуждаются риски и возможности, связанные с этими изменениями, а также необходимость специализации в IT. В этом разговоре обсуждаются ключевые изменения в программировании и внедрении ИИ.
ODS VK Video
ODS YouTube
мой дзен
@valuableai
коллеги из MIT выпустили 200-страничный отчет под названием "Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task"
что они сделали - посадили людей в специальной шапочке для ЭЭГ (1 картинка) и попросили их написать эссе на одну из заданных тем (2 картинка); люди были поделены на три группы: LLM, поисковик или "голый мозг"; после этого людей просили процитировать их эссе
при использовании LLM только 1 из 6 смог что-то процитировать; но точно процитировать не смог никто; при пользовании поисковиком цитату смогли выдать 8 из 9 человек, аналогично тем, кто вообще ничем не пользовался; но точные цитаты для людей с поисковиком были более сложной задаче - 5 из 6, а те, кто писал из головы, цитировали всегда точно; самое интересное на мой взгляд - ощущение удовлетворенности от работы: само собой, те, кто писал сам его ощущали меньше - 1 из 6 был не удовлетворен; у группы с LLM - 1 из 20; а вот среди поисковиков - все были довольны (3-5 картинки)
@valuableai
сегодня снова рубрика "два мира - два Шапиро", но немного необычная: новостей будет три
• в России ГАИ попыталось оштрафовать робота-доставщика за якобы умышленное нарушение движения, но суд не признал за роботом субъектности
• в Китае гражданин пытался засудить чатбота за выдачу ложных сведений - с тем же результатом, суд не признал наличия у чатбота субъектности, т.е. он не мог сознательно обманывать
• в то же время в США, например, мать Илона Маска подала в суд на Grok за генерацию эротических картинок с ней
из США новостей о подаче в суд много, а вот о решениях - нет, только о мировых соглашениях; связано это с тем, что там прецедентное право, первое такое решение определит, как надо поступать с чатботами и прочим ИИ
вот такое отличие континентального права (как в России и Китае) от островного (как в США)
@valuableai
на прошлой неделе завирусился Genie 3 от Google; это генератор "играбельных" демок (первое видео), на самом деле играбельность ограничивается возможностью передвигаться внутри сгенерированного видео; но даже этого хватило, чтобы упали акции игровых компаний; интересно, что после выступления Маска, такого не было
но важнее на мой взгляд другая история - на YCombinator появилась компания, которая представила игру PaxHistoria (второе видео); эта игра генерирует потенциально бесконечное количество сценариев, засчёт взаимодействия LLM, играющих роли разных стран - боты взаимодействуют с игроком и между собой; буквально мечта любителя глобальных стратегий
жанр, конечно, сильно менее популярный, но в играх графика должна привлечь человека, а удержать его может именно взаимодействие с миром; кстати, на Coursera уже есть курс по созданию NPC, управляемых LLM
@valuableai
ну, как говорится, с добрым утром
если появилось желание сдать свою тушку в аренду, то вам сюда
@valuableai
опять же в воскресенье упоминали прогноз AI 2027, где одно из предсказаний - переключение автопроизводителей на производство роботов
упоминали мы это в контексте новости, что Tesla прекращает выпуск Model S и Model X, чтобы освободить мощности для выпуска роботов Optimus
и вот пришла новость с другой стороны Тихого океана: Li Auto приоритизирует разработку роботов; в отличие от Tesla они не планируют сокращать выпуск автомобилей, но с этого момента основные усилия будут прикладываться в разработке роботов и ИИ
P.S. самое смешное, что заглавная картинка сгенерирована Grok
@valuableai
тут в в журнале Природа (не том) вышел комментарий от группы энтузиастов, называется он провокативно - "ИИ уже достиг уровня человека? Доказательства налицо."
на самом деле это не утверждение, а просто перечисление возможных возражений и ответ на них; например, они упоминают, что ИИ решают математические олимпиады на уровне или лучше человека (я про это писал), но это скорее говорит о том, что олимпиады - это не про ум, а про натасканность на решение типовых задач
еще они упоминают, что GPT-4 прошел тест Тьюринга (я про это тоже писал) - но Тьюринг придумал свой тест именно для демонстрации несостоятельности такого определения интеллекта
на мой взгляд, их ответы на возражения напоминают схоластический спор о существовании Бога; ответом на этот спор было либо наличие веры, либо наоборот полного неверия; т.к. мы не можем определить интеллект, то и искусственный интеллект тоже получается не определен
P.S. в группу энтузиастов, кстати, входит Михаил Белкин - профессор из университета Сан-Диего
@valuableai
Всем привет, наконец настал тот час, когда можно объявить победителей нашего соревнования!
У нас было 5 языковых пар, и так получилось, что на каждую пару - свой победитель. Каждый победитель получит 30000 бонусов в облаке Selectel на вычисления.
• русский-башкирский: Дмитрий Вахрушев — код / веса
• английский-татарский: Дмитрий Карпов — веса / датасет
• русский-казахский: Глеб Шаньшин — веса
• английский-чувашский: Алексей Лукин — код & датасет
• русский-кыргызский: Дмитрий Новокшанов — веса / датасет
На воркшопе LoResMT в марте будут опубликованы отчеты от победителей и других участников соревнования, следите за обновлениями.
Будем рады видеть вас в качестве участников на будущих соревнованиях!
@valuableai
всем привет, с 10 февраля начинается новый поток курса Natural Language Processing & LLMs
в прошлом запуске добавили третье задание про агентов; про LLM будет 3 лекции про разные аспекты, плюс само собой про вайб-кодинг тоже будет; вот здесь статья на Хабре с подробностями
регистрация тут, присоединяйтесь!
@valuableai
всем привет, новый выпуск Капитанского мостика, за штурвалом как всегда я и Дмитрий Колодезев
ИИ-саммари:
В этом выпуске подкаста «Капитанский мостик» Валентин Малых и Дмитрий Колоздев обсуждают актуальные темы, включая использование искусственного интеллекта в космических исследованиях, проблемы кибербезопасности, ответственность в технологиях, рост дата-центров в России и строительство АЭС в Казахстане для решения энергетических проблем. В этом разговоре обсуждаются различные аспекты технологий, включая строительство ТЭЦ, использование тепла от коллайдеров, проблемы с избыточным теплом, эффективность тепловых аккумуляторов, роль роботов в производстве и образовании, а также будущее дата-центров в космосе и переход Теслы на производство роботов. В этом разговоре обсуждаются ключевые проблемы образования, текущее состояние рынка искусственного интеллекта, конкуренция между компаниями, такими как OpenAI и Google.
ODS VK Video
ODS YouTube
мой дзен
@valuableai
биологи нагнетают: количество генеративных моделей, способных работать с ДНК и другими биомолекулами растет экспоненциально (1 картинка); уже сейчас понятно 6 классов моделей, которые могут делать всякое нехорошее (2 картинка); меня особо впечатлили a, b и d
мало того, уже другие биологи предложили метод CLASSIC (имели ли они в виду известный мем оставим за скобками), который позволяет, цитирую, "ускорить бег" синтетической биологии - то есть ускорить цикл создание-построение (выращивание?)-проверка-изучение; в общем, эти тоже нагнетают, но не так явно (3 картинка)
@valuableai
я совершенно не специалист в моделях погоды, честно скажу, попался на красивые видосики
суть новости, Nvidia выпустила открытое семейство моделей предсказания погоды Earth 2, что для области метеорологии, как я понимаю, нехарактерно; одновременно наткнулся на сравнение моделей погоды для России от Гидромета (последняя картинка), оказалось, что на периоде от 1 до 3 суток лучше всего справляется (дает наименьший RMSE в данном случае по давлению) американская NCEP, на 4-6 сутки - европейская ECMWF; отечественная PLAV10, к сожалению, - аутсайдер
GeoDelta и Метеум, про них писал в ноябре, как я понимаю, используют данные от этих моделей, плюс Яндекс дополнительно использует данные от частных метеостанций; это позволяет предсказывать по более меткой сетке - заявляется точность "до дома", порядка 100х100 м, а не 10х10 км
P.S. больше графиков тут, кому интересно, рекомендую посмотреть соседние файлы и папки
P.P.S. для желающих попробовать свои силы, Nvidia выпустили туториал по использованию Earth 2
@valuableai
я хочу, чтобы вы насладились вместе со мной:
• в законопроекте, представленном в Госдуму, поленились убрать приписку source=chatgpt.com• в РАН разрабатывается система по предсказанию реакции населения на действия властей
я уже вижу, как в законопроекты встраивается мелкий шрифт "ЕСЛИ ТЫ ЭТО ЧИТАЕШЬ, ОДОБРЯЙ"
шутки шутками, я для рецензентов так уже делают; да и законы вполне официально пишут с помощью ИИ, правда, не у нас; продолжаю вести наблюдение
@valuableai
автор фитнес-трекеров Whoop вышел c новой, даже инновационной идеей: оснастить унитаз микрофоном и камерой с компьютерным зрением, чтобы анализировать состояние кишечника
в этой связи не могу не вспомнить "Путешествие Гулливера":
Другой профессор ...рекомендует государственным мужам исследовать пищу всех подозрительных лиц; разузнать, в какое время они садятся за стол; на каком боку спят, какой рукой подтираются; тщательно рассмотреть их экскременты и на основании их цвета, запаха, вкуса, густоты и степени переваренности составить суждение об их мыслях и намерениях: ибо люди никогда не бывают так серьезны, глубокомысленны и сосредоточенны, как в то время, когда они сидят на стульчаке, в чем он убедился на собственном опыте; в самом деле, когда, находясь в таком положении, он пробовал, просто в виде опыта, размышлять, каков наилучший способ убийства короля, то кал его приобретал зеленоватую окраску, и цвет его бывал совсем другой, когда он думал только поднять восстание или поджечь столицу.
что коллеги из OpenAI всегда умели делать хорошо - это хайповать; группа математиков основала инициативу First Proof для проверки способности современных ИИ-систем решать математические задачи; для этого они выпустили 5 февраля статью, где собрали 10 уже решенных задач из своей работы, но результаты еще не были опубликованы
14 февраля (в день ENIAC) OpenAI выступили c заявлением, что решили 6 из 10 задач (на картинке), и выложили сами решения
последовала жаркая дискуссия в твиттере (резюме - тут), в ходе которой выяснилось, что две из заявленных задач решены неправильно; 2 должны были быть решены; пятая вроде как решена с ошибкой, а вот шестая - решена правильно, но без ссылок на источники, которые были опубликованы 15 лет назад; но самое важное, они нарушили заявленное правило - отсутствие человеческого контроля
по итогам можно сказать, что работа математика - тоже в чем-то рутинная, часть ее уже можно переложить на ИИ
P.S. аналогично обсуждали в воскресенье на Мостике про физиков
@valuableai
немного философии
автора не знаю, нашел в интернетах
@valuableai
буквально во вторник на первой лекции курса рассказывал студентам про тест Тьюринга, а тут предложили новую его итерацию:
какие-то предприимчивые граждане организовали контору под названием Reviewer3 (потому что Reviewer 2 must be stopped!) и продают услуги ИИ по рецензированию; чтобы хайпануть, они предложили поиграть в угадайку, какая из рецензий на ICLR написана человеком
тут хочется напомнить, что ChatGPT уже как год в 3 из 4 случаев проходит тест Тьюринга
и еще, что я про такое развитие событий уже писал и даже выступал на эту тему
@valuableai
небольшой обзор новостей про написание кода, со светлой стороны:
• Claude Code уже сейчас ответственен за 4% всех новых коммитов на GitHub; к концу года обещают 20%
• он же смог найти более 500 ранее неизвестных багов в open source проектах
с темной стороны:
• 90% пулл-реквестов в open source проектах - мусорные
• из-за вайб-кодинга разработчики перестают получать деньги за свои проекты - как в виде контрактов на поддержку, так и от показа рекламы на страницах документации; плюс они жалуются, что не получают также и признание за написание кода
налицо кризис восприятия - для его преодоления обществу нужно выработать другое отношение к написанию кода; это традиционно считается сложной задачей - оно ей и было до последнего времени, но сейчас потребность в этом навыке утрачивается; это можно сравнить с распространением пишущих машин и текстовых процессоров - навык каллиграфии становился все менее и менее востребованным; но человечество не стало производить меньше текста, просто он стал печатным
@valuableai
всем привет, новый выпуск Капитанского мостика, вели, как всегда, я и Дмитрий Колодезев; в этот раз мы записывались на полях Letovo MLConf, к сожалению, звук получился не очень, но зато у нас был замечательный гость - Александр Абрамов
ИИ-саммари:
В этом выпуске обсуждаются актуальные темы энергетики, включая использование старых авиационных двигателей для генерации электроэнергии, будущее космических дата-центров, тренды в образовании IT-специалистов и проблемы на рынке труда. Участники делятся мнениями о том, как быстро меняется рынок и какие навыки будут востребованы в будущем. В этом разговоре обсуждаются современные подходы к найму, важность навыков и автоматизации в разработке, а также влияние новых технологий на индустрию. Упоминаются инвестиции в ИИ и сравниваются с историческими затратами на инфраструктуру. Также рассматривается значение открытых моделей в биологии и их влияние на научные исследования.
ODS VK Video
ODS YouTube
мой дзен
@valuableai
Всем привет, мы открыли прием статей на AINL!
В этом году AINL будет в Томске, принимать нас будет ТГУ, за что коллегам большое спасибо.
Как всегда детали есть на сайте и в канале AINL.
@valuableai
всем привет, мы расширяемся и у меня в команде открыто сразу несколько позиций, вот ссылка на вакансию; можно откликнуться на HH или написать напрямую нашему рекрутеру Алене: a.ostroushko@mts.ai
@valuableai
только в воскресенье на Капитанском мостике обсуждали новость про то, что Qwen будут инферить в космосе
напомню, что эту модель запустили на спутниках от китайской компании Adaspace (картинка), их спутники по сообщениям могут запускать LLM на 8 млрд параметров
а тут SpaceX решила составить конкуренцию и запросила разрешение на запуск 1 миллиона спутников для создания ЦОДов на орбите; я даже не сомневаюсь, что там хотят инферить Grok
в кои-то веки у нас хотя бы что-то сделано в эту сторону - Роскосмос 28 декабря 2025 года вывел спутник RUVDSSat1 на орбиту; спутник имеет возможность запускать на нем стандартное ПО - внутри установлен Raspberry Pi Zero с процессором 1 ГГц и 512 Мб оперативной памяти; на этом уже можно какую-нибудь Gemma 3 квантованную гонять - в 270 млн параметров, в int8 будет что-то вроде 140 Мб памяти
P.S. Qwen - это для лаоваев, в оригинале он 通义千问 (Tongyi Qianwen) - "тысяча вопросов обо всем"
@valuableai
только вчера говорили про чипы для ИИ от китайских товарищей, а сегодня - от корейских; точнее нетоварищей, т.к. новости из Южной Кореи
я пропустил, а оказывается в Корее уже около 10 лет существует производитель чипов Furiosa AI; они выпустили в прошлом году карту RNGD (1 картинка) - по производительности она на 60% лучше, чем Nvidia H20: 512 TOPS против примерно 296 TOPS; и при этом потребляет в два раза меньше: 180 Вт против 400 Вт
но сама новость не в этом, а в том, что Furiosa начали RNGD производить серийно; а это уже растет из того, что LG сделали на этих картах свои ИИ-сервера (2 картинка); для меня несколько неожиданно, что Южная Корея строит свою независимую экосистему ИИ
казалось бы, у них там недавно пол-страны без интернета сидело из-за сгоревшего центрального датацентра, а уже вон что
@valuableai
я уже упоминал, что Huawei - это китайская Nvidia, а сейчас появился прогноз на этот год, где это четко видно; в случае запрета поставок H200 в Китай (а это по-моему неизбежно), Huawei получит до 60% рынка; для сравнения - у Nvidia 92% глобального рынка на начало 2026 года, но из этого рынка примерно четверть по разным оценкам - это Китай, так что в этом году Huawei может откусить глобально до 10% у Nvidia (1 картинка)
в этой связи интересно посмотреть на свежую новость от конкурента - Alibaba представила Zhenwu 810E (2 картинка), который позиционируется, как замена H20; на мой взгляд самое важное - это свой собственный интерконнект вместо NVX; также важно отметить, что Alibaba уже обучает на них Qwen; до этого китайские LLM обучали только на Huawei Ascend; так что Nvidia теряет долю и в пользу более мелких китайских игроков
@valuableai
картинка чуть-чуть запоздала, но с другой стороны - как никогда вовремя
@valuableai
накопилось новостей про робособак:
китайские товарищи из DEEP Robotics протестировали робота LYNX M20 (почему робопес называется "рысь" оставим на совести китайских товарищей) в снегах и морозах Внутренней Монголии (видео)
в наших палестинах не отстают - РЖД собирается использовать робособак для осмотра вагонов в сложных условиях (картинка)
одновременно Северсталь тестирует робособак (и не только) на своих производствах
интересно отметить, что в наших условиях про морозы никто даже не упоминает - это просто требование по умолчанию
P.S. на китайском DEEP Robotics называется 云深处科技股, что примерно можно перевести как "технологии высоко в облаках"
@valuableai
все уже слышали про то, что в Cursor сделали браузер, отправив GPT-5.2 на неделю с заданием "сделай браузер"; понятно, что этот браузер - это скорее технодемка, чем рабочий продукт, но даже если бы он реально работал - вы задумывались, зачем вообще делать браузер?
у меня есть ответ - он не нужен; начать зарабатывать на браузере получится только, если им будет пользоваться много людей; а вот вирусов может существовать сколько угодно, т.к. если обокрасть даже одного человека, эти деньги могут отбить разработку
еще раз - разработка вируса стоит несколько сотен долларов; это становится понятно из исследования CheckPoint Research; коллеги пронаблюдали за незадачливым хакером, который один разрабатывал вирус VoidLink в компании из десятка ИИ-агентов
общая схема разработки - на первой картинке, на остальных - промежуточные этапы разработки (с переводом с китайского); так что ждем вала вирусов, наподобие того, что был на заре массового распространения интернета, в нулевые годы; я вас предупредил
@valuableai
всем привет, свежий выпуск "Капитанского мостика" прямиком с ДатаЁлки в Москве! Вели как всегда мы с Дмитрием Колодезевым, но в этот раз в компании Александра Дьяконова
ИИ-саммари:
В этом разговоре обсуждаются последние новости в области искусственного интеллекта, включая заявления Илона Маска о будущем ИИ, а также философские и практические аспекты интеллекта. Участники делятся мнениями о том, как мы можем оценивать ИИ и его достижения, а также приводят примеры успешных алгоритмов, которые превзошли человеческие способности. В этой беседе обсуждаются возможности и ограничения искусственного интеллекта, философские аспекты сознания и интеллекта, а также влияние ИИ на гуманитарные профессии и программирование.
ссылки:
ODS VK Video
ODS YouTube
мой дзен
@valuableai
GPTZero продолжают свой анализ статей на конференциях, в этот раз в объектив их микроскопа попал NeurIPS
они проверили 4841 работу и в 51 нашли сгаллюцинированные цитаты, я бы сказал, что это - очень по-божески, чуть больше 1%; топ галлюцинаций по институциям на картинке; интересно, что коллеги из MBZUAI и в него попали
авторы исследования объясняют наличие галлюцинаций тем, что NeurIPS - сверхпопулярен, за 5 лет количество поданных работ почти утроилось и достигло 21 тысячи поданных статей; как следствие этого возникает необходимость в настоящей армии рецензентов, которой надо руководить
к чему я все это? я уже высказывался на тему реформы процесса рецензирования, а в следующую среду буду выступать на семинаре AIRI, представлю свое предложение на суд общественности, кому интересно - приходите или подключайтесь онлайн, регистрация здесь
@valuableai