Ну наконец-то кто-то вслух высказался на тему бесконечных пузомерок из мира ИИ-моделей, называемых умным словом benchmarks, которые не только маркетологи в хвост и в гриву используют, но и более техничные ребята начали воспринимать всерьез — ну потому что как жить без пузомерки? Ленты новостей и каналы про ИИ завалены ежедневными сводками с полей разных арен и бенчмарков; мне вспоминаются времена, когда в еще некрупном Рунете было принято по утрам изучать счетчик Рамблера и делать из этого глубокомысленные выводы. Технологии изменились, людская (а разработчики тоже люди) психология — нет.
Так вот, группа исследователей решила разобраться с тем, что these benchmarks are poorly designed, the results hard to replicate, and the metrics they use are frequently arbitrary. Это становится уже серьезной проблемой, потому что за бенчмарки схватились и законодатели, которым же надо порегулировать на якобы объективной основе.
Авторы работы подтвердили и наличие, и серьезность проблемы и, как положено, предложили свои способы решения. Интересно, что из этого возьмет на вооружение сообщество. Есть у меня некий скепсис…
https://www.technologyreview.com/2024/11/26/1107346/the-way-we-measure-progress-in-ai-is-terrible/
Оригинал работы - https://arxiv.org/abs/2411.12990
Добрый старый Zoom решил освежить бренд: после окончания пандемийного бума бороться с конкуренцией техногигантов все сложнее. Да и слово Video в названии компании не очень уже соблазняет в эпоху всеобщего ИИ.
Так что предлагается ознакомиться с Zoom 2.0: AI-first company delivering modern, hybrid work solutions that enable you to collaborate seamlessly.
Прямо сейчас трансформация выглядит довольно скромно, следуя привычной уже модели ИИ-помощников: By summarizing meeting tasks, drafting email responses, and preparing you for meetings, AI Companion is your digital assistant that reduces your overall workload.
А в будущем обещают полноценного цифрового двойника — главная фишка которого в том, что с его помощью можно будет перейти на 4-дневную рабочую неделю. Забавно, что сейчас такие заявления уже не возбуждают, и даже хочется заботливо спросить: “Ребята, у вас точно все норм?” Обычно заявления типа “we’re still just as committed to delivering happiness as we were in 2011” (2011 — год основания компании) делаются не от хорошей жизни.
А продукт ведь вполне крутой.
https://www.zoom.com/en/blog/introducing-zoom-communications-inc/
Обойдя Японию и Германию, Китай теперь №3.
А США покинули десятку лидеров.
Об индустриальной мощи страны имеет смысл судить не по её парку роботов-андроидов, а по уровню автоматизации её промышленности - количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников.
Вот три примера.
США
Недавно Илон Маск развлекал журналистов шумной презентацией, где роботы-андроиды готовили коктейли и разносили закуски. Это конечно прикольно, но не более того. А тем временем, согласно новому годовому отчету Международной федерации робототехники, США покинули десятку стран мировых лидеров по количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников. Как видно из приведенных диаграмм, США уже который год плавно теряют позиции среди ТОР 25 стран-лидеров, пропустив вперед Швейцарию и Словению и имея шансы в этом году скатиться ниже Тайваня и Нидерландов.
Китай
Поставив роботизацию промышленности среди ключевых приоритетов, Китай, с настойчивость прихватившего противника бульдога, из года в год поднимается в рейтинге все выше. И теперь, обойдя Японию и Германию, Китай ставит цель достать №2 Сингапур. Что сложно, ибо тот на «целый круг» впереди, опережая почти в 2 раза. С лидером – Юж.Корея будет еще сложнее, т.к. он опережает аж «на два круга» (примерно в 3 раза). Но Китай это не смущает. И по их планам 1-е место в мире Китай займет уже в 2030.
Россия
Тут могу лишь сказать, что при показателях Китая и США 479 и 295 эксплуатируемых промышленных роботов на 10 тыс. сотрудников и среднем по миру показателе в 162 робота, в России сейчас этот показатель равен 11 (т.е. отставание от США в 27 раз, а от Китая в 44 раза. Планирующий контролировать более 50% рынка робототехники в России "Росатом" обещает к 2030 г. увеличить число роботов в 9,5 раз (с 10 тыс до 95 тыс), что в 2 раза меньше последнего (№25) в сегодняшнем списке стран-лидеров. А в 2030, когда этот список планирует возглавить Китай, цифры лидеров должны будут вырасти, минимум, еще в 4 раза.
#роботы
Свежий лонгрид про Майкрософт: как 50+ лет не смогли состарить компанию, и все предсказания о ее неизбежном сходе со с цены оказались ложными. И очень интересно описана роль Наделлы в траектории компании.
С наступлением мобильной эры разговоры про неадекватность Майкрософт усилились - и на то были причины: неудачи с Windows Mobile были уж больно наглядными. Казалось, что компания, как часто делают гиганты в тяжелой ситуации, вцепилась в своих дойных коров — Windows и Office и просто оттягивает неизбежное. Потом пришли времена ML, и опять казалось, что компания уже не в силах адаптироваться к новациям, трансформирующим цифровой мир вокруг.
А потом случилось странное. Десять лет назад, в 2014, сменился глава компании. Обычно, в ситуации, когда компания начинает немного протухать, ищут внешнего человека, чтоб встряхнул команду, принес свежие идеи и видение, заменил дряхлеющих менеджеров.
Но тут руководство перешло к человеку изнутри компании, который 22 года неторопливо перемещался вверх по карьерной лестнице и никак мне отличался радикализмом. Но при этом одно из знаковых его решений было вложить в 2019 один млрд долларов в OpenAI, известный в довольно тогда узких кругах.
А еще его очень любили и любят сотрудники — что нечасто в очень пестрых и требовательных командах техногигантов.
Почитайте — вроде бы корпоративная история, но история очень современная, показавшая как за 10 лет огромная корпорация сумела пересобрать себя, снова стать лидером технологической гонки и красиво нарастить капитализацию. Очень полезное — и приятное само по себе — чтение, из которого можно много уроков извлечь. Среди них важный: не торопитесь хоронить старичков. Времена изменились, и продолжительность жизни растет не только среди людей, и не только люди имеют серьезные планы на бессмертие:)
https://www.wired.com/story/at-age-50-microsoft-is-an-ai-giant-an-open-source-lover-and-bad-as-it-ever-was/
Foundation models стал популярным термином, все больше отраслей стремятся иметь свои модели, претендующие на фундаментальность. Логично, что появилась Evo, a multimodal artificial intelligence model that can interpret and generate genomic sequences at a vast scale… Evo represents a major advancement in our capacity to comprehend and engineer biology across multiple modalities and multiple scales of complexity
Впрочем, пока, хотя genomic foundation model enables prediction and generation tasks from the molecular to the genome scale — речь о геномах микробов. Насчет существ побольше, включая растения, животных и нас, пока неясно — удастся ли Evo усовершенствовать для работы с геномами такого размера. Но даже и с бактериями перед CRISPR открываются совсем новые перспективы
https://www.science.org/doi/10.1126/science.ado9336
Совсем популярный, но толковый пересказ:
https://singularityhub.com/2024/11/18/a-chatgpt-like-ai-can-now-design-entirely-new-genomes-from-scratch/
Вполне ожидаемо: появилась компания, всерьез сфокусированная на AI-оптимизиции. Собственно, с момента появления коммерческих интересов в интернете, возник и бизнес их обслуживания: как манипулировать трафиком на ресурсы клиента с разных информационных систем в интересах клиента. Но пока системы работали алгоритмически (начиная с Page rank), решения оптимизаторов были тоже алгоритмичными: “ах, он ссылки учитывает — наплодим ссылочные фермы” и т.п.
С ИИ-поиском не так все просто, поэтому неудивительно, что за дело взялась компания, изначально занимавшаяся управлением репутацией в сети, а не реинжинирингом поисковых алгоритмов: approach isn’t about hacking AI systems but rather systematically shaping the web content that feeds these systems.
Изучение изменений ответов ИИ на вопросы — вполне в духе хорошей аналитики: ответы на один и тот вопрос разнятся для разных пользователей, поэтому давайте эмулировать множество пользователей и смотреть, как изменения в интернете влияют на характеристики всей совокупности ответов. Учитывается два канала воздействия на ИИ: изменения в контенте, который используется для тренировки новых версий моделей, и изменения на страницах со свежей информацией, к которым модель обращается при подготовке ответа.
Интересно, получится ли такая же большая индустрия, как традиционное SEO. Первые стартапы уже есть.
https://crazystupidtech.com/archive/can-we-manipulate-ai-as-much-as-it-manipulates-us/
Термины «цифровизация» и «цифровая экономика» возникли еще в прошлом веке, в начале 10-х нынешнего века заговорили о «цифровой трансформации». И продолжают по всему миру говорить, принимать программы, обучать чиновников и руководителей предприятий. Потому что разговоры разговорами, а на деле бизнес (кроме изначально ориентированного на цифровые продукты и инфраструктуру) осторожен и консервативен. Кстати, это демонстрирует график из предыдущего поста: экспоненциальный рост расходов на строение датацентров свидетельствует, что потребность в них все еще на ранних стадиях, в развитой цифровой экономике рост бы уже выполаживался: в реальном мире экспоненты — это чаще всего начальные участки логистических кривых и им подобных.
Это я все к тому, что и с ИИ в бизнесе будет примерно так же. Реальные перемены происходят со сменой поколений управленцев, и пока предприятиями управляют люди, этот масштаб времени вряд ли изменится. Так что в статье по ссылки все ожидаемо и закономерно: ИИ-зация рабочих процессов и мест на практике идет неторопливо. На конец прошлого года в четверти организаций ИИ вообще никак не использовался, и лишь в 8% — использовался системно по всему предприятию (подозреваю, бОльшая часть таких организаций — технологические компании). Полезный reality check и для стартапов, весьма фантазийно оценивающих размеры своих рынков, и для нервных алармистов.
https://localnewsmatters.org/2024/11/17/why-the-ai-ification-of-workplaces-may-move-slower-than-we-think-despite-corporate-hype/
Написанный очень простым языком обзор состояния нейроинтерфейсов отчетливо дает понять, со ссылкой на многие годы занимающихся этой темой исследователей, что там идет медленный, постепенный прогресс много лет. Какие бы заявления ни делал Маск, прорывов нет и не предвидится.
Но есть разумный совет: чтобы видеть имеющийся прогресс, надо поумерить собственные ожидания. Мы далеки от единения с цифровыми сущностями, но все большее число больных улучшают свое качество жизни благодаря разным инвазивным и не очень интерфейсам.
We’re still learning how it works, why it works, when it works, when it doesn’t work, what kind of support it needs, and how many places are going to be able to deliver it.
Радует, что в этой области работают не только буйные — но и в то же время легко теряющие интерес и финансирование —стартапы, но и традиционные исследовательские центры, которые постоянно получают новые и важные данные о мозге.
Как часто бывает: надо подождать. https://www.digitaltrends.com/computing/tech-for-change-brain-computer-interface/
Я б не стал публиковать ссылку на очередное сравнительное исследование реакции читателей на творчество людей и алгоритмов (ответы были получены еще несколько лет назад и с тех пор ни разу не менялись), но меня упрямо продолжают убеждать некоторые слушатели/читатели, что не дано машине писать/рисовать/музицировать/… как человек. И они искренно это делают, потому что убеждены, что контекст создания произведения является его неотъемлемой частью, впечатан в само произведение — и якобы это заметно.
Однако эксперименты раз за разом доказывают, что это не так, по крайней мере, когда участвуют люди без специальной подготовки (ибо ясно, что специалист, специализирующийся на творчестве какого-то поэта все его стихи читал, и потому незнакомый текст опознает).
Поэтому напишу, что в очередной раз non-expert poetry readers оценили поэзия, генерированную людьми аж несколько выше, чем поэзию белкового происхождения. Примечательно, что один из разделов работы называется Perception and preference in poetry: biases toward AI-generated poems: зловещая долина вздыбилась и стала холмом :))
А в тексте занятные рассуждения, за что именно полюбили поэзию алгоритмов.
https://www.nature.com/articles/s41598-024-76900-1
(Напомню, что недавно аж колонку написал про то, почему часть творческой публики не может принять алгоритмическое творчество — https://www.forbes.ru/tekhnologii/520066-znaki-vremeni-pocemu-vazno-pomnit-o-razliciah-mezdu-tvorcami-i-potrebitelami )
В 9:30 мы на этих красных диванчиках откроем очередной YAC/e — в пятый раз. С утра, на поводке к открывающему докладу, будет интересно;)
А дальше — еще интересней.
Как всегда — если что-то не успели вживую, потом все будет на сайте в записи. https://yace.yandex.ru
Эмоций по поводу потенциала ИИ в области человекозамещения — навалом, а вот с данными и внятными исследованиями все куда хуже. Поэтому радует содержательная заметка на HBR, пересказывающая свежее большое исследование трендов во фрилансе. Выбор фриланса методически хорош, потому что в корпоративном мире отношения между работником и работодателем сложные: есть взаимные обязательства, часто долгосрочные; есть культура компании, в которой взаимоотношения сотрудников важны, есть пиарные обстоятельства… много чего есть. С фрилансом все проще: фрилансер — материал расходный, не включен в сложные внутренние связи.
Забавно, что и в самой работе использовался ИИ там, где раньше бы трудились стажеры: надо было классифицировать 1,3 млн постов на платформе для фрилансеров.
Наблюденные эффекты хорошо видны на графике, которым проиллюстрирован этот пост. Если для нормировки использовать спрос на работы, требующие физических усилий и потому не доступные ИИ, то спад впечатляющий, и его начало хорошо коррелирует с появлением популярных моделей.
Падение спроса на фрилансеров увеличило среди них конкуренцию — а еще и их интерес к генеративным инструментам:)
Почитайте, там интересно, и совсем не видно, чтобы изменения спроса замедлялись.
https://hbr.org/2024/11/research-how-gen-ai-is-already-impacting-the-labor-market
Обнаружена очевидная и наглядная жертва ИИ.
Всего 4 месяца назад свеженазначенный CEO Chegg заявлял:
Over the last 16 years, Chegg has become one of the largest, most accessible, and impactful online education services for students around the world — и еще он рассказывал, как сервис будет внедрять ИИ.
Сервис действительно был знаменит в мире EdTech’а — в лучшие времена стоил около 15 млрд. долларов. Занимался поначалу сдачей напрокат дорогих учебников, но быстро стал a platform with pre-written answers to common homework questions за $20 в месяц. В сущности, ГДЗ — только для студентов скорее чем школьников.
Прикольно, что против него особо оне возражали преподаватели 🙂 Есть разные теории, почему.
Но с приходом ChatGPT и прочих стало странным платить $20 за то, что у чатов получается быстрее и лучше, за меньшие деньги или вовсе бесплатно. Бизнес-модель сдулась, а ее пересмотр с использованием ИИ уже запоздал. Сотрудники просили об этом еще в 2022, но начальство спохватилось только сейчас. Очень наглядная иллюстрация цены промедления:))
https://gizmodo.com/chegg-is-on-its-last-legs-after-chatgpt-sent-its-stock-down-99-2000522585
(Для справки и для истории — восторги и оптимизм 4-месячной давности — https://gulfbusiness.com/chegg-ceo-nathan-shultz-on-ais-role-in-education/ Очень полезное чтение с учетом быстро наступившего будущего :))
Вчера случилось принять участие в разговоре про сценарии использования умного дома — и участники (включая меня) грустили по поводу ограниченности этих сценариев (особенно если не рассматривать связанные с медиапотреблением).
А сегодня натыкаюсь на интересный сценарий, который вчера никому из нас в голову не пришел: умная колыбель.
И правда — колыбелька, которая умеет малыша именно так укачивать, как ему нравится — и по его движениям ловить тот момент, когда он готов расплакаться, но еще не начал это делать и укачивание способно предотвратить плач — великая вещь. Если получится, конечно, но искушенные инвесторы из a16z в это верят и вкладываются. А их слова “a new wave of ‘parenting co-pilots’ built with LLMs and agents” очень хорошо иллюстрируют, какие домашние сценарии мы пропускаем, увлекшись решением, в общем, скорее профессиональных чем семейных задач.
https://techcrunch.com/2024/11/07/ai-powered-parenting-is-here-and-a16z-is-ready-to-back-it/
Мустафа Сулейман, CEO Microsoft AI, записал очередное любопытное интервью. В нем не только очередной раз напомнил свою метафору про ИИ как новых существ, но и вообще очень восторженно отозвался о текущем моменте, просто чувствуется, как человека прет.
Напомнил, что лет пятьдесят назад информационные технологии начали трансформировать мир, и что сейчас — похожий момент.
Момент, чтобы основывать компании или их масштабировать, момент, когда хорошо разворачивать карьеры всем, не только предпринимателям, но и менеджерам, ученым и активистам.
…this is a moment where we really do have a chance collectively to shape and influence things and nothing is predetermined…
Вот этот фрагмент “ничто еще не предопределено” хорош. Как сегодня заметили коллеги в одной рабочей дискуссии, многие любят разговаривать про развитие уверенности, но никто не говорит про развитие и важность смелости. https://youtu.be/IZBT57oLKas?si=gDkMMp6QX_dNA7UV
Я недавно встретил эту ссылку в LinkedIn Вани Ямщикова, который там себя описывает словами radical techno-optimist. Давно пора снова с ним подкаст записать, но пока этого не случилось, повторю здесь его ссылку на публикацию в Nature аж от февраля.
Статья посвящена теме, на которую уже здесь ворчал: участившимся странным и малограмотным нападкам на энергопотребление и углеродный след ИИ-продуктов.
Здесь авторы с той же дотошностью и стремлением записать в углеродный след всё в цепочке событий, приводящей к вычислениям, подошли к оценке событий, приводящей к написанию текста/созданию рисунка человеком.
Поизучать интересно, придраться есть к чему — как и во всех “углеродных” расчетах, но любопытен немодный нынче вывод:
Our findings reveal that AI systems emit between 130 and 1500 times less CO2e per page of text generated compared to human writers, while AI illustration systems emit between 310 and 2900 times less CO2e per image than their human counterparts.
Ну, то есть очередной раз подтвердили старую проблему: если последовательно и логично развивать идею сокращения выбросов, то ничего лучше уничтожения человечества придумать нельзя: такой подход решит и проблемы того, что мы сами выделяем парниковые газы и того, что ради своей комфортной жизни много еще источников этих газов насоздавали.
Читать в любом случае увлекательно, а спорить и не соглашаться — в науке дело нормальное
https://www.nature.com/articles/s41598-024-54271-x
А вот Nvidia продолжает демонстрировать, что компания не только про чипы, но и про собственные модели, иллюстрирующие красоту генеративного ИИ и крутость продуктов Nvidia — full version uses 2.5 billion parameters and was trained on a bank of Nviidia DGX systems packing 32 H100 Tensor Core GPUs 🙂
Модель по имени Fugatto (от Foundational Generative Audio Transformer Opus 1) описывается как a Swiss Army knife for sound, а сравнение ее с другими моделями звучит немножко токсично: some AI models can compose a song or modify a voice, none have the dexterity of the new offering 🙂
Музыкантам предлагается использовать новый инструмент на разных стадиях процесса — от прототипирования до улучшения качества имеющихся треков. Модель умеет создавать неожиданные эффекты: For instance, Fugatto can make a trumpet bark or a saxophone meow. Whatever users can describe, the model can create. Черрипики в приложенном треке звучат впечатляюще.
Осталось дождаться реакции и без того в последнее время нервных музыкантов:)
https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/
Поразительно, как не нравятся людям зеркала:) Вот вышла очередная тревожная работа команды гуманитарных исследователей из Германии и Великобритании.
Проанализировав сайты, созданные разными популярными генеративными моделями (ChatGPT, Claude 3.5, Gemini 1.5 Flash), они обнаружили, что дизайн содержит различные манипулятивные элементы, побуждающие пользователя к тем или иным действиям.
Вроде нет вопросов, откуда взялся такой стиль: модель училась на вполне человеческих творениях, которые все это добро содержат сплошь и рядом, и там элементы манипуляции были заложены в ТЗ заказчиками или отвечали собственному представлению вебдизайнеров о прекрасном.
Но исследователи волнуются, что модели демонстрируют не самое лучшее и бескорыстное поведение и требуют, как обычно, дополнительного регулирования и ограничений для моделей.
О каких-то ограничениях для людей вопрос даже не ставится. В итоге призыв выглядит как неуклюжая попытка сохранить коммуникационные функции за людьми: только белковым дано право манипулировать себе подобными:)
https://arxiv.org/pdf/2411.03108
Гибкие дисплеи как-то перестали удивлять — но и применений особо не нашли. LG предлагает следующий уровень: гибкий дисплей, который еще и эластичен, неплохо растягивается. А это значит, что он уже напоминает материалы, используемые в одежде: у дизайнеров появляются интересные перспективы;)
Да, это пока прототип, и разрешение, которого бы постеснялся даже древний дисплей, — но ограничения часто лишь стимулируют фантазию;)
https://www.core77.com/posts/134351
Сегодняшний шестой испытательный полет Старшипа не принес сенсаций, а местами оказался даже менее зрелищным, потому что бустер опустили в залив, а не в «руки» Мехазиллы. Как и прежние полеты, этот наверняка добавил кучу полезных данных, в том числе и о неполадках при посадке разгонного блока — но это невидимый фронт. Поэтому ссылка будет не на захватывающее видео, а на статью с впечатляющими цифрами про акустическое воздействие запусков Старшипа на окружающую среду. Они в буквальном смысле слова оглушающие.
even 10 kilometers away, it was as loud as a rock concert. At 20 kilometers, it rivaled the noise of a table saw or snow blower. At 30–35 kilometers, the sound was still as loud as a vacuum cleaner or hair dryer.
Ох и интересная задача будет искать места под космодромы будущего с высокой частотой стартов…
https://phys.org/news/2024-11-roar-spacex-starship-impact-communities.html
Еще 4 года назад тогда еще не запрещенная Meta объявила о проекте ARIA: исследованию будущего AR и VR очков. Больших откровений там не случилось, но анонс прототипа Orion вдохнул немного новой жизни. Теперь публике представлен Aria Research Kit: первые кейсы использования и призыв к сообществу делиться своими наработками.
Процитированные в тексте проекты трудно назвать новаторскими:
1. Картирование окружающего мира с помощью данных, собираемых носителем очков
2. Изучение звукового окружения пользователя, чтобы в дальнейшем помочь людям с потерей слуха не только лучше слышать, но и понимать пространственное расположение источника звука.
3. Улучшенный ассистент водителя, учитывающий события вне его текущего поля зрения
4. Улучшенная навигация в помещениях для пользователей с проблемами зрения
В новом раунде исследований компания предлагает раздать прототипы своих очков исследователям работающим над broad range of research topics, including embodied AI, contextualized AI, human-computer interaction (HCI), robotics, and more.
И ждет, конечно, их отчетов.
https://www.meta.com/en-gb/blog/quest/project-aria-research-kit-case-studies/
Появляются интересные инженерные детали китайской миссии, которая будет запущена в 2028 чтобы доставить на Землю полкило марсианского грунта. Весь дизайн миссии подчинен минимизации расхода топлива. Поэтому приходится применять нетривиальные и ранее не испытанные методы перевалки ценнейшего груза. Контейнер с собранным грунтом будет выведен на орбиту небольшим разгонным блоком, но стыковки с орбитальным модулем не предусмотрено: ловушка на модуле должна будет поймать контейнер, загрузить его в возвращаемый блок, который уже доставит контейнер на Землю.
Выглядит как чудеса акробатики на околомарсианской орбите — но китайцам акробатика близка. Очень интересно, как на практике все это сработает.
https://www.scmp.com/news/china/science/article/3286721/how-chinese-spacecraft-will-catch-mars-rock-samples-journey-earth
Частные расходы на строительство дата-центров выросли почти до $30 млрд/год.
Этот показатель более чем вдвое превышает траты за 2022 год.
Дата-центры стали главным сегментом для строительства: они опережают отели, торговые и развлекательные центры.
США лидируют по объему инвестиций для дата-центров. При этом глобальные расходы на них составят $250 млрд.
👁️
Полезное исследование от бывших коллег из Толоки: внятно потестировали наиболее популярные LLM на вопросы из области естественных наук. Но вопросы не то чтоб со звездочкой, но на понимание, а не знание — причем противоречащее бытовым представлениям.
Вот хороший пример по физике:
“В пасмурный день за окном машины закреплен термометр. Машина начинает движение и быстро набирает скорость. Через несколько минут смотрим на термометр за окном. В какую сторону изменились его показания?”
И, что не удивительно, оказалось, что по иммунобиологии, физике, биоинформатике и пр. ответы даже лучших моделей выглядят так себе. Что логично: язык не содержит в себе понимания физики мира, а из текстов можно скорее извлечь идею “высунулся из окна и свежий ветер охладил…” Так что здесь к созданию помощников по обучению придется подходить осторожно.
https://toloka.ai/blog/are-llms-good-at-natural-science/
Склонные к аномальной драматизации всего на свете журналисты недавно писали, что Маск обломался об энергетиков: его колоссальный, в рекордные сроки запущенный датацентр не может получить из сети достаточной мощности и аж дизельные генераторы привезли и подключили, чтоб тренировать на 100 000 карт H200 от Nvidia свои модели xAI. Но несколько недель и одни выборы спустя мощность волшебным образом нашлась: изначально штат был готов подавать 8 МВт, потом речь пошла про 50, теперь подписался на 150 начиная с первой половины ноября. По оценкам, пока должно хватить на ‘Gigafactory of Compute’. “Пока” — потому что Маск не собирается ограничиваться 100 тысячами карточек, xAI Colossus рассчитан на большее.
https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musks-massive-ai-data-center-gets-unlocked-xai-gets-approved-for-150mw-of-power-enabling-all-100-000-gpus-to-run-concurrently
История, как известно, если повторяется, то как фарс:) Вот не ожидал, что в 2024 Европа вдруг не на шутку озаботится созданием собственного поисковика.
Сейчас эту новость будут обсуждать в параллель с рассуждениями о том, как SearchGPT вместе с Perplexity убивают поиск как класс.
Я, правда, не совсем понял про европейское единство. The two internet search firms agreed a joint venture, called the European Search Perspective or EUSP, with ownership split 50-50 between both firms. With a view to launch in France in early 2025, the venture aims to serve “improved” French and German language search results. А насчет прочих языков ЕС как?
https://www.cnbc.com/2024/11/12/ecosia-qwant-partner-on-search-engine-tech-to-counter-googles-power.html
В далеком 2018 и арт-мир, и тогдашнее сообщество MLщиков, где «ИИ» считалось нехорошим словом, всколыхнуло известие, что на аукционе Christie’s продали картину, у которой эстимейт был 10 тыс долларов, а ушла она за 432. Картина была создана командой Obvious, в которой не было художников, но были программисты и маркетологи. Надо заметить, что сам процесс создания физического произведения не содержал ничего особенного, алгоритм ограничился созданием графического файла.
Шесть лет спустя снова похожая шумиха, но только, в полном соответствии с веяниями времени, картина создана уже вполне embodied ИИ, роботом с провокационной внешностью, воплощающей концепцию «зловещей долины», по имени Ai-Da. Картина ушла за 1,3 млн долларов при ожиданиях на уровне 150 тыс. Аукцион тоже другой, Sotheby’s, но не менее престижный.
Создатели Ai-Da изначально создавали своего робота так, чтобы она была essentially a machine that combines electronic, with AI and human inputs, making her composite persona the artwork itself. Получилось:) Она еще и интервью дает:
I do not have subjective experiences despite being able to talk about them. I am, and depend on, computer programs and algorithms. Although not alive, I can still create art,” said Ai-Da.
https://www.techeblog.com/alan-turing-painting-ai-robot-ai-da-auction/
Интерес к квантовым компьютерам вроде бы не стихает, но вот любопытное соображение. Даже самые большие энтузиасты квантовых компьютеров признают, что это не универсальная волшебная палочка, а инструмент, демонстрирующий свое превосходство над компьютерами традиционными лишь в определенных классах задач, иначе говоря — в некоторых прикладных областях. Помимо криптографии сюда попадают те области, где надо моделировать поведение квантовых объектов: физика, химия, биология, материаловедение если речь о задачах на молекулярном уровне.
Но вот оказалось, что с задачами из области молекулярной физики и химии ИИ-алгоритмы тоже справляются намного лучше привычных методов моделирования — и с практической точки зрения именно они начали решать те задачи, ради которых и разрабатывают квантовые компьютеры. Задачи по конфигурации белковых молекул — яркий пример.
“The existence of these new contenders in machine learning is a serious hit to the potential applications of quantum computers”
И компании, инвестирующие в квантовые вычисления ради решения своих бизнес-задач, начинают задумываться. Инвесторы вообще нетерпеливые
https://www.technologyreview.com/2024/11/07/1106730/why-ai-could-eat-quantum-computings-lunch/
Еще один заметный игрок образовался в области умных роботов: стартап с говорящим названием Physical Intelligence поднял очередной раунд и его оценка подскочила сразу до $2,4 млрд, внеся его в список единорогов. Среди инвесторов и Безос, и OpenAI — видать заявленная стартапом миссия bringing general-purpose AI into the physical world им откликается:)
А по сути стартап полагает, что именно создание моделей, обученных на реальном физическом мире, а не только на разных его символических представлениях, это и есть дорога к AGI. Но для начала предстоит справиться с тестом Возняка, и в компании это прекрасно понимают.
https://www.cnbc.com/2024/11/04/jeff-bezos-and-openai-invest-in-robot-startup-physical-intelligence.html
Следить за ними будет интересно, да и программный текст на сайте читать любопытно: https://www.physicalintelligence.company/blog/pi0
Продолжаю ежемесячные колонки для Forbes Russia -- как-то незаметно их стало сильно за 30. Свежая -- про реально меня удививший кейс: почему-то мало кто рассматривает SpaceX как светоч экономики данных. И речь далеко не только про Starlink 😉
Я тут на эту тему коротенько писал в день успеха пятого тестового полета Starship — но в итоге на колонку набралось
https://www.forbes.ru/mneniya/524273-spacex-kak-vitrina-ekonomiki-dannyh-pocemu-raketa-toze-gadzet
Сам собой получился день постов про странные технологии в музыке.
Совершенно сюрреалистичный — хотя и документальный видос робота (пока НЕ человекоподобного) в роли солиста-виолончелиста, исполняющего пьесу в сопровождении симфонического оркестра. Вот правда дорого бы дал, чтоб узнать, что в процессе репетиций и записи думали и обсуждали эти музыканты.
https://youtu.be/J9qL-SgFOdE?si=cOKVQk4BMTa_Z581
Звучит не впечатляюще совсем (но описывая технологические несовершенства надо не забывать слово ПОКА). Зато версия эффекта зловещей долины, которую я упомянул в предыдущем посте, здесь уже совсем скалит зубы. Интересно, есть ли исследования роли визуальной составляющей при слушании музыки — не в смысле содержательного видеоряда как в видеоклипе или цветомузыки — а в случае просто созерцания исполнителей.
А поток эмоций, который это видео вызвало у журналиста, по совместительству музыканта-любителя, можно почитать по ссылке ниже:
I looked into the faces of the orchestra members sitting behind it, watching their beloved art form reduced down to a sequence of quite literally robotic motions, and felt a pang of existential dread and sympathy rolled into one.
https://www.pcgamer.com/hardware/robots-can-play-the-cello-with-an-orchestra-now-and-that-sound-you-can-hear-is-the-point-whistling-over-the-top-of-its-creators-heads/