Очень интересная заметка — немножко про наше будущее — в которой анализируется изменение поведения судей в теннисе с того момента, как их ошибки начала исправлять ИИ-система (причем последнее слово именно за ней).
На большинстве топовых турниров сейчас используется система Hawk-Eye, в которой от 6 до 10 камер, расположенных вокруг корта, позволяют в точности восстановить траекторию мяча и с миллиметровой точностью определять, был ли аут — то есть где относительно линии мяч коснулся площадки.
Оказалось, что, во-первых, после появления этой системы белковые судьи стали реже ошибаться:) Риск публичного осуждения (когда ИИ может продемонстрировать их ошибки) заставил людей стать внимательнее.
Но интересней оказались детали. Оказалось, что до введения ИИ-надзора люди чаще объявляли аут, когда его на самом деле не было, то есть старались перебдеть (в сравнении со случаями, когда аут на самом деле был, но судьи не среагировали).
После появления объективного контроля ситуация поменялась: в спорных случаях люди скорее стали пропускать ауты, то есть предпочитать недобдеть. Психологически объяснимо: ложный крик “аут” останавливает игру и вызывает более сильную эмоциональную реакцию игроков и зрителей — судьи стали минимизировать нападки на себя:)
Учитывая, что потихоньку мнения ИИ-помощников станут значимыми и в других местах, например, в судах или в медицине, там будет интересно: Станут ли судьи помягче, а медики, наоборот, склонны к избыточным диагнозам (в рамках того же психологического механизма минимизации осуждения со стороны).
https://www.economist.com/science-and-technology/2024/02/15/what-tennis-reveals-about-ais-impact-on-human-behaviour
OpenAI только что выпустили SORA— text2video модель
Генерация видео по текстовому описанию наступила!
Сегодня обещают статью
Промпт: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
🟣https://openai.com/sora#research
Ждем третью серию этого прекрасного сериала про Starship: две первые были зрелищны, эмоциональны — и, в общем, вполне демонстрировали прогресс, так что в этот раз хочется более длинной трансляции и картинок уже с орбиты:)
Обещают в ближайшие недели, если не случится задержек с официальными разрешениями.
https://www.space.com/spacex-rolls-starship-pad-third-test-flight-photos
На выходных в новостных лентах много было картинок и видео с полыхающим беспилотником Waymo посреди Сан-Франциско.
Можно было бы рассуждать о луддизме и восстании людей против машин — но, полагаю, всё сильно прозаичнее: это же Сан-Франциско, за последние несколько лет сильно похудевший.
После тех картин, что наблюдал там в 2021 и 2022, уверен, что это просто шпана, причем понимающая, что когда в машине нет людей, куда спокойней ее крушить и жечь; полиция даже и дела может не возбудить. Грустно всё это видеть в городе, который еще в 80-е полюбил с первого визита…
https://www.theverge.com/2024/2/11/24069251/waymo-driverless-taxi-fire-vandalized-video-san-francisco-china-town
Очёчки косяком пошли:) Вот еще одни: легонькие, ретро-стильные, от ex-Apple персонажа по фамилии Bobak, которого я упорно читаю как Bobuk :)))
Идея примерно как в Ray-Ban’овских умных очках: встрить интерфейс к умному ИИ-ассистенту, который видит через камеру то же, что ты видишь, и позволить ему мультимодально отвечать поверх наблюдаемой реальности.
Сегодня открыли предзаказ по цене 349 долларов; поставки обещают в апреле. Цена невысокая, поскольку это не самостоятельное устройство, а периферия к смартфону: связь с облачными сервисами типа ChatGPT не предполагает никаких тяжелых вычислений на устройстве.
И, в отличие от Meta Ray-Ban, это просто ассистент, а не клиент для соцсетей: камера в нем чтоб картинку на анализ передать, а не чтоб ролик с нее запостить.
Отлично, поле новых железяк расширяется, к концу года можно будет многое посравнивать и что-то понять про предпочтения людей в мире ИИ-ассистентов, которые всегда с тобой.
https://www.zdnet.com/article/the-most-promising-ai-smart-glasses-are-from-a-brand-youve-never-heard-of/
В 70-е — 80-е годы прошлого века, когда появилась и впечатлила многих физиков идея инерциального лазерного термояда, я как раз оказался в том месте, где ей занимались в СССР, а позже повезло и в LLNL побывать. Как первую любовь, такое не забываешь, судьбой потом всю жизнь интересуешься:)
Прошло полвека , и вот, наконец, удалось получить из мишени, облученной мощным коротким лазерным импульсом, больше энергии, чем было в этом самом импульсе. Это колоссальный научный прорыв, в который вложены огромные средства — а еще и судьбы тысяч талантливых физиков и инженеров нескольких поколений.
Немножко неприятно, что писать о нем начали с излишней лихостью, обещая, что вот-вот лазерный термояд будем нам электричество вырабатывать в промышленных масштабах и тем навсегда очистит энергетику от ископаемой скверны.
От текущего научного достижения до сколь-нибудь работоспособного прототипа генератора — ещё, увы, не одно десятилетие. И потому приятно, что на фоне разнузданного научпопа появляются внятные и трезвые статьи; очень полезно такую прочитать.
https://spectrum.ieee.org/nuclear-fusion-breakthrough-long-road
Вот и еще одна большая популярная платформа, на сей раз игровая, озаботилась снятием языкового барьера — и теперь игроки на Роблоксе (по крайней мере те, что говорят на 16 выбранных для перевода языках) смогут общаться в играх без этого самого барьера.
Само по себе вполне ожидаемо: качественный нейроперевод много где уже есть: в браузерах, в конференционном софте, например.
Удивляет меня другое: сценаристы или фотографы очень громко возмущаются, проводят акции, требуют защитить их от безработицы. Но, кажется, такая угроза для переводчиков куда ближе и реальней. Почему не слышно их протестов или жалоб студентов переводческих специальностей?
https://venturebeat.com/games/roblox-breaks-language-barriers-with-ai-based-real-time-chat-translation/
Мы быстро, конечно, в SciFi попали:
За $159.99 теперь каждый может купить готовый набор для нейронного подключения живого таракана к чипу, чтобы, ну, побегать им с телефона
¯\_(ツ)_/¯
Видео с тараканом-киборгом.
Покупать тут.
В отличие от разработчиков всякого развлекательного софта, создатели профессиональных программ вполне готовы вкладываться в создание нативных приложений под Vision OS (да, продажи стартовали сегодня). Вчера я писал про Microsoft, сегодня с аналогичной новостью подтянулся Adobe, хотя в этот раз предлагается далеко не весь богатый набор Creative Cloud.
Видимо, верят в сценарии рабочего использования нового устройства. Ну, и творения Firefly AI хорошо должны смотреться в таком антураже:)
https://www.theverge.com/2024/2/2/24059011/adobe-firefly-ai-image-generator-lightroom-apps-apple-vision-pro
За день до начала поставок Apple Vision Pro, Microsoft объявил, что в App Store для Vision OS с первого же дня будут доступны все основные офисные приложения: Teams, Word, Excel, PowerPoint, Outlook, OneNote, и Loop, причем в версии с поддержкой ИИ-ассистента Copilot. Microsoft Teams on Vision Pro поддержит уникальную для этих очков фичу Persona.
Для успеха Vision Pro в роли spatial computer, а не просто дорогих VR-очков, это может оказаться важнее чем наличие или отсутствие игрушек, которое огорчает поклонников VR, всюду пытающихся углядеть перспективы для буксующей метавселенной:)
https://techcommunity.microsoft.com/t5/microsoft-365-blog/announcing-microsoft-365-apps-available-on-apple-vision-pro/ba-p/4042505
Не новинка, но я пропустил, а зря. Почти десять минут видео на основе фотографий марсианских пейзажей в 4К; на большом экране смотрится как фантастическая документалка, и периодически приходится себе напоминать, что это не рендеринг, а реальные фото, снятые где-то за десятки миллионов км от того дивана, на котором я ими любуюсь.
https://youtu.be/Vy_RPd0rblI
Сегодня с утра все ленты технологических новостей полны известий о том, что компания Маска Neuralink вживила первый свой нейроимплант человеку — и пациент чувствует себя хорошо, а первичные тесты интерфейса выглядят многообещающе. Про сам стартап Bloomerg, например, пишет: Startup is a leader in the growing brain-computer tech sector.
Имя Маска для многих сияет так, что деталей не различить, поэтому обращаю внимание на важный здесь артикль “a” 🙂
Достижение колоссальное, НО: это действительно лишь один из лидеров новой отрасли нейроинтерфейсов для неврологических больных, страдающих параличами и пр. Другие стартапы заметно раньше получили разрешения на работу с людьми, и, например, Blackrock Neurotech уже сотрудничает с сотнями исследовательских лабораторий, люди помощью их интерфейсов довольно быстро набирают тексты, рисуют и управляют протезами. А отрасль, действительно, очень многообещающая.
Изумительная демонстрация того, что цифровые технологии становятся так же важны и так же могучи, как финансы. В банках есть довольно строгие правила, определяющие благонадежность клиентов и контролирующие законность транзакций ими проводимых. Эти многим знакомые процедуры KYC позволяют, например, легко вводить санкции и ограничения со стороны той страны, в валюте которой производятся операции.
И вот теперь американская администрация хочет нечто подобное ввести для технологий; все началось с экспортных ограничений, но сейчас дошло до почти точного повторения банковских KYC. Теперь знать и проверять своего клиента должны будут провайдеры облачных сервисов, чтобы лишенный потока чипов Китай не смог, например, тренировать свои модели в американских облаках. Провайдеры должны будут собирать информацию о своих клиентах и том, для чего они используют сервисы; при наличии подозрительной активности — докладывать.
Фрагментация цифрового мира набирает обороты:(
https://fortune.com/2024/01/29/biden-administration-cloud-providers-amazon-microsoft-investigate-report-foreign-clients-developing-ai-apps-platforms/
Все, наверное, видели, но все-таки не могу не поделиться: видел много раз картинку на этой неделе и полностью согласен с заголовком статьи:) Более того, и сама ситуация не на шутку эпична.
Напоминаю, вдруг кто-то ещё не в курсе: японский спускаемый лунный модуль совершил прецизионную по точности автономную посадку: в радиусе меньше 10 метров от заданной точки. Увы, сбой в работе одного из тормозных двигателей привел к тому, что на поверхности аппарат совершил кувырок и в итоге застыл “вверх ногами”. Но перед этим он успел выпустить два миниатюрных ровера, которые отъехали от него на некоторое расстояние, и один из них сумел передать на Землю через уже умирающую от отсутствия питания (поскольку лежа в такой нештатной позе модуль не смог раскрыть солнечные батареи) систему связи фотку перевернутого модуля.
Нарочно не придумаешь.
https://mashable.com/article/japan-moon-landing-recent-images
Интересный проект;) Послушал пару выпусков — синтезированные голоса очень быстро себя выдают, в контенте многовато воды, НО:
1. Синтез голоса лучшее быстро, так что проблема временная; да и непринципиальная
2. Качество текста при всех к нему претензиях лучше, чем в среднем в очень многочисленных каналах про ИИ и новинки технологий
Да да да!
OPEN AI тизернули (так, поглядеть одним глазком) свою предстоящую Text2Video модель под названием SORA.
🤩 из хорошего:
- необыкновенное качество, модель просто бъет всех конкурентов наголову
- как будто вылеченные болячки с глазами, лицами, руками, анатомией в целом и пр.
- получилось соблюсти баланс между качеством / реалистичностью и вариативностью результатов (например, можно сгенерировать видео с плоскими странными необычными рыбами, но в духе документалок от BBC).
😒 из плохого:
- модель непонятно когда выйдет (говорят, впереди еще много тестов, чтобы избежать проблем с генерацией дипфейков и вот этого всего).
- в модели будет аж 2 фильтра цензуры.
- все видео выглядят довольно "глянцевыми" и красивыми - вопрос, не получится ли как с MidJourney, по генерациям из которой когда-то сразу угадывался единый стиль.
Пока что доступ дадут избранным артистам и видеомейкерам, парочка месяцев на тесты, допил и, видимо, ближе к середине года будет открытая beta. Ждёмс!
Первого марта состоится мировая премьера второй части “Дюны” Вильнёва, и по этому случаю Microsoft учинил изящную коллаборацию. У Micrjsoft Flight Simulator 2020 появилось расширение с пустынями и каньонами Арракиса. Летательный аппарат тоже соответствует: управлять придется орнитоптером.
Красиво в традиционно реалистичный симулятор вплели фантастическую планету и фантастический же воздушный корабль, для которого любовно создали свои летные характеристики и управление:)
Напрашивается слово "метавселенная" -- но я его замну:))
https://venturebeat.com/games/microsoft-flight-simulator-launches-dune-expansion-so-you-can-fly-an-ornithopter/
Чтобы вы не думали что под Apple Vision Pro сейчас выходят только развлекательные и интерьерные приложения
Это приложение для работы с медицинскими данными.
SurgicalAR Vision — использует Vision Pro для расширенной визуализации данных медицинских изображений и других медицинских данных. Приложение включает в себя функции просмотра изображений, работу с ними, измерения и трехмерную визуализацию.
Пора забывать слово Bard применительно к гугловскому ИИ. Но за любым переименованием или ребрендингом всегда стоит желание to give your product a name that creates the right vibe.
Вот пост самого Сундара Пичаи с объяснениями, что и почему.
Gemini is evolving to be more than just the models. It supports an entire ecosystem — from the products that billions of people use every day, to the APIs and platforms helping developers and businesses innovate.
Фокус заявлен на Workspace и Cloud: генеративный ИИ все больше про деловые применения, а не возбуждающие креативный класс творческие способности:)
И да, нотки Copilot чувствуются в этой истории:))
(Ну, а комментарии можно вот здесь, например, почитать)
Так уж сложилось, что самая дорогая рекламная минута в Штатах — это минута во время трансляции Суперкубка. Компании, покупающие такую рекламу, помимо всего прочего делают громкое публичное заявление: вот в чем наша ставка в этом году, вот что для нас главное, вот с чем мы хотим чтоб пользователь нас ассоциировал.
Microsoft не впервые покупает рекламу, и у него бывали концептуальные высказывания в ней, типа что софт очень важен для человечества. И вот он снова закупил минуту. И прорекламировал Copilot. Ставка сделана.
https://youtu.be/SaCVSUbYpVc
Как все-таки хорошо, что мир полон прекрасных неленивых чудаков:) Вот кто-то из них в свое время не поленился запустить сайт, на котором рассчитывается текущая позиция той самой Теслы с манекеном в ней, которую ровно шесть лет назад, 6 февраля 2018, отправили в космос в ходе первого тестового запуска Falcon Heavy.
С тех пор Стармен (так зовут манекена) совершил почти 4 витка по орбите вокруг Солнца, которая в дальних своих точках заходит за орбиту Марса. А прямо сейчас до него — почти шесть световых минут :), это немногим больше 100 млн км.
Там есть еще всякие забавные графики и цифры, но главное вообще есть такой сайт:)
https://www.whereisroadster.com
Все высказываются на тему поступивших в продажу Apple Vision Pro — вот и я тоже:)
Но прогнозировать я не люблю, поэтому не хочу загадывать, чем дело кончится. А вот следить за происходящим мне будет очень интересно: мне кажется, что Apple вполне честен, когда избегает упоминаний всех этих реальностей с прилагательными: смешанных, виртуальных и пр. Они хотят не доступ в эти самые реальности предоставить, а еще один форм-фактор для универсального ПК предложить; причем в форме шлема он сможет не только лучше решать старые задачи, рабочие и развлекательные, но и сумеет кое-что новое.
Посмотрим, как эти идеи купят пользователи; мнение экспертов и журналистов здесь — дело десятое.
https://www.forbes.ru/tekhnologii/505397-apple-nabiraet-ocki-pocemu-kompania-ne-perestaet-iskat-novyj-komp-uter
Впечатляющая диаграмма, которая показывает, как за полвека менялись каналы покупки музыки: от винила и чуть-чуть кассет в семидесятые до нынешних стримингов. Три вещи обращают на себя внимание:
1. Как же это все быстро происходило: в 1973 я уже в институте учился, а с тех пор не раз поменялся пейзаж.
2. Винил отказался совсем помирать и снова в деньгах заметную долю занимает.
3. Как же всё выросло в абсолютных цифрах — а музыканты умудряются при этом сетовать на технологии и вспоминать якобы тучные былые времена:)
https://www.eastbaytimes.com/2024/02/03/heres-how-music-formats-have-changed-since-the-1970s/
Сэм Альтман вдруг решил поинтересоваться у своих подписчиков в Х, какое слово использовать, чтоб описать чувство ностальгии по настоящему. Вот словно обнаружил и прочитал стихотворение поэта моей юности, Андрея Вознесенского:
Я не знаю, как остальные,
но я чувствую жесточайшую
не по прошлому ностальгию —
ностальгию по настоящему.
Удивительное эхо через почти полвека... Зато не очень удивительно, что в англоязычной дискуссии одно из самых красивых слов предложил Microsoft's AI chatbot Copilot: “Nowstalgia.”
Не обнаруженная вовремя утечка персональных даных, особенно чувствительных для людей, может дорого обойтись, и поставить когда-то блистательный стартап на грань банкротства. Про 23andMe слышали, наверное, все: возможность узнать свое происхождение и найти подчас неизвестных родственников, просто плюнув в пробирку и отправив ее на генетический анализ, завораживала многих. Компания успешно вышла на биржу, какое-то время ее капитализация составляла около 6 млрд долларов, по всему миру появлялись последователи.
Но в прошлом году хакеры получили доступ к данным пользователей (не генетическим, но к данным о родственных связях), и в течение 5 месяцев утечка оставалось не обнаруженной, злоумышленники стащили информацию про почти 7 млн человек,в первую очередь еврейского и китайского происхождения. Результатом стали колоссальные иски, падение акций, грозящее делистингом и разочарование инвесторов. Чем дело кончится, пока неясно, но перспективы смотрятся не очень.
https://www.fastcompany.com/91020738/23andme-risk-delisted-nasdaq-class-action-lawsuits
Вот и новый вид технического спорта (или шоу — хотя, в сущности, это одно и то же) на подходе. Про джет-паки, мощные турбины, закрепляемые на руках пилота, пишут давно, есть впечатляющие видео полетов и, например, посадки на палубу корабля. Военные тоже интерес проявляли и даже как-то на параде показали.
Но вот, наконец, объявлено, что в Дубае 28 февраля пройдут первые соревнования - гонка с препятствиями на джет-паках. Объявила об этом компания Gravity Industries, которая не первый год такие устройства выпускает и даже умудряется их продавать по цене около полмиллиона долларов. Пока всего восемь пилотов заявлены участвовать, но, возможно, эта штука наберет популярность. Ждать осталось меньше месяца, точно хочу видео с этого мероприятия!
https://newatlas.com/aircraft/jet-suit-race/
Amazon, как и ожидалось, официально объявила, что отказывается от сделки по приобретению iRobot за $1,7 мрд. Причина очевидна и названа: Евросоюз заявил, что сделку заблокирует ради сохранения конкуренции.
Любопытно, что сделка не была каким-то поглощением, грозившим маленькой, но гордой компании: iRobot синхронно с Amazon выразила сожаление, что сделка распалась, — и тут же уволила почти треть своих сотрудников; акции ее рухнули, осложнив финансовое положение компании. Перспективы её неочевидны.
Комментарий Amazon выглядит довольно точным: это не защита конкуренции, а её подавление на глобальном рынке, где не всех интересует мнение Евросоюза: Mergers and acquisitions like this help companies like iRobot better compete in the global marketplace, particularly against companies, and from countries, that aren’t subject to the same regulatory requirements in fast-moving technology segments like robotics.
Интересно, кого на самом деле защищал Евросоюз; через годик-другой увидим динамику рынка домашних роботов — и что-то я сомневаюсь, что в лидеры там вырвется Европа
https://www.thestreet.com/technology/amazon-irobot-acquisition-canceled
Интересно всё-таки, насколько временные масштабы отличаются в фундаментальной науке и лихорадочно торопливом мире хайтековых продуктов. В хайтеке нынче год — это уже много, планировать какой-то проект к запуску через десять лет кажется безумием.
А для экспериментальной физики и астрофизики такие горизонты планирования норм. Вот очередной и немножко фантастический:)
Девять лет назад знаменитый наземный эксперимент LIGO впервые зарегистрировал гравитационные волны, возмущения пространства-времени, вызванные событиями с участием черных дыр. Но сильно масштабировать аналогичные детекторы на Земле принципиально невозможно: устройства потребовали бы вакуумных труб длиной сотни километров и полного отсутствия механических вибраций земной коры.
Поэтому гравитационный детектор следующего поколения, LISA, the Laser Interferometer Space Antenna, будет развернут в космосе: вакуум там создавать не надо, он и так присутствует, а расстояния между детекторами можно поддерживать на уровне миллионов километров. Развернуть этот интерферометр планируется в середине 30-х годов, и это представляется очень быстрой реализацией:)
https://phys.org/news/2024-01-nasa-collaborating-european-gravitational-observatory.html
Нейросети пишут подкаст про нейросети (на русском)
Мне в личку постучался подписчик и рассказал про свой проект. Он сделал подкаст про AI на русском языке, который создается автоматически с помощью нейросетей! Это безумие, которое стало реальным благодаря мощному прогрессу в АI за последние пару лет, за которым мы тут и следим 👀.
Причем, нейросетевой подкаст D00M4ACE содержит полноценный пайплан с нейсколькими этапами поиска и обработки актуальной информации по теме подкаста, то есть это не просто озвучка блогпостов из интернета. Со слов автора, весь пайплайн заскриптован, и между шагами нет ручных действий. На вход тема подкаста - на выходе набор wav файлов.
Как это работает вкратце:
1. По заданной теме подкаста парсится реддит и собирается база текстов.
2. Далее эта база пропускается через ряд LLM-ок, которые разбивают ее на отдельные суммаризированные блоки, которые потом еще раз пропускаются через LLM-ки для ранжирования и отбора наиболее высоких по рейтингу кусков информации.
3. Затем это добро пропускается через API gpt-4-turbo, где системный промпт содержит инструкцию написать сценарий подкаста, задает описание ведущих и прочие требования.
4. И, наконец, Text-to-Speach нейронки преобразуют сценарий в аудиозапись и с помощью RVC (real-time voice cloning) голосам придается идентичность. Причем один из виртуальных подкастье имеет голос самого автора, а для со-ведущей автор натренировал нейронку, которая повторяет голос его супруги.
Пайплайн все ещё в процессе улучшения и автор планирует переделать его на базе опенсоурс решений без использоывания OpenAI апишек.
Внизу прикрепляю один из эпизодов.
Канал c подкастом
d00m4ace">Ютуб
Сайт автора
@ai_newz
Немножечко про психотерапию будущего, местами доступную уже сегодня: как микс из VR и ИИ позволил создать виртуального терапевта, который реально помогает людям и отчасти решает в США острую проблему нехватки хороших психотерапевтов в условиях роста спроса на их помощь. Попутно мне нравится точный по нынешним временам термин, описывающий среду, в которой оперирует eXtended-reality Artificial Intelligence Assistant (XAIA): «сгенерированная реальность».
В исследовании принимали участие 14 человек с тревожными расстройствами и депрессией, в целом они остались довольны (Participants described the digital avatar as empathic, understanding, and conducive to a therapeutic alliance), хотя и претензий выказали немало. Авторы работы полагают, что начало положено и первые результаты вполне обнадеживают: надо и дальше совершенствовать виртуальных ИИ-терапевтов
https://www.nature.com/articles/s41746-024-01011-0