В отличие от разработчиков всякого развлекательного софта, создатели профессиональных программ вполне готовы вкладываться в создание нативных приложений под Vision OS (да, продажи стартовали сегодня). Вчера я писал про Microsoft, сегодня с аналогичной новостью подтянулся Adobe, хотя в этот раз предлагается далеко не весь богатый набор Creative Cloud.
Видимо, верят в сценарии рабочего использования нового устройства. Ну, и творения Firefly AI хорошо должны смотреться в таком антураже:)
https://www.theverge.com/2024/2/2/24059011/adobe-firefly-ai-image-generator-lightroom-apps-apple-vision-pro
За день до начала поставок Apple Vision Pro, Microsoft объявил, что в App Store для Vision OS с первого же дня будут доступны все основные офисные приложения: Teams, Word, Excel, PowerPoint, Outlook, OneNote, и Loop, причем в версии с поддержкой ИИ-ассистента Copilot. Microsoft Teams on Vision Pro поддержит уникальную для этих очков фичу Persona.
Для успеха Vision Pro в роли spatial computer, а не просто дорогих VR-очков, это может оказаться важнее чем наличие или отсутствие игрушек, которое огорчает поклонников VR, всюду пытающихся углядеть перспективы для буксующей метавселенной:)
https://techcommunity.microsoft.com/t5/microsoft-365-blog/announcing-microsoft-365-apps-available-on-apple-vision-pro/ba-p/4042505
Не новинка, но я пропустил, а зря. Почти десять минут видео на основе фотографий марсианских пейзажей в 4К; на большом экране смотрится как фантастическая документалка, и периодически приходится себе напоминать, что это не рендеринг, а реальные фото, снятые где-то за десятки миллионов км от того дивана, на котором я ими любуюсь.
https://youtu.be/Vy_RPd0rblI
Сегодня с утра все ленты технологических новостей полны известий о том, что компания Маска Neuralink вживила первый свой нейроимплант человеку — и пациент чувствует себя хорошо, а первичные тесты интерфейса выглядят многообещающе. Про сам стартап Bloomerg, например, пишет: Startup is a leader in the growing brain-computer tech sector.
Имя Маска для многих сияет так, что деталей не различить, поэтому обращаю внимание на важный здесь артикль “a” 🙂
Достижение колоссальное, НО: это действительно лишь один из лидеров новой отрасли нейроинтерфейсов для неврологических больных, страдающих параличами и пр. Другие стартапы заметно раньше получили разрешения на работу с людьми, и, например, Blackrock Neurotech уже сотрудничает с сотнями исследовательских лабораторий, люди помощью их интерфейсов довольно быстро набирают тексты, рисуют и управляют протезами. А отрасль, действительно, очень многообещающая.
Изумительная демонстрация того, что цифровые технологии становятся так же важны и так же могучи, как финансы. В банках есть довольно строгие правила, определяющие благонадежность клиентов и контролирующие законность транзакций ими проводимых. Эти многим знакомые процедуры KYC позволяют, например, легко вводить санкции и ограничения со стороны той страны, в валюте которой производятся операции.
И вот теперь американская администрация хочет нечто подобное ввести для технологий; все началось с экспортных ограничений, но сейчас дошло до почти точного повторения банковских KYC. Теперь знать и проверять своего клиента должны будут провайдеры облачных сервисов, чтобы лишенный потока чипов Китай не смог, например, тренировать свои модели в американских облаках. Провайдеры должны будут собирать информацию о своих клиентах и том, для чего они используют сервисы; при наличии подозрительной активности — докладывать.
Фрагментация цифрового мира набирает обороты:(
https://fortune.com/2024/01/29/biden-administration-cloud-providers-amazon-microsoft-investigate-report-foreign-clients-developing-ai-apps-platforms/
Все, наверное, видели, но все-таки не могу не поделиться: видел много раз картинку на этой неделе и полностью согласен с заголовком статьи:) Более того, и сама ситуация не на шутку эпична.
Напоминаю, вдруг кто-то ещё не в курсе: японский спускаемый лунный модуль совершил прецизионную по точности автономную посадку: в радиусе меньше 10 метров от заданной точки. Увы, сбой в работе одного из тормозных двигателей привел к тому, что на поверхности аппарат совершил кувырок и в итоге застыл “вверх ногами”. Но перед этим он успел выпустить два миниатюрных ровера, которые отъехали от него на некоторое расстояние, и один из них сумел передать на Землю через уже умирающую от отсутствия питания (поскольку лежа в такой нештатной позе модуль не смог раскрыть солнечные батареи) систему связи фотку перевернутого модуля.
Нарочно не придумаешь.
https://mashable.com/article/japan-moon-landing-recent-images
Интересный проект;) Послушал пару выпусков — синтезированные голоса очень быстро себя выдают, в контенте многовато воды, НО:
1. Синтез голоса лучшее быстро, так что проблема временная; да и непринципиальная
2. Качество текста при всех к нему претензиях лучше, чем в среднем в очень многочисленных каналах про ИИ и новинки технологий
Гугл запустил очень красивый генератор коротких видео с набором опций: тут и привычный текст-в-видео, и оживлял статической картинки, и всякие стилизации. Название намекает: Lumiere; да, это первые шажочки, но очень скоро будет много больше.
Открыть ссылку полезно хотя бы чтоб полюбоваться на галерею в начале статьи. Заявление авторов не отличается скромностью, но выглядит вполне адекватным: они утверждают, что создали a text-to-video diffusion model designed for synthesizing videos that portray realistic, diverse and coherent motion -- a pivotal challenge in video synthesis. Но пока это не готовый пользовательский продукт, а исследовательское достижение.
FoxNews, конечно, не самый правильный канал для получения адекватных технологических новостей. Однако тот факт, что и они уже пишут о человекоподобных роботах без особого изумления, свидетельствует, что этих разработок стало настолько много, что они почти уже мейнстрим.
На этот раз описывается робот EVE, созданный норвежской компанией 1Х; параметры — как и у прочих андроидов — похожи на человеческие, разве что колесики вместо ног.
Может выполнять кое-какие задачи по дому, может работать на производстве и на складах. Деталей еще не очень много, зато после CES и подобных статей понятно, что разнообразных андроидов в этом году увидим много. Уже хочется не рекламных демонстрашек, а практических кейсов (и курьезов) из их работы 🙂
https://www.foxnews.com/tech/eve-the-robot-can-cook-clean-and-guard-your-home
Интересный был челлендж: поговорить про всё тот же ИИ в ночном эфире Первого канала ТВ. Спасибо ведущему, Григорию Тарасевичу, в итоге оказалось интересно, а грамотная редактура на постпродакшене отжала воду и запинки.
Вряд ли интересно самой аудитории этого канала, но может пригодиться в образовательных целях:)
(UPD: поправил битую ссылку, пардон)
https://www.1tv.ru/podcasts/kot-shredingera/vypuski/kot-shredingera-uchenyy-andrey-sebrant-o-strahah-pered-iskusstvennym-intellektom-i-zadachah-dlya-nego-vypusk-ot-19-01-2024
Сегодня много обсуждений старта предзаказа Apple Vision, и я уж не знаю, насколько случайно это совпадает с важной для Apple сорокалетней годовщиной.
Двадцать второго января во время Super Bowl XVIII дебютировала телереклама Apple Macintosh, и она куда больше была похожа не рекламу кинопремьеры, чем технологической новинки (кстати, и снимал ее Риддли Скотт).
Apple turned technology into fashion, and it did it through user experience — очень точная формулировка, и она хорошо сработала, ибо компания всегда понимала, что продает устройства для жизни, а не набор кое-как воплощенных технологий :)
И круто, что эти традиции до сих пор не сдулись.
https://theconversation.com/mac-at-40-user-experience-was-the-innovation-that-launched-a-technology-revolution-220535
Аналитики периодически напоминают, что высказывавшиеся год назад предположения о том, что ChatGPT угрожает поиску и может подточить безусловное доминирование Гугла (в большей части стран мира) не оправдались совсем. Доля Гугла стабильна, доля Бинга чуть-чуть выросла, но это не тот рост, которым пугали.
Тем не менее, сам Гугл совершенно не считает, что поиск может и дальше жить по-старинке. В свежем посте он описывает, как ИИ начнет уже сейчас менять поиск на смартфонах. Прежде всего, появится фишка «выдели что-то на экране, и мы тебе расскажем, что это» — причем выделить можно и на картинке с собственной камеры, и на любом стороннем материале, отображаемом на экране. А можно даже не делать снимок, а просто камеру навести.
https://blog.google/products/search/google-search-ai-january-2024-update/
Интересно, что в некоторых отчетах о вчерашней презентации нового смартфона Самсунга подобный функционал именно Самсунгу и приписывали:) Сам Гугл, впрочем, не использует каких-то восторженных эпитетов, описывая новинку, наоборот:
Today’s updates will make Search even more natural and intuitive, but we've only just scratched the surface of what's possible.
Всё только еще начинается:)
Скоро начинается форум в Давосе; там собравшиеся представители мировой элиты будут обсуждать насущное — т.е., как принято нынче, проблемы вокруг ИИ.
На прошлой неделе был издан отчет “Global Risks Report 2024”, и в нем ИИ-фейки помещены выше аж климатических проблем, неслыханное нарушение традиционного ранжирования.
https://www.cnbc.com/2024/01/10/wef-ai-election-disruption-poses-the-biggest-global-risk-in-2024.html
Бренд Swarovski большинству известен всякими блестящими побрякушками, но и он оказался не чужд современной моде всюду вкручивать ИИ:) Причем в данном случае всё очень по делу, а не маркетинговый хайп: дочка Swarovski Optik разработала и только что представила публике бинокль, который умеет распознавать практически любую в мире птицу, попавшую в поле зрения наблюдателя. Для любителей рассматривать пернатых в естественной среде — прямо сказка, и статья написана как раз таким энтузиастом, который в прошлом году принимал участие в закрытом (и очень секретном) тестировании устройства. У бинокля куча других полезных фич (например, стриминг на подключенный смартфон), которые действительно превращают добрую старую оптику в крутой цифровой девайс.
https://www.outsideonline.com/outdoor-gear/tools/swarovskis-ai-powered-binoculars-tell-you-what-youre-looking-at/
SpaceX протестировала спутниковую связь для смартфонов
Два обычных iPhone обменялись текстовыми сообщениями через спутник Direct to Cell.
https://twitter.com/SpaceX/status/1745246204118925711
—
@ventureinpics — инфографики о стартапах и инвестициях
Сэм Альтман вдруг решил поинтересоваться у своих подписчиков в Х, какое слово использовать, чтоб описать чувство ностальгии по настоящему. Вот словно обнаружил и прочитал стихотворение поэта моей юности, Андрея Вознесенского:
Я не знаю, как остальные,
но я чувствую жесточайшую
не по прошлому ностальгию —
ностальгию по настоящему.
Удивительное эхо через почти полвека... Зато не очень удивительно, что в англоязычной дискуссии одно из самых красивых слов предложил Microsoft's AI chatbot Copilot: “Nowstalgia.”
Не обнаруженная вовремя утечка персональных даных, особенно чувствительных для людей, может дорого обойтись, и поставить когда-то блистательный стартап на грань банкротства. Про 23andMe слышали, наверное, все: возможность узнать свое происхождение и найти подчас неизвестных родственников, просто плюнув в пробирку и отправив ее на генетический анализ, завораживала многих. Компания успешно вышла на биржу, какое-то время ее капитализация составляла около 6 млрд долларов, по всему миру появлялись последователи.
Но в прошлом году хакеры получили доступ к данным пользователей (не генетическим, но к данным о родственных связях), и в течение 5 месяцев утечка оставалось не обнаруженной, злоумышленники стащили информацию про почти 7 млн человек,в первую очередь еврейского и китайского происхождения. Результатом стали колоссальные иски, падение акций, грозящее делистингом и разочарование инвесторов. Чем дело кончится, пока неясно, но перспективы смотрятся не очень.
https://www.fastcompany.com/91020738/23andme-risk-delisted-nasdaq-class-action-lawsuits
Вот и новый вид технического спорта (или шоу — хотя, в сущности, это одно и то же) на подходе. Про джет-паки, мощные турбины, закрепляемые на руках пилота, пишут давно, есть впечатляющие видео полетов и, например, посадки на палубу корабля. Военные тоже интерес проявляли и даже как-то на параде показали.
Но вот, наконец, объявлено, что в Дубае 28 февраля пройдут первые соревнования - гонка с препятствиями на джет-паках. Объявила об этом компания Gravity Industries, которая не первый год такие устройства выпускает и даже умудряется их продавать по цене около полмиллиона долларов. Пока всего восемь пилотов заявлены участвовать, но, возможно, эта штука наберет популярность. Ждать осталось меньше месяца, точно хочу видео с этого мероприятия!
https://newatlas.com/aircraft/jet-suit-race/
Amazon, как и ожидалось, официально объявила, что отказывается от сделки по приобретению iRobot за $1,7 мрд. Причина очевидна и названа: Евросоюз заявил, что сделку заблокирует ради сохранения конкуренции.
Любопытно, что сделка не была каким-то поглощением, грозившим маленькой, но гордой компании: iRobot синхронно с Amazon выразила сожаление, что сделка распалась, — и тут же уволила почти треть своих сотрудников; акции ее рухнули, осложнив финансовое положение компании. Перспективы её неочевидны.
Комментарий Amazon выглядит довольно точным: это не защита конкуренции, а её подавление на глобальном рынке, где не всех интересует мнение Евросоюза: Mergers and acquisitions like this help companies like iRobot better compete in the global marketplace, particularly against companies, and from countries, that aren’t subject to the same regulatory requirements in fast-moving technology segments like robotics.
Интересно, кого на самом деле защищал Евросоюз; через годик-другой увидим динамику рынка домашних роботов — и что-то я сомневаюсь, что в лидеры там вырвется Европа
https://www.thestreet.com/technology/amazon-irobot-acquisition-canceled
Интересно всё-таки, насколько временные масштабы отличаются в фундаментальной науке и лихорадочно торопливом мире хайтековых продуктов. В хайтеке нынче год — это уже много, планировать какой-то проект к запуску через десять лет кажется безумием.
А для экспериментальной физики и астрофизики такие горизонты планирования норм. Вот очередной и немножко фантастический:)
Девять лет назад знаменитый наземный эксперимент LIGO впервые зарегистрировал гравитационные волны, возмущения пространства-времени, вызванные событиями с участием черных дыр. Но сильно масштабировать аналогичные детекторы на Земле принципиально невозможно: устройства потребовали бы вакуумных труб длиной сотни километров и полного отсутствия механических вибраций земной коры.
Поэтому гравитационный детектор следующего поколения, LISA, the Laser Interferometer Space Antenna, будет развернут в космосе: вакуум там создавать не надо, он и так присутствует, а расстояния между детекторами можно поддерживать на уровне миллионов километров. Развернуть этот интерферометр планируется в середине 30-х годов, и это представляется очень быстрой реализацией:)
https://phys.org/news/2024-01-nasa-collaborating-european-gravitational-observatory.html
Нейросети пишут подкаст про нейросети (на русском)
Мне в личку постучался подписчик и рассказал про свой проект. Он сделал подкаст про AI на русском языке, который создается автоматически с помощью нейросетей! Это безумие, которое стало реальным благодаря мощному прогрессу в АI за последние пару лет, за которым мы тут и следим 👀.
Причем, нейросетевой подкаст D00M4ACE содержит полноценный пайплан с нейсколькими этапами поиска и обработки актуальной информации по теме подкаста, то есть это не просто озвучка блогпостов из интернета. Со слов автора, весь пайплайн заскриптован, и между шагами нет ручных действий. На вход тема подкаста - на выходе набор wav файлов.
Как это работает вкратце:
1. По заданной теме подкаста парсится реддит и собирается база текстов.
2. Далее эта база пропускается через ряд LLM-ок, которые разбивают ее на отдельные суммаризированные блоки, которые потом еще раз пропускаются через LLM-ки для ранжирования и отбора наиболее высоких по рейтингу кусков информации.
3. Затем это добро пропускается через API gpt-4-turbo, где системный промпт содержит инструкцию написать сценарий подкаста, задает описание ведущих и прочие требования.
4. И, наконец, Text-to-Speach нейронки преобразуют сценарий в аудиозапись и с помощью RVC (real-time voice cloning) голосам придается идентичность. Причем один из виртуальных подкастье имеет голос самого автора, а для со-ведущей автор натренировал нейронку, которая повторяет голос его супруги.
Пайплайн все ещё в процессе улучшения и автор планирует переделать его на базе опенсоурс решений без использоывания OpenAI апишек.
Внизу прикрепляю один из эпизодов.
Канал c подкастом
d00m4ace">Ютуб
Сайт автора
@ai_newz
Немножечко про психотерапию будущего, местами доступную уже сегодня: как микс из VR и ИИ позволил создать виртуального терапевта, который реально помогает людям и отчасти решает в США острую проблему нехватки хороших психотерапевтов в условиях роста спроса на их помощь. Попутно мне нравится точный по нынешним временам термин, описывающий среду, в которой оперирует eXtended-reality Artificial Intelligence Assistant (XAIA): «сгенерированная реальность».
В исследовании принимали участие 14 человек с тревожными расстройствами и депрессией, в целом они остались довольны (Participants described the digital avatar as empathic, understanding, and conducive to a therapeutic alliance), хотя и претензий выказали немало. Авторы работы полагают, что начало положено и первые результаты вполне обнадеживают: надо и дальше совершенствовать виртуальных ИИ-терапевтов
https://www.nature.com/articles/s41746-024-01011-0
В Дубае любят (и умеют!) всё футуристичное. Интересно, что новые городские транспортные средства, которые там разрабатывают, это не какие-нибудь монорельсы с магнитным подвесом — как-то не прижились эти новшества, хотя экспериментам уже не один десяток лет. Это добрый старый рельсовый транспорт — только уже автономный, питаемый от чистого электричества, движущийся по своим эстакадам, чтоб не путаться с остальным графиком. Концепция колеса на рельсе оказалась очень устойчива к прорывным инновациям и прочим дирапшонам:)
https://luxurylaunches.com/transport/01-20-2024-driverless-pods-dubai.php
Разговоры про необходимость перехода ИТ-гигантов с их прожорливыми датацентрами на чистую энергию, не требующую сжигания углеводородов, звучат все громче. При этом поминают огромные поля солнечных панелей или нескончаемые шеренги ветряков — но есть проблема. Датацентрам требуется очень надежный и стабильный источник питания, и на них нельзя ввести временный режим экономии электропотребления, если что. При этом необходимая мощность серьезна: сейчас в США датацентры потребляют 17 ГВт; к 2030 ожидается рост этой цифры до 30 ГВт. Для масштаба: мощность крупнейшей в России Саяно-Шушенской ГЭС (а это колоссальное сооружение) — 6,4 ГВт.
Надежный, стабильный и одновременно очень мощный источник электроэнергии на сегодня известен один — так что не удивительно, что в Microsoft появилась Director of Nuclear Development Acceleration. Она справедливо замечает: “Microsoft is leading the way in advocating for a clean and sustainable energy future. I am looking forward to contributing to the datacenter R&D team's success.” Но нервная экологическая общественность всё равно её покусает, конечно:)
https://www.techradar.com/pro/microsoft-goes-atomic-worlds-most-valuable-company-just-hired-a-director-of-nuclear-development-acceleration-to-help-power-its-very-own-ai-revolution
И ещё странное эхо из Китая донесло слово “метавёрс”:)
Там создается околоправительственная экспертная группа из 60 человек, куда, в частности, входят специалисты из Huawei Technologies, Tencent Holdings, NetEase, Ant Group, Lenovo Group и Baidu — и академических центров. Задача перед группой амбициозная: разработать стандарты для метавселенной как сектора цифровой индустрии. Причем хотя основной фокус группы на национальных стандартах, предполагается, что группа будет способствовать local companies and institutions to deeply engage in international standard-setting activities.
Неужто хоть кто-то выработает для начала общепризнанное определение этой самой метавселенной?
Цукерберг в свое время умудрился так опошлить термин «метавселенная», что он стал чуть ли не ругательным, а в некоторых местах и просто запрещенным к использованию, так как его расплывчатость исключает конструктивное обсуждение. И вот теперь он плотно взялся за ИИ, и это слегка напрягает.
Он заявил, что теперь цель его компании — опенсорсный Общий ИИ: “Our long-term vision is to build general intelligence, open source it responsibly, and make it widely available so everyone can benefit”. На ресурсы Цукерберг не скупится и пообещал к концу года эквивалент 600 000 карт H100s для этих разработок и объединение исследовательских групп. Впрочем, про метавселенную он не забывает: “People are also going to need new devices for AI and this brings together AI and Metaverse is over time”, его вера в очки неколебима.
https://venturebeat.com/ai/meta-is-all-in-on-open-source-agi-says-zuckerberg/
Китайский суд создал очень практичный прецедент в области авторских прав в отношении ИИ творений. Нет, он не признал ИИ субъектом, который может претендовать на права, но зато согласился, что художник, использующий Stable Diffusion, вполне может обладать авторскими правами на сгенерированный результат, поскольку он является результатом интеллектуальных усилий автора промыта.
При этом была сделана оговорка, что решение не универсально, и в каждом случае надо отдельно рассматривать вклад автора и на основе этого принимать решения.
Ситуация удивительно напоминает ранние дни доброго старого интернета 1.0, когда все опубликованное в Сети считалось возможным использовать по собственному усмотрению со словами “да я ж из интернета взял!”
Попытки так же относиться к алгоритмически сгенерированным произведениям, похоже, ждет та же судьба.
https://www.scmp.com/tech/tech-trends/article/3248510/why-chinese-courts-landmark-decision-recognising-copyright-ai-generated-image-benefits-creators
Роботы общего назначения (и с уклоном в домашнее хозяйство) были вполне заметны на CES этого года, но, как ни странно, видео не очень много. А вот в этой работе специалистов Стэнфорда по имитационному обучению роботов — куча интересных видео о том, как у робота получается повторить операции, производимые человеком. Или как НЕ получается — видео ошибок робота не менее познавательны.
Конечно, это лабораторный экземпляр, и у него нет модного человекообразного тела. Но с этой задачей уже неплохо научились справляться другие люди.
Что важно: для обучения новой операции системе не надо огромного объема обучающих кейсов — достаточно нескольких десятков.
Любуйтесь кухонными достижениями 🙂
https://mobile-aloha.github.io
Автомобили — особенно электрические — становятся гаджетами, и Китай, похоже, собирается здесь играть не меньшую роль, чем в смартфонах:)
Вот только за последние дни две статьи: не очень дружелюбно настроенный к Китаю The Economist пишет, что тревоги западных автопроизводителей вполне обоснованы:
In 2023, Chinese industry groups claim, China overtook Japan to become the world’s biggest exporter of cars, in part because of surging sales of evs. In the final quarter of 2023, byd, a Chinese firm, surpassed Tesla as the world’s biggest manufacturer of purely battery-powered vehicles
https://www.economist.com/briefing/2024/01/11/western-firms-are-quaking-as-chinas-electric-car-industry-speeds-up
А тем временем BYD зафрахтовал специализированный электромобилевоз: судно, предназначенное исключительно для перевозки электромобилей в Европу. За один рейс этот громадный BYD Explorer No. 1 доставляет 7 000 машин
https://fortune.com/europe/2024/01/11/byd-using-purpose-built-ev-cargo-ships-send-cars-europe-first-set-sail/
Вы тут какашек набросали на предыдущий пост, а соскучившиеся по новинкам американские пользователи уже выкупили 10 000 штук первой партии по предзаказу за 24 часа — и теперь стартап собирает предзаказы на следующий тираж с поставкой в марте-апреле;) https://www.theverge.com/2024/1/10/24033498/rabbit-r1-sold-out-ces-ai
Читать полностью…