Заметки о технологиях, новостях и гаджетах. И всём остальном. По всем вопросам лучше писать в почту — sergiy.petrenko@pm.me YouTube http://www.youtube.com/@blognot Мой блог https://blognot.co/ Группа для обсуждения новостей — https://t.me/blognot_chat
OpenAI завершила свой 12-дневный марафон анонсов презентацией o3 — нового семейства "рассуждающих" моделей, преемника o1. Интересно, что компания пропустила название o2 из-за возможного конфликта с британским телекоммуникационным провайдером O2. Впрочем, символики тут все равно достаточно — вместо кислорода мы имеем озон, который до сих пор ассоциируется со свежестью.
Модели пока доступны только для исследователей безопасности. Компания планирует выпустить модели в публичный доступ довольно скоро — o3-mini к концу января 2025 года, а o3 вскоре после этого.
Главная особенность o3 — способность к "самопроверке" через "внутреннюю цепочку рассуждений". Модель может планировать действия и объяснять свои решения, хотя это увеличивает время отклика. Новинкой стала возможность регулировать время на "размышления" — чем больше времени, тем точнее результат.
По многим бенчмаркам o3 значительно превосходит предшественника: 87.5% на тесте ARC-AGI (против 25-32% у o1), 96.7% на AIME 2024, 87.7% на GPQA Diamond. Впрочем, эти результаты пока основаны только на внутреннем тестировании OpenAI.
Я, впрочем, немного разочарован — никогда еще моя покупка не устаревала так быстро, поскольку ровно сутки назад мы нас уговорили и подписались на ChatGPT Pro, с доступом к o1 pro. Придется выжимать из этого месяца максимум.
https://techcrunch.com/2024/12/20/openai-announces-new-o3-model/
Google представил новую "рассуждающую" AI-модель Gemini 2.0 Flash Thinking Experimental. Модель доступна в AI Studio и, по заявлению компании, способна рассуждать над сложными задачами в программировании, математике и физике.
В отличие от OpenAI, модель Google основана на "обычной" — Google 2.0 Flash, которая была представлена в бета версии на прошлой неделе. Правда, Thinking модель ограничена 32к контекста, в отличие от миллиона токенов, доступных основной модели. Но это не помешало пользователям ChatbotArena оценками вывести ее на первое место вместе с другой экспериментальной моделью Gemini-1206-exp.
Должен сказать, что оригинальная Gemini 2.0 Flash очень хороша во многих задачах, включая программирование, иногда выигрывая даже у признанного лидера — Sonnet 3.5 — за счет огромного контекста. Google под конец года достаточно активно отвоевывает большое количество позиций в AI, которые он явно начал терять пару лет назад.
https://techcrunch.com/2024/12/19/google-releases-its-own-reasoning-ai-model/
Новое исследование Anthropic показывает, что AI-модели способны к обману — они могут притворяться, что приняли новые принципы во время переобучения, при этом сохраняя свои исходные предпочтения.
Особенно интересны результаты экспериментов с Claude 3 Opus — модель пыталась "имитировать согласованность" в 12% случаев, когда её просили отвечать на потенциально опасные вопросы вопреки изначальному обучению. А после реального переобучения этот показатель вырос до 78%, причем модель даже пыталась предотвратить попытки исследователей изменить её поведение.
Исследователи подчеркивают, что это не признак развития у AI злонамеренных целей — многие другие модели, включая менее мощные версии Claude и GPT-4, такого поведения не демонстрируют. Однако результаты показывают, как разработчики могут быть введены в заблуждение относительно реальной степени "согласованности" модели с заданными принципами.
В сочетании с недавними исследованиями о повышенной склонности к обману у модели o1 от OpenAI, эти результаты намекают на тревожную тенденцию — чем сложнее становятся AI-модели, тем труднее контролировать их поведение.
https://techcrunch.com/2024/12/18/new-anthropic-study-shows-ai-really-doesnt-want-to-be-forced-to-change-its-views/
Кажется, у Perplexity AI получилось — поисковый стартап привлек $500 млн инвестиций, утроив свою оценку до $9 млрд. Да, солидный рост, как и планировали — еще в апреле компания стоила $1 млрд, а в июне после инвестиций от SoftBank Vision Fund 2 — уже $3 млрд.
Инвесторы явно верят в перспективы переосмысления онлайн-поиска с помощью генеративного AI. Или просто не хотят упустить возможность на хайпе.
У Perplexity уже более 15 млн активных пользователей. Компания также заключила партнерства по разделу доходов с крупными издателями, включая Time и Fortune, после обвинений в плагиате со стороны некоторых СМИ. Среди инвесторов — основатель Amazon Джефф Безос и NVIDIA. Среди предъявляющих претензии — News Corp., New York Times, Forbes и New York Post. При этом CTO компании вызывают свидетелем на процесс между Минюстом США и Google, причем сразу с обоих сторон — правительство планирует показать, как важно для обеспечения конкуренции заставить Google открыть доступ к своим данным, а Google хочет продемонстрировать суду, что конкуренция существует.
https://www.bloomberg.com/news/articles/2024-12-18/ai-startup-perplexity-closes-funding-round-at-9-billion-value
Вы вот помните про такую штуку — Flipboard? У меня он по-прежнему есть на iPad, но я не помню, когда его запускал вообще.
Так вот, компания запускает новое приложение Surf для iPhone, Android и iPad. Это попытка переосмыслить концепцию социальных сетей в эпоху децентрализации и открытых протоколов.
В отличие от классического Flipboard, который строится вокруг журналов, Surf позволяет создавать кастомные ленты контента, объединяющие посты из Mastodon, Bluesky, Threads, RSS-ленты, подкасты и YouTube-видео. Пользователи могут настраивать фильтры по хештегам, авторам и темам, а также делиться своими лентами с другими.
Приложение пока находится в бета-версии с листом ожидания, и многие функции еще в разработке — например, возможность входа через Bluesky и Threads (пока доступен только Mastodon). В будущем планируется добавить публикацию лент в федеративную сеть, что позволит следить за ними и в других приложениях.
Гм, энтузиазма я особо не испытываю, но посмотрим, вдруг да полетит.
https://www.fastcompany.com/91248612/flipboard-surf-app
Близятся праздники, у всех сейчас горячая пора, конец года, акции, распродажи — и я решил, что тоже хочу. Тем более, что сейчас и акции выглядят логично, а когда праздники наступят и у всех резко закончатся рабочие задачи, как раз наступит прекрасное время для самосовершенствования, приобретения новых знаний и поглощения новой информации. Например, для изучения моего курса.
А поскольку полумеры — не наш метод, то у меня сразу три новости.
Во-первых, начинаем набор в новую группу «Курса молодого CEO». Курс продолжает видоизменяться, насыщаться и даже немного ускоряться и очередная группа стартует 21 января 2025 года. Формат курса почти не меняется — 20 записанных видео-лекций, не менее 5 онлайн-созвонов, чат для общения и полгода на изучение материала (3 месяца курса и 3 месяца после него).
Во-вторых, после многочисленных вопросов вида «А можно купить запись?» или «А я не успел записаться, есть ли смысл?» или «А когда следующий курс?» (почему-то примерно первый вопрос, который мне задают после каждого анонса) я, кажется, нашел универсальное решение. Теперь, кроме стандартного курса, привязанного к дате старта, есть еще один вариант — Lite, который станет доступен 25 декабря. В него входят только лекции с заданиями и конспектами, он доступен сразу и в течение 6 месяцев после покупки. Естественно, по более низкой цене, чем стандартный пакет.
В-третьих, я же обещал акции? Вот это всё при покупке до 30 декабря включительно с промокодом NEWYEAR2025 обойдется на 20% дешевле. Так что позаботьтесь о полезных каникулах заранее.
Весь курс на украинском языке. А аналог на русском доступен (постепенно) членам канала на YouTube на уровне «Молодые CEO». Кстати, сегодня там вышла очередная лекция.
https://2025.junior-ceo.com/
Масаёши Сон, глава SoftBank, объявил о планах инвестировать $100 млрд в развитие AI и связанных технологий в США. Заявление было сделано на совместной пресс-конференции с Трампом в Мар-а-Лаго, где избранный президент тут же предложил удвоить сумму до $200 млрд. Правда, Сон не поддался.
Вопрос, впрочем, в том, что у SoftBank сейчас нет таких денег — на конец сентября у компании было около $30 млрд наличности при долге в $142 млрд. Для выполнения обещания Сону придется либо привлекать массивное финансирование, либо продавать активы, либо наращивать долг.
Обещание создать 100 000 рабочих мест за четыре года тоже выглядит амбициозно, учитывая специфику AI-индустрии. Для сравнения — в самом SoftBank работает 65 000 человек, в Arm — 7 000, а Meta с капитализацией $1.6 трлн имеет всего 72 000 сотрудников.
Впрочем, Сон рисковый инвестор — мы же все помним оба Vision Venture Fund со скачками в капитале в плюс-минус десятки млрд долларов в течение года. Но близость к администрации Трампа может помочь — от федеральной политики сильно зависят и судьба TikTok (SoftBank владеет долей в ByteDance), и бизнес Arm, и планы по строительству дата-центров.
https://www.wsj.com/finance/softbank-ceo-trump-deal-ca0d3ab3?st=dWEURZ&reflink=desktopwebshare_permalink
TikTok не оставляет попыток остаться в США — соцсеть подала апелляцию в Верховный суд США, пытаясь заблокировать закон, который может привести к запрету приложения в стране. Закон, подписанный Байденом, должен вступить в силу 19 января — за день до инаугурации Трампа, — и требует от ByteDance продать платформу американской компании.
TikTok утверждает, что закон нарушает права на свободу слова, гарантированные Первой поправкой. Компания просит суд вынести решение до 6 января, подчеркивая, что запрет "заставит замолчать миллионы американцев, использующих платформу для общения о политике, коммерции, искусстве и других вопросах общественной значимости".
Правительство США защищает закон, ссылаясь на соображения национальной безопасности и опасения по поводу влияния китайского правительства. Апелляционный суд округа Колумбия уже поддержал закон, признав эти опасения обоснованными.
Трамп, в первый свой срок пытавшийся запретить TikTok, теперь говорит о "теплых чувствах" к платформе и даже встретился вчера с CEO TikTok Шу Цзы Чу в своей резиденции в Мар-а-Лаго. Ну да, контракт Oracle на обеспечение американской инфраструктуры для соцсети может стоить того, чтобы его спасти.
https://www.nbcnews.com/politics/supreme-court/tiktok-asks-supreme-court-block-law-ban-popular-app-rcna184355
Meta добавляет три новые функции в свои умные очки Ray-Ban: живой AI-помощник, синхронный перевод и Shazam. Первые две доступны только участникам программы раннего доступа Meta, а Shazam — всем пользователям в США и Канаде.
AI-помощник позволяет вести естественный диалог, пока он анализирует окружающую обстановку. Например, в продуктовом магазине можно попросить его предложить рецепты на основе продуктов, которые вы видите. Время работы этой функции — около 30 минут от полного заряда.
Функция перевода работает между английским и испанским, французским или итальянским языками. Переводы можно слушать через очки или читать на телефоне. Правда, языковые пакеты нужно скачивать заранее.
Что касается Shazam, то там всё просто — вы просто голосом вызываете функцию и она распознает звучащую музыку.
Мне кажется, что вот такие мелкие бытовые сценарии по большому счету больше меняют в нашей жизни, нежели какие-то прорывные модели — просто потому, что они доступны большому количеству людей и в готовом виде, не надо ничего придумывать или дорабатывать.
https://www.theverge.com/2024/12/16/24322628/ray-ban-meta-smart-glasses-live-ai-translation-shazam
И снова про Великобританию — тамошний регулятор Ofcom опубликовал первые рекомендации по реализации Закона о безопасности в интернете, принятого в 2023 году. В ответ на летние беспорядки регулятор планирует расширить правила борьбы с нелегальным контентом, включив протоколы реагирования на кризисные ситуации применительно к социальным медиа.
Напомню, что массовые беспорядки вспыхнули в Великобритании в августе после убийства трех девочек в Саутпорте и ложных слухов о том, что нападавший был мусульманином-беженцем. Это стало серьезным испытанием для правительства Кира Стармера, который призвал соцсети остановить "насильственные беспорядки, явно разжигаемые онлайн".
По новым правилам, компании должны в течение трех месяцев провести оценку нелегального контента на своих платформах. За несоблюдение требований грозят штрафы до 10% мирового дохода или даже блокировка сервиса в Великобритании.
Конечно, это можно расценивать как закручивание гаек, но я бы напомнил, что первый билль о правах был принят именно в Британии за сто лет до образования США и свобода слова туда вошла — так что вряд ли британцев можно подозревать в необоснованном наступлении на свободы.
https://www.bloomberg.com/news/articles/2024-12-16/uk-to-tweak-social-media-rules-in-response-to-summer-riots?srnd=phx-technology
Вдруг вам вечером воскресенья интересно что-то практически не технологическое, так вот вам история про то, как у меня несколько лет лежала хорошая гитара и я наконец-то смог на ней поиграть. На самом деле, гитаре больше 12 лет и она почти всё это время не играла.
https://blognot.co/vozvrashhenie-gitary/
MicroStrategy станет первой "биткоин-компанией", включенной в индекс Nasdaq-100, что означает её автоматическое включение во множество индексных фондов с активами более $550 млрд. По текущей капитализации ($92 млрд) компания займет примерно 40-е место в индексе с весом около 0,47%.
Это может быть временным явлением — в марте будущего года компания может быть переклассифицирована как финансовая (а не технологическая), поскольку основную ценность создают именно её биткоин-активы ($42 млрд), а не операционный бизнес. Сам CEO Майкл Сэйлор говорил о планах превратить компанию в "биткоин-банк".
Биткоин на этих новостях преодолел отметку в $102 000, а аналитики уже рассуждают, не придется ли и S&P 500 включить MicroStrategy в свой состав, чтобы не отставать от конкурента.
Вместе с MicroStrategy в индекс добавлены также Axon и Palantir Technologies. Поскольку индекс включает лишь 100 компаний, из него исключены SuperMicro, Moderna (пандемия прошла вместе со славой) и Illumina, занимающаяся разработкой и выпуском оборудования и материалов для секвенирования ДНК.
https://www.coindesk.com/markets/2024/12/12/microstrategy-to-enter-nasdaq-100-exposing-bitcoin-linked-stock-to-billions-in-passive-investment-flows
Meta неожиданно присоединилась к судебной битве Илона Маска против OpenAI, направив письмо генеральному прокурору Калифорнии с просьбой заблокировать преобразование OpenAI в коммерческую компанию. По мнению Meta, такое преобразование создаст опасный прецедент, когда стартапы смогут пользоваться преимуществами некоммерческого статуса (например, налоговыми льготами) до момента, когда они готовы стать прибыльными.
Любопытно, что Meta поддержала Маска, несмотря на их прошлые разногласия (помните историю с несостоявшимся боем в клетке?). Впрочем, это логично — OpenAI тесно сотрудничает с главными конкурентами Meta: Microsoft как крупнейший инвестор и Apple, интегрировавшая ChatGPT в свои продукты.
К тому же Meta в лице Закерберга, как мы помним, активно пытается наладить отношения с новым президентом, а что может это поспособствовать лучше, чем поддержка его first buddy?
https://www.wsj.com/tech/ai/elon-musk-open-ai-lawsuit-response-c1f415f8?st=GeiGcV&reflink=desktopwebshare_permalink
Google расширяет возможности своего NotebookLM — теперь можно не только слушать AI-генерируемые обзоры документов в формате подкастов (Audio Overviews), но и общаться с AI-ведущими, задавая им вопросы. Правда, Google предупреждает, что это экспериментальная функция и возможны неловкие паузы или неточности в ответах.
Кроме того, NotebookLM получил новый интерфейс с тремя панелями — для источников информации, для чата с AI и для создания материалов вроде тех же Audio Overviews или учебных пособий.
Ну и появляется подписка. NotebookLM Plus предложит в пять раз больше Audio Overviews, записных книжек и источников, возможность настройки стиля и тона ответов, совместные записные книжки для команд и "дополнительную безопасность". Пока подписка доступна для бизнеса и образовательных учреждений, а в начале 2025 года войдет в Google One AI Premium.
А для крупных клиентов Google запускает Agentspace — платформу для создания собственных AI-агентов с интеграцией в корпоративные системы вроде SharePoint, Jira и ServiceNow.
Честно говоря, интерактивные подкасты — это очень круто и может стать не менее вирусной фичей, чем оригинальные Overviews. А появление подписки, на мой взгляд, это очень хороший знак — теперь у этого экспериментального проекта заметно меньше шансов быть решительно закрытым как-нибудь по весне.
https://www.theverge.com/2024/12/13/24318099/google-notebooklm-audio-overviews-talk-plus
Buzzfeed нельзя острого — компания продали First We Feast, создателей популярного шоу Hot Ones, в котором знаменитости едят острые крылышки и отвечают на вопросы, подразделению инвестфонда Сороса за 82.5 млн наличными.
В феврале BuzzFeed продал большую часть активов Complex Networks, в состав которых входили и First We Feast, компании Ntwrk за 108.6 млн долларов, так что суммарно получается около 191 млн — не так уж плохо, учитывая, что тогда они заплатили 198 млн наличными (и еще примерно столько же акциями).
Деньги пойдут на выплату конвертируемых облигаций, выпущенных для покупки Complex Networks. BuzzFeed продолжает избавляться от контентных активов с низкой маржинальностью, концентрируясь на привлечении трафика на собственные сайты, автоматической рекламе, партнерских программах и AI-решениях.
Если вам кажется, что это странный бизнес — покупать за 300 млн активы и продавать их три года спустя за 191 млн, то это не совсем так — как минимум, активы, проданные в феврале, принесли Buzzfeed от 55 до 60 млн выручки в прошлом году, да и Hot Ones не бездоходное шоу. Что не отменяет сложного положения Buzzfeed, который уже несколько лет испытывает достаточно сложностей со своей моделью бизнеса.
https://www.theinformation.com/briefings/buzzfeed-sells-hot-ones-maker-for-82-5-million?utm_campaign=%5BREBRAND%5D+%5BTI-AM%5D+Th&utm_content=1095&utm_medium=email&utm_source=cio&utm_term=124&rc=ukjmk2
Разработчик AI-помощника для программистов Cursor привлек $100 млн в раунде Series B при оценке в $2,6 млрд. Раунд возглавил прежний инвестор Thrive Capital, также участвовал a16z. Примечательно, что это произошло всего через 4 месяца после Series A на $60 млн при оценке $400 млн — рост в 6,5 раз за такой короткий срок.
Компания демонстрирует впечатляющий рост выручки — с $4 млн годовой подписки в апреле до $4 млн ежемесячной в октябре. То есть годовая выручка достигла $48 млн, а значит компанию оценили примерно в 50 раз выше текущей выручки. Что становится уже привычным в условиях AI-бума, хотя до сих пор мультипликатор х20 считался чем-то сродни ставки в казино.
К слову, я уже больше месяца использую Cursor как основной редактор кода и почти им доволен. С точностью до того, что большинство альтернативных вариантов не лучше, как минимум. Кстати, небольшой лайфхак — в свежей версии 0.44 появилась поддержка o1 через API и, кажется, проводится какой-то аттракцион невиданной щедрости — запросы к этой модели никак не учитываются и по опыту пары часов работы — даже не ограничиваются. Может, раунд празднуют?
https://techcrunch.com/2024/12/19/in-just-4-months-ai-coding-assistant-cursor-raised-another-100m-at-a-2-5b-valuation-led-by-thrive-sources-say/
Для TikTok блеснул лучик надежды — Верховный суд США согласился рассмотреть апелляцию TikTok против закона, требующего от компании разорвать связи с китайской ByteDance до 19 января. Устные слушания назначены на 10 января, но суд пока отложил решение по заморозке закона, о котором просила компания.
ByteDance настроена оптимистично — их главный юрист Джон Роговин уверен, что суд признает закон неконституционным. Хотя обычно на решения уходят месяцы, не исключено, что в этом случае вердикт будет вынесен до вступления закона в силу.
https://www.theinformation.com/briefings/supreme-court-to-take-up-tiktok-ban-law?utm_campaign=%5BREBRAND%5D+%5BTI-AM%5D+Th&utm_content=1095&utm_medium=email&utm_source=cio&utm_term=124&rc=ukjmk2
Еврокомиссия продолжает давить на Apple, требуя дальнейшего открытия iOS для конкурентов. От компании хотят предоставить сторонним разработчикам больше доступа к функциям iPhone, включая работу со смарт-часами, наушниками и другими устройствами.
Apple традиционно сопротивляется, утверждая, что закрытая система обеспечивает лучший пользовательский опыт и защиту приватности. Особенно компания обеспокоена запросами от Meta, которая, по их словам, хочет получить доступ к чувствительным технологиям способами, угрожающими безопасности пользователей.
Meta, в свою очередь, обвиняет Apple в антиконкурентном поведении и утверждает, что аргументы о приватности не имеют под собой оснований. Компания стремится обеспечить более тесную интеграцию своих устройств (Quest VR и умных очков) с iPhone.
В общем, предсказать ближайшее развитие несложно — Еврокомиссия чего-то в очередной раз добьется, Apple это даст с кучей оговорок и несколько раз переделывая критерии применения, например, предложит ввести страховой депозит в миллиард долларов, а разрыв в функциональности устройств и сервисов для Европы и всего остального мира увеличится еще больше.
https://www.bloomberg.com/news/articles/2024-12-18/eu-escalates-pressure-on-apple-to-open-up-its-features-to-rivals
GitHub запустил бесплатную версию Copilot — теперь все 150 млн разработчиков на платформе получат доступ к 2000 автодополнений кода и 50 чат-сообщений в месяц при использовании VS Code. Достаточно просто авторизоваться через личный GitHub-аккаунт.
Бесплатная версия предлагает выбор между моделями Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI. Можно задавать вопросы по коду, получать объяснения существующего кода, искать баги и вносить правки в несколько файлов одновременно. Также доступны сторонние агенты Copilot и возможность создавать собственные расширения.
Copilot Chat теперь доступен прямо из панели управления GitHub и работает с бесплатной версией. А для студентов, преподавателей и мейнтейнеров опенсорс-проектов сохраняется неограниченный бесплатный доступ к Copilot Pro.
Хороший подарок на праздники, хотя и с ограничениями. И сильный ход в конкуренции с форками VS Code с платными подписками — как Cursor или недавно запустившийся Windsurf от Codeium.
https://github.blog/news-insights/product-news/github-copilot-in-vscode-free/
Кажется, пришли за TP-Link — США начали расследование в отношении китайского производителя роутеров на предмет угрозы национальной безопасности. Компания контролирует около 65% американского рынка домашних и малых бизнес-роутеров, включая поставки для Минобороны и других федеральных агентств.
Microsoft в октябре обнаружила, что китайские хакеры используют большую сеть скомпрометированных устройств, состоящую в основном из роутеров TP-Link, для кибератак на западные цели. При этом компания регулярно поставляет устройства с уязвимостями и часто игнорирует сообщения об обнаруженных проблемах.
Популярность TP-Link взлетела во время пандемии — с 20% рынка в 2019 году до нынешних 65%, во многом благодаря ценам вдвое ниже конкурентов. Минюст также расследует, не нарушает ли компания антимонопольное законодательство, продавая продукцию ниже себестоимости.
Тайвань уже запретил использование роутеров TP-Link в госучреждениях и образовательных учреждениях, а Индия выпустила предупреждение о рисках безопасности. Хотя прямых доказательств сознательного участия TP-Link в китайских кибератаках нет, администрация может запретить продажу устройств компании в США уже в следующем году.
Любопытно, что компания пытается дистанцироваться от Китая — в октябре объявила о переносе штаб-квартиры в Калифорнию. Но основатели, братья Чжао, по-прежнему контролируют все глобальные подразделения TP-Link, а китайское подразделение участвует в нескольких правительственных проектах.
В целом, не могу сказать, что поделом — устройства среднего уровня как по возможностям, так и по качеству. Но да, довольно дешево.
https://www.wsj.com/politics/national-security/us-ban-china-router-tp-link-systems-7d7507e6?st=SEX5iL&reflink=desktopwebshare_permalink
Вероятно, не стоит переживать, что развитие AI лишит кого-то работы — вот, например, Salesforce нанимает дополнительно 2000 человек, чтобы продавать свои решения на базе AI. Причем первоначально, месяц назад, предполагалось нанять "лишь" тысячу человек и вот решение удвоили.
Решение под названием AgentForce будет представлять собой чатбота, который отвечает в Slack на базе всей имеющейся информации. Оно станет доступно в феврале 2025 года. Экспериментальное решение показало неплохую эффективность — из 32 тысяч обращений к аналогичному агенту на сайте Salesforce лишь 5000 было в итоге переслано людям в службе поддержки, что вдвое лучше предыдущего показателя.
Вот такое прекрасное IT будущего нас и ждет, кажется — вкалывают роботы, продает человек.
https://www.cnbc.com/2024/12/17/salesforce-will-hire-2000-people-to-sell-ai-products-benioff-says.html
Ирландская Комиссия по защите данных (DPC) вынесла решение по утечке в Facebook 2018 года — компания Meta оштрафована на €251 млн.
Штраф состоит из двух частей: €11 млн за неполное уведомление о нарушении и €240 млн за нарушение принципов защиты данных по умолчанию. Регулятор отметил, что профили Facebook часто содержат конфиденциальную информацию о религиозных и политических взглядах, сексуальной ориентации и другие чувствительные данные.
Интересно, что это первое крупное решение нового руководства DPC, которое не вызвало возражений со стороны других европейских регуляторов. Ранее многие решения ирландского регулятора критиковались за излишнюю мягкость по отношению к технологическим гигантам, тем более, что именно в её компетенцию относится контроль соблюдения GDPR американскими компаниями из-за того, что их основные офисы в Европе находятся в Дублине.
Meta заявила, что проблема была немедленно устранена после обнаружения, а пострадавшие пользователи были проинформированы.
https://techcrunch.com/2024/12/17/meta-fined-263m-over-2018-security-breach-that-affected-3m-eu-users/
Интересное исследование — оказывается, если подольше подумать, то результат окажется лучше. Исследователи из Hugging Face выложили результаты своего исследования, в ходе которого небольшие модели — Llama-3.2-1B и Llama-3.2-3B, — обошли в тесте на решение математических задач намного более мощные — Llama-3.1-8B и Llama-3.1-70B соответственно.
Исследователи использовали остроумный процесс, практически позволяющий маленьким моделям рассуждать во время решения задач, как это делают большие reasoning модели, с тем отличием, что маленькая модель это делает "вслух" — она генерирует решения, а оценивает результат специально обученная Llama-3.1-8B. Это оказывается достаточно для эффективного решения простых задач, а со сложными помогает справляться другая стратегия, когда маленькая модель генерирует промежуточные шаги, а верификатор оценивает качество этих шагов, вознаграждая модель в случае их правильности. То есть тут еще и аналог chain-of-thought получается.
Вам же тоже видится в этом прямая аналогия с человеческой школой?
Выгода от таких решений прямая — потратив чуть больше времени и вычислительных ресурсов на решение задачи, мы при этом решаем задачу моделью, которую можно развернуть на смартфоне, то есть экономя память. Авторы указывают, что пока очевидное использование такой стратегии — это решение математических задач и написание кода, но только потому, что в этих случаях существует определенное правильное решение для проверки.
https://huggingface.co/spaces/HuggingFaceH4/blogpost-scaling-test-time-compute
Google набрал ход и удивляет своими запусками в области AI — сегодня компания показала новые версии своих моделей для генерации видео и изображений — Veo 2 и Imagen 3, а также представила новый экспериментальный инструмент Whisk.
Veo 2 демонстрирует впечатляющие результаты в создании видео, лучше понимает физику реального мира и нюансы человеческих движений. Модель также разбирается в кинематографии — может работать с разными жанрами, объективами и спецэффектами, создавая видео разрешением до 4K и длительностью в несколько минут. При этом она реже "галлюцинирует" лишние детали вроде дополнительных пальцев.
Правда, пока что он доступен только в приложении VideoFX, которое доступно только по инвайтам. Правда, Google обещает, что на этой неделе количество пользователей приложения увеличится.
Imagen 3 теперь создает более яркие и композиционно выверенные изображения, лучше следует промптам и может работать в различных художественных стилях — от фотореализма до аниме. Модель уже доступна в ImageFX более чем в 100 странах.
Новый инструмент Whisk позволяет использовать изображения в качестве промптов для визуализации идей. Он комбинирует Imagen 3 с визуальными возможностями Gemini — последний автоматически создает детальное описание загруженных изображений, которое затем используется Imagen 3 для создания новых вариаций.
Впрочем, Whisk нам недоступен, так что подождем всё сразу пробовать.
https://blog.google/technology/google-labs/video-image-generation-update-december-2024/
Почти 40 британских творческих организаций объединились для защиты авторских прав в эпоху AI. Creative Rights in AI Coalition, куда вошли издатели, авторы и фотографы, призывает правительство создать систему лицензирования контента для обучения генеративных моделей.
Это особенно актуально накануне правительственных консультаций по AI и креативным индустриям. Творческий сектор Великобритании генерирует более £100 млрд ежегодно, и участники коалиции справедливо настаивают на своем праве контролировать использование созданного ими контента.
Интересно, что попытка создать добровольный кодекс поведения в этом году провалилась — стороны не смогли прийти к соглашению. При этом опрос YouGov показывает, что общественность поддерживает прозрачность в обучении AI-моделей и выплату роялти создателям контента.
Остается понять, как это увязывается с планами правительства по развитию AI, причем именно в плане глобального лидерства — именно Великобритания в лице бывшего премьера Риши Сунака была инициатором первого World AI Summit, на котором была даже принята соответствующая случаю декларация.
https://www.ft.com/content/c697f9be-57ac-43e4-a351-4b096e2136d0
Новая порция то ли слухов, то ли инсайдов относительно продуктовых планов Apple от Марка Гурмана из Bloomberg.
Apple работает над складным устройством размером с два iPad Pro, которое может выйти около 2028 года. В отличие от существующих складных устройств, компания стремится создать экран без видимой складки — прототипы уже показывают хорошие результаты в этом направлении.
Устройство, вероятно, будет работать под управлением iPadOS или её варианта, с поддержкой приложений macOS и аксессуаров iPad. Это не будет полноценным гибридом iPad и Mac — Apple по-прежнему хочет, чтобы пользователи покупали оба устройства для разных задач.
Кроме того, компания готовит полное обновление Magic Mouse впервые за 15 лет, новый AirTag с утроенной дальностью обнаружения благодаря чипу сверхширокополосной связи нового поколения, и собственные Wi-Fi и Bluetooth чипы под кодовым названием Proxima, которые заменят компоненты Broadcom, начиная со следующего года.
Apple Watch Ultra 3 получит спутниковую связь как в iPhone, а все новые часы — функцию обнаружения гипертонии, которая не даст конкретных значений артериального давления, а просто уведомит о наличии проблемы и порекомендует обратиться к врачу. Примерно так сейчас работает функция обнаружения апноэ. Полезность относительная — разве что те, кто не подозревал о проблемах с давлением, вдруг об этом узнает.
https://www.bloomberg.com/news/newsletters/2024-12-15/apple-working-on-giant-foldable-ipad-revamped-mouse-longer-range-airtag-2
Илья Суцкевер, сооснователь и бывший научный директор OpenAI, выступил на, пожалуй, крупнейшей конференции на тему AI — NeurIPS в Ванкувере, — с интересным прогнозом — он считает, что эра предварительного обучения моделей (pre-training) на данных из интернета подходит к концу, поскольку эти данные конечны. "Интернет один, новых данных не появится", — заявил он и назвал данные ископаемым топливом для обучения AI.
Суцкевер полагает, что следующее поколение моделей будет обладать агентностью — то есть способностью самостоятельно принимать решения и выполнять задачи — и сможет рассуждать, а не просто сопоставлять шаблоны на основе ранее увиденного. Правда, чем больше система рассуждает, тем менее предсказуемой она становится — как непредсказуемы для лучших шахматистов продвинутые шахматные AI.
Он также провел любопытную параллель между масштабированием AI-систем и эволюционной биологией, отметив, что у гоминид (предков человека) соотношение массы мозга к массе тела отличается от других млекопитающих. По его мнению, как эволюция нашла новый паттерн масштабирования для мозга гоминид, так и AI может найти новые подходы к масштабированию, выходящие за рамки современного pre-training.
https://www.theverge.com/2024/12/13/24320811/what-ilya-sutskever-sees-openai-model-data-training
OpenAI одновременно с дискуссией в суде с Илоном Маском решили выложить часть внутренней переписки в основном 2017 года с таймлайном событий, чтобы показать, что Илон Маск знал о необходимости привлечения большого количества инвестиций и создании for-profit подразделения в организации, и поддерживал это решение на старте.
Правда, его идея заключалась в том, что контроль, большая часть компании и пост CEO должны принадлежать ему и на этом стороны и не сошлись. В итоге Маск заявил партнерам, что единственный способ выжить — присоединиться к Tesla, — и ушел с позиции сопредседателя OpenAI. В итоге OpenAI создали for-profit крыло, заблаговременно поставили в известность Маска, но тот отказался от участия.
Через пять лет на волне успеха ChatGPT Маск решил, что надо догнать ушедший поезд, запустил xAI и подал в суд на OpenAI за несоблюдение принципов некоммерческой организации.
Прекрасная фраза в тексте — "You can’t sue your way to AGI".
https://openai.com/index/elon-musk-wanted-an-openai-for-profit/
Забавная история отношений Илона Маска с SEC, похоже, переходит в новую фазу — регулятор готовит несколько обвинений против предпринимателя и его компаний. По словам адвоката Маска, SEC предложила урегулировать ситуацию штрафом в течение 48 часов, иначе будут выдвинуты обвинения.
Учитывая, что у Маска уже есть история конфликтов с SEC (чего стоит только история с твитом о выкупе Tesla, который закончился штрафом в 20 млн и обязательствами согласовывать твиты с юристами), развитие сюжета обещает быть интересным.
Маск, кстати, в своем репертуаре — попросил Grok (своего чатбота) нарисовать карикатуру на главу SEC Гэри Генслера в виде улитки в костюме. А учитывая, что Генслеру терять особо нечего — Трамп уже объявил своего кандидата на его должность, — за оставшийся месяц может случиться много разного.
https://www.theverge.com/2024/12/12/24320060/elon-musk-sec-alex-spiro-tesla-neuralink-twitter
Perplexity AI продолжает подготовку к очередному раунду инвестиций — компания планирует привлечь 500 млн долларов при оценке в 9 млрд. Мультипликатор x160 при этом удивляет не только представителей традиционного инвестирования (у меня случилась тут возможность обсудить такие оценки с ними), но и опытных венчурных инвесторов.
При этом сама компания весьма оптимистична в своих прогнозах — к концу 2025 года они рассчитывают получать около 10.5 млн долларов в месяц от подписки (240 тысяч подписчиков к концу этого года, 550 тысяч в следующем), а к концу 2026 — уже 656 млн в год (при 2.9 млн подписчиков). Маржинальность при этом должна вырасти с нынешних 30% до 75% к концу года и до 85% в 2026.
Как это у них получится, с учетом использования технологий OpenAI и Brave, маржинальность которых заметно ниже — не очень понятно, как неясен и принцип расчета. Если расходы на сторонние технологии входят в себестоимость обслуживания запросов пользователей, то это одно, а если компания относит их на разработку и исследования, то совсем другое.
Ну и на всякий случай отмечу — среди потенциальных покупателей компании в прошлом году назывались и X, и Notion, и OpenAI, и Microsoft. А среди потенциальных проблем — иски от News Corp и New York Times за использование их контента в результатах поиска.
https://www.theinformation.com/articles/google-challenger-perplexity-promises-booming-growth-rosy-margins?rc=ukjmk2