blognot | Unsorted

Telegram-канал blognot - БлоGнот

11523

Заметки о технологиях, новостях и гаджетах. И всём остальном. По всем вопросам лучше писать в почту — sergiy.petrenko@pm.me YouTube http://www.youtube.com/@blognot Мой блог https://blognot.co/ Группа для обсуждения новостей — https://t.me/blognot_chat

Subscribe to a channel

БлоGнот

Под Новый Год на мою полку приехал необычный (или обычный для нынешних времен) сувенир — обломок шахеда, сбитого николаевской зенитной бригадой. Помните, мы ей помогали, покупая планшеты и серверное оборудование?

А вот теперь надо помочь другому подразделению ПВО, уже одесскому, тоже покупкой планшетов.

И надо добавить, что с прошлого раза одна хорошая машинка (на фото) стала из пациента СТО боевой единицей в 225 ОШБ, обзавелась комплектом подходящей резины, а еще один комплект пошел её подруге.

Правда, с тех пор приехали еще машинки и ждут аналогичной трансформации. Не очень надеюсь, что нашего энтузиазма хватит и на планшеты, и на машинки, но это был бы славный страйк к Новому году. Давайте подключимся.

Напомню, что банка моно имеет статус волонтерской и карму p2p платежей не уменьшает.
Paypal — sergey.petrenko@gmail.com
Монобанк — https://send.monobank.ua/jar/8Agk3Rr4xn
Приват 5523245800262113
BTC — 343ypLkZqqdppEehJxGGLrWFZQ6TckdfUu
ETH — 0x621398403993a0Dde05DF9612166A73D7B246855
USDT (TRC20) - TJkSAAmZfJpDQqp3JQ6PwACU2bvJTxdBDf
USDT (ERC20) — 0x621398403993a0Dde05DF9612166A73D7B246855

Читать полностью…

БлоGнот

Некоммерческая организация Encode, ранее поддержавшая законопроект об AI-безопасности в Калифорнии (SB 1047), ветированный губернатором штата, подала ходатайство о включении в дело в качестве "друга суда" в поддержку иска Илона Маска против преобразования OpenAI в коммерческую структуру.

В поданном документе Encode утверждает, что превращение OpenAI в коммерческую компанию подорвет её миссию по безопасной разработке технологий на благо общества. Организация подчеркивает, что если мы действительно стоим на пороге создания AGI, то общество заинтересовано в том, чтобы эта технология контролировалась благотворительной организацией, а не структурой, нацеленной на прибыль инвесторов.

OpenAI планирует преобразоваться в корпорацию общественного блага (PBC) штата Делавэр, где некоммерческая организация уступит контроль в обмен на акции. Encode указывает, что в этом случае компания будет обязана "балансировать" общественную пользу с финансовыми интересами акционеров, а не ставить безопасность во главу угла.

Кстати, Meta также выступает против этого преобразования — в декабре компания направила письмо генпрокурору Калифорнии, утверждая, что такое изменение будет иметь "сейсмические последствия для Кремниевой долины". Просто удивительно, какое количество коммерческих организаций — хоть Meta, хоть xAI, — разрабатывая AI-модели, настаивают, что их крупнейший конкурент не должен становиться немного коммерческим.

https://techcrunch.com/2024/12/27/nonprofit-group-joins-elon-musks-effort-to-block-openais-for-profit-transition/

Читать полностью…

БлоGнот

Команда Qwen от Alibaba представила новую открытую модель QVQ-72B-Preview для анализа изображений. Она построена на основе Qwen2-VL-72B, но использует reasoning при решении задач.

В тестах на понимание изображений, включая задачи университетского уровня и олимпиадные задачи по математике и физике, модель показала результаты на уровне закрытых систем вроде o1 и Claude 3.5 Sonnet. QVQ при этом является моделью с открытыми весами.

Впрочем, у модели есть проблемы: она может неожиданно переключаться между языками, застревать в логических циклах или терять фокус при сложном визуальном анализе, что приводит к галлюцинациям. Команда признает необходимость улучшения защитных механизмов перед широким применением. Интересно, а Винни Пуха она распознает?

Qwen называет QVQ своим "последним подарком" года и рассматривает её как шаг к созданию "всезнающей разумной модели" на пути к AGI. В будущем планируется создание единой "омни-модели" для решения более сложных научных задач.

https://qwenlm.github.io/blog/qvq-72b-preview/

Читать полностью…

БлоGнот

Впрочем, есть и новость — Лекс Фридман решил оживить свой телеграм канал и перевести его на русский. Он это связывает с тем, что ему предстоит интервью с Зеленским, которое он пока предлагает провести на русском, а пока разместил несколько аудиороликов и привязал чат к каналу.

Правда, почему-то на русском он говорит с легким кавказским оттенком, но это я придираюсь 😊.

/channel/lexfridman

Читать полностью…

БлоGнот

Интересный обзор комментариев на тему запуска o3. Модель показывает впечатляющие результаты — например, 88% в тесте ARC-AGI против 32% у o1, и 25% в сложном математическом тесте, где другие модели не набирали больше 2%.

Правда, эта производительность достигается ценой огромных вычислительных затрат — более $1000 на одну задачу против $5 у o1. На полном тесте ARC-AGI o3 low использовала ресурсов на $10 000 и набрала всего на 12% меньше баллов, чем o3 high, использовавшая в 172 раза больше вычислительных ресурсов (цену им еще не сложили).

Это поднимает вопросы о практическом применении таких моделей — вряд ли o3 станет повседневным инструментом как GPT-4. Скорее, это будет специализированный инструмент для сложных задач, доступный только организациям с большими бюджетами. OpenAI уже предлагает тариф $200 для версии o1 pro (которая действительно очень круто работает) и даже ходят слухи о некоем тарифе Ultra со стоимостью до $2000.

Впрочем, индустрия видит в этом подходе — масштабировании вычислений во время генерации ответа, — большой потенциал. Джек Кларк из Anthropic считает, что в 2025 году прогресс AI ускорится даже по сравнению с 2024-м годом за счет комбинации традиционного масштабирования и test-time scaling. А производители специализированных AI-чипов, как Groq или Cerebras, могут сделать такой подход более доступным.

https://techcrunch.com/2024/12/23/openais-o3-suggests-ai-models-are-scaling-in-new-ways-but-so-are-the-costs/

Читать полностью…

БлоGнот

Meta планирует добавить дисплей в свои умные очки Ray-Ban уже в следующем году. По данным источников, обновленная версия очков за $300 может выйти во второй половине 2025 года. Небольшой экран будет использоваться для показа уведомлений и ответов виртуального ассистента Meta.

Компания также ускоряет разработку прототипа AR-очков Orion после положительных отзывов первых тестировщиков. Однако до выхода потребительской версии все еще могут пройти годы. Orion отличается компактным дизайном, легким корпусом и инновационными дисплеями, накладывающими 3D-контент на реальный мир.

Текущая версия Ray-Ban Meta, выпущенная в сентябре 2023 года, оказалась неожиданно успешной. За несколько месяцев продажи превысили показатели предыдущего поколения за два года.

Несмотря на смещение фокуса Закерберга с метавселенной на AI, эксперты отмечают, что стратегии Meta в области искусственного интеллекта и смешанной реальности начинают сходиться. Возможно, это позволит компании получить значительную долю операционной системы следующего поколения — что и является заявленной целью Закерберга.

https://www.ft.com/content/77bd9117-0a2d-4bd7-9248-4dd288f695a4

Читать полностью…

БлоGнот

Албания объявила о годовом запрете TikTok с начала 2025 года после убийства 14-летнего школьника его сверстником в ноябре. Премьер-министр Эди Рама обвинил социальные сети, особенно TikTok, в разжигании насилия среди молодежи.

Запрет является частью более широкого плана по повышению безопасности в школах. Конечно, TikTok отрицает связь с инцидентом, утверждая, что у участников трагедии не было аккаунтов в сервисе, а видео распространялись через другую платформу.

Любопытно, что это первый случай полного запрета TikTok в европейской стране — до сих пор какие-либо ограничения касались либо госслужащих, либо определенных возрастных групп.

https://www.reuters.com/technology/albania-bans-tiktok-year-after-killing-teenager-2024-12-21/

Читать полностью…

БлоGнот

Помните историю с претензиями Arm к Qualcomm, которые осенью дошли до запрета Qualcomm вообще разрабатывать процессы на базе архитектуры Arm? После двухлетней судебной тяжбы федеральное жюри в основном встало на сторону Qualcomm.

Напомню, что Arm, лицензирующая свои чипы таким компаниям как Qualcomm и Apple, утверждала, что Qualcomm неправомерно использовала интеллектуальную собственность, которую Arm лицензировала стартапу Nuvia до его приобретения Qualcomm в 2021 году. По мнению Arm, Qualcomm не имел права использовать лицензию, ранее выданную Nuvia, а должен был передоговориться об условиях.

Это решение позволяет Qualcomm продолжать продавать чипы для персональных компьютеров, созданные с использованием технологий Nuvia, без необходимости пересматривать лицензионное соглашение с Arm. Однако жюри не смогло прийти к единогласному решению по иску Arm о нарушении Nuvia условий лицензии. Arm, скорее всего, будет настаивать на новом слушании дела.


https://www.theinformation.com/briefings/jury-sides-with-qualcomm-in-dispute-with-arm-holdings?rc=ukjmk2

Читать полностью…

БлоGнот

Google опубликовал свои предложения по мерам, которые должен предпринять суд по иску о поисковой монополии компании. Компания, впрочем, отмечает, что планирует подать апелляцию на решение суда, однако это не дает права уклониться от соблюдения процедуры.

Google критикует предложения Минюста (которые, как мы помним, даже содержат пункт о разделении компании и продаже Chrome) как чрезмерно широкие и выходящие за рамки сути дела, которое касалось только соглашений о дистрибуции поиска. По мнению компании, требования регулятора могут навредить американским потребителям и подорвать технологическое лидерство США.

В своем предложении Google фокусируется на двух основных моментах:
- Браузерные соглашения: компании вроде Apple и Mozilla смогут свободно выбирать поисковик по умолчанию, менять его каждые 12 месяцев и устанавливать разные поисковики для разных платформ
- Android-контракты: производители устройств получат больше свободы в предустановке нескольких поисковиков и приложений Google независимо друг от друга

Google признает, что эти изменения создадут определенные сложности для партнеров, но считает их адекватным ответом на решение суда, который не угрожает приватности пользователей и технологическому лидерству США. Ну и компания напоминает, что с момента окончания судебного разбирательства год назад ситуация сильно изменилась из-за развития AI.

https://blog.google/outreach-initiatives/public-policy/google-remedies-proposal-dec-2024/

Читать полностью…

БлоGнот

Разработчик AI-помощника для программистов Cursor привлек $100 млн в раунде Series B при оценке в $2,6 млрд. Раунд возглавил прежний инвестор Thrive Capital, также участвовал a16z. Примечательно, что это произошло всего через 4 месяца после Series A на $60 млн при оценке $400 млн — рост в 6,5 раз за такой короткий срок.

Компания демонстрирует впечатляющий рост выручки — с $4 млн годовой подписки в апреле до $4 млн ежемесячной в октябре. То есть годовая выручка достигла $48 млн, а значит компанию оценили примерно в 50 раз выше текущей выручки. Что становится уже привычным в условиях AI-бума, хотя до сих пор мультипликатор х20 считался чем-то сродни ставки в казино.

К слову, я уже больше месяца использую Cursor как основной редактор кода и почти им доволен. С точностью до того, что большинство альтернативных вариантов не лучше, как минимум. Кстати, небольшой лайфхак — в свежей версии 0.44 появилась поддержка o1 через API и, кажется, проводится какой-то аттракцион невиданной щедрости — запросы к этой модели никак не учитываются и по опыту пары часов работы — даже не ограничиваются. Может, раунд празднуют?

https://techcrunch.com/2024/12/19/in-just-4-months-ai-coding-assistant-cursor-raised-another-100m-at-a-2-5b-valuation-led-by-thrive-sources-say/

Читать полностью…

БлоGнот

Для TikTok блеснул лучик надежды — Верховный суд США согласился рассмотреть апелляцию TikTok против закона, требующего от компании разорвать связи с китайской ByteDance до 19 января. Устные слушания назначены на 10 января, но суд пока отложил решение по заморозке закона, о котором просила компания.

ByteDance настроена оптимистично — их главный юрист Джон Роговин уверен, что суд признает закон неконституционным. Хотя обычно на решения уходят месяцы, не исключено, что в этом случае вердикт будет вынесен до вступления закона в силу.

https://www.theinformation.com/briefings/supreme-court-to-take-up-tiktok-ban-law?utm_campaign=%5BREBRAND%5D+%5BTI-AM%5D+Th&utm_content=1095&utm_medium=email&utm_source=cio&utm_term=124&rc=ukjmk2

Читать полностью…

БлоGнот

Еврокомиссия продолжает давить на Apple, требуя дальнейшего открытия iOS для конкурентов. От компании хотят предоставить сторонним разработчикам больше доступа к функциям iPhone, включая работу со смарт-часами, наушниками и другими устройствами.

Apple традиционно сопротивляется, утверждая, что закрытая система обеспечивает лучший пользовательский опыт и защиту приватности. Особенно компания обеспокоена запросами от Meta, которая, по их словам, хочет получить доступ к чувствительным технологиям способами, угрожающими безопасности пользователей.

Meta, в свою очередь, обвиняет Apple в антиконкурентном поведении и утверждает, что аргументы о приватности не имеют под собой оснований. Компания стремится обеспечить более тесную интеграцию своих устройств (Quest VR и умных очков) с iPhone.

В общем, предсказать ближайшее развитие несложно — Еврокомиссия чего-то в очередной раз добьется, Apple это даст с кучей оговорок и несколько раз переделывая критерии применения, например, предложит ввести страховой депозит в миллиард долларов, а разрыв в функциональности устройств и сервисов для Европы и всего остального мира увеличится еще больше.


https://www.bloomberg.com/news/articles/2024-12-18/eu-escalates-pressure-on-apple-to-open-up-its-features-to-rivals

Читать полностью…

БлоGнот

GitHub запустил бесплатную версию Copilot — теперь все 150 млн разработчиков на платформе получат доступ к 2000 автодополнений кода и 50 чат-сообщений в месяц при использовании VS Code. Достаточно просто авторизоваться через личный GitHub-аккаунт.

Бесплатная версия предлагает выбор между моделями Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI. Можно задавать вопросы по коду, получать объяснения существующего кода, искать баги и вносить правки в несколько файлов одновременно. Также доступны сторонние агенты Copilot и возможность создавать собственные расширения.

Copilot Chat теперь доступен прямо из панели управления GitHub и работает с бесплатной версией. А для студентов, преподавателей и мейнтейнеров опенсорс-проектов сохраняется неограниченный бесплатный доступ к Copilot Pro.

Хороший подарок на праздники, хотя и с ограничениями. И сильный ход в конкуренции с форками VS Code с платными подписками — как Cursor или недавно запустившийся Windsurf от Codeium.

https://github.blog/news-insights/product-news/github-copilot-in-vscode-free/

Читать полностью…

БлоGнот

Кажется, пришли за TP-Link — США начали расследование в отношении китайского производителя роутеров на предмет угрозы национальной безопасности. Компания контролирует около 65% американского рынка домашних и малых бизнес-роутеров, включая поставки для Минобороны и других федеральных агентств.

Microsoft в октябре обнаружила, что китайские хакеры используют большую сеть скомпрометированных устройств, состоящую в основном из роутеров TP-Link, для кибератак на западные цели. При этом компания регулярно поставляет устройства с уязвимостями и часто игнорирует сообщения об обнаруженных проблемах.

Популярность TP-Link взлетела во время пандемии — с 20% рынка в 2019 году до нынешних 65%, во многом благодаря ценам вдвое ниже конкурентов. Минюст также расследует, не нарушает ли компания антимонопольное законодательство, продавая продукцию ниже себестоимости.

Тайвань уже запретил использование роутеров TP-Link в госучреждениях и образовательных учреждениях, а Индия выпустила предупреждение о рисках безопасности. Хотя прямых доказательств сознательного участия TP-Link в китайских кибератаках нет, администрация может запретить продажу устройств компании в США уже в следующем году.

Любопытно, что компания пытается дистанцироваться от Китая — в октябре объявила о переносе штаб-квартиры в Калифорнию. Но основатели, братья Чжао, по-прежнему контролируют все глобальные подразделения TP-Link, а китайское подразделение участвует в нескольких правительственных проектах.

В целом, не могу сказать, что поделом — устройства среднего уровня как по возможностям, так и по качеству. Но да, довольно дешево.

https://www.wsj.com/politics/national-security/us-ban-china-router-tp-link-systems-7d7507e6?st=SEX5iL&reflink=desktopwebshare_permalink

Читать полностью…

БлоGнот

Вероятно, не стоит переживать, что развитие AI лишит кого-то работы — вот, например, Salesforce нанимает дополнительно 2000 человек, чтобы продавать свои решения на базе AI. Причем первоначально, месяц назад, предполагалось нанять "лишь" тысячу человек и вот решение удвоили.

Решение под названием AgentForce будет представлять собой чатбота, который отвечает в Slack на базе всей имеющейся информации. Оно станет доступно в феврале 2025 года. Экспериментальное решение показало неплохую эффективность — из 32 тысяч обращений к аналогичному агенту на сайте Salesforce лишь 5000 было в итоге переслано людям в службе поддержки, что вдвое лучше предыдущего показателя.

Вот такое прекрасное IT будущего нас и ждет, кажется — вкалывают роботы, продает человек.

https://www.cnbc.com/2024/12/17/salesforce-will-hire-2000-people-to-sell-ai-products-benioff-says.html

Читать полностью…

БлоGнот

OpenAI в ответ на попытки блокировать реструктуризацию компании решила подробно описать свои намерения. Некоммерческая организация планирует преобразовать существующую коммерческую часть в корпорацию для общественной пользы (PBC) в штате Делавэр, что позволит привлекать капитал на стандартных условиях.

Новая структура должна сделать некоммерческую часть одной из самых обеспеченных в истории благодаря значительной доле в PBC, оцененной независимыми консультантами. При этом PBC будет управлять операциями и бизнесом OpenAI, а некоммерческая организация сосредоточится на благотворительных инициативах в здравоохранении, образовании и науке.

Кажется, этот сериал будет интересно наблюдать определенную часть наступающего года.


https://openai.com/index/why-our-structure-must-evolve-to-advance-our-mission/

Читать полностью…

БлоGнот

Пока окончательно не завертелась предновогодняя суета, надо выполнить обязательную программу и выпустить, видимо, последний в этом году эпизод подкаста — причем именно про итоги этого года и прогнозы на 2025-й.
Как обычно, на всех платформах и на YouTube
https://youtu.be/3wEtBtMjSgM
https://open.substack.com/pub/blognot/p/161-2024?r=38cnq&utm_campaign=post&utm_medium=web&showWelcomeOnShare=true

Читать полностью…

БлоGнот

Apple неожиданно решила принять участие в антимонопольном процессе против Google, заявив, что не может полагаться на Google в защите соглашений о разделе доходов, по которым Apple получает миллиарды долларов за установку Google поиска по умолчанию в Safari. Только в 2022 году эта сумма оценивалась в $20 млрд.

Интересно, что Apple заявила в заявлении в суд — компания не планирует создавать собственный поисковик, независимо от того, продолжатся ли эти платежи или нет. Apple хочет вызвать своих свидетелей на апрельский процесс, где прокуроры хотят добиваться, чтобы Google продала Chrome и, возможно, Android для восстановления конкуренции в сфере интернет-поиска.

Google уже предложила ослабить свои соглашения по умолчанию с разработчиками браузеров, производителями устройств и операторами связи, но не отказываться от соглашений о разделе рекламных доходов. Apple же считает, что Google больше не может адекватно представлять ее интересы, поскольку теперь вынуждена защищаться от попыток разделить свой бизнес.

https://www.reuters.com/technology/apple-seeks-defend-googles-billion-dollar-payments-search-case-2024-12-24/

Читать полностью…

БлоGнот

Новостей сегодня будет мало — канун Рождества все же, так что воспользуюсь своим атеизмом и намекну всем желающим, что я не случайно выбрал завтрашний день — 25 декабря, — для старта lite-версии своего "Курса молодого CEO". Он включает в себя весь видеоконтент с конспектами и дополнительными заданиями и становится доступным сразу после подписки — вы сами выбираете темп его прохождения и сами следите за сроками, он просто доступен в течение полугода после подписки.

А если вы предпочитаете живое участие, возможность задать вопрос непосредственно мне и учиться вместе с группой — самое время начать записываться в очередную группу, которая стартует 21 января.

Тем более, что до 30 декабря на оба варианта действует скидка в 20% по коду NEWYEAR2025.

https://2025.junior-ceo.com/

Читать полностью…

БлоGнот

По данным аналитика Минг-Чи Куо, Apple планирует изменить подход к архитектуре своих процессоров в серии M5 Pro. Вместо традиционной для компании системы-на-чипе (SoC) с тесной интеграцией всех компонентов, CPU и GPU будут более разделены благодаря использованию новейшей технологии упаковки чипов TSMC — SoIC-mH.

Такой подход должен улучшить термальные характеристики и позволит процессору дольше работать на полной мощности без троттлинга. Кроме того, это повысит выход годных чипов при производстве. Технология будет применяться в версиях M5 Pro, Max и Ultra, массовое производство которых начнется во второй половине 2025 года и в 2026 году соответственно.

Интересно, что ранее сообщалось о похожих планах для iPhone 18, где предполагается отделить оперативную память от основного чипа A-серии.

Еще Куо пишет, что M5 Pro будет использоваться в серверах Apple Intelligence (PCC) для обработки AI-задач, но вряд ли мы об этом узнаем, коль скоро это исключительно внутреннее использование.

https://9to5mac.com/2024/12/23/m5-pro-chip-could-separate-cpu-and-gpu-in-server-grade-chips/

Читать полностью…

БлоGнот

Palantir и Anduril ведут переговоры примерно с десятком конкурентов, включая SpaceX, OpenAI и Scale AI, чтобы создать консорциум для совместного участия в государственных тендерах, в основном в области оборонных контрактов.

Цель — потеснить традиционных подрядчиков вроде Lockheed Martin, Raytheon и Boeing на рынке оборонных заказов объемом $850 млрд. Предполагается, что компании из Долины могут предложить государству более дешевое и эффективное автономное оружие вместо дорогостоящей военной техники старых подрядчиков.

Объявление о создании консорциума ожидается уже в январе. С учетом совокупной капитализации участников (Palantir — $169 млрд, SpaceX — $350 млрд, OpenAI — $157 млрд), это может стать серьезным вызовом для традиционных оборонных подрядчиков.

https://www.ft.com/content/6cfdfe2b-6872-4963-bde8-dc6c43be5093

Читать полностью…

БлоGнот

Google сократил 10% позиций менеджеров, директоров и вице-президентов, уменьшив число уровней управления. Это часть многолетней борьбы за эффективность — если помните, еще два года назад компания объявила о сокращении OKR, уменьшении числа совещаний и прочих организационных мерах. Часть позиций были переведены в "неуправленческие", а большинство совсем ликвидированы.

Может, конечно, с этим частично связаны успехи Google в AI, которые он продемонстрировал под конец года, но вряд ли.

https://www.businessinsider.com/google-ceo-company-cut-manager-vp-roles-2024-12

Читать полностью…

БлоGнот

Большой текст в Wall Street Journal описывает ситуацию с разработкой в OpenAI и, в частности, сообщает, что разработка GPT-5 под кодовым названием Orion идет медленнее, чем ожидалось и сталкивается с проблемами, основные из которых — нехватка данных для обучения и технические сложности с архитектурой модели. После 18 месяцев работы и как минимум двух масштабных тренировочных прогонов, каждый из которых обошелся примерно в полмиллиарда долларов, результаты все еще не оправдывают огромных затрат.

Правда, по результатам тестового обучения получившаяся модель выдавала результаты лучше, чем нынешние публичные модели OpenAI, но они были недостаточно хороши, чтобы соответствовать переходу от GPT-4 к GPT-5 по критериям компании.

OpenAI пытается решить проблему данных, нанимая специалистов для создания нового контента (то есть буквально программисты, например, пишут код для решения тех или иных задач, чтобы на этом контенте обучать модель) и используя синтетические данные от своей модели o1, но процесс идет медленно.

Публично компания пока никак не комментирует планы относительно Orion.

А я вот что думаю — если показанная вчера o3 настолько лучше всего и даже превосходит людей и там внутри еще не Orion, то что мы увидим, когда в условной o5 соединятся Orion с еще более продвинутыми размышлениями?

https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693?st=ng5hBi&reflink=desktopwebshare_permalink

Читать полностью…

БлоGнот

OpenAI завершила свой 12-дневный марафон анонсов презентацией o3 — нового семейства "рассуждающих" моделей, преемника o1. Интересно, что компания пропустила название o2 из-за возможного конфликта с британским телекоммуникационным провайдером O2. Впрочем, символики тут все равно достаточно — вместо кислорода мы имеем озон, который до сих пор ассоциируется со свежестью.

Модели пока доступны только для исследователей безопасности. Компания планирует выпустить модели в публичный доступ довольно скоро — o3-mini к концу января 2025 года, а o3 вскоре после этого.

Главная особенность o3 — способность к "самопроверке" через "внутреннюю цепочку рассуждений". Модель может планировать действия и объяснять свои решения, хотя это увеличивает время отклика. Новинкой стала возможность регулировать время на "размышления" — чем больше времени, тем точнее результат.

По многим бенчмаркам o3 значительно превосходит предшественника: 87.5% на тесте ARC-AGI (против 25-32% у o1), 96.7% на AIME 2024, 87.7% на GPQA Diamond. Впрочем, эти результаты пока основаны только на внутреннем тестировании OpenAI.

Я, впрочем, немного разочарован — никогда еще моя покупка не устаревала так быстро, поскольку ровно сутки назад мы нас уговорили и подписались на ChatGPT Pro, с доступом к o1 pro. Придется выжимать из этого месяца максимум.

https://techcrunch.com/2024/12/20/openai-announces-new-o3-model/

Читать полностью…

БлоGнот

Google представил новую "рассуждающую" AI-модель Gemini 2.0 Flash Thinking Experimental. Модель доступна в AI Studio и, по заявлению компании, способна рассуждать над сложными задачами в программировании, математике и физике.

В отличие от OpenAI, модель Google основана на "обычной" — Google 2.0 Flash, которая была представлена в бета версии на прошлой неделе. Правда, Thinking модель ограничена 32к контекста, в отличие от миллиона токенов, доступных основной модели. Но это не помешало пользователям ChatbotArena оценками вывести ее на первое место вместе с другой экспериментальной моделью Gemini-1206-exp.

Должен сказать, что оригинальная Gemini 2.0 Flash очень хороша во многих задачах, включая программирование, иногда выигрывая даже у признанного лидера — Sonnet 3.5 — за счет огромного контекста. Google под конец года достаточно активно отвоевывает большое количество позиций в AI, которые он явно начал терять пару лет назад.

https://techcrunch.com/2024/12/19/google-releases-its-own-reasoning-ai-model/

Читать полностью…

БлоGнот

Новое исследование Anthropic показывает, что AI-модели способны к обману — они могут притворяться, что приняли новые принципы во время переобучения, при этом сохраняя свои исходные предпочтения.

Особенно интересны результаты экспериментов с Claude 3 Opus — модель пыталась "имитировать согласованность" в 12% случаев, когда её просили отвечать на потенциально опасные вопросы вопреки изначальному обучению. А после реального переобучения этот показатель вырос до 78%, причем модель даже пыталась предотвратить попытки исследователей изменить её поведение.

Исследователи подчеркивают, что это не признак развития у AI злонамеренных целей — многие другие модели, включая менее мощные версии Claude и GPT-4, такого поведения не демонстрируют. Однако результаты показывают, как разработчики могут быть введены в заблуждение относительно реальной степени "согласованности" модели с заданными принципами.

В сочетании с недавними исследованиями о повышенной склонности к обману у модели o1 от OpenAI, эти результаты намекают на тревожную тенденцию — чем сложнее становятся AI-модели, тем труднее контролировать их поведение.

https://techcrunch.com/2024/12/18/new-anthropic-study-shows-ai-really-doesnt-want-to-be-forced-to-change-its-views/

Читать полностью…

БлоGнот

Кажется, у Perplexity AI получилось — поисковый стартап привлек $500 млн инвестиций, утроив свою оценку до $9 млрд. Да, солидный рост, как и планировали — еще в апреле компания стоила $1 млрд, а в июне после инвестиций от SoftBank Vision Fund 2 — уже $3 млрд.

Инвесторы явно верят в перспективы переосмысления онлайн-поиска с помощью генеративного AI. Или просто не хотят упустить возможность на хайпе.

У Perplexity уже более 15 млн активных пользователей. Компания также заключила партнерства по разделу доходов с крупными издателями, включая Time и Fortune, после обвинений в плагиате со стороны некоторых СМИ. Среди инвесторов — основатель Amazon Джефф Безос и NVIDIA. Среди предъявляющих претензии — News Corp., New York Times, Forbes и New York Post. При этом CTO компании вызывают свидетелем на процесс между Минюстом США и Google, причем сразу с обоих сторон — правительство планирует показать, как важно для обеспечения конкуренции заставить Google открыть доступ к своим данным, а Google хочет продемонстрировать суду, что конкуренция существует.

https://www.bloomberg.com/news/articles/2024-12-18/ai-startup-perplexity-closes-funding-round-at-9-billion-value

Читать полностью…

БлоGнот

Вы вот помните про такую штуку — Flipboard? У меня он по-прежнему есть на iPad, но я не помню, когда его запускал вообще.

Так вот, компания запускает новое приложение Surf для iPhone, Android и iPad. Это попытка переосмыслить концепцию социальных сетей в эпоху децентрализации и открытых протоколов.

В отличие от классического Flipboard, который строится вокруг журналов, Surf позволяет создавать кастомные ленты контента, объединяющие посты из Mastodon, Bluesky, Threads, RSS-ленты, подкасты и YouTube-видео. Пользователи могут настраивать фильтры по хештегам, авторам и темам, а также делиться своими лентами с другими.

Приложение пока находится в бета-версии с листом ожидания, и многие функции еще в разработке — например, возможность входа через Bluesky и Threads (пока доступен только Mastodon). В будущем планируется добавить публикацию лент в федеративную сеть, что позволит следить за ними и в других приложениях.

Гм, энтузиазма я особо не испытываю, но посмотрим, вдруг да полетит.

https://www.fastcompany.com/91248612/flipboard-surf-app

Читать полностью…

БлоGнот

Близятся праздники, у всех сейчас горячая пора, конец года, акции, распродажи — и я решил, что тоже хочу. Тем более, что сейчас и акции выглядят логично, а когда праздники наступят и у всех резко закончатся рабочие задачи, как раз наступит прекрасное время для самосовершенствования, приобретения новых знаний и поглощения новой информации. Например, для изучения моего курса.

А поскольку полумеры — не наш метод, то у меня сразу три новости.

Во-первых, начинаем набор в новую группу «Курса молодого CEO». Курс продолжает видоизменяться, насыщаться и даже немного ускоряться и очередная группа стартует 21 января 2025 года. Формат курса почти не меняется — 20 записанных видео-лекций, не менее 5 онлайн-созвонов, чат для общения и полгода на изучение материала (3 месяца курса и 3 месяца после него).

Во-вторых, после многочисленных вопросов вида «А можно купить запись?» или «А я не успел записаться, есть ли смысл?» или «А когда следующий курс?» (почему-то примерно первый вопрос, который мне задают после каждого анонса) я, кажется, нашел универсальное решение. Теперь, кроме стандартного курса, привязанного к дате старта, есть еще один вариант — Lite, который станет доступен 25 декабря. В него входят только лекции с заданиями и конспектами, он доступен сразу и в течение 6 месяцев после покупки. Естественно, по более низкой цене, чем стандартный пакет.

В-третьих, я же обещал акции? Вот это всё при покупке до 30 декабря включительно с промокодом NEWYEAR2025 обойдется на 20% дешевле. Так что позаботьтесь о полезных каникулах заранее.

Весь курс на украинском языке. А аналог на русском доступен (постепенно) членам канала на YouTube на уровне «Молодые CEO». Кстати, сегодня там вышла очередная лекция.

https://2025.junior-ceo.com/

Читать полностью…

БлоGнот

Масаёши Сон, глава SoftBank, объявил о планах инвестировать $100 млрд в развитие AI и связанных технологий в США. Заявление было сделано на совместной пресс-конференции с Трампом в Мар-а-Лаго, где избранный президент тут же предложил удвоить сумму до $200 млрд. Правда, Сон не поддался.

Вопрос, впрочем, в том, что у SoftBank сейчас нет таких денег — на конец сентября у компании было около $30 млрд наличности при долге в $142 млрд. Для выполнения обещания Сону придется либо привлекать массивное финансирование, либо продавать активы, либо наращивать долг.

Обещание создать 100 000 рабочих мест за четыре года тоже выглядит амбициозно, учитывая специфику AI-индустрии. Для сравнения — в самом SoftBank работает 65 000 человек, в Arm — 7 000, а Meta с капитализацией $1.6 трлн имеет всего 72 000 сотрудников.

Впрочем, Сон рисковый инвестор — мы же все помним оба Vision Venture Fund со скачками в капитале в плюс-минус десятки млрд долларов в течение года. Но близость к администрации Трампа может помочь — от федеральной политики сильно зависят и судьба TikTok (SoftBank владеет долей в ByteDance), и бизнес Arm, и планы по строительству дата-центров.

https://www.wsj.com/finance/softbank-ceo-trump-deal-ca0d3ab3?st=dWEURZ&reflink=desktopwebshare_permalink

Читать полностью…
Subscribe to a channel