Когда гугл купил DeepMind все (в том числе и гугл) говорили, что покупают ресерч-лабораторию, которая двигает науку вперед. Но время прошло, кажется, все устали от бесполезных прототипов. 12 разных источников блумберга говорят, что, судя по всему, с апреля 2023 года DeepMind активно двигается от экспериментов к продуктовому подразделению.
На самом деле читать эту новость можно иначе: "т.к. остальные ИИ-подразделения провалились, был сформирован Google DeepMind, на который сделана ставка". Смотрю на это как на поучительный пример, как компания-лидер в области машинного обучения потеряла все полимеры.
https://www.bloomberg.com/news/articles/2024-06-17/google-deepmind-shifts-from-research-lab-to-ai-product-factory
Я еще не дочитал эти документы, но судя по тому что я вижу - США только что ввели полный запрет на поставку софта, облачных или IT услуг любому лицу на территории России. Ну как, не прямо запретили - но появился прецендент введения вторичных санкций производителю софта, а это прямой сигнал "прячьте все концы".
Я не думаю что все будет настолько жестко, но часть компаний явно убоится, так что ждем...
https://home.treasury.gov/news/press-releases/jy2404
Прямо сейчас очень плохой дипфейк Тима Кука рассказывал, что Эппл встраивает криптовалюты, и конкретно показывал, как перевести деньги на свой кошелек. Разумеется, это был не эппл, и стрим забанили, однако в лайве его смотрело более полумиллиона наивных людей. Пожалуйста, не ведитесь на такие разводы.
Читать полностью…Назревает очень, очень интересный скандальчик: бывший сотрудник Amazon AWS рассказывает, что Amazon нарушает санкции Великобритании, предоставляя технологию распознавания лиц (Rekognition) российской компании VisionLabs. Я не знаю зачем бы VisionLabs покупать Rekognition (разве что для тестов), но обвинение крайне серьезное.
Из интересных подробностей, человек который собственно слил эту историю - по утверждениям Амазона его уволили за грубейшее нарушение дисциплины, в том числе за отказ отработать указанные в контракте часы. Короче будьте аккуратнее, возможно это суд из мести [O_o]
Ройтерс наконец-то подтвердили, что Duolingo удаляет из своего приложения контент, связанный с любыми проявлениями LGBTQ+ в России. По сути они получили предупреждение от регулятора и решили не терять рынок.
Наконец-то я нашел причину, почему больше не буду слушать советов этой неприятной совы https://www.reuters.com/technology/duolingo-deletes-lgbt-references-russia-after-warning-moscow-2024-06-04/
Stability выложили в открытый доступ модель Stable Audio Open - довольно простая модель, которая может генерировать по текстовому описанию звуки и немного музыки. Вцелом коммерческие сервисы ушли от Audio Open уже очень далеко, приятно что появился опенсорсный заход на тему. Особенно учитывая что, цитирую "Новая модель была обучена на аудиоданных из FreeSound и Free Music Archive. Это позволило нам создать открытую аудиомодель, соблюдая при этом права авторов."
Стоит заметить, что лицензия Stable Audio Open очень далека от определения Open Source. Для того чтобы получить доступ к весам, надо сначала подписать онлайн форму с согласием с лицензией, а потом выяснится, что для использования весов в любых коммерческих целях предусмотрена оплата подписки.
https://stability.ai/news/introducing-stable-audio-open
Около получаса уже лежит интерфейс ChatGPT. Шутки о том, что это выкатывают GPT5, совершенно не успокаивают школьников всего мира, которые сейчас не могут решать свои задачи.
На самом деле вот такие падения — самый явный намек, что надо продолжать развивать открытые и доступные всем модели.
https://status.openai.com/
Знаю, что меня читает много технарей, находящихся в России. Вы наверное уже знаете, что Docker Hub прекратил работать у вас в стране. Удивительно, что только сейчас, санкции были введены очень давно, видимо, только сейчас у них руки дошли. То, что война и убивают людей, доходит до компаний не очень быстро.
Понятное дело, что можно использовать прокси, и некоторая часть людей так и сделает. Однако я был бы очень осторожен, сейчас появляется много пет проектов, которые вроде как проксируют напрямую в докерхаб, но кто это и зачем они это делают — большой вопрос. Работая через такие прокси, вы по сути доверяете этим людям ваши сервера. Сегодня они нарушают пользовательское соглашение докерхаба, а завтра ваши сервера майнят монеро.
Совета у меня два. Если можете, выезжайте (сами и серверами) в другие страны. Если не можете — пользуйтесь зеркалом от гугла mirror.gcr.io, эти будут за вами следить, но что они сделают, если вы в другом городе.
Долго думал что не буду про это писать. Но почитав и исследовав вопрос решил, что вам будет интересно.
На прошлой неделе начался большой бум среди всех, кто как-то завязан на поиск Гугла (а это почти весь современный интернет, все его разработчики). Некто "Erfan Azimi", владец SEO фирмы внезапно начал показывать слитые ему документы о том как устроено ранжирование в поиске Гугла. На самом деле всё чуть сложнее, не сам поиск, а различные API вокруг него, но как вы понимаете даже по этим API уже можно понять многое. Утечка произошла по ошибке, один из разработчиков в гугле написал программу для превращения API в вызовы на любимом им языке программирования, но вместо публичных вызовов выложил все (если вам интересно, я приложил ссылку на коммит, в котором содержатся все эти описания [1]).
Многочисленные проверки через разных бывших и действующих гуглеров говорят, что это не подделка, не шутка, а вполне реальная утечка, исследованием которой теперь очень озабочены все SEO-ресерчеры. Дам вам ссылку на самый глубокий из них [2], но если кратко то вот что уже сейчас понятно:
- В поиске гугла есть белые списки сайтов, которые принудительно оптимизированы. Как минимум это известно о некоторых тематиках, таких как выборы штатах в 2020 или ковид.
- Название домена, а так же субдоменов является значимой информацией (гугл всегда говорил что это не так).
- Есть отдельная песочница для новых сайтов. Гугл всегда это отрицал.
- В поиске напрямую используются данные из EWOK (это система, в которой живые люди сидят и за деньги оценивают какой вариант выдачи в поиске лучше). Да, судя по всему есть пользователи, которые своими глазами и мнением определяют, какой из нескольких сайтов лучше по некоторому запросу.
- Гугл активно использует информацию по поведению пользователей на сайте для ранжирования
- Данные по тому, куда пользователь нажимает на странице берутся не только из гугл-аналитики, но и напрямую из браузера Chrome
- По количеству кликов на странице сайты делятся на три категории, для каждой из которых строится свой "ранк качества", более популярные по кликам сайты приносят бОльший вклад в пейджранк, т.е. более ценны
- Гугл внутри учитывает размер бренда сайта, не только по самому сайту но и вцелом по упоминанию этого сайта в интернете (даже без ссылок)
- Контент и ссылки вообще вторичны, сейчас гораздо значимее именно клики и навигация по сайту (то что называют "поведенческий фактор").
- Как следствие для большинства мелких компаний и сайтов SEO почти не значим, пока вы не создадите бренд, пользователей на сайте и репутацию для аудитории.
Безусловно это самая значимая утечка про поиск гугла за последние 10-15 лет. По ней очень вероятно, что гугл часто врет [3] когда публично рассказывает о поиске. Скорее всего надо переставать верить, что "content is king", кликбейты + фермы ботов - вот нынешний путь к успеху в SEO. Разумеется гугл от комментариев отказался [4]. Если вам хочется почитать на эту тему еще что-то - вот неплохая статья в iPullRank [5].
А если вам хочется как-то перестать сливать все свои данные в гугл - поставьте себе что-то не из хрома, например Firefox.
[1] https://github.com/googleapis/elixir-google-api/commit/078b497fceb1011ee26e094029ce67e6b6778220
[2] https://sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/
[3] https://www.seroundtable.com/google-chrome-search-usage-15618.html
[4] https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents-link-seo
[5] https://ipullrank.com/google-algo-leak
Я в последнее время редко пишу — много работы и мало времени, но все же. Майкрософт официально запустил Copilot for Telegram. И утром когда я показывал это разным людям — никто не верил, все сначала были уверены, что это фейк, а потом не понимали зачем. Ответа на вопрос "зачем" у меня нет, кажется, просто потому что сделать это легко и они могут. Плюс в процессе собирается приятная база номеров телефонов (без этого бот не работает).
P.S. На российских номерах телефонов вроде бы не работает, по крайней мере, не должно. Остальные в порядке, можно даже не переходить по ссылке выше, а сразу запрыгивать в бота: /channel/CopilotOfficialBot?form=000159
Вчера в гугле обьявили, что теперь в поиске в картинках карточек товаров одежда будет показываться на разных сгенерированных людях. Немного запутано, но по сути теперь будет показываться как одни и те же джинсы сидят на людях разной полноты и цвета кожи. Делает это нейронка, в автоматическом режиме и что-то в этом есть. Знаю с десяток стартапов которые продавали услугу "сделаем из фотографии одной модели несколько десятков фотографий этой же одежды на разных людях", но все это была нишевая история. Теперь это на гугле и кажется бесплатно https://www.wired.com/story/google-ai-shopping-clothes-fit-different-bodies/
Читать полностью…На прошлой неделе гугл запустил в штатах на своем главном сервисе "сгенерированные ИИ ответы". Штука удобная некоторым, потому что можно не проходить по каким-то ссылкам и сразу получить короткий ответ на вопрос.
Но было две детали, которые всем не давали покоя: 1. зачем это гуглу 2. зачем это владельцам сайтов с информацией. На второй вопрос мне отвечать неинтересно (потому что куда мы денемся). А на первый сегодня гугл начал отвечать — с сегодняшнего дня в этих ИИ-сниппетах будет реклама.
https://www.wired.com/story/google-search-ai-overviews-ads/
В приложении чатгпт можно выбирать голоса, которыми "разговаривает" модель. Один из голосов, Sky, из приложения внезапно пропал — оказалось, что многие искренне считали, что это голос Скарлет Йоханссон 🙂 Компания убрала этот голос и отдельно подчеркнула, что голос не был выбран для имитации.
https://www.bloomberg.com/news/articles/2024-05-20/openai-to-pull-johansson-soundalike-sky-s-voice-from-chatgpt
Еще раз расскажу, в штатах есть отдельный набор правовых актов под названием deepfakes accountability act, все очень строго.
https://www.congress.gov/bill/118th-congress/house-bill/5586/text
Послание Сэма Альтмана к сегодняшней презентации:
Из нашего сегодняшнего объявления я хотел бы выделить два момента.
Во-первых, ключевой частью нашей миссии является бесплатное (или по доступной цене) предоставление в руки людей очень мощных инструментов искусственного интеллекта. Я очень горжусь тем, что лучшая в мире модель доступна бесплатно в ChatGPT, без рекламы или чего-либо подобного.
Когда мы начинали OpenAI, наша первоначальная концепция заключалась в том, что мы будем создавать ИИ и использовать его для создания всевозможных благ для мира. Теперь же все выглядит так, что мы создадим ИИ, а другие люди будут использовать его для создания всевозможных удивительных вещей, от которых выиграем мы все.
Мы — бизнес, и мы найдем, за что брать деньги, и это поможет нам предоставить бесплатные, выдающиеся услуги ИИ (надеюсь) миллиардам людей.
Во-вторых, новый голосовой (и видео) режим — это лучший компьютерный интерфейс, который я когда-либо использовал. Это похоже на ИИ из фильмов, и меня до сих пор немного удивляет, что он настоящий. Достижение времени отклика и выразительности на уровне человека оказалось большим изменением.
Изначально ChatGPT показал намек на то, что возможно с языковыми интерфейсами; этот новый релиз ощущается совершенно иначе. Он быстрый, умный, веселый, естественный и полезный.
Разговор с компьютером никогда не казался мне естественным, а теперь это так. По мере добавления (по желанию) персонализации, доступа к вашей информации, возможности совершать действия от вашего имени и т. д. я вижу захватывающее будущее, в котором мы сможем использовать компьютеры для гораздо большего, чем когда-либо прежде.
Наконец, огромное спасибо команде, которая проделала столько работы, чтобы это произошло!
Майкрософт суперактивно вкладывается в Европу, в данном случае в ИИ-проекты и дата-центры во Франции. Удивительно, как Париж и вообще Франция внезапно для всех стали главным ИИ-центром Европы. Я бы больше ожидал Цюрих и Берлин, но нет — Париж и совсем уж далекий Мулюз.
https://www.reuters.com/technology/microsoft-invest-4-billion-euros-france-2024-05-13/
Nvidia выложила новую LLM-модель с открытой лицензией — Nemotron-4 340B. И ее масштабы прям поражают.
Это модель, у которой минимальные требования — это две A100 и 1.3TB памяти. По тестам она близка к GPT4o, а местами и обгоняет её. Но сейчас постоянно выходят большие модели, моё внимание привлек вот этот пункт в лицензии (выделение моё):
Этика ИИ. NVIDIA стремится к безопасности, доверию и прозрачности в разработке ИИ. NVIDIA призывает вас (a) убедиться, что продукт или услуга, которые вы разрабатываете, используете, предлагаете в качестве услуги или распространяете, соответствуют юридическим и этическим требованиям соответствующей отрасли или сферы применения, (b) принять разумные меры для устранения непреднамеренной предвзятости и смягчения вреда для других, включая недопредставленные или уязвимые группы, и (c) информировать пользователей о характере и ограничениях продукта или услуги. NVIDIA категорически запрещает использовать свои продукты или услуги для любых целей, нарушающих действующее законодательство, включая, помимо прочего, (a) незаконное наблюдение, (b) незаконный сбор или обработку биометрической информации без согласия субъекта, если это требуется в соответствии с действующим законодательством, или (c) незаконное преследование, злоупотребление, угрозы или запугивание отдельных лиц или групп лиц, а также намеренное введение в заблуждение или обман других лиц.
https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/
По сложившейся уже традиции я не пишу о том, что рассказали эппл на презентации — этим уже завалены все новости. Однако кусок про Private Cloud Compute крайне любопытный, и я очень рекомендую вам его почитать внимательно, очень неожиданное решение.
Если коротко: в некоторых ситуациях нейронки на телефоне недостаточно для вычислений и прогнозов. В такой ситуации эппл 1. вычленяет необходимые для вычислений данные 2. извлекает из них ключевые свойства, которые использует нейронка 3. создает специальный зашифрованный раздел на сервере (он зашифрован так же, как отпечатки пальцев в айфоне, с использованием ключа вашего устройства) 4. отправляет туда зашифрованные абстрактные данные с телефона 5. производит вычисления 6. отправляет результаты в телефон и стирает их вместе с разделом из пункта 3. 7. в телефоне данные расшифровываются и уже используются по назначению.
Таким образом получается, что ваши данные в чистом виде (т.е. например фотографии) не покидают устройство, а то, что уходит на сервера, малопригодно для прямой слежки, и практически невозможно определить, что вот эти вычисления на сервере относятся к вашим данным. Решение крутое и, я уверен, довольно скоро станет индустриальным стандартом. В остальном, кроме дизайна никаких новых решений от эппл я не увидел. Но и этого достаточно. [O_o]
Anthropic написали, как они тренировали персоналию (хотя очень хочется перевести character как характер) своего чат-бота Claude. Довольно поучительное чтиво и видео. Меня больше всего зацепило, что 1. с одной стороны, ИИ — это не человек, вкладывать в него видимость человеческих эмоций — явный источник проблем и ошибок. А с другой стороны, 2. если сделать чат-бота показательно нейтральным, люди автоматически перестают помнить, что ИИ как люди, часто ошибается. Честно говоря, я не думал, что при нашей жизни мы застанем такого рода проблемы.
https://www.anthropic.com/research/claude-character
Судя по слухам NYT, Humane Ai Pin продались в количестве всего 10 тысяч штук, а компания будет продаваться примерно за миллиард, в качестве потенциального покупателя выступает HP.
Я очень удивлюсь, если удастся за эту компанию выручить целый миллиард, продажи провалены, продукта нет, инвесторы жмут на стопкран чтобы спасти хотябы часть своих денег https://www.nytimes.com/2024/06/06/technology/humane-ai-pin.html
Я думаю, для многих это будет шоком, но ИИ-революция — это очень выгодно. Nvidia достигла капитализации в $3 триллиона и стала второй самой дорогой компанией в мире. На первом месте Майкрософт, а на третьем Эппл.
https://www.cnbc.com/2024/06/05/nvidia-passes-apple-in-market-cap.html
Лучшая защита — это нападение. Поэтому Samsung превентивно подал в суд на Oura, производителя "умного" кольца, чтобы добиться решения суда, что Samsung Ring не нарушает никаких патентов Oura.
Собственно, Oura после анонса кольца от Samsung рассказывала, что у них много патентов и они будут внимательно следить за действиями Samsung, а те как раз собрались на американский рынок выходить с новым девайсом. Вот и разберутся.
https://www.theverge.com/2024/6/3/24170479/samsung-galaxy-ring-oura-lawsuit-smart-ring-patents
Судя по всему, Spotify это самый прилипчивый и любимый пользователями стримминговый сервис. Его ежемесячный черн всего 2%. Близко к нему только Netflix.
Для платного сервиса 2% это невероятно низкий чёрн, честно говоря, самые оптимистичные мои ожидания были в районе 7-8%.
https://www.bloomberg.com/news/newsletters/2024-06-02/spotify-has-one-big-advantage-on-every-other-streaming-service
Два слуха сразу: на прошлой неделе Сэм Альтман и Сатья Наделла встречались, чтобы обсудить как сделка между OpenAI и Apple повлияет на амбиции Майкрософт в применении ИИ для своих продуктов. Говоря проще, Майкрософт давит на ОпенИИ, чтобы они аккуратнее выбирали партнеров, давая больше влияния тем кто инвестирует в компанию 🙂
Вместе с тем именно Microsoft пушит и всегда пушили OpenAI в пользу коммерциализации продуктов. Особенно ярко это начало проявляться после бунта против Альтмана в ноябре прошлого года.
Вывод можно делать простой - майкрософт пытается все больше влиять на OpenAI. А OpenAI общается, но глобально делает что захочет. Интересно чем все это закончится.
Помните Mt.Gox, первую взломанную и рухнувшую в 2014 году биржу? Прошло 10 лет, кредиторы начали получать возмещение. Вчера были переведены первые 140 тысяч биткоинов, сумма небольшая, но значимая.
Кажется довольно скоро, через несколько лет FTX тоже будет платить возмещения. Жаль только, что платить они скорее всего будут в долларах, а не в крипте.
https://www.coindesk.com/markets/2024/05/28/mtgox-moves-7b-bitcoin-as-part-of-repayment-plans-sparking-btc-price-plunge/
Одновременно лежат поиск Бинга, Copilot, часть ChatGPT которая ходит в интернет. И все кто пользуются этими сервисами, например DuckDuckGo тоже лежит.
Причина не очень понятно но время простоя уже несколько часов. https://www.bleepingcomputer.com/news/microsoft/microsoft-outage-affects-bing-copilot-duckduckgo-and-chatgpt-internet-search/
Помните Humane AI, которые недавно с шумом (и треском) запустили Ai Pin - брошь с проектором и ИИ? Судя по всему, компания ищет покупателя, по оценке от 750 миллионов до миллиарда. В прошлом году последние инвесторы входили в компанию по цене 850 миллионов.
Вообще кажется все новые хардварные компании пока не очень успешны. Телефоны всё еще самый привлекательный формат, а жаль, хочется разнообразия https://www.bloomberg.com/news/articles/2024-05-22/wearable-ai-startup-humane-is-said-to-explore-potential-sale
Вынесу из комментариев продолжение этой новости. Вот с купюрами заявление самой Скарлет:
"В сентябре прошлого года я получила предложение от Сэма Альтмана, который хотел нанять меня для озвучивания текущей системы ChatGPT 4.0. Он сказал мне, что, по его мнению, озвучивая систему, я смогу ... помочь потребителям почувствовать себя комфортно в связи с резким изменением в отношениях между людьми и ИИ. Он сказал, что чувствует, что мой голос будет успокаивать людей. После долгих раздумий и по личным причинам я отклонила это предложение. Девять месяцев спустя мои друзья, семья и обычные люди отметили, насколько сильно новейшая система под названием "Sky" похожа на меня. Когда я услышала выпущенное демо, я была шокирована, возмущена и не поверила, что мистер Альтман стал использовать голос, настолько похожий на мой, что мои близкие друзья и новостные агентства не смогли отличить его. Мистер Альтман даже намекнул, что сходство было намеренным, написав в Твиттере одно слово "her" — отсылка к фильму, в котором я озвучивала чат-систему Саманту, вступающую в близкие отношения с человеком. За два дня до выхода демо-версии ChatGPT 4.0 мистер Альтман связался с моим агентом и попросил передумать. Мы не успели связаться, и система была выпущена. В результате их действий я была вынуждена нанять адвоката, который написал два письма г-ну Альтману и компании OpenAl, в которых изложил их действия и попросил подробно описать процесс создания голоса "Sky".
В результате OpenAl неохотно согласился убрать голос "Sky". В то время, когда мы все боремся с подделками и защищаем свое собственное лицо, свою работу, свою идентичность, я считаю, что эти вопросы заслуживают абсолютной ясности. Я с нетерпением жду решения в виде прозрачности и принятия соответствующего законодательства, которое поможет обеспечить защиту прав личности."
Илья Суцкевер и Ян Лейке, которые возглавляли всё техническое направление по развитию ИИ, покинули компанию OpenAI. Конец предсказуемный, хоть и неприятный. https://www.theverge.com/2024/5/14/24156920/openai-chief-scientist-ilya-sutskever-leaves
Читать полностью…OpenAI показала свою новую модель GPT 4о (читать, видимо, мы будем "гпт чо"), именно ее тестировали под названием gpt2 на LLM Arena несколько недель подряд. Она будет доступна всем пользователям ChatGPT в ближайшее время, а сейчас доступна в виде API. Главное отличие модели — она изначально мультимодальная, т.е. обучена не только на текстах, но и на видео, аудио и т.д.
Отдельно надо отметить обновленное приложение ChatGPT — оно ведет диалог без пауз и задержек (на презентации были проблемы, но это, конечно, мелочи), по сути слушает вопрос не с момента, когда вы его задали, а с момента, когда вы начали его задавать. Система понимает эмоции и неплохо умеет их имитировать. Словом, это примерно та Сири, которую нам обещали на запуске. Вероятно, именно про этот проект OpenAI и договаривались с Apple. Обновленное приложение для мобильных (и новое, для десктопа) обещают в ближайшие недели.
https://openai.com/index/hello-gpt-4o/
ElevenLabs показали демо своей модели для генерации песен. С куда большим чем у других акцентом на слова, а не музыку. Ну, звучит неплохо, но чтобы на самом деле оценить, надо дождаться бета-теста.
Читать полностью…