Stability выложили в открытый доступ модель Stable Audio Open - довольно простая модель, которая может генерировать по текстовому описанию звуки и немного музыки. Вцелом коммерческие сервисы ушли от Audio Open уже очень далеко, приятно что появился опенсорсный заход на тему. Особенно учитывая что, цитирую "Новая модель была обучена на аудиоданных из FreeSound и Free Music Archive. Это позволило нам создать открытую аудиомодель, соблюдая при этом права авторов."
Стоит заметить, что лицензия Stable Audio Open очень далека от определения Open Source. Для того чтобы получить доступ к весам, надо сначала подписать онлайн форму с согласием с лицензией, а потом выяснится, что для использования весов в любых коммерческих целях предусмотрена оплата подписки.
https://stability.ai/news/introducing-stable-audio-open
Около получаса уже лежит интерфейс ChatGPT. Шутки о том, что это выкатывают GPT5, совершенно не успокаивают школьников всего мира, которые сейчас не могут решать свои задачи.
На самом деле вот такие падения — самый явный намек, что надо продолжать развивать открытые и доступные всем модели.
https://status.openai.com/
Знаю, что меня читает много технарей, находящихся в России. Вы наверное уже знаете, что Docker Hub прекратил работать у вас в стране. Удивительно, что только сейчас, санкции были введены очень давно, видимо, только сейчас у них руки дошли. То, что война и убивают людей, доходит до компаний не очень быстро.
Понятное дело, что можно использовать прокси, и некоторая часть людей так и сделает. Однако я был бы очень осторожен, сейчас появляется много пет проектов, которые вроде как проксируют напрямую в докерхаб, но кто это и зачем они это делают — большой вопрос. Работая через такие прокси, вы по сути доверяете этим людям ваши сервера. Сегодня они нарушают пользовательское соглашение докерхаба, а завтра ваши сервера майнят монеро.
Совета у меня два. Если можете, выезжайте (сами и серверами) в другие страны. Если не можете — пользуйтесь зеркалом от гугла mirror.gcr.io, эти будут за вами следить, но что они сделают, если вы в другом городе.
Долго думал что не буду про это писать. Но почитав и исследовав вопрос решил, что вам будет интересно.
На прошлой неделе начался большой бум среди всех, кто как-то завязан на поиск Гугла (а это почти весь современный интернет, все его разработчики). Некто "Erfan Azimi", владец SEO фирмы внезапно начал показывать слитые ему документы о том как устроено ранжирование в поиске Гугла. На самом деле всё чуть сложнее, не сам поиск, а различные API вокруг него, но как вы понимаете даже по этим API уже можно понять многое. Утечка произошла по ошибке, один из разработчиков в гугле написал программу для превращения API в вызовы на любимом им языке программирования, но вместо публичных вызовов выложил все (если вам интересно, я приложил ссылку на коммит, в котором содержатся все эти описания [1]).
Многочисленные проверки через разных бывших и действующих гуглеров говорят, что это не подделка, не шутка, а вполне реальная утечка, исследованием которой теперь очень озабочены все SEO-ресерчеры. Дам вам ссылку на самый глубокий из них [2], но если кратко то вот что уже сейчас понятно:
- В поиске гугла есть белые списки сайтов, которые принудительно оптимизированы. Как минимум это известно о некоторых тематиках, таких как выборы штатах в 2020 или ковид.
- Название домена, а так же субдоменов является значимой информацией (гугл всегда говорил что это не так).
- Есть отдельная песочница для новых сайтов. Гугл всегда это отрицал.
- В поиске напрямую используются данные из EWOK (это система, в которой живые люди сидят и за деньги оценивают какой вариант выдачи в поиске лучше). Да, судя по всему есть пользователи, которые своими глазами и мнением определяют, какой из нескольких сайтов лучше по некоторому запросу.
- Гугл активно использует информацию по поведению пользователей на сайте для ранжирования
- Данные по тому, куда пользователь нажимает на странице берутся не только из гугл-аналитики, но и напрямую из браузера Chrome
- По количеству кликов на странице сайты делятся на три категории, для каждой из которых строится свой "ранк качества", более популярные по кликам сайты приносят бОльший вклад в пейджранк, т.е. более ценны
- Гугл внутри учитывает размер бренда сайта, не только по самому сайту но и вцелом по упоминанию этого сайта в интернете (даже без ссылок)
- Контент и ссылки вообще вторичны, сейчас гораздо значимее именно клики и навигация по сайту (то что называют "поведенческий фактор").
- Как следствие для большинства мелких компаний и сайтов SEO почти не значим, пока вы не создадите бренд, пользователей на сайте и репутацию для аудитории.
Безусловно это самая значимая утечка про поиск гугла за последние 10-15 лет. По ней очень вероятно, что гугл часто врет [3] когда публично рассказывает о поиске. Скорее всего надо переставать верить, что "content is king", кликбейты + фермы ботов - вот нынешний путь к успеху в SEO. Разумеется гугл от комментариев отказался [4]. Если вам хочется почитать на эту тему еще что-то - вот неплохая статья в iPullRank [5].
А если вам хочется как-то перестать сливать все свои данные в гугл - поставьте себе что-то не из хрома, например Firefox.
[1] https://github.com/googleapis/elixir-google-api/commit/078b497fceb1011ee26e094029ce67e6b6778220
[2] https://sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/
[3] https://www.seroundtable.com/google-chrome-search-usage-15618.html
[4] https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents-link-seo
[5] https://ipullrank.com/google-algo-leak
Я в последнее время редко пишу — много работы и мало времени, но все же. Майкрософт официально запустил Copilot for Telegram. И утром когда я показывал это разным людям — никто не верил, все сначала были уверены, что это фейк, а потом не понимали зачем. Ответа на вопрос "зачем" у меня нет, кажется, просто потому что сделать это легко и они могут. Плюс в процессе собирается приятная база номеров телефонов (без этого бот не работает).
P.S. На российских номерах телефонов вроде бы не работает, по крайней мере, не должно. Остальные в порядке, можно даже не переходить по ссылке выше, а сразу запрыгивать в бота: /channel/CopilotOfficialBot?form=000159
Вчера в гугле обьявили, что теперь в поиске в картинках карточек товаров одежда будет показываться на разных сгенерированных людях. Немного запутано, но по сути теперь будет показываться как одни и те же джинсы сидят на людях разной полноты и цвета кожи. Делает это нейронка, в автоматическом режиме и что-то в этом есть. Знаю с десяток стартапов которые продавали услугу "сделаем из фотографии одной модели несколько десятков фотографий этой же одежды на разных людях", но все это была нишевая история. Теперь это на гугле и кажется бесплатно https://www.wired.com/story/google-ai-shopping-clothes-fit-different-bodies/
Читать полностью…На прошлой неделе гугл запустил в штатах на своем главном сервисе "сгенерированные ИИ ответы". Штука удобная некоторым, потому что можно не проходить по каким-то ссылкам и сразу получить короткий ответ на вопрос.
Но было две детали, которые всем не давали покоя: 1. зачем это гуглу 2. зачем это владельцам сайтов с информацией. На второй вопрос мне отвечать неинтересно (потому что куда мы денемся). А на первый сегодня гугл начал отвечать — с сегодняшнего дня в этих ИИ-сниппетах будет реклама.
https://www.wired.com/story/google-search-ai-overviews-ads/
В приложении чатгпт можно выбирать голоса, которыми "разговаривает" модель. Один из голосов, Sky, из приложения внезапно пропал — оказалось, что многие искренне считали, что это голос Скарлет Йоханссон 🙂 Компания убрала этот голос и отдельно подчеркнула, что голос не был выбран для имитации.
https://www.bloomberg.com/news/articles/2024-05-20/openai-to-pull-johansson-soundalike-sky-s-voice-from-chatgpt
Еще раз расскажу, в штатах есть отдельный набор правовых актов под названием deepfakes accountability act, все очень строго.
https://www.congress.gov/bill/118th-congress/house-bill/5586/text
Послание Сэма Альтмана к сегодняшней презентации:
Из нашего сегодняшнего объявления я хотел бы выделить два момента.
Во-первых, ключевой частью нашей миссии является бесплатное (или по доступной цене) предоставление в руки людей очень мощных инструментов искусственного интеллекта. Я очень горжусь тем, что лучшая в мире модель доступна бесплатно в ChatGPT, без рекламы или чего-либо подобного.
Когда мы начинали OpenAI, наша первоначальная концепция заключалась в том, что мы будем создавать ИИ и использовать его для создания всевозможных благ для мира. Теперь же все выглядит так, что мы создадим ИИ, а другие люди будут использовать его для создания всевозможных удивительных вещей, от которых выиграем мы все.
Мы — бизнес, и мы найдем, за что брать деньги, и это поможет нам предоставить бесплатные, выдающиеся услуги ИИ (надеюсь) миллиардам людей.
Во-вторых, новый голосовой (и видео) режим — это лучший компьютерный интерфейс, который я когда-либо использовал. Это похоже на ИИ из фильмов, и меня до сих пор немного удивляет, что он настоящий. Достижение времени отклика и выразительности на уровне человека оказалось большим изменением.
Изначально ChatGPT показал намек на то, что возможно с языковыми интерфейсами; этот новый релиз ощущается совершенно иначе. Он быстрый, умный, веселый, естественный и полезный.
Разговор с компьютером никогда не казался мне естественным, а теперь это так. По мере добавления (по желанию) персонализации, доступа к вашей информации, возможности совершать действия от вашего имени и т. д. я вижу захватывающее будущее, в котором мы сможем использовать компьютеры для гораздо большего, чем когда-либо прежде.
Наконец, огромное спасибо команде, которая проделала столько работы, чтобы это произошло!
Майкрософт суперактивно вкладывается в Европу, в данном случае в ИИ-проекты и дата-центры во Франции. Удивительно, как Париж и вообще Франция внезапно для всех стали главным ИИ-центром Европы. Я бы больше ожидал Цюрих и Берлин, но нет — Париж и совсем уж далекий Мулюз.
https://www.reuters.com/technology/microsoft-invest-4-billion-euros-france-2024-05-13/
Судя по всему OpenAI делают свое техническое решение для поиска по интернету. Многие диалоги с ChatGPT закончились бы иначе, если бы система могла сходить за валидацией данных в поиск. Сейчас для этого используется Bing (при работе с Copilot) но это конечно совсем не то.
Гугл с встраиванием ИИ в поиск не торопится, посмотрим как выйдет встроить поиск в ИИ у OpenAI https://www.bloomberg.com/news/articles/2024-05-07/openai-is-readying-an-ai-search-product-to-rival-google-perplexity
Из вот этой статьи я узнал, что Linkedin запустили три своих небольших игры, примерно в жанре сапера или wordle, по одному заданию в день:
- PinPoint - вариация на тему wordle, вам дают подсказку, вы должны угадать тему, подсказок всего пять
- Crossclimb - любопытная идея на тему кроссвордов
- Queens - смесь "сапёра" с судоку
и что ужасно, игры залипательные но на них нельзя потратить больше 10 минут в день. Не думал что такое скажу, но игры и линкедын неплохо сочетаются друг с другом.
Пока вокруг пугают, что скоро люди останутся без работы, выяснилось, что планам по полной автоматизации товаров из Амазона в Аризоне не суждено сбыться. Оказалось, что дроны-доставщики летают только при температуре ниже 40 градусов. Но средняя температура в Толлесоне, Аризона летом несколько выше 40. И люди с доставкой справляются. https://www.wired.com/story/amazon-delivery-drones-heat-grounded-summer/
Читать полностью…Небольшая швейцарская компания SoFlow нашла изящный выход из проблемы "должна быть фича по удалению пользовательских аккаунтов, но делать её лень, и это вредит бизнесу". Они просто сделали удаление пользовательских данных платным 🙂 Если их топовый скутер стоит 6400 евро, то удаление аккаунта и всех данных всего 20 евро.
Но вообще, если я правильно помню условия GDPR — сейчас их быстро научат, как обращаться с пользователями.
https://www.soflow.com/eu/product/deletion-of-user-account/
Для Claude AI наконец-то запустилось приложение. Простое и симпатичное, если вы пользователь — очень рекомендую. В нем нет режима "говорим голосом" как в ChatGPT, но мне оно и не надо.
https://apps.apple.com/us/app/claude/id6473753684
Лучшая защита — это нападение. Поэтому Samsung превентивно подал в суд на Oura, производителя "умного" кольца, чтобы добиться решения суда, что Samsung Ring не нарушает никаких патентов Oura.
Собственно, Oura после анонса кольца от Samsung рассказывала, что у них много патентов и они будут внимательно следить за действиями Samsung, а те как раз собрались на американский рынок выходить с новым девайсом. Вот и разберутся.
https://www.theverge.com/2024/6/3/24170479/samsung-galaxy-ring-oura-lawsuit-smart-ring-patents
Судя по всему, Spotify это самый прилипчивый и любимый пользователями стримминговый сервис. Его ежемесячный черн всего 2%. Близко к нему только Netflix.
Для платного сервиса 2% это невероятно низкий чёрн, честно говоря, самые оптимистичные мои ожидания были в районе 7-8%.
https://www.bloomberg.com/news/newsletters/2024-06-02/spotify-has-one-big-advantage-on-every-other-streaming-service
Два слуха сразу: на прошлой неделе Сэм Альтман и Сатья Наделла встречались, чтобы обсудить как сделка между OpenAI и Apple повлияет на амбиции Майкрософт в применении ИИ для своих продуктов. Говоря проще, Майкрософт давит на ОпенИИ, чтобы они аккуратнее выбирали партнеров, давая больше влияния тем кто инвестирует в компанию 🙂
Вместе с тем именно Microsoft пушит и всегда пушили OpenAI в пользу коммерциализации продуктов. Особенно ярко это начало проявляться после бунта против Альтмана в ноябре прошлого года.
Вывод можно делать простой - майкрософт пытается все больше влиять на OpenAI. А OpenAI общается, но глобально делает что захочет. Интересно чем все это закончится.
Помните Mt.Gox, первую взломанную и рухнувшую в 2014 году биржу? Прошло 10 лет, кредиторы начали получать возмещение. Вчера были переведены первые 140 тысяч биткоинов, сумма небольшая, но значимая.
Кажется довольно скоро, через несколько лет FTX тоже будет платить возмещения. Жаль только, что платить они скорее всего будут в долларах, а не в крипте.
https://www.coindesk.com/markets/2024/05/28/mtgox-moves-7b-bitcoin-as-part-of-repayment-plans-sparking-btc-price-plunge/
Одновременно лежат поиск Бинга, Copilot, часть ChatGPT которая ходит в интернет. И все кто пользуются этими сервисами, например DuckDuckGo тоже лежит.
Причина не очень понятно но время простоя уже несколько часов. https://www.bleepingcomputer.com/news/microsoft/microsoft-outage-affects-bing-copilot-duckduckgo-and-chatgpt-internet-search/
Помните Humane AI, которые недавно с шумом (и треском) запустили Ai Pin - брошь с проектором и ИИ? Судя по всему, компания ищет покупателя, по оценке от 750 миллионов до миллиарда. В прошлом году последние инвесторы входили в компанию по цене 850 миллионов.
Вообще кажется все новые хардварные компании пока не очень успешны. Телефоны всё еще самый привлекательный формат, а жаль, хочется разнообразия https://www.bloomberg.com/news/articles/2024-05-22/wearable-ai-startup-humane-is-said-to-explore-potential-sale
Вынесу из комментариев продолжение этой новости. Вот с купюрами заявление самой Скарлет:
"В сентябре прошлого года я получила предложение от Сэма Альтмана, который хотел нанять меня для озвучивания текущей системы ChatGPT 4.0. Он сказал мне, что, по его мнению, озвучивая систему, я смогу ... помочь потребителям почувствовать себя комфортно в связи с резким изменением в отношениях между людьми и ИИ. Он сказал, что чувствует, что мой голос будет успокаивать людей. После долгих раздумий и по личным причинам я отклонила это предложение. Девять месяцев спустя мои друзья, семья и обычные люди отметили, насколько сильно новейшая система под названием "Sky" похожа на меня. Когда я услышала выпущенное демо, я была шокирована, возмущена и не поверила, что мистер Альтман стал использовать голос, настолько похожий на мой, что мои близкие друзья и новостные агентства не смогли отличить его. Мистер Альтман даже намекнул, что сходство было намеренным, написав в Твиттере одно слово "her" — отсылка к фильму, в котором я озвучивала чат-систему Саманту, вступающую в близкие отношения с человеком. За два дня до выхода демо-версии ChatGPT 4.0 мистер Альтман связался с моим агентом и попросил передумать. Мы не успели связаться, и система была выпущена. В результате их действий я была вынуждена нанять адвоката, который написал два письма г-ну Альтману и компании OpenAl, в которых изложил их действия и попросил подробно описать процесс создания голоса "Sky".
В результате OpenAl неохотно согласился убрать голос "Sky". В то время, когда мы все боремся с подделками и защищаем свое собственное лицо, свою работу, свою идентичность, я считаю, что эти вопросы заслуживают абсолютной ясности. Я с нетерпением жду решения в виде прозрачности и принятия соответствующего законодательства, которое поможет обеспечить защиту прав личности."
Илья Суцкевер и Ян Лейке, которые возглавляли всё техническое направление по развитию ИИ, покинули компанию OpenAI. Конец предсказуемный, хоть и неприятный. https://www.theverge.com/2024/5/14/24156920/openai-chief-scientist-ilya-sutskever-leaves
Читать полностью…OpenAI показала свою новую модель GPT 4о (читать, видимо, мы будем "гпт чо"), именно ее тестировали под названием gpt2 на LLM Arena несколько недель подряд. Она будет доступна всем пользователям ChatGPT в ближайшее время, а сейчас доступна в виде API. Главное отличие модели — она изначально мультимодальная, т.е. обучена не только на текстах, но и на видео, аудио и т.д.
Отдельно надо отметить обновленное приложение ChatGPT — оно ведет диалог без пауз и задержек (на презентации были проблемы, но это, конечно, мелочи), по сути слушает вопрос не с момента, когда вы его задали, а с момента, когда вы начали его задавать. Система понимает эмоции и неплохо умеет их имитировать. Словом, это примерно та Сири, которую нам обещали на запуске. Вероятно, именно про этот проект OpenAI и договаривались с Apple. Обновленное приложение для мобильных (и новое, для десктопа) обещают в ближайшие недели.
https://openai.com/index/hello-gpt-4o/
ElevenLabs показали демо своей модели для генерации песен. С куда большим чем у других акцентом на слова, а не музыку. Ну, звучит неплохо, но чтобы на самом деле оценить, надо дождаться бета-теста.
Читать полностью…НОС: В Латвии взломали местное интернет-телевидение и транслировали там парад с красной площади https://eng.lsm.lv/article/society/crime/09.05.2024-balticoms-tv-channels-temporarily-hacked-by-russian-propaganda.a553409/
Читать полностью…Давайте я коротко подведу итог впечатлениям от презентации Apple. Нам фактически показали две модели iPad — Air и Pro. Air предсказуемо получил все обновления из существующей итерации Pro — процессор M2, теперь этот планшет существует в двух размерах, 11 и 13 дюймов.
А вот Pro выглядит совершенно иначе. Дело не в том, что он тонкий, например, но перед нами первый планшет, который получил совершенно новый процессор M4 — ранее новые версии процессора Apple начинала ставить в ноутбуки и лишь через полгода-год они доезжали до планшетов. Если добавить новую клавиатуру Magic Keyboard, максимально идентичную клавиатуре ноутбука, и переехавшую на длинную сторону фронтальную камеру, то становится понятно, что новое дефолтное положение iPad Pro — это landscape и он теперь максимально близок ноутбуку. В принципе, видя такое устройство, я всерьез задумываюсь, что оно может заменить мне как старый iPad Pro, так и старый MacBook Pro — все же я не разработчик, специфических функций ОС мне не надо, а стандартные способы использования практически полностью покроются.
В общем, подождем с месяц, пока устройства доедут куда-то поближе и подумаю серьезно.
https://9to5mac.com/2024/05/07/apple-announces-new-ipad-pro-oled-display-thinnest-apple-product-ever/
Слухи ходили давно, а теперь официально: в чатгпт и других нейронках от OpenAI будет доступ к ответам с главного ресурса для ленивых программистов, StackOverflow. В обратную сторону тоже справедливо — OpenAI будет использоваться в продуктах StackOverflow.
До этого стэковерфлоу явно и сильно страдали от пришествия ChatGPT и подобных продуктов.
https://stackoverflow.co/company/press/archive/openai-partnership/
Шумная история разгорается с четверга: видимо, Гугл уволил многих людей, которые занимались развитием языков программирования Python, Dart и других членов core team. Но это не вызвало бы шума, если бы вместо уволенных уже не начали набирать людей из других стран, в первую очередь, из Индии и Мексики. Да, решили немного сэкономить. [Link]
Читать полностью…В Nikkei очень понятная история, как один из тысяч китайских продавцов поставляет легкую гражданскую электронику из Китая в Россию. А эта электроника легко используется в военных целях.
Современный мир так устроен, что нет никакой мирной гражданской электроники. Даже детские игрушки можно превратить в оружие [O_o] [Link]