Компания Inflection выпустила Inflection-2.5, улучшенный ИИ, сопоставимый с GPT-4, но требующий на 40% меньше вычислительных ресурсов. Похоже OpenAI пора делать свой ход, а то GPT-4 становится общепринятой нормой для новых чат-ботов🤓
https://inflection.ai/inflection-2-5
Интересный момент, раскрытый инженером Anthropic Алексом Альбертом, что при тестировании Claude 3 Opus исследователи обнаружили, что она, казалось, осознала, что ее тестируют🌚 В частности, при оценке способности модели фокусироваться на конкретном фрагменте информации в большом массиве данных, а затем вспоминать эту информацию по запросу, модель не только нашла правильный ответ на вопрос о начинках для пиццы из единственного предложения, среди большого количества нерелевантной информации, но и сообщила исследователям, что подозревает, что ее тестируют. Это свидетельствует о новом уровне самосознания и метапознания искусственного интеллекта✨
https://venturebeat.com/ai/anthropics-claude-3-knew-when-researchers-were-testing-it/
Первое минутное видео от Sora, обратите внимание насколько чёткие картины🤯
"fly through tour of a museum with many paintings and sculptures and beautiful works of art in all styles"
С марта владельцы каналов в Telegram начнут получать доход от рекламы, используя блокчейн TON🌚
Читать полностью…Новое видео от OpenAI — оказывается Sora умеет превращать фото в видео 🔥
Похоже нас ждут ожившие фото из Гарри Поттера 🌚
Ну и ещё немного Sora✨ стеклянная черепаха уползает в закат, преломление света, песок, отражения.. 🤯 Интересно, сколько бы заняло времени создать такое же cgi? часы, дни, недели 🤔
Читать полностью…Тут старший научный сотрудник в команде робототехники Google DeepMind тизерит какие-то крутые анонсы в робототехнике и AI в ближайшие недели, чтож будем ждать✨ И это только их команда, а сколько компаний готовят представить свои технологические прорывы 🌚 похоже этот год, станет репетицией будущего, где технологические прорывы станут ежедневной нормой🤓
Читать полностью…Пока все говорят о впечатляющих возможностях Sora, как-то упустили из вида не менее значимые новости про гугловскую модельку Gemini 1.5, а там очень интересно, вот некоторые из последних:
Gemini 1.5 успешно справилась с задачей создания персонажа для сложной ролевой игры по 352-страничному правилу, которое ранее не удавалось другим моделям ИИ. Инструкции были разбросаны по множеству страниц и представляли собой сложную задачу, но Gemini смогла разобраться.
После загрузки полного кода прямо с GitHub и всех сопутствующих проблем, Gemini не только поняла весь код, но и определила наиболее срочную проблему, а затем реализовала решение.
Показав Gemini 1.5 полный код самоорганизующегося компьютера и пример вызова API Gemini 1.5, модель смогла не только идеально объяснить, как работает код, но и интегрировала себя как новую поддерживаемую модель для репозитория, хотя и с небольшими неточностями.
Прогнозируется, что Gemini 1.5 будет примерно в 20 раз дешевле, чем GPT-4🤯 что может создать серьезную конкуренцию для OpenAI. Gemini 1.5 Pro демонстрирует сопоставимые с GPT-4 результаты в тестах, при этом имеет поразительные возможности обучения в контексте и длину контекста до 1 миллиона токенов. Учитывая высокую эффективность вычислений за счет использования архитектуры с мягкими механизмами внимания и специализированными экспертами, стоимость использования Gemini 1.5 Pro может быть сопоставима с GPT-3.5, предлагая при этом качество на уровне GPT-4, что ставит под угрозу доминирование OpenAI на сегодняшнем поле битвы ИИ-моделей, но судя по интенсивности ИИ-новостей, нас ждут очень интересные времена🌚
Примеры симуляции игрового мира Minecraft. Игрок может перемещаться, у него консистентно отображается инвентарь снизу, а окружение вокруг не меняется при изменении угла взгляда.
Разве что свинья пропадает в один момент 🐷
Добавить возможность менять генерацию видео на лету и можно играть в AI-GTA да и вообще любую игру себе заказывать, только управлять голосом🤓 Ох уж это будущее🌚
Читать полностью…Что за день анонсов✨ Ответка гуглу от OpenAI (или просто запланированный релиз🌚)
Text2video модель Sora - модель может генерировать видео длительностью до минуты, сохраняя при этом высокое качество визуализации и точность выполнения пользовательских запросов. Основная цель разработки Sora — обучение ИИ пониманию и моделированию физического мира в движении, чтобы помогать людям решать задачи, связанные с взаимодействием с реальным миром. Пока доступна ограниченному кругу творческих профессионалов.
Ждём обновы ChatGPT🤓
https://openai.com/sora#research
Ого, Nvidia представила раннюю версию Chat with RTX — приложения, позволяющего запускать личного AI-чат-бота на ПК✨
Это приложение может анализировать видео с YouTube и документы пользователя, создавая резюме и предоставляя релевантные ответы на основе локальных данных. Для работы требуется GPU серии RTX 30 или 40 с минимум 8 ГБ видеопамяти. Chat with RTX умеет обрабатывать видео и документы, мгновенно находя в них нужную информацию, что может быть полезно журналистам и исследователям. Несмотря на некоторые недочеты и отсутствие памяти диалога в демо-версии, приложение показывает большой потенциал для анализа данных на локальном ПК без необходимости подписки на облачные сервисы.
Как знал, что мои 8гб видео не только для игрушек и Stable Diffusion пригодятся🌚
Видео преза https://www.youtube.com/watch?v=gdsRJZT3IJw
Качаю тут - https://www.nvidia.com/en-us/ai-on-rtx/chat-with-rtx-generative-ai/
Stable Diffusion начинает покорять 3D✨
Создали крутую тулу Stable Projectorz для геймдева, которая может работать локально, если у вас хотя бы 12гб видео памяти. Создание текстур для 3д моделей, генерация 2д фона и окружения и тд.. геймдев уже не будет прежним🌚
Качать тут
Там Google подвез Gemini Ultra в прод. И, конечно, небесплатно, ведь моделька жирная, дорогая.
У меня просят 22 евро в месяц, но к этому ещё идёт 2TB на Google Drive и прочие ништяки типа интеграции LLM с почтой и календарем в будущем. Проапгрейдится можно тут.
Gemini Ultra бьёт GPT-4 на 7 из 8 бенчмарках по тексту и на всех бенчмарках по зрению, если сравнивать с GPT-4V.
Что ж, бенчмарки — это хорошо, и появление серьезной конкуренции для GPT-4 не может не радовать. Однако, бенчмарки имеют свойство попадать в тренировочную выборку, особенно когда речь идёт о триллионах токенов со всего интернета. Так что посмотрим, как Ultra покажет себя на практике, когда тысячи людей протестируют её. 🤔
@ai_newz
Что-то интересное происходит с Claude 3 Opus🌚 За последние сутки много учёных с научными степенями и исследователей делятся впечатлениями о способности алгоритма понимать и оперировать сложными научными темами. Отмечены случаи, когда Claude 3 самостоятельно разработал квантовый алгоритм и продемонстрировал владение языком, на котором ранее его не обучали - речь идёт о черкесском языке. Даже с небольшой выборкой в 5.7 тысяч переводных пар, Claude 3 Opus смог достигнуть высокой точности перевода и глубокого анализа языка, чего не удалось достичь другим моделям, включая GPT-4. Также алгоритм быстро нашел научные решения, над которыми ученые работали месяцами.
Ждём ответа от OpenAI и вообще, похоже, мы на пороге крупного открытия в области ИИ и скачка науки и технологий в целом✨
https://twitter.com/BenBlaiszik/status/1765097390158000541
https://twitter.com/GillVerd/status/1764901418664882327?t=Y1fXXlR-RLsOJ97HwRDrQw
https://twitter.com/hahahahohohe/status/1765088860592394250?t=q5pXoUz_KJo6acMWJ79EyQ&s=19
УХ🔥
Anthropic представили серию AI-моделей Claude 3, превосходящих GPT-4 и Gemini Ultra в тестах. Ключевой моделью линейки является Opus, который, по заявлениям компании, способен выполнять широкий спектр задач лучше любой другой доступной системы AI.
Opus демонстрирует впечатляющие результаты на академических тестах, таких как GSM-8k и MMLU. Серия также включает модели среднего уровня Sonnet и предстоящую модель Haiku, ориентированные на экономичность и скорость для бизнеса. Все модели поддерживают ввод изображений, расширяя возможности применения в различных отраслях. Anthropic также уделяет внимание проблеме предвзятости в AI, стремясь к созданию моделей, ориентированных на широко признанные ценности и подходящих для всех пользователей.
А что там с роботами?🤖
Компания Figure из Сан-Франциско, подтвердила, что привлекла 675 миллионов долларов в рамках раунда финансирования Серии B, что позволило оценить стартап в 2,6 миллиарда долларов. В число инвесторов входят крупные игроки, такие как Microsoft, OpenAI, Nvidia, Amazon Industrial Innovation Fund, Jeff Bezos через Bezos Expeditions, Parkway Venture Capital, Intel Capital, Align Ventures и ARK Invest. Фирма, численность персонала которой составляет всего 80 человек, уже привлекла внушительные средства: основатель Brett Adcock изначально вложил 100 миллионов долларов, а в прошлом мае было добавлено еще 70 миллионов долларов в рамках Серии А. Figure, основанная в 2022 году с амбициозной целью создать ходячего бипедального робота в течение года, уже достигла этой цели.
Стартап активно работает над созданием роботов для промышленного использования и недавно заключил партнерство с OpenAI для разработки новых моделей ИИ для гуманоидных роботов, что должно ускорить коммерческий запуск продукта. Кроме того, Figure уже подписала договор с BMW на развертывание робототехники.
Говоря об оживших фото и портретах.. 🤯 Похоже будущее наступает слишком быстро 🌚
https://humanaigc.github.io/emote-portrait-alive/
Парижский стартап Mistral AI объявил о запуске новой модели искусственного интеллекта под названием Mistral Large и чат-ассистента Le Chat, предназначенных для конкуренции с GPT-4 и ChatGPT соответственно. Mistral AI утверждает, что их модель занимает второе место после GPT-4 по ряду бенчмарков. Mistral Large, ориентированная на высокие способности рассуждения, поддерживает пять языков и предлагается по цене значительно ниже, чем GPT-4. Le Chat, доступный в бета-версии, позволяет пользователям выбирать между разными моделями для общения и планирует внедрение платной версии для корпоративных клиентов. Компания, основанная выпускниками Google’s DeepMind и Meta, собрала значительные суммы средств для разработки своих моделей и теперь сотрудничает с Microsoft для предоставления своих моделей через Azure, расширяя своё присутствие на рынке.
https://techcrunch.com/2024/02/26/mistral-ai-releases-new-model-to-rival-gpt-4-and-its-own-chat-assistant/?guccounter=1
Неожиданно Adobe вступает в AI-race💫
Adobe объявила о запуске встроенного искусственного интеллекта в приложениях Reader и Acrobat, который способен создавать резюме и отвечать на вопросы по документам PDF. Этот помощник, находящийся на стадии бета-тестирования, ускоряет анализ длинных текстов, отличаясь от аналогичных сервисов, таких как ChatGPT, тем, что не требует загрузки документов пользователями. Помимо генерации кратких обзоров и ответов на вопросы, AI может создавать цитаты для проверки источников информации и тексты для различных форматов. Adobe планирует ввести подписку на этот инструмент после завершения бета-тестирования, стремясь демократизировать доступ к триллионам PDF-документов.
https://www.cnbc.com/2024/02/20/adobe-launches-ai-assistant-that-can-search-and-summarize-pdfs.html
Вы не поверите: Не успели спецы из Google представить революционную (нет) модель Gemini Ultra, как уже анонсировали и выкатили в ограниченный доступ через API новую модель Gemini 1.5, которая конечно же будет умнее и сможет обрабатывать до 1 млн токенов. Судя по тому как выглядит распиаренная Gemini Ultra - а она едва дотягивает до уровня GPT-3.5, как-то с трудом верится в эти столь спешные анонсы, но AI-гонка продолжает набирать обороты 🌚
Читать полностью…OpenAI в партнёрстве с Microsoft Threat Intelligence обнаружили и деактивировали аккаунты, принадлежащие 5 группировкам, связанным со злоумышленниками и государствами.
Для чего им потребовались модельки OpenAI?
1️⃣Charcoal Typhoon (Китай 🇨🇳): исследования различных компаний и инструментов кибербезопасности, отладка и написание кода, а также создания контента, который может быть использован в фишинговых кампаниях.
2️⃣Salmon Typhoon (Китай🇨🇳): перевод технических статей, получение общедоступной информации о многочисленных разведывательных агентства, снова программирование, и исследование распространенных способов сокрытия процессов в операционной системе (для создания вирусов).
3️⃣Crimson Sandstorm (Иран 🇮🇷 ): написание веб/мобильных приложений, относящихся к текстовой поддержке, создание фишингового контента, и исследование распространенных способов, с помощью которых вредоносное ПО может избежать обнаружения.
4️⃣Emerald Sleet (Северная Корея 🇰🇵): использовали сервисы OpenAI для выявления экспертов и организаций, занимающихся вопросами обороны в Азиатско-Тихоокеанском регионе, понимания общедоступных уязвимостей, помощи в выполнении основных задач по написанию сценариев и подготовки контента, который можно было бы использовать в фишинговых кампаниях.
И НАКОНЕЦ...специалисты из СБ Сбербанка!
👋Forest Blizzard (Россия, группировка связана с ГРУ 🇷🇺): исследование открытых источников в области протоколов спутниковой связи и технологий радиолокационной визуализации. Ну и программирование до кучи.
А вы говорите в гугле так и так всё есть!
(ну и дежурное напоминание, что модели следующего поколения будут ещё более эффективнее в ассистировании даже таким задачам)
Читать у OpenAI
Читать более подробно в блоге MSFT