@Futuris - канал о технологиях, будущем и не только. Contact @antonod
⚡️⚡️Компания Figure представила Helix — первую Vision-Language-Action (VLA) AI-модель, объединяющую зрение, язык и управление движениями. Helix способен полноценно контролировать верхнюю часть тела робота (Figure-2), включая кисти, торс, голову и пальцы, что делает его первым решением такого уровня. Кроме того, модель позволяет двум роботам координировать свои действия при выполнении сложных задач, работая с предметами, которые они никогда не видели ранее. Helix способен мгновенно осваивать новые манипуляции, поднимая любые мелкие объекты по простому голосовому запросу. В отличие от других систем, он использует единую нейросеть без необходимости дополнительной настройки. Helix работает на энергоэффективных процессорах и готов к коммерческому внедрению, открывая новые возможности для массового использования роботов в быту.
Бытовые/промышленные роботы стали реальностью сегодня✨ Ещё пару лет прогресса и своим старикам точно таких закажу🌚
Спите? А я нет - воплощаю свои ИИ-задумки в реальность🌚 в общем люблю я всякие концепции и идеи и давно хотел, чтобы в каком нмбудь чате гпт появился интерактивный 3D-граф понятий, который бы помогал находить связи между идеями, заглядывать в будущее ну и просто залипать в визуальном хаосе понятий и концепций🫠в общем встречайте моё (совместное с ИИ) творение - вводите слово — нейросеть предлагает одну общую тему (жёлтый узел), несколько связанных (синие) и одну эволюцию идеи в будущее (фиолетовый). Всё это можно двигать и перетаскивать. Всё работает через бесплатный API Google Gemini 1.5 Flash (у вас там будет считайте анлим обращений). Базу собрал на Claude 3.5 дальше работала o3-mini-high и всё это с 0.0001% опыта в кодинге 😅в общем держите код кто хочет залипать, а у меня теперь это личный проект который буду развивать с помощью новых версий нейронок 🤓
Живём в удивительное время✨✨✨
P.S.
Чтобы создать api ключ Gemini - идите в AI Studio и там сверху сразу будет кнопка API👌
P.P.S
На русском тоже может
А вот это бомба💥
Спецы из Google только что представили AI co-scientist — многоагентную систему на базе Gemini 2.0, разработанную для содействия учёным в формулировании новых гипотез и ускорении научных и биомедицинских открытий. Система способна генерировать оригинальные исследовательские предложения и детальные экспериментальные протоколы, используя специализированных агентов, имитирующих научный метод. В сотрудничестве с учёными из Стэнфордского университета и Имперского колледжа Лондона AI-учёный продемонстрировал способность предлагать перспективные гипотезы, некоторые из которых были подтверждены лабораторными экспериментами. Google планирует предоставить доступ к системе исследовательским организациям через программу Trusted Tester.
Ускоряемся💫 (такая система по сути и есть AGI, только с узкой специализацией и первая версия)
Прошло пару месяцев и gamestudio@x.ai уже создана и набирает таланты✨
Ждём первые релизы (хотя бы инди какие 🌚)
Думаю, в такую ИИ-стратегию интересно будет поиграть, вот уже где настоящее продолжение Цивилизации может получиться🌚
made in Kling
Meta объявила о масштабном проекте подводного кабеля — Project Waterworth. Этот проект охватит пять континентов, проложив более 50 000 км кабеля, что превышает длину земного экватора.
Waterworth обеспечит высокоскоростное соединение между США, Индией, Бразилией, ЮАР и другими ключевыми регионами, способствуя цифровой интеграции и развитию экономики.
Кабель станет крупнейшим в мире с 24 оптоволоконными парами, что ускорит развитие ИИ и цифровой инфраструктуры.
Проект включает новые океанические маршруты, защиту от повреждений в зонах риска и использование передовых технологий прокладки на глубинах до 7 000 м. Реализация проекта потребует инвестиций свыше 10 миллиардов долларов США.
Похоже Цукерберг решил объеденить датацентры по всему миру, чтобы тренировать следующие модельки, чем-то похоже на SkyNet🤔
Люблю ночью порисовать 🌚
Напомню, про свой любимый AI-плагин для Krita, который очень помогает в этом деле, особенно в скетчах
(использовал модельку StableDiffusion XL - чекпоинт DreamShaper)
А так в новом бенчмарке от создателей ARC-AGI теста, нейронки соревнуются в игре в змейку 🐍
Давайте уже на каком старкрафте их проверять 🌚
P.S
Из 50 бойцов
1 место o3-mini
2 - DeepSeek r1
Хм, скажите Денису, чтобы Gemini 2.0 попробовал в AI Studio🌚
Вообще из всех нейронок самая человечная пока что на мой взгляд
OpenAI (а точнее Сэм) анонсировал обновление дорожной карты для GPT-4.5 и GPT-5. Компания упрощает модельный ряд и убирает выбор модели, возвращаясь к «магическому» объединённому интеллекту. В ближайшие недели выйдет GPT-4.5 (Orion) — последняя модель без цепочки рассуждений. Позже GPT-5 станет универсальной системой, интегрирующей технологии o-серии, а o3 больше не будет доступен отдельно. Бесплатные пользователи получат неограниченный доступ к GPT-5 на стандартном уровне интеллекта, а подписчики Plus и Pro — доступ к более продвинутым версиям.
LETs Gooo💫
Чую DeepSeek R2 на подходе🌚
Luma.ai обновился и вроде неплохо так, ждём когда бесплатные конкуренты подятнутся 🌚
Читать полностью…Интересное: тут специалисты из Microsoft Research, Лаборатории языковых технологий Кембриджского университета и Института автоматики Китайской академии наук разработали метод "Мультимодального визуального мышления" (MVoT), направленный на улучшение пространственного рассуждения в больших языковых моделях (LLM) и мультимодальных моделях (MLLM). MVoT позволяет моделям создавать изображения, отражающие их мыслительные процессы, что повышает точность в сложных задачах. Эксперименты показали, что MVoT эффективно справляется с динамическими пространственными задачами, превосходя традиционные цепочки рассуждений в сложных сценариях. Этот метод открывает новые возможности для решения задач, где визуальное мышление дополняет вербальное.
FEEL THE AGI👁
Интересно, если сейчас с помощью шэрскрина новая Gemini 2.0 может делать работу радиолога (помогать ему), то что будет через годик - другой 🌚
Читать полностью…А вот это мощно 💥
Китай строит гигантский лазерный комплекс для термоядерного синтеза
Спутниковые снимки показывают масштабный X-образный объект под Мьянъяном (провинция Сычуань), который, по мнению аналитиков, может стать крупнейшим в мире лазерным комплексом для исследований термоядерного синтеза.
Цель проекта — получение чистой энергии путем слияния изотопов водорода под воздействием лазеров. Однако эксперты не исключают связь с разработкой ядерного оружия, так как установка позволяет моделировать условия ядерных взрывов.
Комплекс, предположительно на 50% больше американского аналога NIF, где в 2022 году впервые достигли положительного энергобаланса, ускорил строительство после пандемии. Китай демонстрирует амбиции в «термоядерной гонке», что вызывает опасения Запада: без активных инвестиций США и их союзники могут уступить лидерство.
Источник
Напомню, что это одно из лучших развлечений, которые я пробовал с LLMками (кроме кодинга), а теперь с новыми модельками играть станет ещё интереснее🤓
Вот мой обновлённый промпт кому интересно для начала приключений🧙♂️
Смотрю уже дали доступ к Grok 3 с функциями мышления и Deep Search, вот попробовал его в стихи (на своём скрипте из прошлого поста позже опробую и расскажу если как-то впечатлит 🌚)
Читать полностью…Такого Гарри я бы пересмотрел/переиграл, похоже появился новый жанр diorama-AI-video🌚
Читать полностью…Планы на вечер: посмотреть свеженькое интервью Сатьи Наделлы про планы Microsoft по достижению AGI и прорыва в квантовых технологиях ☕️
https://youtu.be/4GLSzuYXh6w?si=lFl0FF4OeBN_rZGo
Grok-3-mini будет бесплатным для всех пользователей в ближайшие дни🤯 А это мощный удар OpenAI и другим, ждём чем ответят (хотя Сэм обещал GPT-5 тоже всем раздать, но ждать-то ещё пару месяцев🌚)
Читать полностью…Grok-3 и 3-mini порвали ChatGPT 🔥(но понятно, что это временно)
Grok-3 - одна модель с режимами обычного и рассуждающего ответа. Позже добавят аудио инпут/аутпут и Deep Research агента. Обучение модельки на гигакомпе Colossus продолжается 👌
Протестить можно тут (выбирайте direct chat и Grok-3 из списка моделек)
https://lmarena.ai/
Маск в своей манере объявил о релизе "умнейшего ИИ на планете" - Grok-3 в понедельник 8 pm PT (7 утра во вторник по МСК)
Будем посмотреть live demo👁
GPT-4o получил обновление, благодаря которому модель стала более "живой" и улучшила свои возможности поиска. Кроме того, ожидается, что в ближайшее время будет внедрена функция постоянной памяти между чатами (не только то что вы просите запоминать отдельно). А ещё подписчики за 20уе получат доступ к полноценной модели o3-pro и всё это за несколько недель до GPT-4.5 и несколько месяцев до GPT-5😅
Читать полностью…Yoo, perplexity.ai представили аналог Deep Research и дали доступ сразу всем (5 обращений в день, а у кого Pro - анлим) ✨✨✨
Предназначен для проведения глубоких исследований и анализа. При запросе Deep Research выполняет десятки поисков, анализирует сотни источников и самостоятельно предоставляет подробный отчет. Эта функция подходит для экспертных задач в области финансов, маркетинга и продуктовых исследований.
YouTube интегрировал новую модель генерации видео Veo 2 от Google DeepMind. Теперь пользователи могут создавать уникальные AI-видеофоны или генерировать отдельные видеоклипы, которые можно добавлять в любые Shorts. Эти функции сейчас доступны в США, Канаде, Австралии и Новой Зеландии, с планами расширения на другие регионы в будущем. (кому нужно - юзайте VPN)
Чтобы включить Veo 2 в YouTube Shorts, откройте камеру Shorts, выберите «Зелёный экран», затем перейдите в Dream Screen и введите текстовый запрос для генерации видео.
Похоже началось..(хорошо что я шортсы не смотрю🌚)
Первый пошёл - 11и минутная ИИ-короткометражка по Звёздным Войнам✨ смотрится не хуже последних фильмов от Диснея, представляю, какие шедевры от настоящих фанов мы ещё посмотрим по пути к сингулярности 🌚
Спсиок ии-приблуд для создания в титрах
Вот как должен выглядеть настоящий ИИ-собеседник (а не просто окно чатика)🩶 зафайнтюнить Vector Robot можно по туториалам тут и тут
Читать полностью…Просто прикольно - ai.com теперь перенаправляет на deepseek🌚 а год назад его за круглую сумму выкупал Сэм Альтман, а до этого принадлежал Gemini😁
Читать полностью…Общение с ChatGPT через годик (или уже в этом🌚) будет выглядеть так:
Читать полностью…Прогерам приготовиться! GitHub представил новый режим агента для Copilot в VS Code (может работать на o3-mini). Теперь AI-ассистент может не только помогать программистам, но и самостоятельно исправлять ошибки в коде, проводить юнит-тесты, предлагать терминальные команды и анализировать сбои во время выполнения программы. Режим агента способен распознавать дополнительные задачи, необходимые для реализации основного запроса, и выполнять их без участия человека👌
Обзорчик тут https://youtu.be/of--3Fq1M3w?si=JG3JX5JmbSOcA1zo