futuris | Blogs

Telegram-канал futuris - Futuris

3066

@Futuris - канал о технологиях, будущем и не только. Contact @antonod

Subscribe to a channel

Futuris

Опа, мне маркетплейс ботов GPTs стал доступен✨Глядишь, может и своего агента придумаю🤓

Читать полностью…

Futuris

https://huggingface.co/spaces/ysharma/OpenAI_TTS_New

Читать полностью…

Futuris

OpenAI DevDay - ждем новых анонсов по моделям и API

Через 16 минут OpenAI будет проводить свою первую конференцию для девелоперов. Ходит много слухов о том, что будут представлять. Возможно появится GPT4-TURBO - более быстрая и дешевая версия GPT4. А так же ожидается куча новостей по поводу плагинов, интеграции ChatGPT с разными приложениями и маркетплейс чатботов на базе ChatGPT.

Некоторые даже сравнивают эту конфу с тем моментом, когда Джобс анонсировал первый Iphone. Я, честно, не верю, что это будет что-то настолько же большое, но посмотреть интересно.

Смотрим стрим на YouTube

@ai_newz

Читать полностью…

Futuris

Интересные времена и интересные сервисы✨ Буквально на днях запустился уникальный ИИ-пиар сервис "Пиарошная", который открывает новую страницу в PR-индустрии. Этот сервис создан, чтобы максимизировать ваше мастерство в создании контента и автоматизировать рутинные задачи.

Если вы специалист в области продвижения, SMM, СМИ, копирайтингу, работаете с отзывами - не упустите шанс идти в ногу со временем – "Пиарошная" поможет вам усилить ваш профессионализм и гарантирует, что в эпоху цифровизации вашу уникальность не заменит нейронка🤖

Для знакомства с "Пиарошной" посетите (желательно с десктопа) https://aipr.pro/ и следите за обновлениями и кейсами на /channel/pyaroshnaya.

Используйте промокод "Start01" для бесплатного доступа на 7 дней и проверьте, как искусственный интеллект может трансформировать ваш подход к PR.

Читать полностью…

Futuris

Тут нейронку (text to video)Gen-2 обновили, результаты видите сами🤯 такими темпами киноиндустрию скоро будет не узнать, да и не только кино... Уже представляю как такие нейронки будут использоваться для создания фейковых видео в целях политической пропаганды например...😵‍💫 Больше примеров в новости:
https://venturebeat.com/ai/runways-gen-2-update-is-blowing-peoples-minds-with-incredible-ai-video/

Читать полностью…

Futuris

ChatGPT теперь поддерживает работу с файлами (загружай PDF и задавай вопросы) и совмещение разных модальностей в одном чате (может рисовать картинки, гуглить, писать и исполнять код в одном чате).

Для большинства это шок, потому что их стартап идея была разбита о быструю доставку качественного продукта команды OpenAI с инженерами за $600к в год.

Дабы предупредить будущий шок, давайте сразу обсудим, что ChatGPT выкатит в следующих версиях:

- подключение своих данных: Gmail, slack, WhatsApp
- общение в едином чате, который помнит все о вас. по сути - разговор с ассистентом.
- возможность соединять цепочки действий и плагинов (агенты)
- маркетплейс плагинов с монетизацией и курацией (curation, если на человеческом)
- полная мультимодальность: на вход видео, на выход голос; на вход музыку, на выход видео; на вход excel на выход диаграммы
- проактивный ИИ: сам поймёт когда и что у вас спросить или вам рассказать
- у каждого пользователя персональная модель, обученная на последних годах диалога (каждому — свою LoRA)

Читать полностью…

Futuris

Исследовательская команда из Google представила новую технологию под названием "Ring Attention".

"Ring Attention" позволяет AI-моделям анализировать до миллиона слов одновременно, что стало возможным благодаря устранению ограничений памяти GPU. Основная идея заключается в создании "кольцевой" структуры из GPU, где каждый GPU передает и получает данные от соседних устройств, минимизируя задержки и проблемы памяти. Это позволяет моделям AI анализировать миллионы слов за раз. Модели, такие как ChatGPT, обрабатывают всего несколько тысяч слов, Claude может обрабатывать до 75,000 слов, а с новым методом контекстное окно может включать до нескольких миллионов токенов✨

Ждём прокаченного Bard🤓

Новость
Препринт исследования

Читать полностью…

Futuris

Anthropic (создатели Claude) представили прорывной метод интерпретации нейронных сетей, разлагая их на более понятные компоненты. В своей последней работе исследователи доказали, что отдельные нейроны не всегда коррелируют с поведением модели. Вместо этого они предлагают использовать "признаки" - комбинации активаций нейронов, которые лучше интерпретируются и имеют последовательное значение. Этот метод позволил выделить специфические особенности в модели, такие как последовательности ДНК и юридический язык.

Это открывает новые перспективы для глубокого понимания и улучшения нейронных сетей. С возможностью лучше понимать внутренние процессы моделей, специалисты могут значительно улучшить их безопасность, надежность и применимость в различных отраслях. Также это может способствовать разработке новых методов обучения и оптимизации, которые были бы более эффективными и предсказуемыми. Компания уже выражает интерес к дальнейшему масштабированию этого подхода, чтобы внедрить его в более сложные модели, что может стать революционным шагом в области искусственного интеллекта.

https://www.anthropic.com/index/decomposing-language-models-into-understandable-components

Читать полностью…

Futuris

Помните работу RT-2 от Google Deepmind, где брали языковую модель, давали ей контролировать робо-руку и смотрели, насколько хорошо получается решать задачи в реальном мире?

Сегодня представили RT-X, датасет, собранный усилиями более чем 30 исследовательских лабораторий. Он включает в себя более 500 навыков (читайте "действий"), 150,000 задач с суммарно более чем миллионом примеров. Все действия были собраны с 22 разных роборук.

В работе показано, что обучение одной и той же модели на данных из нескольких вариантов роботов приводит к значительно более высокому качеству (оно, напомню, замеряется долей решаемых задач).

Чтобы исследовать передачу знаний между разными роботами, авторы проводят эксперименты с моделью и робо-рукой RT-2 над задачами, которые включают в себя объекты и навыки, которых нет в исходном наборе данных именно для этой робо-руки, но представлены в других наборах. В этом случае, RT-2-X оказался в три раза лучше предыдущей лучшей модели RT-2.

Probably, ImageNet moment for Robotics.

Блогпост
Статья (ссылка на PDF)

Читать полностью…

Futuris

Говорят в Bing добавили DALL·E 3 и он теперь генерит ещё более качественный арт. А чат продолжает поражать своим анализом изображений, догадался, какой запрос я написал для генерации картинки🤓

Читать полностью…

Futuris

В искусстве тоже разбирается, хоть и увидел только 2 из 3х картин. А в школах и универах, думаю скоро будут забирать телефоны на уроках и парах (если уже не забирают🙃) Хотя с таким инструментом, можно как раз лучше понять решение, а не просто получить готовый ответ🤓

Читать полностью…

Futuris

Так сложилось, что у меня имеется некоторое количество антиквариата, который я периодически пытаюсь изучить и видимо со следующим обновлением GPT-4 у меня появится настоящий эксперт в этом деле)

В авто сразу видно, что он разбирается намного лучше)

Ну а про еду уже было много постов, что можете сфоткать свой холодильник и не думать о том, что бы приготовить) (у меня пустой, поэтому взял фото из интернета🌚)

Ну и ещё он визуализировал дизайн сайта по макету, примерно то, что показывали на изначальной презентации GPT-4 🤓

Как чату добавят ещё генерацию картинок, а потом ещё и мозгов, а потом анализ и генерацию видео.. в общем, похоже мы на самом деле стоим на пороге какой-то новой эры. "Джарвис в каждый дом" не за горами✨

Читать полностью…

Futuris

Вот само видео. Источник

Через год ждём повторение всех демок Boston Dynamics с прыжками и сальто, через два — выход первых роботов на заводы Tesla.

На самом деле скорее всего до сальто и прочего не дойдет: потому что это не нужно, а значит можно игнорировать и тем самым удешевлять процесс разработки.

Читать полностью…

Futuris

⚡️Google набирает обороты в гонке ИИ-технологий. С сегодняшнего дня Bard AI способен сканировать Gmail, Docs и Drive пользователей, помогая находить нужную информацию. Эта функция позволяет, например, суммировать содержание электронных писем или выделять ключевые моменты документов. Помимо этого, Bard интегрирован с Maps, YouTube и Google Flights, предоставляя еще больше возможностей для пользователей. Google утверждает, что конфиденциальность данных сохраняется, и информация из личных аккаунтов не используется для обучения модели. Нововведения в Bard также включают улучшенные функции проверки ответов и интеграцию с Google Lens.

День богат на ИИ-новости 🤓

https://www.theverge.com/2023/9/19/23878999/google-bard-ai-chatbot-gmail-docs-drive-extensions

Если что, Bard тут

Читать полностью…

Futuris

⚡️Возможно, конкурент GPT-4 уже буквально за углом. Google активно работает над своим проектом под названием Gemini, который представляет собой мультимодальную языковую модель, способную генерировать различные типы данных, такие как текст, изображения и код. В отличие от текущей модели PaLM 2, Gemini может учиться из разнообразных источников. Некоторые разработчики уже получили ранний доступ к Gemini для интеграции и тестирования. Этот шаг указывает на то, что Google активно стремится догнать и возможно превзойти текущие возможности GPT-4. Ранее компания заявляля, что выпуск Gemini назначаен на осень 2023.

https://www.androidpolice.com/google-gemini-ai-around-the-corner/

Читать полностью…

Futuris

Даже как-то немного крипово слушать как общаются два ИИ😅 представляю если добавить возможность самообучения на лету и оставить их вместе на денёк другой, то до чего они там договорятся 🙃 а может у OpenAI уже есть такие умные ИИ, как иначе они так оперативно выкатывают обновления для самого популярного сервиса в мире своей небольшой командой🌚

Читать полностью…

Futuris

В общем представлено было много чего✨ (в ближайшее время все об этом напишут) но больше всего мне понравилась новая моделька, которая скоро станет доступна премиум пользователям. GPT-4 Turbo — более мощная из всех существующих моделей, имеет знания о событиях в мире до апреля 2023 года. Одной из ключевых особенностей GPT-4 Turbo является её способность обрабатывать значительно больший контекст — до 128 тысяч токенов(!!!), что позволяет обрабатывать тексты объёмом более 300 страниц за один запрос. Кроме того, модель была оптимизирована для повышения производительности, благодаря чему стоимость использования модели снизилась в три раза для входных токенов и в два раза для выходных токенов по сравнению с предыдущей версией GPT-4​.

Если вкратце, то сегодня человечество стало ещё на шаг ближе к AGI (artificial general intelligence)🤖

https://openai.com/blog/new-models-and-developer-products-announced-at-devday

Читать полностью…

Futuris

Китайский стартап 01.AI, основанный Кай-Фу Ли, достиг статуса "единорога" с оценочной стоимостью в 1 миллиард долларов менее чем за год благодаря разработке передовой модели искусственного интеллекта с открытым исходным кодом. Открытая модель Yi-34B, обученная на 34 миллиардах параметров, превзошла опенсорс конкурентов (в том числе Llama 2 от Meta Platforms Inc) и доступна для разработчиков на китайском и английском языках.

01.AI уже планирует свою бизнес-стратегию за пределами только что представленной открытой модели. Стартап будет работать с клиентами над собственными альтернативами, настроенными для конкретной отрасли или конкурентной ситуации. Например, Yi-34B получила свое название от 34 миллиардов параметров, использованных в обучении, но стартап уже работает над опенсорс моделью с более чем 100 миллиардами параметров, которая будет сопоставима с GPT-4 от OpenAI.

_____
Кстати, говоря о GPT-4. В преддверии конференции OpenAI появились первые утечки, что компания готовится представить новую функцию для подписчиков ChatGPT, известную как «Конструктор GPT». Утечка информации, включая скриншоты и видео, показывает инструмент, позволяющий создавать персонализированные чат-боты с функциями веб-серфинга и анализа данных. Кроме того, компания планирует запустить рынок, где пользователи смогут обмениваться созданными чат-ботами.

Читать полностью…

Futuris

Может вы знаете браузер Brave🦁, который позиционирует себя как более конфиденциальный чем свои конкуренты. Так вот Brave запустил AI-ассистента Leo, который также обещает высокий уровень конфиденциальности пользователей. Основанный на языковых моделях Claude от Anthropic и Llama 2 от Meta, Leo не сохраняет историю чатов и не требует аккаунта для использования. Премиум-версия Leo, стоимостью $15 в месяц, предлагает дополнительные функции и безопасность, не связывая покупку с личными данными пользователя. Последняя версия десктопного браузера Brave 1.60 включает в себя Leo, а поддержка версий для iPhone и Android ожидается в ближайшие месяцы. Новый AI-ассистент может отвечать на вопросы, суммировать содержимое веб-страниц и видео, переводить и переписывать текст, а также помогать с математическими и программными запросами на нескольких языках.

https://bgr.com/tech/brave-launches-leo-a-free-generative-ai-assistant-more-private-than-chatgpt/

Читать полностью…

Futuris

В Салеме, штат Орегон, в этом году откроется завод RoboFab — первое в мире предприятие по производству гуманоидных роботов🤖 Это проект компании Agility Robotics, специализирующейся на создании двуногих роботов. На заводе планируется выпускать до 10 000 роботов в год✨ Главный продукт завода — робот Digit, способный выполнять разнообразные задачи, от переноса коробок до подъема по лестнице. Первые модели Digit будут доступны публике в 2025 году, но участники партнерской программы Agility получат доступ к роботу уже в 2024 году.

https://www.foxnews.com/tech/1st-humanoid-robot-factory-us-crank-10000-robots-year

Читать полностью…

Futuris

Nvidia Research представила ИИ-агента Eureka, созданного на базе GPT-4 от OpenAI. Eureka самостоятельно формирует алгоритмы вознаграждения для обучения роботов сложным задачам, таким как вращение ручки или открытие ящиков. С помощью Eureka было достигнуто улучшение эффективности обучения роботов на 52% по сравнению с вознаграждениями, разработанными человеческими экспертами в 83% тестовых задач. Nvidia также предложила библиотеку алгоритмов Eureka для экспериментов в области обучения с подкреплением через приложение Nvidia Isaac Gym.

https://venturebeat.com/ai/new-nvidia-ai-agent-powered-by-gpt-4-can-train-robots/

Читать полностью…

Futuris

К приближающемуся Хэллоуину👻 разработчики представили новую модель искусственного интеллекта Mistral Trismegistus-7B, углубленно занимающуюся оккультными науками🌚. Этот ИИ, который можно охарактеризовать как цифрового мистика, предлагает пользователям возможность заглянуть в мир эзотерики и гаданий, помогая читать ладони и даже создавать персональные гороскопы. Наименование Mistral Trismegistus-7B было вдохновлено фигурой Гермеса Трисмегиста, мифического персонажа, объединяющего черты греческого бога Гермеса и египетского бога Тота.

Примечательной особенностью этой модели является ее легковесность, так как она была обучена на 7 миллиардах параметров, что обеспечивает простоту запуска на локальном устройстве и сохраняет конфиденциальность пользовательских духовных сессий🔮

Статья
Моделька

Читать полностью…

Futuris

Не знаю зачем, но оставлю здесь https://biblegpt.org/ - GPT Библия🙏🏿🤖

Читать полностью…

Futuris

пинтерест? нет не слышали. Актуально для тех кто собирается делать ремонты, DALL-E 3 теперь бесплатный генератор идей. А вообще это всё уже даже немного пугает😅 но человеки ко всему быстро привыкают🤓

Читать полностью…

Futuris

Похоже чат теперь может неплохо придумывать сюжеты по одной картинке, раздолье для писателей и других мастеров испытывающих творческий кризис, да и просто развлечься можно неплохо)

Читать полностью…

Futuris

К вопросу о распознавании символов на фото🤓

Читать полностью…

Futuris

⚡️Компания OpenAI анонсировала новые функции для ChatGPT. Теперь пользователи могут взаимодействовать с помощником, используя голосовые команды и предоставляя изображения. Эти обновления предоставляют более интуитивный интерфейс, позволяя вести голосовой диалог и демонстрировать ChatGPT визуальный контент. Голосовые функции будут доступны на платформах iOS и Android, а возможность работы с изображениями будет доступна на всех платформах. Внедрение новых функций начнется с пользователей категорий Plus и Enterprise в ближайшие две недели.

https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

Читать полностью…

Futuris

Пока вы (мы (я)) спали, Tesla выкатили полутораминутное демо-видео с своим роботом Optimus.

В нём показывается, как робот раскладывает детальки конструктора по цвету в 2 разные коробки, сортируя по цвету. Команда Tesla утверждает, что:
1) робот работает полностью на нейросети, без вручную запрограммированных эвристик;
2) то есть нейросеть получает на вход изображение с камер и положение конечностей, а предсказывает действия, которые необходимо осуществить (то есть подать ток на моторчики);
3) модель тренируется end-2-end, то есть на всей задаче целиком. Не нужно разбивать одну задачу на маленькие ("определи цвет", "возьми кубик", "поверни кубик", итд);
4) нейросеть работает внутри бота, а не в облаке. То есть вычислительные мощности зашиты внутрь, и робот получается автономным — главное чтобы батарейки хватило;
5) Senior Staff Engineer говорит, что "соберите больше данных, и мы сможем выучить новую сложную задачу, не меняя ни одной строчки кода!". В целом звучит круто, осталось понять, что это за данные. Симуляции? Или действия в реальном мире?
6) Также он пишет, что "его можно запромптить (как LLM?), в этом видео используется та же нейросеть для сортировки и перемешивания блоков, вы просто говорите ей, что хотите.". Если там есть текстовый интерфейс - это 🔥 (моя ставка что там не LLM, а цели задаются иначе);
7) у робота работают пальцы, он спокойно берет и переворачивает объекты. Мелкая моторика - сложная для программирования вещь, а тут её и делать не нужно, всё само;
8) в конце видео показывается, как хорошо робот балансирует - он встаёт в две йога-стойки и не падает.

Почему это круто? В чём отличие от нашумевших Boston Dynamics?
1) у BD всё программировалось вручную (по крайней мере последний раз когда я проверял, может за пару лет изменилось в корне), и поэтому сложно масштабировалось. Если ваш пёс умеет бегать и прыгать, то научить его ползать это очень сложная задача на год+ целой команде (цифра условная);
2) Тренировка end-2-end позволяет свести любую задачу к проблеме данных. Если у вас много качественных данных — проблема решена. И, как отметил инженер, перепрограммировать ничего не надо. Вероятно, тут он лукавит — Tesla показывали, что они используют виртуальные симуляторы, соответственно надо в них задать новую задачу, а потом просто запустить — и тогда бот разберется, что к чему;
3) прогресс ГОРАЗДО быстрее, чем у BD. Робот был анонсирован всего пару лет назад, а год назад еле ходил. BD были основаны в 1992 году (!), а гуманоидного Atlas показали в 2013м году. И за следующие 10 лет лишь немного улучшили его с точки зрения сложности поведения/действий — потому что всё это плохо масштбируется;
4) Tesla'ой рулит Elon Musk, человек, ориентированный на бизнес. Основная фишка - удешевление, ускорение и масштабирование производства. Это было с Tesla, это происходит в SpaceX. Если поставить производство ботов на поток, они будут очень дешевы, что позволит им конкурировать с рабочими на складах и в McDonalds. И на заводах Tesla, и на фабрике SpaceX на Марсе — тоже!
5) Правда не ясно зачем McDonalds, если такой же робот сможет готовить блюда как шеф с тремя звёздами Мишлен...

Читать полностью…

Futuris

OpenAI неспешно докидывают знания в GPT-4.

Раньше она знала только то, что происходило до сентября 2021го, теперь же в промпте указано, что заложены знания до января 2022го. Правда, у меня всё еще "старая" модель, снова попал не в ту группу на А/Б тесте, поэтому спасибо Илье Гусеву за предоставление скриншота с верификацией.

Ну шо, го мучить модельку вопросами про политику в 2022м году)))

Читать полностью…

Futuris

Команда исследователей из DeepMind создала новый метод, OPRO, который позволяет большим языковым моделям, таким как ChatGPT, самостоятельно оптимизировать свои подсказки (промпты). Вместо того чтобы использовать сложные математические алгоритмы для оптимизации, этот метод применяет естественный язык. Исследователи начинают с создания "мета-подсказки", которая содержит описание задачи и примеры возможных решений. Большая языковая модель затем генерирует кандидатов на решение на основе этой мета-подсказки.

Каждое сгенерированное решение оценивается по определенным критериям, и самые успешные из них используются для дальнейшего улучшения подсказок модели. Этот процесс является итеративным и продолжается до тех пор, пока не будут найдены наиболее оптимальные подсказки.

Метод OPRO уже показал обещающие результаты в решении различных задач и имеет потенциал для улучшения точности и эффективности больших языковых моделей в разнообразных приложениях.

https://venturebeat.com/business/deepmind-discovers-that-ai-large-language-models-can-optimize-their-own-prompts/

Читать полностью…
Subscribe to a channel