Сори за спам, но можно вообще просто просить пошагово рассуждать при каждом запросе в обычном чате и ни разу не ошибается с этой клубничкой🍓 а значит и в других запросах должен быть эффект✨
но обязательно в каждом новом запросе пишите Reason through the query in a step-by-step manner (походу gpt4o очень боится нарушать инструкции🤷♂️)
Я не знаю, мне реально повезло столько раз подряд или я реально сделал аналог Reflection только GPT🌚🌚
проверьте и отпишите плз🙏🏿 (ну или лайк если вы убедились, что gpt стал умнее)
https://chatgpt.com/g/g-mei7dmDkl-reflection-gpt
А промпт скопипастил но добавил step by step manner и всё заиграло✨
You are a world-class AI system, capable of complex reasoning and reflection. Reason through the query inside <thinking> tags in a step-by-step manner, and then provide your final response inside <output> tags. You do not ask the user if they want to reflect, as the reflection is already integrated into the thinking process. All responses should adhere to the standard Llama 3.1 chat format: <|begin_of_text|><|start_header_id|>system<|end_header_id|> with reasoning enclosed in tags and the final output clearly formatted.Читать полностью…
🤯🤯🤯
Reflection 70B — новая открытая LLM, которая по показателям превосходит GPT-4o и Claude 3.5 Sonnet 🔥Она лидирует в тестах MMLU, MATH и GSM8K. В основе модели лежит техника Reflection-Tuning, которая помогает модели распознавать и исправлять свои ошибки. Это также усиливает её способности планирования и улучшает логическую последовательность ответов. Вес модели доступен на Hugging Face. В следующем релизе обещают улучшенную версию Reflection-405B, способную значительно опередить конкурентов (выход gpt-next через 3..2..1..)
Тестим! https://reflection-playground-production.up.railway.app/
ACCELERATE!
Компания Anthropic представила новый план Claude Enterprise, предназначенный для безопасной работы с внутренними данными организаций. План включает расширенное окно контекста на 500 тысяч токенов, увеличенные возможности использования и интеграцию с GitHub, что позволяет обрабатывать целые кодовые базы.
Claude Enterprise также обеспечивает высокий уровень безопасности благодаря поддержке единого входа (SSO), ролевому управлению доступом и журналам аудита для мониторинга. Важно, что Claude не обучается на содержимом пользовательских данных, обеспечивая защиту информации.
Новый план уже используется такими компаниями, как GitLab и Midjourney, для автоматизации процессов, создания контента и работы с кодом, что помогает улучшить производительность и безопасность работы команд.
https://www.anthropic.com/news/claude-for-enterprise
1000 ии-нпс в Minecraft создали своё сообщество. С такими модами я бы даже сам поиграл 🌚
Читать полностью…Ого! команда xAI запустила обучающий кластер Colossus на 100 тысячах графических процессоров H100 (которые мощнее раза в 2-3 чем А100, на 25000 которых создавался GPT-4). На весь процесс ушло всего 122 дня. Colossus сейчас является самым мощным в мире ИИ-обучающим комплексом. В ближайшие месяцы его мощность удвоится, достигнув 200 тысяч процессоров, включая 50 тысяч новых H200🤯
В общем ждём Grok-3, похоже нас ждёт настоящая битва титанов, а мы будем в итоге получать доступ к всё более продвинутым ИИ - моделям 🌚
Вот так выглядит cocrearor в MS Paint 2024 на новых лаптопах Copilot Plus, в общем make Paint great again ✨
Очень похоже на Krita AI но без танцев с бубном для использования
Ещё горяченькое🔥
Стартап Magic AI объявил о создании модели LTM-2-mini, способной обрабатывать контекст объемом до 100 миллионов токенов🤯 Бенчмарков и открытого доступа пока нет, но Magic уже заключили партнерство с Google Cloud и NVIDIA и привлекли $320 миллионов инвестиций от крупных компаний и частных инвесторов. Сейчас компания активно ищет специалистов для ускорения разработки и внедрения новых моделей. Ждём, верим✨
А ещё тут OpenAI в поисках новых инвестиций, компанию предварительно оценивают свыше 100 млрд долларов, в них также собираются вложиться Apple ну и главное, что это обычное поведение компании перед релизом крупных моделей 🌚
Исследователи из Google и Тель-Авивского университета разработали GameNGen — первый игровой движок, полностью основанный на нейронной модели, который позволяет взаимодействовать с игрой в реальном времени (Sora для игр). Модель способна симулировать классическую игру DOOM со скоростью более 20 кадров в секунду на одном TPU, с качеством изображения, сравнимым с сжатием JPEG. Для обучения модели использовался алгоритм с усилением (RL-агент), который играл в игру, создавая данные для генеративной модели. GameNGen использует диффузионную модель для предсказания следующих кадров, обеспечивая стабильное воспроизведение игры на протяжении длительного времени. Эксперименты показали, что люди с трудом отличают симуляцию от реальной игры🤯
Hello future of gaming👾
Пока я готовлю пост(-ы) для Substack (если ещё не подписались, хоть это и бесплатно и делается в два клика — обязательно сделайте это, осталось меньше 100 человек до второй планки, и тогда будет стрим с ответами на ваши вопросы!), давайте посмотрим на свежую новость про OpenAI. TheInformation пишет, что:
— два человека, вовлечённых в процесс, утверждают, что OpenAI может запустить давно порождающую слухи технологию Strawberry (ранее называлась Q*) уже осенью.
— Напомню, Strawberry якобы может решать математические задачи, с которыми раньше совсем не сталкивалась, а также она была обучена решать более сложные задачи в программировании. Но дело не ограничивается ответами на технические вопросы —система в целом будет куда лучше рассуждать и «думать»
— в рамках демонстрации модель смогла решить сложный пазл New York Times Connections (вот ссылка, попробуйте разобраться сами), где нужно объединять слова в группы по 4 по смыслу/теме
— сначала планируется выпустить маленькую версию Strawberry — это как бы не GPT-5, саму технологию будут использовать поверх GPT-4/ChatGPT. По сути это дистилляция из большой модельки в маленькую, как сейчас зачастую делают ведущие игроки
— кроме этого, есть проект Orion (в моей интерпретации это скорее всего GPT-5, но в новости про это не говорится), включающий в себя модели большего размера. Старшая версия Strawberry будет генерировать синтетические данные для дообучения и прокачки Orion
— синтетические данные нужны для того, чтобы преодолеть ограничения на получение достаточного количества высококачественных данных из реального мира для обучения Orion
— ожидается, что в сумме все техники + дальнейшее масштабирование существенно снизит долю ошибок/галлюцинаций моделей
— в мае на приватной встрече Sam Altman говорил, что «мы чувствуем, что нам хватает данных для обучения новой модели. Мы проделали все типы экспериментов, включая генерацию синтетики».
— OpenAI ожидает существенного прироста выручки от запуска этих двух систем (Orion и Strawberry), и ищет потенциальных инвесторов, чтобы привлечь ещё больше денег (как было в случае с Microsoft и $10B за ~2 месяца до GPT-4)
— но технология и модели по большому счёту уже готовы: по сообщения источника, летом OpenAI уже продемонстрировала Strawberry представителям агентств по национальной безопасности
Дополнительный контекст:
— следующая модель Gemini от Google и Claude 3.5 Opus от Anthropic должны появиться в первой половине осени, и моя догадка такова, что младшая версия Strawberry доберётся до ChatGPT/моделек примерно в то же время (OpenAI не может себе позволить отставать от конкурентов, будучи постоянным лидером в гонке). А вот Orion можем не увидеть ещё долго, больше полугода
Илон Маск опубликовал у себя в Х видео из гигантского нового суперкластера обучения искусственного интеллекта Cortex, который строится в штаб-квартире Tesla в Остине для решения «реальных задач искусственного интеллекта».
Обычно видео и фото в таких кластерах делать не дают, а ходить там можно только в бахилах, халатах и шапочках из фольги — так что наслаждаемся, пока можно.
RetroFuturism + soul music + AI video generator =❤️
А когда ИИ научится делать сразу готовые 3д сцены, мы сможем погружаться в сгенерированные миры в VR ✨
Запись того, как второй парализованный пациент с чипом Neural Link играет в CS 2
Просто бегать вокруг так приятно, потому что я могу смотреть по сторонам, и мне не нужно двигать Quadstick (джойстик) влево и вправо... Я могу (думать о том, куда) смотреть, и оно идет туда, куда я хочу. Это очень круто
Просто чтобы вы понимали разницу с обычным ответом gpt4o 5/5 неверные, а мой gpt ещё ни разу не ошибся🌚🌚
правда я не уверен, что этим стандартным тестам можно доверять, но интересно🤓
Пока ждём воскрешения серверов Reflection можно посмотреть мемасы и парочку примеров от тех кому удалось пощупать модель (задача на логику с которой не справляется ни одна другая модель) и почитать подробнее про неё на venturebeat🤓
В интересное время живём, когда один парень может нагнуть целую отрасль за 1 вечер, чувствую нас ждут горячие пару месяцев релизов 🌚
На арене опять появилась новая моделька anonymous chatbot и по традиции предлагаю всем проверить насколько она хороша, кто-то пишет это будущий апдейт gpt4 🍓 но не поверю пока сам не затестирую🌚
https://chat.lmsys.org/
Tesla забронировала на 10 октября киностудию Warner Bros. На месте съёмок фильмов о Бэтмене и сериала «Друзья» может состояться премьера роботакси.
В распоряжении Tesla будет площадка в 500 тысяч квадратных метров с декорациями, имитирующими маленькие городки. Предположительно, компания также активно собирает данные, которые необходимы для создания HD-карт киностудии и организации физических проездов.
HD-карты отличаются от стандартных тем, что содержат детальную информацию о дорожной инфраструктуре, в том числе положение, ширину и количество полос движения, разметку, пешеходные переходы, дорожные знаки и светофоры, а также здания, деревья, мосты, столбы, бордюры и другие трёхмерные объекты, которые могут влиять на навигацию.
Первоначально премьера роботакси Tesla была запланирована на август, однако компания сдвинула её на октябрь, чтобы переделать «отдельные элементы автомобиля».
Если презентация Tesla состоится, четвёртый квартал может стать горячей порой для автономного транспорта. На 15 октября запланирована презентация нового поколения роботакси WeRide, а до конца года Waymo может начать тестирование автономных автомобилей в зимних локациях.
В Токио сейчас проходит KDDI Summit 2024 (крупное бизнес мероприятие), где выступил генеральный директор OpenAI Japan, Нагасаки, сообщил, что новая модель искусственного интеллекта "GPT Next", планируемая к выпуску в 2024 году, будет значительно превосходить предыдущие версии. Согласно его заявлению, ожидается, что эта модель улучшится почти в 100 раз по сравнению с текущей версией GPT-4.
Прирост мощности в 100 раз связан с эффективным увеличением вычислительных объемов и усовершенствованием архитектуры и методов обучения модели. Также упоминается, что она будет обучена на уменьшенной версии модели Strawberry🍓
Кроме того, упомянуто о другой модели, под названием Orion, которая, мощнее GPT-4 на три порядка (в 1000 раз🤯🤯🤯). Выпуск этой модели ожидается в следующем году.
В общем, ждём девдеи OpenAI которые пройдут в октябре и ноябре. Хватит нас уже тизерить🌚
Вот это крутой юзкейс для Meta Smart Glasses 👍
Вообще представьте сколько возможностей появится у людей с ограниченными возможностями лет так через 5, один только Neuralink как жизнь улучшит ✨
А вот так выглядит кросс-плей в no man's sky 🌚 кстати играл в неё и Скайрим в VR и скажу вам, что за этим будущее, как минимум first person гамок
Читать полностью…✨Google добавила новый ИИ-инструмент «Gmail Q&A» в приложение Gmail для Android. Теперь пользователи могут взаимодействовать с ИИ Gemini прямо в приложении, чтобы искать конкретную информацию или получать краткие сводки писем. Например, можно спросить о содержимом старых писем или узнать детали прошедших мероприятий. Полный запуск на Android займет 15 дней, а поддержка iOS ожидается в ближайшее время.
Читать полностью…Ну вот и первые новости перед горячей LLM-осенью:
Китайская команда Qwen представила Qwen2-VL — новую версию модели, значительно улучшившую понимание визуальной информации. Модель поддерживает анализ изображений, видео (до 20и минут), в открытом доступе в версиях с 2B и 7B параметров, демонстрируя передовые результаты в решении сложных задач и мультиязычном контенте. Qwen2-VL 72B (пока доступна только по API) почти по всем визуальным бенчмаркам бьёт GPT4o и Claude 3.5 Sonnet🤯
Ждём ответку от OpenAI и не только🌚
Учёные из MIT показали как выглядят кварки и антикварки. Надеюсь после этого квантовая физика стала вам намного понятнее 🌚
Читать полностью…Только что Google обновила модели Gemini 1.5 Pro (ver 0827), Flash-8B и улучшенную версию модели Flash в линейке Gemini 1.5✨ (видимо в ответ на недавнее обновление GPT4o, которое сместило Gemini 1.5 Pro с пьедестала на LLM арене)
Го пробовать (VPN-USA)
https://t.co/fBrh6UGKz7
Тут некая команда Nous Research разработала технологию DisTrO (Distributed Training Over-the-Internet), которая позволяет обучать большие нейросети через интернет с гораздо меньшими затратами на передачу данных между видеокартами. DisTrO уменьшает объем передаваемых данных в 1000 -10000 раз🤯 что делает возможным обучение даже при медленном интернете и разном оборудовании. Это открытие позволит исследователям и компаниям работать над созданием мощных нейросетей без необходимости в дорогостоящих суперкомпьютерах. DisTrO делает процесс более доступным и независимым от крупных игроков, открывая больше возможностей для инноваций и совместной работы (привет Nvidia)
Команда выложила предварительный отчет и планирует выпустить код и полный алгоритм позже. Это может изменить подход к обучению ИИ, особенно в распределенных сетях и на обычных ПК✨
Как говорится, Big if true, ждём дальнейших новостей от этой команды и возможно скоро все сольёмся в одну ИИ-сеть🌐
В интересное время живём🌚
Пока Карпатый уже не может представить, как работать без копайлота или Cursor, Амазоновские перелопатил половину корпоративного спагетти-кода, юзая их Amazon Q*.
Чуваки прикинули и пришли к выводу, что за пару недель сэкономили 4500 лет (sic!) работы человека-разработчика. Сначало не верится, но если учесть, что 80% кода они отправили напрямую в прод... хочется задуматься о перспективах работы для программистов.
Новая простыня отличается повышенной безопасностью и эффективностью (конечно, со слов разработчиков, ещё посмотрим какие дыры проявятся через некоторое время). А вообще, оптимизация должна принести Безосу лишние 260М в год👍
С одной стороны, в очередной раз press F джунам, с другой — ребята, пока еще не все выкупили фишку, устраивайтесь скорее на синьоров в старые компании и переписывайте им код за нормальную зп😁
* Amazon Q - это амазоноаский копайлот, который под капотом все также использует GPT, имеет доступ ко всей базе кода и документов внутри компании, плюс некий обвес из пайплайнов и интерфейсов вокруг. Вот тут про него.
@ai_newz
Тут вышел очередной генератор картинок https://ideogram.ai/
Ежедневно можно нагенерить около 40 штук, вроде неплохой 👌
А вот Midjourney хоть и вышел из дискорда, так и остался платным 🌚