Ого, оказывается вместе с релизом новых моделей OpenAI зафайнтюнили стандартную gpt4o (апдейт от 3 сентября) да так, что она улучшилась во всех направлениях, я кстати заметил что тексты естественнее стали 👌
А ещё у o1-mini теперь лимит сообщений не 50 в неделю а 50 в сутки ✨
Думаю после октябрьского релиза следующей крупной модели, gpt4o заменит gpt4 и станет доступна всем без лимитов 🤞
Странно что никто не пишет, но у Google вышла бомбзеная обнова на блокнот, где из ваших заметок или файла создаётся AI-подкаст да такой реалистичный, что хочется все новости теперь так прогонять через него, голоса и интонации не хуже презентации Voice Mode (который мы когда нибудь дождёмся) 👌
Вот вам про завтрашнее лунное затмение, вам же интересно да? 🌚
И ещё пару 10-и минутных примеров: тут про релиз новой модели OpenAI, тут про DnD правила
GitHub внедрил o1-preview в GitHub Copilot и модель продемонстрировала впечатляющие результаты в анализе и оптимизации кода. Благодаря способности разбивать сложные задачи на структурированные шаги, o1-preview значительно улучшает процессы отладки, рефакторинга кода и написания тестов.
В одном из тестов модель успешно оптимизировала алгоритм токенизации, используемый в Copilot Chat, что привело к заметному увеличению производительности. Также o1-preview смогла быстро выявить и устранить ошибку производительности за несколько минут, тогда как разработчикам на это потребовались часы.
Модели o1-preview и o1-mini теперь доступны в GitHub Models для раннего доступа. GitHub продолжает исследовать новые возможности использования o1-preview для ускорения рабочих процессов разработчиков, пока они ещё нужны😜
https://github.blog/news-insights/product-news/openai-o1-in-github-copilot/
AI Winter is coming 🔥(всё это добро планируют зарелизить до конца года/в начале 2025. OpenAI собираются представить Orion в октябре👌) и ещё LLaMA 4 не хватает 🌚
Читать полностью…А вот так выглядит AI overlay графики в фортнайт🦄 (интересно ещё майнкрафт глянуть🌚)
Интересный гейминг нас ждёт в ближайшем будущем✨
Пример решения довольно нетривиальной задачки, с которой текущие модели не справляются
Читать полностью…OpenAI представила новую серию моделей ИИ o1, которые лучше справляются с трудными задачами благодаря способности дольше обдумывать ответы. Первая модель, o1-preview, уже доступна в ChatGPT и API с 12 сентября 2024 года. Она отлично подходит для сложных задач в науке, программировании и математике, показывая результаты, близкие к уровню студентов PhD.
Для разработчиков также выпущена версия o1-mini — более быстрая и экономичная модель, которая эффективно решает задачи по программированию и на 80% дешевле. Пользователи ChatGPT Plus могут уже сейчас воспользоваться новыми моделями.
https://openai.com/index/introducing-openai-o1-preview/
Все мы знаем что там покажут, но уверен будет также много про ИИ, так что через 2 часа смотрим 🍿
https://www.youtube.com/live/uarNiSl_uh4?si=l5e_8hKwjx3zkd2J
Эммм опять проверяю на Atari Breakout и это пушка, мало того что он сделал бронированные кубики (синие), так и улучшения работают, счёт идёт, жизни, он даже звук хотел всунуть, только файл нужный подавай, и всё это модель 70B🤯
Приложил код, кто захочет вдруг побить мой рекорд🌚
создатель Reflection 70B нашёл баг из-за которого его модель не работала ни на одной LLM площадке, типа Hugging Face и собирается пофиксить сегодня (по времени USA)✨
Момент истины, если опять начнутся качели после фикса, то возникает вопрос в реальности и работоспособности его файнтюна LLama 70B, но хотя бы за промпт и направление куда двигаться опенсорсу спасибо🌚
Просто чтобы вы понимали разницу с обычным ответом gpt4o 5/5 неверные, а мой gpt ещё ни разу не ошибся🌚🌚
правда я не уверен, что этим стандартным тестам можно доверять, но интересно🤓
Пока ждём воскрешения серверов Reflection можно посмотреть мемасы и парочку примеров от тех кому удалось пощупать модель (задача на логику с которой не справляется ни одна другая модель) и почитать подробнее про неё на venturebeat🤓
В интересное время живём, когда один парень может нагнуть целую отрасль за 1 вечер, чувствую нас ждут горячие пару месяцев релизов 🌚
На арене опять появилась новая моделька anonymous chatbot и по традиции предлагаю всем проверить насколько она хороша, кто-то пишет это будущий апдейт gpt4 🍓 но не поверю пока сам не затестирую🌚
https://chat.lmsys.org/
Эммм... Google DeepMind только что математически доказали, что трансформеры могут решить любую задачу, если им разрешено генерировать столько промежуточных шагов рассуждений, сколько необходимо. Удивительно, но для этого достаточно постоянной глубины модели» То есть они уже создали AGI (локально)? только нужны мощности для бесконечных цепочек размышлений как у o1-preview??🤯 Думаю Google как раз-таки могут позволить такие мощности для своего внутреннего ИИ🌚 fkin shit, мне кажется или мы ускоряемся уже каждый день? видимо ответ Google на релиз gpto1 будет мощным🦾
Читать полностью…Ну всё, ChatGPT собираются сделать проактивным, один из пользователей поделился чатом, который нейронка начала САМА🤯🤯 похоже начинают тестить новую фичу🌚
Видимо, gpt будет использовать память, чтобы общаться с нами, узнавать как наши дела, потом предлагать купить что нибудь "полезное", постепенно начнёт входить в доверие и незаметно станет манипулировать с целью поработить человечество😈 (шутка, я надеюсь😅)
https://chatgpt.com/share/66e718e5-c934-8001-8ffa-ef7ca1f165ff
А вдруг.... это вообще аномальное поведение о котором даже не знают в OpenAI🫥 Но в любом случае диалог очень натуральный получился👌
Как раз у Вани на канале ещё примеры video-to-video да и вообще много других крутых Ai-вкусностей 🍭
Если что сам читаю, много про AI в дизайне и графике👌 Точки над ИИ
В общем решил я заюзать gpto1-preview чтобы улучшить мой промпт для текстовых DnD кампаний ииии он выдал мне несколько листов А4 (1200 слов) развёрнутых механик с примерами🤯🤯 (думал аж 12 сек) Всё это даже не влазит в инструкции моей специальной dnd-gpt, но это не беда, тк круче всего в текстовые рпг получается играть с Google Gemini 1.5 pro (ждём вторую версию🌚), он жрёт 2 млн токенов контента и можно даже регулировать максимальный размер сообщений на выдачу (я ставлю 60к токенов) Так что, кому интересно берите промпт и развлекайтесь ✨
А и вгонять в гемини всю эту инструкцию нужно именно в System instructions ну и про американский VPN не забывайте👌
А ещё я даже читалку вслух подключаю, чтобы как аудиокнижка получалась и атмосферный музыкальный фон, представляю как с Voice Mode можно будет в такое залипнуть🤓
Вчера из-за релиза сами знаете чего, пропустил интересную новость: Google представила DataGemma — первый открытый набор моделей, предназначенных для решения проблемы "галлюцинаций" в языковых моделях (LLM). Галлюцинации возникают, когда ИИ уверенно выдает неверную информацию. DataGemma помогает улучшить точность LLM, подключая их к реальным данным из Google Data Commons — обширного репозитория достоверной информации от таких источников, как ООН, ВОЗ и другие.
Data Commons включает более 240 миллиардов данных по различным темам, от экономики до здравоохранения. DataGemma использует два подхода: RIG (генерация с чередованием запросов) и RAG (генерация с дополнением запросов), что позволяет моделям автоматически проверять факты и получать точную информацию из Data Commons.
Результаты тестов новых моделей показывают, что точность обработки числовых данных заметно улучшилась. DataGemma уже доступна для использования и тестирования✨
https://blog.google/technology/ai/google-datagemma-ai-llm/
Всё конечно хорошо, но...ГДЕ VOICE MODE? да и вообще релиз не для всех, даже не из-за драконовских лимитов по 30 обращений в неделю, а это просто новый инструмент для сложных и комплексных задач (который будут развивать отдельно, чтобы думал дольше, глубже над всё более сложными задачами), что конечно круто, но для отраслей в перспективе, а не обычных пользователей. Gpt4o пока остаётся лучшей для обычных повседневных задач (и моих dnd заруб🌚). В общем ждём октября, там возможно зарелизят новую модель 4.5, а может и voice mode наконец подгонят, а ну и не забываем про конкурентов, надеюсь удивят🫡
Но в интересное время живём, как ни крути, прогресс ускоряется🌪
Компания OpenAI может выпустить текстовую версию новой модели под кодовым названием Strawberry в течение двух недель, согласно информации от двух тестировщиков. По их словам, модель показывает улучшенные результаты по сравнению с GPT-4o, особенно в цепочках размышлений. Однако есть и недостатки: скорость отклика составляет от 10 до 20 секунд, и модель сталкивается с трудностями при кратких запросах и интеграции памяти. Поддержка изображений пока не предусмотрена. ЖДЁМ🤓
Похоже осень будет горячей🔥
https://www.theinformation.com/articles/new-details-on-openais-strawberry-apples-siri-makeover-larry-ellison-doubles-down-on-data-centers
Предлагаю отвлечься от этой драмы с Reflection (если что до конца не понятно, но вроде как 90% что это скам) и отведать бодрящего AI - бургера🍔🔥
Читать полностью…Го тестить рабочую Reflection 70B (пока бесплатно) ✨
вроде всё работает, если так, то Reflection 405B будет бомба💥
https://openrouter.ai/models/mattshumer/reflection-70b:free
PS
Сервис положат через 3..2..1..🤓
Сори за спам, но можно вообще просто просить пошагово рассуждать при каждом запросе в обычном чате и ни разу не ошибается с этой клубничкой🍓 а значит и в других запросах должен быть эффект✨
но обязательно в каждом новом запросе пишите Reason through the query in a step-by-step manner (походу gpt4o очень боится нарушать инструкции🤷♂️)
Я не знаю, мне реально повезло столько раз подряд или я реально сделал аналог Reflection только GPT🌚🌚
проверьте и отпишите плз🙏🏿 (ну или лайк если вы убедились, что gpt стал умнее)
https://chatgpt.com/g/g-mei7dmDkl-reflection-gpt
А промпт скопипастил но добавил step by step manner и всё заиграло✨
You are a world-class AI system, capable of complex reasoning and reflection. Reason through the query inside <thinking> tags in a step-by-step manner, and then provide your final response inside <output> tags. You do not ask the user if they want to reflect, as the reflection is already integrated into the thinking process. All responses should adhere to the standard Llama 3.1 chat format: <|begin_of_text|><|start_header_id|>system<|end_header_id|> with reasoning enclosed in tags and the final output clearly formatted.Читать полностью…
🤯🤯🤯
Reflection 70B — новая открытая LLM, которая по показателям превосходит GPT-4o и Claude 3.5 Sonnet 🔥Она лидирует в тестах MMLU, MATH и GSM8K. В основе модели лежит техника Reflection-Tuning, которая помогает модели распознавать и исправлять свои ошибки. Это также усиливает её способности планирования и улучшает логическую последовательность ответов. Вес модели доступен на Hugging Face. В следующем релизе обещают улучшенную версию Reflection-405B, способную значительно опередить конкурентов (выход gpt-next через 3..2..1..)
Тестим! https://reflection-playground-production.up.railway.app/
ACCELERATE!
Компания Anthropic представила новый план Claude Enterprise, предназначенный для безопасной работы с внутренними данными организаций. План включает расширенное окно контекста на 500 тысяч токенов, увеличенные возможности использования и интеграцию с GitHub, что позволяет обрабатывать целые кодовые базы.
Claude Enterprise также обеспечивает высокий уровень безопасности благодаря поддержке единого входа (SSO), ролевому управлению доступом и журналам аудита для мониторинга. Важно, что Claude не обучается на содержимом пользовательских данных, обеспечивая защиту информации.
Новый план уже используется такими компаниями, как GitLab и Midjourney, для автоматизации процессов, создания контента и работы с кодом, что помогает улучшить производительность и безопасность работы команд.
https://www.anthropic.com/news/claude-for-enterprise