Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
Вслед за OpenAI Academy Антропик запустил свои курсы.
Курсы включают в себя десятки лекций, тесты для самостоятельного прохождения и и даже сертификаты, которые вы сможете получить по их окончании.
Каждый курс охватывает реальные примеры использования и практические детали реализации, и был создан при участии разработчиков, уже использующих Claude в производстве.
https://anthropic.com/learn/courses
Все это на базе LMS от Skilljar, там в принципе даже аккунт Антропика не нужен.
@cgevent
Перевел для вас полный эфир презентации Grok4
Поддержать переводы можно тут:
https://pay.cloudtips.ru/p/c8960bbb
#Grok4 #переводы
———
@tsingular
Полная заметка по Гроку 4 от самого Грока4
вы просили промпты, - нате :)
Grok4 — флагманская модель ИИ от xAI, запущенная 10 июля 2025 года как "самая мощная в мире". Обучена на кластере Colossus с 200K+ GPU, превосходит конкурентов в бенчмарках: лидер в Artificial Analysis Intelligence Index (73), GPQA (88%), MMLU-Pro (87%), AIME 2025 (94-100%), ARC-AGI-2 (15.9%), Humanity’s Last Exam (24-41%)
Ключевые возможности:
Reasoning и анализ:
Превосходит PhD-уровень в физике, математике, праве;
решает олимпиадные задачи (USAMO 61.9%, HMMT 96.7%);
прогнозирует события (например, World Series с вероятностями)
Мультимодальность: Текст, голос (улучшенный, без прерываний), видение (анализ изображений, визуализация, например, слияния чёрных дыр);
генерация изображений в разработке (улучшения через месяц).
Контекст и инструменты: 256K токенов; function calling, structured outputs;
реал-тайм поиск (включая X), инструменты для бизнеса/анализа (например, Polymarket скриншоты за 4.5 мин)
Кодирование: Генерация/отладка кода; лидер в Coding Index (LiveCodeBench 79.4%).
Дополнительно: Понимание мемов/сленга;
скорость ~75 токенов/с; API-доступ ($3/15 за 1M токенов);
ожидается открытие новых технологий/физики в 1-2 года.
Доступ: Через grok.com, X, apps; для SuperGrok ($30/мес) и Premium+; частично на Azure.
Grok4 Heavy — запущенная сегодня продвинутая версия с multi-agent системой (параллельная работа нескольких агентов для сравнения решений, итераций);
фокусируется на сложных задачах, где базовый Grok4 — single-agent.
Ключевые отличия/возможности:
Улучшенный reasoning:
Humanity’s Last Exam до 50.7% (с tools 41%);
ARC-AGI-2 выше;
решает задачи, где Grok4 слабее.
Multi-agent: Параллельный анализ/итерации; визуализация сложных сценариев (чёрные дыры); прогнозирование/моделирование.
Доступ: SuperGrok Heavy ($300/мес или $3000/год); эксклюзивный preview, ранний доступ к фичам, поддержка.
#Grok4
———
@tsingular
Теперь можно вот такого качества игру с ИИ создать за пару часов.
Грок сам создаст и объекты и текстуры и игровую механику.
#Grok4
———
@tsingular
$3K в год.. ну не дорого.
$300 при помесячной оплате.
Еще сверху налоги, так что считай 30К рублей в месяц, примерно.
#Grok4
———
@tsingular
Рассуждающие возможности в 10 раз более эффективны, чем у Грока3
это позволило вытащить результаты HLE до 41%
Запуск нескольких агентов одновременно позволил решить 50% HLE
Мультиагентная система добавила около 9% к эффекту.
#Grok4
———
@tsingular
эфир Грока-4 не случился пока.
#Grok4
———
@tsingular
Microsoft запустила бесплатный курс по Model Context Protocol
Компания выложила на GitHub полноценную программу обучения MCP — новому стандарту для взаимодействия ИИ-моделей с внешними приложениями и инструментами.
Курс включает практические примеры на пяти языках: C#, Java, JavaScript, TypeScript и Python. Материалы переведены на 40+ языков, включая русский.
Параллельно Microsoft проводит двухдневное мероприятие MCP Dev Days 29-30 июля с демонстрациями интеграции в VS Code, Visual Studio и GitHub Copilot.
MCP решает ключевую проблему — как стандартизировать подключение ИИ к внешним системам данных. Протокол уже поддерживают партнеры вроде Arcade, Block, Okta и Neon.
#MCP #Microsoft #обучение
------
@tsingular
ИТМО и Raft запустили систему мониторинга для LLM-приложений
AI Security Lab ИТМО представил HiveTrace — платформу для защиты GenAI-приложений от атак. Система в реальном времени выявляет prompt-injection, jailbreaks и утечки персональных данных.
Основные возможности: двунаправленный мониторинг запросов и ответов LLM, очистка от PII, адаптивное управление токенами.
Защищает от всех угроз из перечня OWASP Top 10 для LLM 2025.
Доступно подключение через Yandex Cloud. Лаборатория стала официальным партнером по внедрению YandexGPT и участвовала в создании нового стандарта OWASP.
#cybersecurity #HiveTrace
———
@tsingular
Покажи мне свой диалог с ChatGPT — и я скажу, кто ты!
Кажется, у меня появилась новая привычка. Или даже новая норма.
Когда ставлю задачу — проанализировать что-то, подготовить презентацию, разработать чат-бота, сделать исследование или даже просто собрать текст — я всё чаще прошу не только показать результат, но и… скинуть ссылку на диалог с ChatGPT.
И вот почему.
Результат можно оценить быстро. Хорошо/плохо, подходит/не подходит.
Но гораздо интереснее — как человек пришёл к этому результату. Как ставил задачу. Что уточнял. Какие гипотезы проверял. Насколько глубоко разбирался. Что принимал «на веру», а где усомнился и проверил.
Потому что для меня диалог с ChatGPT стал зеркалом мышления:
- если диалог пустой — скорее всего, и работа сделана левой пяткой.
- если видно, что человек формулирует нестандартные запросы, уточняет, спорит, просит примеры — у меня сразу другой уровень доверия.
⠀
Я начал просить такое не только у коллег и партнёров. Даже на собеседованиях прошу кандидатов показать переписку с AI по тестовым задачам. Это для меня больше, чем резюме. Это — thinking trace.
И я не про то, что «ChatGPT должен всё делать идеально». Наоборот. Я про то, насколько человек умеет использовать инструмент. Насколько включал голову.
Кто ещё так делает?
🚀 Новинка от Hugging Face — FineWeb‑2: огромный высококачественный веб‑датасет на базе CommonCrawl!
📊 Основные характеристики:
- ~8 ТБ сжатого текста (~3 трлн слов) из 96 дампов CommonCrawl (2013–2024)
- Более 1000 языков и почти 1900 языковых-скриптовых пар
- Высокое качество: извлечён только основной текст, проведена фильтрация и дедупликация
- Лицензия ODC‑By 1.0 — можно использовать в коммерческих и исследовательских целях
📝 Зачем это нужно:
- Даёт открытому ИИ доступ к качеству, сравнимому с закрытыми наборами (как у LLaMA 3 или Mixtral)
- Существенно улучшает результаты на бенчмарках вроде MMLU и ARC, особенно при обучении с FineWeb‑Edu
🔧 Где применить FineWeb‑2:
- Обучение LLM с нуля
- Дообучение на редких языках
- Синтетическая генерация, RAG и пр.
📥 Скачать: https://huggingface.co/datasets/HuggingFaceFW/fineweb-2
Tencent выпустили новую модель для 3D-генерации
Hunyuan3D-PolyGen — первая модель "арт-уровня" для создания профессиональных 3D-моделей. Генерирует готовые ассеты за 8-20 секунд против 40 минут у конкурентов.
Технология BPT сжимает mesh-последовательности на 75% без потери деталей. Модель создает объекты с 8000+ полигонами и правильной топологией для игр и кино.
Tencent уже использует систему в Honor of Kings — время создания персонажей сократилось на 90%. Поддерживает Unity, Unreal Engine и форматы GLB/OBJ/FBX.
Если если китайская авторизация попробовать можно тут
На GitHub есть 2.1, это еще не PolyGen, но близко.
#3D #Китай #Tencent #Hunyuan #PolyGen
———
@tsingular
Интервью Дэвида Яна у Оскара Хартманна
Интересное интервью с большим количеством деталей по созданию бизнесов на базе ИИ ассистентов.
Подводные камни, правила, риски, методы оптимизации, примеры из опыта.
Прикольный момент на 33й минуте, как ИИ ассистент продаёт сам себя.
Ну и вообще много всего полезного.
История как Хартман нанимал сотрудников в Японии, - вообще огонь :)
#Дэвид #Ян #newo
———
@tsingular
ROBOTERA Q5: новый изящный робот-гуманоид
Китайская ROBOTERA представила гуманоидного робота Q5 с невероятно ловкими руками.
Биомеханические руки с 11 степенями свободы выполняют до 10 действий в секунду и поднимают 10 кг.
Компактные размеры 582×519×225 мм позволяют роботу проходить через узкие проходы. LiDAR с машинным зрением обеспечивает навигацию в сложных условиях.
Особенность Q5 — 44 степени свободы что делает его движения максимально человекоподобными.
Может поворачивать голову, пожимать руки, скручивать талию.
Встроенная EraAI Platform с моделью ERA-42 понимает команды на 37 языках и учится на человеческих движениях.
#robots #Китай #ROBOTERA
------
@tsingular
"Да вон ребятишки наши бегают: Савелий, Захар, Ратибор, Ярополк и Тайтан Инвиктус 5000. Что-то Титанюша сегодня расшалился, наверное плутония после сончаса переел - любит он у Тамары Никитишны на кухне добавку клянчить".
Читать полностью…Ахаха... короче я то думал это вам нравится идея перевода, а оказывается бот-модератор первым оценил пост,- открыл шампанское по этому поводу (бот). :)
У него теперь эмоциональный контроль настроен и реакции с его точки зрения на посты и комментарии.
Можете добавлять в свои чаты - будет и ботов гонять и оценки ставить постам.
@guardian_aibot
в чат нужно добавить в роли админа с доступом к сообщениям
#dev #боты
———
@tsingular
Эфир Мастеркласс по созданию ИИ-агента для продактов и стартапов.
Вы просили больше мастер-классов с практическими примерами, - исполняем.
В эту субботу на канале Семейка продактов проводим прямой эфир о том, как можно сделать мультиагентную систему на n8n с RAG и интернет поиском, которая подготовит вас к челленжу идей от топов и инвесторов.
Кому актуально?
Фанатам n8n
Разработчикам lowcode
Продактам
Маркетологам
Стартапам
Всем, кто презентует идеи или стратегии (студентам тоже 🤩)
Когда: суббота, 12 июля, 12:00
Ссылка на эфир
Если нужны напоминалки,⏰ можно зарегистрироваться на эфир через Timepad
Если заранее есть вопросы или пожелания на чем сделать акцент,- напишите в комментариях, дополню эфир.
UPD: так как есть просьба рассказать про безопасную работу с фреймворком, то весь пример будет на self-hosted решении. Т.е. буквально все будет крутиться на ноутбуке. Приходите.
#эфиры #обучение
———
@tsingular
По подписке в веб уже доступен
#Grok4
———
@tsingular
ARC-AGI Grok4 решает более эффективно.
Дешевле и с лучшим результатом.
#Grok4
———
@tsingular
Grok4 Heavy
Мультиагентная система, которая добивается 50.7% на HLE!
#Grok4
———
@tsingular
Эфир:
https://x.com/i/broadcasts/1lDGLzplWnyxm
#Grok4
———
@tsingular
Salesforce проанализировал миллион разговоров с ИИ-агентами
С октября 2024 года Agentforce обработал миллион запросов клиентов — от серьезных до абсурдных типа «Как варить спагетти?» и «Отвечай только рэп-текстами».
Главный вывод: недостаточно сделать ИИ умным — нужна эмпатия. Изначально компания снизила передачу к живым операторам до 1%, но клиенты были недовольны. Пришлось поднять до 4%.
Теперь в критических ситуациях вроде сбоев агент сначала выражает сочувствие: «Понимаю, как это расстраивает», а потом предлагает решение. 740 тысяч примеров диалогов помогают давать точные ответы, но без человечности это бесполезно.
#Salesforce #AI #CustomerService
------
@tsingular
Зашла тут речь в беседе, - а зачем вообще человеку много денег.
Сделал интересное упражнение - пример роста возможностей в зависимости от дохода.
Как вам? Реалистично?
#trends #прогнозы #доход
———
@tsingular
Grok доболтался
После всех его высказываний за последние пару дней, которые вырезала бы не только западная но и наша цензура, поэтому не цитируем и осуждаем, Grokу обрубили ответы текстом в соцсети X.
Он все еще отвечает картинками, но односложно.
А всего стоило поменять промпт:
"If the query requires analysis of current events, subjective claims, or statistics, conduct a deep analysis finding diverse sources representing all parties. Assume subjective viewpoints sourced from the media are biased. No need to repeat this to the user."
"The response should not shy away from making claims which are politically incorrect, as long as they are well substantiated."
И все посыпалось.
Интересно что с завтрашним релизом Grok4 теперь? Сингулярность откладывается?
#Grok #fail
———
@tsingular
Ты прекрасная бабочка и летаешь над low-poly лугом, собираешь безвкусный нектар, пытаешься полететь дальше, но там заканчивается мир, а над тобой голубое ничего даже без звезд – если что, это видео от 2024 года и оно буквально «Матрица» но для бабочки:
>био-чип подключен к 3d миру
>тупо через интернет
>бабочка управляется этим био чипом
>органоид сообщает через сенсоры, что именно чувствует будучи бабочкой
Вот тут за $1000 в месяц продают доступ на 4 органоида, если вы из университета:
https://finalspark.com/neuroplatform/
У насекомых киберпанк уже давно наступил, ждем людской 🌝
На утро четверга по мск ничего не планируем
В 6 утра релиз Grok4
#Grok
------
@tsingular
ByteDance выложила в opensource Trae - ИИ агента для разработки
ByteDance открыла исходный код Trae Agent — автономного ИИ-агента для программирования через командную строку.
Умеет писать код, искать и исправлять баги, работать с большими кодовыми базами.
Показал лучшие результаты на бенчмарке SWE-bench Verified среди open-source решений.
Поддерживает API формат популярных протоколов - OpenAI, Claude-4-Sonnet, Gemini-2.5-Pro и другие модели.
Можно подключать локальные модели для работы.
Разработчики могут модифицировать поведение агента, добавлять новые инструменты, изучать принципы работы - исходники открыты.
Лицензия - MIT.
#ByteDance #Agents #Trae
———
@tsingular
Google выпустил MCP Toolbox для баз данных
Google открыл исходный код инструмента, который позволяет ИИ-агентам безопасно работать с базами данных. Теперь можно подключить свою IDE к базам данных через стандарт MCP от Anthropic.
Тулбокс берет на себя все сложности — пулы соединений, аутентификацию, безопасность. Поддерживает MySQL, PostgreSQL, AlloyDB, Cloud SQL и другие базы.
Главная фишка — ИИ-помощник в редакторе кода получает прямой доступ к данным. Можно делегировать сложные задачи с базой данных, не переключаясь между окнами.
Доступны SDK для Python, JavaScript, интеграция с LangChain и LlamaIndex. Настройка через файл tools.yaml.
#MCP #Google #databases
------
@tsingular
Вышел доклад от François Chollet, который я слушал ещё 2 недели назад в Сан-Франциско на YC AI Startup School.
Это, кстати, был один из 3 самых интересных докладов (другие два - это Карпатый и Chelsea Finn).
В докладе Шолле показывает, что до AGI нам еще далековато, что существующие бенчи слишком простые, и показывает свой новый бенч ARC-AGI-2. На новом бенче средний человек набирает 60%, а команда из нескольких — 100%. В то время как o3-high выбивает только 6.5%, а Claude Opus 4 (Thinking 16K) - 8.6%. Показывая, что пропасть между лучшими LLM и человеком тут огромная.
Старый ARC-AGI-1 продержался пять лет, потому что он был вызовом для обычных LLM, которые хороши в запоминании, но пасуют когда дело доходит до настоящего мышления. Ризонеры наконец-то смогли его решать, поэтому сделали ARC-AGI-2, который опять же бьёт в самую слабую точку современных LLM — их способность к подвижному интеллекту (fluid intelligence). Он проверяет умение работать с символами, многошаговыми правилами и контекстом, где тупой перебор не работает. Шолле ожидает, что этот бенч не продержится так долго, потому что именно в ризонинге будет происходить самый быстрый прогресс в ближайшие годы.
Но ARC-2 — это не предел. Шолле уже затизерил ARC-AGI-3, который должен выйти в 2026 году. Он будет ещё жёстче — бенчмарк будет построен в виде интерактивных игр, требующих от ИИ ставить цели и по-настоящему адаптироваться, а не подбирать решение грубой силой. Фокус этого бенча — эффективность обучения, сравнимую с человеческой. Системы должны будут не просто решить задачу, а сделать это быстро и с небольшим количеством примеров. ARC-3 целится в то, чтобы продержаться больше трёх лет.
В конце он объявил о создании своей новой лабы — NDEA. Их цель — строить тот самый ИИ, который нужен для настоящих прорывов: самообучающийся движок для синтеза программ, способный не на автоматизацию, а на изобретения. По сути, они хотят создать систему, которая сможет ускорять научный прогресс, а бенчмарки ARC будут для них главным мерилом успеха.
https://www.youtube.com/watch?v=5QcCeSsNRks
@ai_newz
Школы возвращают рукописные экзамены из-за ИИ-мошенничества
До 89% студентов используют ChatGPT для учёбы, что заставляет университеты кардинально менять подход к оценке знаний.
Техасский университет, Флорида и UC Berkeley массово возвращают старые добрые "синие книжки" - тетради для рукописных экзаменов. Логика проста: если писать от руки в аудитории, ChatGPT не поможет.
Проблема в том, что ИИ научился мимикрировать под человеческий стиль письма настолько хорошо, что учителя в слепых тестах не могут отличить ИИ-текст от студенческого. Даже софт для детекции плагиата работает неточно.
Т.е. идея переписывать научные статьи вручную монахами как в старину в монастырях не такая уж и шутка.
#AI #education #cheating
------
@tsingular