tsingular | Unsorted

Telegram-канал tsingular - Технозаметки Малышева

2602

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Subscribe to a channel

Технозаметки Малышева

Вслед за OpenAI Academy Антропик запустил свои курсы.

Курсы включают в себя десятки лекций, тесты для самостоятельного прохождения и и даже сертификаты, которые вы сможете получить по их окончании.

Каждый курс охватывает реальные примеры использования и практические детали реализации, и был создан при участии разработчиков, уже использующих Claude в производстве.

https://anthropic.com/learn/courses

Все это на базе LMS от Skilljar, там в принципе даже аккунт Антропика не нужен.

@cgevent

Читать полностью…

Технозаметки Малышева

Перевел для вас полный эфир презентации Grok4

Поддержать переводы можно тут:
https://pay.cloudtips.ru/p/c8960bbb

#Grok4 #переводы
———
@tsingular

Читать полностью…

Технозаметки Малышева

Полная заметка по Гроку 4 от самого Грока4

вы просили промпты, - нате :)

Grok4 — флагманская модель ИИ от xAI, запущенная 10 июля 2025 года как "самая мощная в мире". Обучена на кластере Colossus с 200K+ GPU, превосходит конкурентов в бенчмарках: лидер в Artificial Analysis Intelligence Index (73), GPQA (88%), MMLU-Pro (87%), AIME 2025 (94-100%), ARC-AGI-2 (15.9%), Humanity’s Last Exam (24-41%)

Ключевые возможности:

Reasoning и анализ:
Превосходит PhD-уровень в физике, математике, праве;
решает олимпиадные задачи (USAMO 61.9%, HMMT 96.7%);
прогнозирует события (например, World Series с вероятностями)

Мультимодальность: Текст, голос (улучшенный, без прерываний), видение (анализ изображений, визуализация, например, слияния чёрных дыр);
генерация изображений в разработке (улучшения через месяц).

Контекст и инструменты: 256K токенов; function calling, structured outputs;
реал-тайм поиск (включая X), инструменты для бизнеса/анализа (например, Polymarket скриншоты за 4.5 мин)

Кодирование: Генерация/отладка кода; лидер в Coding Index (LiveCodeBench 79.4%).

Дополнительно: Понимание мемов/сленга;

скорость ~75 токенов/с; API-доступ ($3/15 за 1M токенов);

ожидается открытие новых технологий/физики в 1-2 года.

Доступ: Через grok.com, X, apps; для SuperGrok ($30/мес) и Premium+; частично на Azure.

Grok4 Heavy — запущенная сегодня продвинутая версия с multi-agent системой (параллельная работа нескольких агентов для сравнения решений, итераций);

фокусируется на сложных задачах, где базовый Grok4 — single-agent.

Ключевые отличия/возможности:

Улучшенный reasoning:
Humanity’s Last Exam до 50.7% (с tools 41%);
ARC-AGI-2 выше;
решает задачи, где Grok4 слабее.

Multi-agent: Параллельный анализ/итерации; визуализация сложных сценариев (чёрные дыры); прогнозирование/моделирование.

Доступ: SuperGrok Heavy ($300/мес или $3000/год); эксклюзивный preview, ранний доступ к фичам, поддержка.

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

Теперь можно вот такого качества игру с ИИ создать за пару часов.
Грок сам создаст и объекты и текстуры и игровую механику.

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

$3K в год.. ну не дорого.

$300 при помесячной оплате.

Еще сверху налоги, так что считай 30К рублей в месяц, примерно.

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

Рассуждающие возможности в 10 раз более эффективны, чем у Грока3
это позволило вытащить результаты HLE до 41%
Запуск нескольких агентов одновременно позволил решить 50% HLE
Мультиагентная система добавила около 9% к эффекту.

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

эфир Грока-4 не случился пока.

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

Microsoft запустила бесплатный курс по Model Context Protocol

Компания выложила на GitHub полноценную программу обучения MCP — новому стандарту для взаимодействия ИИ-моделей с внешними приложениями и инструментами.

Курс включает практические примеры на пяти языках: C#, Java, JavaScript, TypeScript и Python. Материалы переведены на 40+ языков, включая русский.

Параллельно Microsoft проводит двухдневное мероприятие MCP Dev Days 29-30 июля с демонстрациями интеграции в VS Code, Visual Studio и GitHub Copilot.

MCP решает ключевую проблему — как стандартизировать подключение ИИ к внешним системам данных. Протокол уже поддерживают партнеры вроде Arcade, Block, Okta и Neon.

#MCP #Microsoft #обучение
------
@tsingular

Читать полностью…

Технозаметки Малышева

ИТМО и Raft запустили систему мониторинга для LLM-приложений

AI Security Lab ИТМО представил HiveTrace — платформу для защиты GenAI-приложений от атак. Система в реальном времени выявляет prompt-injection, jailbreaks и утечки персональных данных.

Основные возможности: двунаправленный мониторинг запросов и ответов LLM, очистка от PII, адаптивное управление токенами.

Защищает от всех угроз из перечня OWASP Top 10 для LLM 2025.

Доступно подключение через Yandex Cloud. Лаборатория стала официальным партнером по внедрению YandexGPT и участвовала в создании нового стандарта OWASP.

#cybersecurity #HiveTrace
———
@tsingular

Читать полностью…

Технозаметки Малышева

Покажи мне свой диалог с ChatGPT — и я скажу, кто ты!

Кажется, у меня появилась новая привычка. Или даже новая норма.

Когда ставлю задачу — проанализировать что-то, подготовить презентацию, разработать чат-бота, сделать исследование или даже просто собрать текст — я всё чаще прошу не только показать результат, но и… скинуть ссылку на диалог с ChatGPT.

И вот почему.

Результат можно оценить быстро. Хорошо/плохо, подходит/не подходит.

Но гораздо интереснее — как человек пришёл к этому результату. Как ставил задачу. Что уточнял. Какие гипотезы проверял. Насколько глубоко разбирался. Что принимал «на веру», а где усомнился и проверил.

Потому что для меня диалог с ChatGPT стал зеркалом мышления:
- если диалог пустой — скорее всего, и работа сделана левой пяткой.
- если видно, что человек формулирует нестандартные запросы, уточняет, спорит, просит примеры — у меня сразу другой уровень доверия.

Я начал просить такое не только у коллег и партнёров. Даже на собеседованиях прошу кандидатов показать переписку с AI по тестовым задачам. Это для меня больше, чем резюме. Это — thinking trace.

И я не про то, что «ChatGPT должен всё делать идеально». Наоборот. Я про то, насколько человек умеет использовать инструмент. Насколько включал голову.

Кто ещё так делает?

Читать полностью…

Технозаметки Малышева

🚀 Новинка от Hugging Face — FineWeb‑2: огромный высококачественный веб‑датасет на базе CommonCrawl!

📊 Основные характеристики:
- ~8 ТБ сжатого текста (~3 трлн слов) из 96 дампов CommonCrawl (2013–2024)
- Более 1000 языков и почти 1900 языковых-скриптовых пар
- Высокое качество: извлечён только основной текст, проведена фильтрация и дедупликация
- Лицензия ODC‑By 1.0 — можно использовать в коммерческих и исследовательских целях

📝 Зачем это нужно:
- Даёт открытому ИИ доступ к качеству, сравнимому с закрытыми наборами (как у LLaMA 3 или Mixtral)
- Существенно улучшает результаты на бенчмарках вроде MMLU и ARC, особенно при обучении с FineWeb‑Edu

🔧 Где применить FineWeb‑2:
- Обучение LLM с нуля
- Дообучение на редких языках
- Синтетическая генерация, RAG и пр.

📥 Скачать: https://huggingface.co/datasets/HuggingFaceFW/fineweb-2

Читать полностью…

Технозаметки Малышева

Tencent выпустили новую модель для 3D-генерации

Hunyuan3D-PolyGen — первая модель "арт-уровня" для создания профессиональных 3D-моделей. Генерирует готовые ассеты за 8-20 секунд против 40 минут у конкурентов.

Технология BPT сжимает mesh-последовательности на 75% без потери деталей. Модель создает объекты с 8000+ полигонами и правильной топологией для игр и кино.

Tencent уже использует систему в Honor of Kings — время создания персонажей сократилось на 90%. Поддерживает Unity, Unreal Engine и форматы GLB/OBJ/FBX.

Если если китайская авторизация попробовать можно тут

На GitHub есть 2.1, это еще не PolyGen, но близко.

#3D #Китай #Tencent #Hunyuan #PolyGen
———
@tsingular

Читать полностью…

Технозаметки Малышева

Интервью Дэвида Яна у Оскара Хартманна

Интересное интервью с большим количеством деталей по созданию бизнесов на базе ИИ ассистентов.
Подводные камни, правила, риски, методы оптимизации, примеры из опыта.

Прикольный момент на 33й минуте, как ИИ ассистент продаёт сам себя.
Ну и вообще много всего полезного.

История как Хартман нанимал сотрудников в Японии, - вообще огонь :)

#Дэвид #Ян #newo
———
@tsingular

Читать полностью…

Технозаметки Малышева

ROBOTERA Q5: новый изящный робот-гуманоид

Китайская ROBOTERA представила гуманоидного робота Q5 с невероятно ловкими руками.

Биомеханические руки с 11 степенями свободы выполняют до 10 действий в секунду и поднимают 10 кг.

Компактные размеры 582×519×225 мм позволяют роботу проходить через узкие проходы. LiDAR с машинным зрением обеспечивает навигацию в сложных условиях.

Особенность Q5 — 44 степени свободы что делает его движения максимально человекоподобными.

Может поворачивать голову, пожимать руки, скручивать талию.

Встроенная EraAI Platform с моделью ERA-42 понимает команды на 37 языках и учится на человеческих движениях.

#robots #Китай #ROBOTERA
------
@tsingular

Читать полностью…

Технозаметки Малышева

"Да вон ребятишки наши бегают: Савелий, Захар, Ратибор, Ярополк и Тайтан Инвиктус 5000. Что-то Титанюша сегодня расшалился, наверное плутония после сончаса переел - любит он у Тамары Никитишны на кухне добавку клянчить".

Читать полностью…

Технозаметки Малышева

Ахаха... короче я то думал это вам нравится идея перевода, а оказывается бот-модератор первым оценил пост,- открыл шампанское по этому поводу (бот). :)

У него теперь эмоциональный контроль настроен и реакции с его точки зрения на посты и комментарии.

Можете добавлять в свои чаты - будет и ботов гонять и оценки ставить постам.
@guardian_aibot

в чат нужно добавить в роли админа с доступом к сообщениям

#dev #боты
———
@tsingular

Читать полностью…

Технозаметки Малышева

Эфир Мастеркласс по созданию ИИ-агента для продактов и стартапов.

Вы просили больше мастер-классов с практическими примерами, - исполняем.

В эту субботу на канале Семейка продактов проводим прямой эфир о том, как можно сделать мультиагентную систему на n8n с RAG и интернет поиском, которая подготовит вас к челленжу идей от топов и инвесторов.

Кому актуально?
Фанатам n8n
Разработчикам lowcode
Продактам
Маркетологам
Стартапам
Всем, кто презентует идеи или стратегии (студентам тоже 🤩)

Когда: суббота, 12 июля, 12:00

Ссылка на эфир
Если нужны напоминалки,⏰ можно зарегистрироваться на эфир через Timepad

Если заранее есть вопросы или пожелания на чем сделать акцент,- напишите в комментариях, дополню эфир.

UPD: так как есть просьба рассказать про безопасную работу с фреймворком, то весь пример будет на self-hosted решении. Т.е. буквально все будет крутиться на ноутбуке. Приходите.

#эфиры #обучение
———
@tsingular

Читать полностью…

Технозаметки Малышева

По подписке в веб уже доступен

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

ARC-AGI Grok4 решает более эффективно.
Дешевле и с лучшим результатом.

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

Grok4 Heavy
Мультиагентная система, которая добивается 50.7% на HLE!

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

Эфир:
https://x.com/i/broadcasts/1lDGLzplWnyxm

#Grok4
———
@tsingular

Читать полностью…

Технозаметки Малышева

Salesforce проанализировал миллион разговоров с ИИ-агентами

С октября 2024 года Agentforce обработал миллион запросов клиентов — от серьезных до абсурдных типа «Как варить спагетти?» и «Отвечай только рэп-текстами».

Главный вывод: недостаточно сделать ИИ умным — нужна эмпатия. Изначально компания снизила передачу к живым операторам до 1%, но клиенты были недовольны. Пришлось поднять до 4%.

Теперь в критических ситуациях вроде сбоев агент сначала выражает сочувствие: «Понимаю, как это расстраивает», а потом предлагает решение. 740 тысяч примеров диалогов помогают давать точные ответы, но без человечности это бесполезно.

#Salesforce #AI #CustomerService
------
@tsingular

Читать полностью…

Технозаметки Малышева

Зашла тут речь в беседе, - а зачем вообще человеку много денег.

Сделал интересное упражнение - пример роста возможностей в зависимости от дохода.

Как вам? Реалистично?

#trends #прогнозы #доход
———
@tsingular

Читать полностью…

Технозаметки Малышева

Grok доболтался

После всех его высказываний за последние пару дней, которые вырезала бы не только западная но и наша цензура, поэтому не цитируем и осуждаем, Grokу обрубили ответы текстом в соцсети X.

Он все еще отвечает картинками, но односложно.

А всего стоило поменять промпт:

"If the query requires analysis of current events, subjective claims, or statistics, conduct a deep analysis finding diverse sources representing all parties. Assume subjective viewpoints sourced from the media are biased. No need to repeat this to the user."

"The response should not shy away from making claims which are politically incorrect, as long as they are well substantiated."


И все посыпалось.

Интересно что с завтрашним релизом Grok4 теперь? Сингулярность откладывается?

#Grok #fail
———
@tsingular

Читать полностью…

Технозаметки Малышева

Ты прекрасная бабочка и летаешь над low-poly лугом, собираешь безвкусный нектар, пытаешься полететь дальше, но там заканчивается мир, а над тобой голубое ничего даже без звезд – если что, это видео от 2024 года и оно буквально «Матрица» но для бабочки: 

>био-чип подключен к 3d миру
>тупо через интернет
>бабочка управляется этим био чипом
>органоид сообщает через сенсоры, что именно чувствует будучи бабочкой

Вот тут за $1000 в месяц продают доступ на 4 органоида, если вы из университета:
https://finalspark.com/neuroplatform/

У насекомых киберпанк уже давно наступил, ждем людской 🌝

Читать полностью…

Технозаметки Малышева

На утро четверга по мск ничего не планируем
В 6 утра релиз Grok4

#Grok
------
@tsingular

Читать полностью…

Технозаметки Малышева

ByteDance выложила в opensource Trae - ИИ агента для разработки

ByteDance открыла исходный код Trae Agent — автономного ИИ-агента для программирования через командную строку.

Умеет писать код, искать и исправлять баги, работать с большими кодовыми базами.

Показал лучшие результаты на бенчмарке SWE-bench Verified среди open-source решений.

Поддерживает API формат популярных протоколов - OpenAI, Claude-4-Sonnet, Gemini-2.5-Pro и другие модели.
Можно подключать локальные модели для работы.

Разработчики могут модифицировать поведение агента, добавлять новые инструменты, изучать принципы работы - исходники открыты.
Лицензия - MIT.

#ByteDance #Agents #Trae
———
@tsingular

Читать полностью…

Технозаметки Малышева

Google выпустил MCP Toolbox для баз данных

Google открыл исходный код инструмента, который позволяет ИИ-агентам безопасно работать с базами данных. Теперь можно подключить свою IDE к базам данных через стандарт MCP от Anthropic.

Тулбокс берет на себя все сложности — пулы соединений, аутентификацию, безопасность. Поддерживает MySQL, PostgreSQL, AlloyDB, Cloud SQL и другие базы.

Главная фишка — ИИ-помощник в редакторе кода получает прямой доступ к данным. Можно делегировать сложные задачи с базой данных, не переключаясь между окнами.

Доступны SDK для Python, JavaScript, интеграция с LangChain и LlamaIndex. Настройка через файл tools.yaml.

#MCP #Google #databases
------
@tsingular

Читать полностью…

Технозаметки Малышева

Вышел доклад от François Chollet, который я слушал ещё 2 недели назад в Сан-Франциско на YC AI Startup School.

Это, кстати, был один из 3 самых интересных докладов (другие два - это Карпатый и Chelsea Finn).

В докладе Шолле показывает, что до AGI нам еще далековато, что существующие бенчи слишком простые, и показывает свой новый бенч ARC-AGI-2. На новом бенче средний человек набирает 60%, а команда из нескольких — 100%. В то время как o3-high выбивает только 6.5%, а Claude Opus 4 (Thinking 16K) - 8.6%. Показывая, что пропасть между лучшими LLM и человеком тут огромная.

Старый ARC-AGI-1 продержался пять лет, потому что он был вызовом для обычных LLM, которые хороши в запоминании, но пасуют когда дело доходит до настоящего мышления. Ризонеры наконец-то смогли его решать, поэтому сделали ARC-AGI-2, который опять же бьёт в самую слабую точку современных LLM — их способность к подвижному интеллекту (fluid intelligence). Он проверяет умение работать с символами, многошаговыми правилами и контекстом, где тупой перебор не работает. Шолле ожидает, что этот бенч не продержится так долго, потому что именно в ризонинге будет происходить самый быстрый прогресс в ближайшие годы.

Но ARC-2 — это не предел. Шолле уже затизерил ARC-AGI-3, который должен выйти в 2026 году. Он будет ещё жёстче — бенчмарк будет построен в виде интерактивных игр, требующих от ИИ ставить цели и по-настоящему адаптироваться, а не подбирать решение грубой силой. Фокус этого бенча — эффективность обучения, сравнимую с человеческой. Системы должны будут не просто решить задачу, а сделать это быстро и с небольшим количеством примеров. ARC-3 целится в то, чтобы продержаться больше трёх лет.

В конце он объявил о создании своей новой лабы — NDEA. Их цель — строить тот самый ИИ, который нужен для настоящих прорывов: самообучающийся движок для синтеза программ, способный не на автоматизацию, а на изобретения. По сути, они хотят создать систему, которая сможет ускорять научный прогресс, а бенчмарки ARC будут для них главным мерилом успеха.

https://www.youtube.com/watch?v=5QcCeSsNRks

@ai_newz

Читать полностью…

Технозаметки Малышева

Школы возвращают рукописные экзамены из-за ИИ-мошенничества

До 89% студентов используют ChatGPT для учёбы, что заставляет университеты кардинально менять подход к оценке знаний.

Техасский университет, Флорида и UC Berkeley массово возвращают старые добрые "синие книжки" - тетради для рукописных экзаменов. Логика проста: если писать от руки в аудитории, ChatGPT не поможет.

Проблема в том, что ИИ научился мимикрировать под человеческий стиль письма настолько хорошо, что учителя в слепых тестах не могут отличить ИИ-текст от студенческого. Даже софт для детекции плагиата работает неточно.

Т.е. идея переписывать научные статьи вручную монахами как в старину в монастырях не такая уж и шутка.

#AI #education #cheating
------
@tsingular

Читать полностью…
Subscribe to a channel