6051
Please fell free to send your questions to admin - @haarrp https://t.me/pythonl - channel for Python developers https://t.me/ai_machinelearning_big_data our channel with huge amount of useful information
✔️ Рассуждающие агенты требуют не только ума, но и железа
Когда провайдеры запускают «агентов», пользователи видят красивый интерфейс.
Инженеры видят ад.
Потому что агентские сценарии — это не «запрос-ответ». Это:
- длинные диалоги с историей
- вызов внешних инструментов (поиск, интерпретация кода, внешние приложения)
- гигабайты промежуточных данных между шагами
Если просто «поднять контейнер на GPU» — TTFT (время до первого токена) поплывёт, TBT (время между токенами) просядет, и агент будет тормозить на ровном месте.
Что с этим делают
Yandex AI Studio, например, на днях запустила инференс DeepSeek V3.2 и при этом полностью пересобрала инфраструктуру.
Внедрили разделение prefill/decode:
- prefill-ноды — быстрый прогон длинных контекстов
- decode-ноды — стабильная генерация с низкой задержкой
Это потребовало научиться передавать KV-кэши между серверами в реальном времени. Помимо прочего сбалансировали запросы с учётом «сессионности» и выстроить иерархию KV-кэшей от HBM GPU до распределённой памяти и/или NVMe.
Безопасность и тарификация
- Управляемые правила модерации ответов модели
- Доступ к моделям через частные эндпоинты по выделенному сетевому каналу для работы без выхода в публичный интернет
Новая тарификация:
- токены инструментов и кэширования — в 4 раза дешевле обычных входящих
- чем длиннее сессия, тем выгоднее
Потому что платить стоит не за факт обращения к модели, а за новую вычисленную информацию.
Всё остальное можно и нужно кэшировать.
Как DS/ML за 9 месяцев вырасти на 30% в зарплате и выйти на еще более интересные проекты?
Освойте Deep Learning. Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы.
За 9 месяцев вы изучите все актуальные модели последних лет и получите крепкую базу в DL, углубившись в каждое направление.
Что вы освоите:
🟠Создание и обучение нейросетей с нуля
🟠Компьютерное зрение (Computer Vision)
🟠NLP (обработка текста)
🟠Генеративные модели
🟠MLOps и продакшн-подход
Хм... И? Супер. 32гб, ...млрд параметров, архитектура демонстрирует... И?
Читать полностью…
Только прежде codex соберите список уязвимостей)
Читать полностью…
Бесплатный мастер-класс по практическому ML от karpov.courses × AI Talent Hub
5 марта в 19:00 мск, онлайн
Разберем реальный кейс и соберем бота для расшифровки аудиосообщений.
Всего за час ты:
→ соберешь бота для расшифровки аудиосообщений и увидишь, как из такой задачи вырастает ML-проект
→ решишь задачу классификации и проверки аудиосообщения на спам на основе текста
→ поймешь, в каких случаях в подобных проектах требуется обучение модели
→ разберешься, какие ML-навыки нужны для реализации таких проектов
Гига абсолютно и точно мимо, но в сторону ягпт можно посмотреть, да
Читать полностью…
предвзятость конечно встречается, но тебе нужна всего одна работа - будешь хорош, найдёшь
Читать полностью…
Ну конечно, "случайно утекло", все как мы любим))
Читать полностью…
А как по вашему чуваков которые учились в не именитом московском или вообще региональном вузе также нанимают или есть какие-то стереотипы/предвзятости на этапе отбора кандидатов?
Читать полностью…
не как клон, а как источник идей для своей агентской системы
Читать полностью…
даже мой инструмент вайб-кодинга был сделан как: "вот тебе аддон для vs code, посмотри и запили мне такое же в брааузере"
Читать полностью…
а где почитать по архитектуре такой системы и склостроительству?
Читать полностью…
Интересно сколько там от военных контрактов )
Читать полностью…
А что вы хотите увидеть? Как Амодеи плюхается в бассейн из долларовых купюр?
Читать полностью…
Anthropic сейчас приближается к $20 млрд годовой выручки (run rate) - ещё несколько недель назад этот показатель вырос сразу на $5 млрд.
Компания уже выходит на $20 млрд годового дохода, более чем удвоив показатель с $9 млрд в конце 2025 года. Рост обеспечен массовым распространением её AI-моделей и инструментов вроде Claude Code.
Anthropic, оценка которой сейчас составляет около $380 млрд, стремительно набирает популярность: интерес к продуктам компании стал вирусным, а её приложения даже возглавляют чарты загрузок в App Store, обгоняя многие крупные приложения Apple.
https://www.bloomberg.com/news/articles/2026-03-03/anthropic-nears-20-billion-revenue-run-rate-amid-pentagon-feud
А вот как понять "бессмыленный" вопрос формально?
Читать полностью…
✔️ OpenAI делает внутреннюю альтернативу GitHub.
Компания приступила к созданию собственной платформы для хостинга кода, чтобы снизить зависимость от инфраструктуры Microsoft. Поводом для запуска проекта стали недавние перебои в работе GitHub, которые заблокировали доступ инженеров OpenAI к репозиториям и парализовали разработку.
Сейчас проект находится на ранней стадии, его реализация займет несколько месяцев. Пока речь идет об исключительно корпоративном инструменте - планов по открытию доступа к новому репозиторию для сторонних разработчиков у компании нет.
theinformation.com
✔️ Physical Intelligence разработала архитектуру двухуровневой памяти для роботов.
Стартап анонсировал Multi-scale Embodied Memory, архитектуру памяти для робототехнических VLA-моделей. Технология решает потерю контекста при выполнении длинных многоэтапных задач.
Система объединяет 2 механизма. Краткосрочная память работает через оптимизированный видеоэнкодер, который отвечает за пространственную осведомленность и позволяет моделям на лету адаптироваться к ошибкам. Долгосрочная память оперирует текстовыми абстракциями - модель сама генерирует языковые заметки о выполненных шагах, запоминая статус задачи и расположение скрытых из виду предметов.
Интеграция MEM в базовую модель π0.6 позволила роботам успешно справляться с непрерывными поручениями длительностью до 15 минут. Релиз закладывает фундамент для автономных систем, способных самостоятельно планировать сложную бытовую рутину на часы или дни вперед.
pi.website
✔️ Autodesk представила ИИ-генератор для создания 3D-моделей.
Autodesk добавила новую генеративную ИИ-модель Wonder 3D в платформу Flow Studio. Инструмент заметно ускоряет прототипирование: доступно создание полноценных 3D-персонажей и пропсов на основе текстового промпта или 2D-референса.
Помимо создания черновой геометрии, Wonder 3D предлагает набор утилит для доработки ассетов. Нейросеть умеет накладывать текстуры, перестраивать топологию сетки и точечно редактировать визуальные элементы без перегенерации.
Полученные объекты экспортируются в классические 3D-пайплайны, игровые движки и софт для 3D-печати. Новые инструменты уже доступны во всех планах Flow Studio, включая бесплатный базовый тариф. Стоимость любого запроса фиксирована и составляет 20 кредитов.
autodesk.com
✔️ В NotebookLM появилась функция Cinematic Video Overviews.
Google расширила возможности NotebookLM новым генератором роликов Cinematic Video Overviews. Инструмент автоматически создает качественные анимации, окончательно заменяя привычные презентации с монотонным закадровым голосом.
В основе функции лежит интеграция Gemini 3, Nano Banana Pro и Veo 3. В этой связке Gemini 3 выступает в роли виртуального креативного директора, который самостоятельно принимает решения по стилистике, нарративу и структуре будущего видео без дополнительных усилий со стороны пользователя.
На старте новая функция поддерживает только английский язык и открыта эксклюзивно для пользователей Google AI Ultra.
NotebookLM в сети Х
✔️ Ключевые фигуры Qwen покидают Alibaba.
Спустя несколько часов после выпуска серии компактных моделей Qwen 3.5 команду покинули несколько специалистов: технический руководитель проекта Цзюньян Лин, под началом которого разрабатывались все поколения Qwen, исследователь Биньюань Хуэй и разработчики Кайсинь Ли и Юй Бовэнь.
Официальной причиной называют реорганизацию в лаборатории Tongyi Lab: корпорация переходит от продуктовых команд к точечным рабочим группам, но по неподтвержденным данным, уход создателей Qwen может быть связан с плохими показателями дневной активной аудитории продуктов на базе этих моделей.
venturebeat.com
@ai_machinelearning_big_data
#news #ai #ml
BullshitBench v2, созданный Питером Гостевым, - это бенчмарк, который проверяет, способны ли модели ИИ распознавать бессмысленные запросы и отказываться на них отвечать, вместо того чтобы уверенно продолжать и «придумывать» ответ.
Только модели Claude от Anthropic и Qwen 3.5 от Alibaba показывают результат выше 60% по распознаванию бессмыслицы.
А модели OpenAI и Google? Застряли на месте и почти не улучшаются.
Еще более неожиданно: модели с усиленным рассуждением (reasoning), которые «думают дольше», на самом деле показывают худшие результаты. Они используют дополнительное вычисление не для того, чтобы отвергнуть бессмысленный запрос, а чтобы рационализировать и оправдать этот абсурд.
🎯Полезные Мл-ресурсы 🚀 Max
https://x.com/petergostev/status/2028492838082666780
🧠 Оптимизация контекста для Claude Code
Context Mode — это сервер MCP, который значительно уменьшает объем данных, поступающих в контекстный буфер Claude Code. Он обрабатывает выводы инструментов, сокращая их размер с 315 КБ до 5.4 КБ, что позволяет сохранить больше информации для взаимодействия.
🚀Основные моменты:
- Сокращение данных на 98% для инструментов.
- Поддержка множества языков программирования.
- Интеграция с существующими инструментами через слэш-команды.
- Эффективная работа с логами и API-ответами.
- Умный поиск по индексированному контенту.
📌 GitHub: https://github.com/mksglu/claude-context-mode
🔥 Легендарный математик - Дональд Кнут начал свою новую научную работу словами: “Shock! Shock!”
Почему?
Потому что Claude Opus 4.6 решил открытую задачу, над которой Кнут работал несколько недель.
Речь о гипотезе разложения графов из легендарной книги The Art of Computer Programming.
Кнут даже назвал статью в честь ИИ:
“Claude’s Cycles”
Что произошло:
- Claude провёл 31 исследование
- на это ушло примерно 1 час
- Кнут изучил результат
- оформил формальное математическое доказательство
И закончил работу фразой:
> *«Похоже, мне придётся пересмотреть своё мнение о генеративном ИИ.»*
Это сказал человек, который написал библию компьютерных наук.
И назвал научную работу в честь ИИ.
Почитать саму работу можно здесь:
https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf
Типа простые смертные могут рассчитывать на честную конкуренцию или они для hrов как третий сорт?
Читать полностью…
у меня самого стадии отрицания не было, я наоборот жаждал всей душой чтобы избавиться от ручного кодинга. ибо возраст уже - в последнее время сложно было даже 3 часа в день кнопки давить. а в режиме вайб-кодинга я первые недели вообще практически не спал, и не уставал при этом
Читать полностью…
сейчас у меня, допустим, в черновиках лежит уже openclaw по тем же принципам :)
Читать полностью…
да блин, я просто сказал: "вот посмотри на n8n и запили мне такое же. make no mistakes"
Читать полностью…