boris_again | Unsorted

Telegram-канал boris_again - Борис опять

15113

life = curiosity + irreducible noise Whois: https://t.me/boris_again/1652 Лс: @btseytlin

Subscribe to a channel

Борис опять

#дайджест
Дайджест AI/ML за неделю 11-17 мая 2026 (запоздалый)

Кибербезопасность:
Слишком много для отдельных пунктов, но проходить мимо первых огоньков прекрасного будущего не хочется
Google GTIG зафиксировали первую крупную реальную ИИ 0-day атаку.
Microsoft: MDASH - обвязка из 100+ агентов на разных моделях нашла очередную кучу критических уязвимостей первого дня.
UK AISI отчёт "Cooling Tower": Claude Mythos Preview  первая модель, которая смогла пройти симулятор атаки на промышленную систему управления (в 3 из 10 попыток).
ExploitBench: на 41 уязвимости Mythos Preview довёл до рабочего эксплойта 18, остальные модели - ноль.

Vercel Zero
Экспериментальный язык программирования, спроектированный под чтение, починку и сборку нативных программ агентами, а не людьми. Structured JSON-диагностика вместо текстовых ошибок, typed repair metadata, встроенный toolchain в формате Agent Skills (совместим с Claude Code, Cursor, Codex). Компилятор уже self-hosting. Сам по себе сырой, но как проба пера дизайна agent-native языков любопытно. GitHub

UPenn: ApexGO
Итеративная оптимизация исходной молекулы антибиотиков под нужные свойства через байесовскую оптимизацию. Метрики растут, какие-то антибиотики даже эффективны на мышах.
Пресс-релиз, Статья в Nature

SenseTime: SenseNova-U1
нативно мультимодальная модель на архитектуре NEO-Unify, причём делает это единым куском без VAE и vision-энкодера. 8B параметров, генерацию 2048×2048 тянет одна RTX 5090. GitHub , HF, Препринт

Менее значительные релизы:
xAI: Grok Build - очередной Claude Code, теперь от xAI. Ранняя бета для SuperGrok Heavy. Блогпост 
SOOHAK - бенчмарк из 439 математических задач research-уровня от 64 математиков. 1 место - Gemini-3-Pro с 30.4%. Статья
Alibaba: Qwen-Image-2.0 - вышел техрепорт к 7B омни-модели для генерации и редактирования картинок. Веса всё ещё закрыты. Статья
Google DeepMind: AI-pointer - UX-концепт курсора мыши на Gemini, который понимает на что показывает и зачем. Блогпост
METR: Разработчики считают что с агентами они 3х инженеры, но по объективным замерам уже только 1.4-2х, и то METR подозревают что их методология завышает значение (узнали? согласны?). Блогпост
EVA-Bench - бенчмарк голосовых агентов, если после релизов прошлой недели вы решили делать себе вайфу или переводчик на фарси в отпуск, то вот вам бэнчмарк. Статья
MinT - инфраструктура для LoRA-пост-тренинга и развертывания миллионов адаптеров без материализации полных чекпоинтов. Статья
Visual Aesthetic Benchmark - могут ли фронтир-модели оценивать красоту? А создатели бэнчмарка? Никто не знает. Статья

Читать полностью…

Борис опять

Google Gemini Omni: новый уровень творчества

Google собрал весь мультимодальный стек в одну модель: текст, изображение, аудио, видео на вход - видео на выход.
Первая модель семейства, Gemini Omni Flash, уже доступна подписчикам.

🤖 Что под капотом: Omni принимает любую комбинацию входов (текст + фото + звук + видео) и генерирует видео за один проход модели, а не через цепочку специализированных систем. Каждая инструкция наслаивается на предыдущую: «замени скульптуру на мыльные пузыри», «когда рука касается зеркала - зеркало плывёт» - модель помнит контекст и сохраняет персонажей сквозь правки. Физика улучшена: гравитация, кинетика, динамика жидкости.

💰 Доступ и цены: AI Plus от $20/мес, AI Ultra от $100/мес с приоритетом. Пока только потребительский продукт. Vertex AI API - «в ближайшие недели». Для продакшена пока рано - нет API, нет SLA.

🛡 Безопасность: Каждый ролик маркируется невидимым цифровым водяным знаком SynthID. Google расширяет C2PA Content Credentials и запускает AI Content Detection API для распознавания сгенерированного контента.

Omni - программируемый видеодвигатель по генерации новой реальности кинематографического качества, а не просто игрушка для нейрорендера.
Вариантная реклама, обучающие ролики, визуализация продуктов, фильмы - все можно создавать без студии и привычных рендер инструментов.

#Gemini #Omni #Google #нейрорендер
------
@tsingular

Читать полностью…

Борис опять

Идёт сбор заявок на ежегодную Летнюю школу по искусственному интеллекту «Лето с AIRI». Она пройдёт в Первом университетском лицее им. Н.И. Лобачевского в Усть-Лабинске, Краснодарский край, с 21 июля по 4 августа.

В программе — лекции, семинары, постерная сессия, работа над проектами и внеучебные активности. Школа бесплатная, проживание и питание также на организаторах — участники оплачивают только транспортные расходы.

Подать заявку можно до 24 мая включительно

Читать полностью…

Борис опять

Приезжайте в Белград. Я буду выступать с докладом 31 мая! 👀

Читать полностью…

Борис опять

Я студент ПМИ, делаю курс по LLM-инженерии:

prompt-engineering, RAG, агенты, eval и продакшен - 15 модулей
с код-задачами и автопроверкой. Выходит 31 мая на Stepik (буду допиливать местами, мб, добавлю еще модули).

Планирую сделать бесплатным/низкую цену относительно других курсов.


Буду признателен, если упомянешь у себя 👉👈.

Страница курса:
https://stepik.org/course/287333

Спасибо!

Читать полностью…

Борис опять

Примерно пол года назад я писал про бота для поиска работы Софи. Ты подключаешь его в HH.ru и он помогает попасть на собеседование делая по 20+ персонализированных откликов в день.

С тех пор ребята развивали продукт:

1. Переписали парсер - теперь собирают вакансии из 110+ источников: Telegram, Хабр, LinkedIn и другие.

2. Сделали умный мэтчер - Софи теперь показывает не всё подряд, а то, что подходит именно вам
(локация, стек, грейд + обучение на фидбэке юзеров).

Следующий шаг - откалибровать мэтчер до точности 80%+, но это невозможно без реальных пользователей.

Поэтому уже скоро ребята откроют доступ к бесплатному трехдневному тесту.

Места будут ограничены и первым пользователям предлагают скидку 15% после триала.

➡️Если хотите попасть - подписывайтесь на канал, там будет анонс о наборе.

Читать полностью…

Борис опять

Привет! В неделю пет-проектов)
https://seely.ru/ - MCP-сервер к Яндекс.Метрике и Яндекс.Вебмастеру. Задаете вопрос обычным языком, например:
- "Почему упал трафик на прошлой неделе?"
- "Какие страницы в шаге от топа?"
- "Где у меня ошибки индексации?"

ИИ сам достает реальные данные и дает конкретный ответ.
Базовые инструменты Метрики (трафик, отказы, конверсии, аудитория, устройства, рефералы) и Вебмастера (индексация, запросы, битые ссылки, сайтмапы, диагностика). Только чтение, нельзя ничего изменить или удалить в яндексе.
Скоро ещё добавлю туда же MCP для Google Search Console и Google Analytics.

Читать полностью…

Борис опять

Кто-нибудь знает, что за сервис Яндекса такой YCombinator?

Читать полностью…

Борис опять

Всем привет, пишу свою небольшую хоррор-игру в нуар-сеттинге. Разработку веду в соло, поэтому помимо стека Godot, Blender и Substance Painter, использую такие нейронки, как Tripo3D и Codex.
Игра повествует об одной из смен ночного портье в далёкие 60-е годы Америки. Кому интересно, вот:
DevLog — /channel/gypsy_studio_game
Страница игры — https://gypsystudio.itch.io/pinefall

Читать полностью…

Борис опять

Боря, привет!
А можешь про мой пет проект по собакам рассказать ещё? А то смотрю у тебя на канале ещё не было реального пет проекта)))


Я биоинформатик, но жизнь и мое сердце сделало финт ушами: и вот теперь я кинолог и у меня есть курс по делай как я (когда собака повторяет за человеком). Вот такой вот действительно «пет» проект 🙃
Курс тут https://doasido.tilda.ws/
Блог тут /channel/zookinghome


PS био (и даже хемо!) информатикой тоже все еще занимаюсь, при том и не одна. Про это редко, но рассказываем в /channel/fre3power

Читать полностью…

Борис опять

Портировал CTranslate2 под мак (чипы Apple Silicon), чтобы можно было транскрибировать текст локально. На этой основе сделал библиотеку metal-faster-whisper [1], и приложение для локального транскрибирования текста CT Transcriber [2].

В последнем можно не только текст расшифровать, но еще и подключить LLM-ку, чтобы задать дополнительные вопросы.

[1] https://github.com/vsevolod-oparin/metal-faster-whisper/
[2] https://github.com/vsevolod-oparin/ct-transcriber-macos/

Читать полностью…

Борис опять

https://web.archive.org/web/20250402041136/https://pages.cs.wisc.edu/~kovar/hall.html

Читать полностью…

Борис опять

Рекламодатели, берите пример как надо заходить в холодную

И никакого ллм аутрича!

Читать полностью…

Борис опять

Привет Борис !

Разрабатываю сервис для владения и переиспользования ИИ контекста.
https://mnemonik.xyz

В настоящий момент контекст можно сохранять подключив MCP сервер в IDE
https://mcp.mnemonik.xyz/mcp

Браузерное расширение в разработке. С помощью него можно будет переиспользовать контексты между различными АИ чатами и провайдерами .

Читать полностью…

Борис опять

#дайджест

Дайджест AI/ML за неделю 4-10 мая 2026

OpenAI выпустили стразу три голосовые модели:
GPT-Realtime-2 — voice-to-voice с ризонингом уровня GPT-5. Контекст увеличили в 4 раза до 128К, есть параллельный вызов инструментов с озвучкой действий. Задержка 1.12с-2.33с в зависимости от ризонинга. Цена $32/$64 за 1M аудио-токенов, кэш $0.40/1M.
GPT-Realtime-Translate — кто-то учит язык, а кто-то модели для стримингового перевода по цене $0.034/мин с задержкой 200мс.
GPT-Realtime-Whisper — потоковая STT за $0.017/мин.
Блогпост

OpenAI: GPT-5.5 Instant
Заменяет GPT-5.3 Instant как дефолт в ChatGPT. Заявляют -52.5% галлюцинаций в ответственных темах (медицина, право, финансы) и -37.3% на реальных разговорах. Рост бенчмарков 5-15%. Ответы стали короче на 30%, эмодзи поубавили.  В общем та же разница что и между thinking GPT-5.3 и GPT-5.5. По API доступна как "chat-lates".
Блогпост, Системная карточка

Google: Gemma 4 MTP speculative decoding
Открыли веса вспомогательных drafter-моделей для всей линейки Gemma 4. Дает до 3x ускорения генерации с математически идентичным качеством. Из коробки работает в transformers, MLX, vLLM, SGLang, Ollama, LiteRT-LM.
Блогпост, HF, Ollama

Zyphra: ZAYA1-8B
8.4B MoE с 760M активных параметров и сильно сжатым KV-кэшем, что делает модель удобной для длинных контекстов на потребительском железе, тренировали целиком на AMD железе. Согласно их сайту API цены: $0.00/$0.00, ждем пока начнут доплачивать.
Блогпост, Статья, HF

Subquadratic: SubQ 1M-Preview
Единорог выпрыгнул из кустов выпустил первую LLM, в которой каждый токен сам учится выбирать на какие позиции тратить attention - это должно давать Subquadratic™ сложность. Контекст 1М и 12М в research. На длинных входах в 52x быстрее FlashAttention. По качеству на коротких бенчмарках вровень с Opus 4.6.
Веса закрыты, статьи нет, ощущения скептические.
Блогпост, Блогпост_2

Scale Labs: SWE Atlas Refactoring Leaderboard
- очередной SWE-bench, задача рефакторинга на промышленном коде. Opus 4.7 Claude Code #1 (48.57), GPT-5.5 Codex #2 (44.79). Результат

RoundPipe — pipeline parallelism для GPU. Дает 1.48-2.16x ускорение на 8x RTX 4090. Статья, GitHub

Умельцы: caveman — Вы когда-нибудь слышали что китайский язык более семантически "плотный" чем английский? На основе этого факта сделали Claude Code skill для сжатия выдачи агента с помощью перевода на традиционный китайский. Наконец подходы спидранеров пришли в вайб-кодинг. GitHub

Читать полностью…

Борис опять

Кто тоже платит 200 баксов за которая не работает половину времени: с вас по звездочке, с вас не убудет

Читать полностью…

Борис опять

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

3.5 Flash вышел!

Обещают качество уровня Gemini 3.1Pro даже на сложных задачах при скорости в 4 раза быстрее. Большой фокус на агентах и собственном клоне OpenClaw:

The new Gemini Spark, your personal AI agent, uses 3.5 Flash. It runs 24/7, helping you navigate your digital life, taking action on your behalf while under your direction.


Совсем ничего про вижн! Что печально.

Читать полностью…

Борис опять

Мои подписчики слишком продуктивные и пет-проектов слишком много. Придется сжимать в один пост

Skiller от @devall: тул для для менеджмента скиллов агентов

Мотивация простая:
• бывает в одном агенте есть нужный скилл, а в другом нет
• либо же наоборот их избыток и забитый контекст (например курсор таким страдает и тянет все со всех агентов и дублирует).
• отдельная полезная фича это установка скиллов из чужого репозитория с возможностью выбрать какие нужны
• остальное на скринах


Palatine Speech и Spectra от @Valeronich:
Palatine Speech: речевые технологии для бизнеса. Переводим аудио, видео, звонки, встречи и интервью в текст, делаем диаризацию, субтитры, краткие итоги и речевую аналитику. Это полезно, если у вас есть контакт-центр, отдел продаж, интервью, созвоны, пользовательские аудио или любой процесс, где люди говорят, а потом это нужно разбирать руками.

Palatine Spectra: компьютерное зрение для промышленной дефектоскопии. Помогаем производствам автоматически находить дефекты на линии, фиксировать отклонения и снижать зависимость от ручного контроля качества.


Бесплатный курс на Stepik "Введение в разработку ИИ-агентов" от @maks_maks1:
Стояла цель структурировать свои знания об этой области, а также поделиться с теми, кто только начинает погружаться.

Как говорится, если можешь объяснить что-то другим простыми словами, значит ты эту тему знаешь хорошо =)


Sublex: бесплатное браузерное расширение для двойных субтитров на Youtube:
Оригинал и перевод прямо поверх видео. Можно навести курсор на любое слово, увидеть его перевод в контексте, сохранить в личный словарь и потом повторять с помощью карточек. Доступно 20 языков. Полностью бесплатно.

Изначально проект начал из-за самостоятельного изучения немецкого языка, поэтому постепенно буду развивать функционал сервиса.


ai-dotfiles — менеджер фпайлов контекста для claude code от @psgorlov:
У меня была боль синхронизации скиллов и прочего для Claude Code на разных машинках и в разных проектах. При этом не хотелось создавать очередную библиотеку скиллов, а решить проблему уровнем выше. Из этой боли родился проект: менеджер файлов контекста(скиллы, сабагенты, правила), позволяющий гибко управлять ими, группировать, подключать внешних вендоров и настраивать контекст под стек проекта и т. п. В общем, что-то типа npm для контекста агентов. 🙈

Читать полностью…

Борис опять

Близится конец мая — а значит, и неделя Data Fest 😎

В этом году в Белграде пройдут целых два дня: в начале и в конце Data Fest недели

📅 24 мая — Яндекс Белград
• 8 докладов по трекам: Agentic LLM, Practical ML, CV
• Плюс утренняя активность, нетворкинг и афтепати
🗣 Язык: RU (в основном) / EN
👉 Регистрация (скоро закончится!)

📅 31 мая — Факультет ФОН
• 24 спикера по трекам: LLM, Speech, Robotics и другие
• Сбор гостей с 12:00, программа скоро появится
🗣 Язык: EN
👉 Регистрация

Регистрация на каждое событие отдельно
На входе: письмо-приглашение и документ

// Другие города и онлайн площадки датафеста тут

Увидимся 😎

Читать полностью…

Борис опять

привет, Борис!)

у нас в компании друзей постоянно поездки, посиделки в калике, ДР, шашлыки на даче – и каждый раз кто-то заводит эксель таблицу, остальные перестают ее обновлять через два дня, в чате присылают скриншоты "итого с тебя еще 800 рублей" и никто не помнит кто за что платил 🧠

Splitwise и Tricount пробовали, но там нет ocr, удобного входа через tg/vk и UI просто режет глаза

в общем, мы сели и сделали Пополаму 🍀(popolama.com): компания заводит спейс, добавляет траты по фотке чека или вручную, далее все пересчитывается и можно удобно посмотреть кто кому сколько должен

также в профиле можно добавить способы оплаты, чтобы друзья быстро понимали куда переводить деньги 💸🤑

Читать полностью…

Борис опять

Привет, Борис. Я на петпроектную неделю :)

Мы пилим курс на Stepik по AI Security / Red Teaming: https://stepik.org/course/225332/promo

Это курс про то, как защищать (и ломать) LLM-приложения: prompt injection, jailbreaks, indirect prompt injection, атаки на AI-агентов и RAG. Все заточено на практику. Курс состоит из большого набора CTF-задач. Построен на собственном CTF-тренажере.

Курс пока развивается, поэтому особенно полезна обратная связь: где непонятно, где слишком легко, где хочется больше практики.

Читать полностью…

Борис опять

Привет. Мне 14 лет, занимаюсь роботами и ИИ. Для одного проекта нужен был надёжный механизм прерывистого движения. В итоге, вместо ручного рисования шестерён, с вайбкодингом я сделал полноценный параметрический генератор самых разных мальтийских механизмов.

Там уже 17 различных параметров, экспорт STL и Fusion 360 Python-скрипта, просмотр в 3D и анимация движения.

Проект здесь: https://geneva-drive.onefile.space

Читать полностью…

Борис опять

Борис, привет! Я на астрологическую неделю — вдруг что-то зайдет.

Давно занимаюсь интерпретируемостью моделей. Помимо рисерча стараюсь делать много открытых материалов:

а) Мини курс на степике: https://stepik.org/course/228094 — бесплатный — про базовые методы и вообще интро в задачу

б) Банк туториалов по объяснению моделей — из свежего — туториалы по YOLO и GPT, также там есть материалы по важностям признаков в бустингах и методу LIME (и недавно слепила агентов на задачу интерпретировать модель): https://github.com/SadSabrina/XAI-open_materials

в) И хабр. Там, как правило, поясняю все туториалы лонгридом — https://habr.com/ru/users/sad__sabrina/

г) И канал про это всё: /channel/jdata_blog — статейки, обзоры + какой-то опыт рисерч пути в режиме «я туда иду, куда-то пришла, дальше иду»

Вот, вдруг звезды сойдутся!)

Читать полностью…

Борис опять

Привет. У меня сейчас пара пет-проектов.
Первый - я довольно плотно работаю с Клодом, трачу по три недельных лимита в неделю и прыгаю между аккаунтами. Под это завела систему быстрой работы, она доросла до состояния когда её наверно уже можно считать проектом: https://github.com/AnastasiyaW/claude-code-config. Статья на Хабре - https://habr.com/ru/articles/1022578/. Есть ещё версия для развертывания совместной работы инженеров - https://habr.com/ru/articles/1027064/.
Второй - база знаний https://happyin.space/. В первую очередь для агентов, но человекочитаема. С устареванием данных, обновляю довольно активно сама. Как устроена - https://habr.com/ru/articles/1026666/

Читать полностью…

Борис опять

Последняя часть вышла, lets fucking goooooo

Читать полностью…

Борис опять

Привет! Хочу поделиться своим небольшим проектом - @otter_sticker_bot
Это бот для удобного создания Telegram-стикеров. Он сам конвертирует изображения и видео в нужный формат, предлагает выбрать эмодзи для стикера, умеет импортировать стикеры из других паков, удалять их и работать с общими стикерпаками.
Главная идея - сделать создание стикеров проще, особенно если вы хотите вести один пак вместе с друзьями, а не каждый раз просить владельца что-то добавить.
Пользуюсь только я с другом, но у нас прекрасно живёт набор в котором уже больше 50 стикеров, добавленных коллективными усилиями)

Читать полностью…

Борис опять

nitpicker - еще одна утилита для код ревью и анализа кодовой базы.

Реализует актор-критик паттерн, благодаря чему работает долго, жжет много токенов, но иногда находит нетривиальные баги с малым количеством ложных срабатываний. Умеет использовать бесплатные модели с опенроутера (с соответствующим качеством). Не сжирает всю доступную память 🦀, минимум зависимостей. Умеет в субагенты и автосжатие контекста, используется кем-то, кроме автора.

Читать полностью…

Борис опять

Чёрт, бот пробанил в комментах. Привет ) Я полгода назад клод кодом навайбкодил https://respect-ai.com/ :) Идея типа - запиши сообщение в блокчейн выражая респект ИИ пока не стало поздно 😁 ну и кто запишется - тот спасётся 😁 но нигде не пиарил и в маркетинг не пилил) просто как концепт запилил )

Читать полностью…

Борис опять

Borealis - как обучить audio llm по цене макбука

Вообще учить аудио модели сложно если речь идет про TTS, а вот audio llm - не сложно и весело. Год назад в рамках стажировки в Вихрях Илья начал делать audio llm для русского, потом у меня стало меньше времени и по итогу я только сейчас сел доучить модели, доделать блог и инетграции с vllm(чем я горжусь).

Читать и листать про то как учить с НУЛЯ аудио модели

https://huggingface.co/spaces/AlexWortega/borealis-blog - тут на русском и английском
https://x.com/justALEXWORTEGA/status/2054153630639403307 - а еще в твитере

Читать полностью…

Борис опять

Борис, привет! сделал бота + миниапп @fittrace_bot для голосового логирования тренировок - можно просто наговорить, что делал, а он разложит и запишет в прогресс

делал для себя, но вдруг кому-то ещё будет полезным

ui и некоторые вещи ещё допиливаю

Читать полностью…
Subscribe to a channel