evilfreelancer | Unsorted

Telegram-канал evilfreelancer - Pavel Zloi

3071

директор ИИ · инженер‑интегратор @eprogrammist | https://github.com/EvilFreelancer 20 лет в IT ∈ 10 лет в разработке ∈ 3 года в ML/AI ∈ 1 год - вайбмастер Бусти: https://boosty.to/evilfreelancer Пожертвования: https://pay.cloudtips.ru/p/937f48ac

Subscribe to a channel

Pavel Zloi

Создано в разных агентах

Вожусь с проектами в разных агентах уже вторую неделю и заметил занятную закономерность:

Если проект начат через Claude Code с Opus, то Codex через GPT его тянет плохо.

И наоборот, проект который строился на GPT через Codex, Claude Code потом причёсывает с трудом. Агент как будто не понимает чужой почерк, спотыкается на архитектурных решениях, которые другой агент принял сам для себя.

При этом проекты, которые изначально делались на слабых моделях предыдущего поколения или через Model: Auto в Cursor мигрируют на вендорлочные агенты без проблем, и Claude Code с ними работает, и Codex.

Тут как раз вспомнился недавний пост Александра @dealerAI, он разбирал исследование про то что Claude не должен проверять свой же код, потому что узнаёт знакомые паттерны и одобряет их не через анализ а через распознавание. Я тогда в комментах вспоминал про метчинг резюме, типа если сгенерить его через LLM и потом попросить её же оценить, оценка будет выше чем у похожего резюме сгенеренного моделью другой архитектуры.

Гипотеза, которая приходит в голову:
Флагманские модели при генерации кода вносят в него свой "почерк", структуру, паттерны и идиомы, которые отражают как именно эта модель решает задачи, как она обучалась и как работает, а вот слабые модели походу этого не делают, код остаётся нейтральным.


Вопрос к аудитории, есть ли у кого похожие наблюдения?
Или замечали обратное - что флагманские модели наоборот лучше "читают" чужой код?

UPD. В комментах пришли к идее что вероятно Model: Auto у курсора благодаря тому что запрос ходит в разные модели позволяет "усреднить" стиль кода, поэтому что клод что кодекс видят в нём что-то знакомое меньше хотят всё поломать и переделать.

#МесяцАгентности

Читать полностью…

Pavel Zloi

Как накачать агентов к лету:

Читать полностью…

Pavel Zloi

Маркеры AI Slop (от которых меня мутит (прям очень))

Пишу данный пост после чтения постов на Хабр и некоторых тг-каналов на которые подписан.

В данный публикации расскажу вам про признаки текста c большой долей вероятности сгенерированного моделью, когда встречаю хотя бы три из них то обычно скипаю пост, так как с моей скромной точки зрения наличествование указанных клише говорит о том, что автор решил не заморачиваться с вычиткой и тюном, а значит и мне нет смысла напрягаться в прочтении.

Начнем с банальщины…

Прорывная технология Ж: Как мы сделали О через П (в заголовке статей, нейронки любят это клише)

Если в тексте — длинные дефисы, то — вероятно — это слоп, нормальные люди — даже не знают как — их делать (спойлер, два раза минус)

Дурацкие 🤣 эмодзи 🍺 по поводу и без 👍

Горизонтальные разделители текста
———
модель будто считает, что читатель не способен различать абзацы.

«слова» в таких вот фигурных кавычках, хотя можно не придуриваться и писать "нормально"

Бесполезные двоеточия: по поводу, и без. Иногда: несколько, раз, за абзац

Все предложения, даже у списков, оканчиваются точкой.

Так же частенько встречаются:
- Очень: нудные.
- Списки: с бесполезной.
- Структурированной: информацией.

Z это Y, а не X (вот от этого мне дурно сильнее всего, хотя раньше я и сам использовал данную конструкцию, но модельки, аки Ржевский, все опошлили)

Длинные, идеально грамотные и ровные абзацы текста, как правило содержащие приблизительно два или три предложения. Полагаю такой размер связан с тем, что в современном мире людям сложно удерживать внимание на более сложной структуре подачи информации. Плюс модели сами по себе не способны генерировать лаконичный текст.

Есть ещё ряд признаков и клише по которым можно подмечать пост сгенерированный моделью, но это уже мелочи.

А по каким признакам вы выявляете нейрослоп?

Читать полностью…

Pavel Zloi

Месяц Агентности

Объявляю Июнь 2026 года - месяцем агентности!

Всем доброго времени суток! Наигравшись за прошлую неделю с разными агентами и попытками их подружить на общем проекте пришёл к идеи публично провести основательный тест агентных решений, по ходу дела рассказывать о своих приключениях.

В планах попробовать разные агентные истории которые я отправил в долгий ящик, но так и не дошел, например хаб mcp-серверов на докерхабе, сборка роя агентов, агентные операционные системы, применение агентов в спорте, создание автономных SDLC и PDLC, ну и попытаться пожить и поработать несколько дней используя в основном какой-то один кодовый агент или харнес, в массе своей я постараюсь пробовать делать разные проекты, но не будем забывать и о проекте Coddy Agent который я активно развиваю уже более месяца, в этот месяц я найду время на проведение публичных стримов.

Список агентов которыми планирую пользоваться в этом месяце:
- Cursor - на тарифе Pro ($16) - бейзлайн, с ним будут сравнивать
- ClaudeCode - на тарифе Max ($100)
- Codex - на тарифе Plus ($20)
- OpenCode - на тарифе Go ($8)
- KodaCode - на тарифе Pro (1500р)
- KimiCode - на тарифе Allegretto ($39)
- Drift - на тарифе Pro (4900р)
- CoddyAgent - это моя on-prem история, буду пробовать интеграцию с другими агентами

Ну и как вы могли догадаться из названия сие меро-прия-тие буду вести весь следующий месяц, а связанные с событием посты буду помечять тегом #МесяцАгентности и в конце месяца проведём ретро и обсудим.

Приглашаю всех желающих принять участие в эвенте, просто пишете пост, или видео, или подкаст в любой соцсети про ваши эксперименты с агентами, добавляете тег, ну а если поделитесь ссылочкой где-нибудь под моим постом с таким же тегом то по итогам месяца он попадёт в общий отчёт.

Читать полностью…

Pavel Zloi

Agent Reliability Engineer (ARE)

Размышляя на тему разработки проектов через разные агенты пришла в голову мысль, что согласование работы разных агентов в пределах одного (или нескольких) проекта ну уж очень сильно напоминает мою прошлую работу где я был в роли Site Reliability Engineer (SRE), там я занимался тем что наводил мосты между командой DevOps и командой DevTeam, к примеру запускал и налаживал процессы миграций приложений в кубер, докерилизировал, делал e2e тесты, писал всякие спеки чтобы проще было новые проекты делать клауднейтив, продвигал концепцию микросервисности.

И вот сижу так и думаю, а это ведь в чём-то похоже на согласование работы разных агентов, тут ведь тоже чтобы заставить их работать одновременно и в одном направлении надо понимать между ними различия, уметь писать универсальные рулесы, знать какие скилы и как будут работать, заниматься отладкой флоу. Есть мнение, что очень скоро (если ещё не) появится целая отдельная роль спецов которые будут шарить за агентов, я бы назвал их Agent Reliability Engineer, ещё и аббревиатура прикольная получается - ARE, сразу мысли типа ARE, who they are?

PS. Гуглёжка в сети показывает, что уже есть AI SRE, там про классический SRE но через AI агентов, а я имею ввиду немного иное.

Читать полностью…

Pavel Zloi

Через кодовые агенты провожу эксперименты на проекте Coddy Agent, мне интересно понять как разные агенты будут работать с общей кодовой базой заточенной агентную разработку, связано это с тем, что по работе у меня есть коллеги вайбкодеры и периодически возникают проблемы и нестыковки, эдакий рассинхрон.

Так что мне захотелось попробовать понять можно ли принципиально разными кодовыми агентами пилить систему сохраняя общее её видение. Ну и заодно посмотреть, что видят и чувствуют новички которые следуя моим советам начинают пробовать кодовые агенты.

Что ты построил? (фичи)


Агент и инструменты
- Рефакторинг web-инструментов, к DuckDuckGo добавил Google и Bing параллельно, результаты сливаются в один ответ
- Доработка apply_patch для патчей файлов
- Resume permission после рестарта или обрыва stream

Web UI
- Черновики сессий в localStorage, теперь можно создать пустую сессию, написать так что-то и переключиться на другую, драфт не пропадёт
- Добавил спиннер на sidebar для активной генерации, фиолетовая точка для "завершилось в фоне", ? для ожидания ответа на вопрос
- Полноценная работа с ask permission, восстановление после reload, политики allow/reject, отображение аргументов tool call
- DiffView как на GitHub для patch/diff ответов
- Улучшенные карточки tool call, анимация точек в момент генерации ответа, кнопка copy у code block
- Обновления composer (play/stop), анимации в меню, выбор и загрузка сессий

Что разрушил? (багфиксы)

- Play/Stop в инпуте (клиппинг и визуал stop-кнопки)
- Выбор и загрузка сессий через sidebar (была race condition при смене активного чата)
- Пофксил логику apply_patch, добавит поддержку разных форматов патчей

Добавил новых багов, чтобы вам не было скучно ;)

Вавилон, Вавилон (какие планы)

В следущих релизах хочу добавить:
- Возможность мимикрировать под codex чтобы не тратить токены по API
- Rollback на предыдущие стейты (полезно если были правки файлов в воркспейсе), плюс возможность редактирования сообщений (с перезапуском генерации и конечно же сохранением дерева сообщений)
- Бэкграунд задачки и возможность отсоединить run command и оправить в фон
- Шлюз для мессенджеров

Релиз Coddy Agent 0.9.10 уже на GitHub.

Читать полностью…

Pavel Zloi

Ну что я хочу вам сказать, недельный лимит codex на подписке plus я потратил за один день, pro докупать не охота, поэтому оплатил claude подписку за 20 баксов, интересно за сколько дней я потрачу её недельные лимиты?

Итого получается у меня теперь есть подписки на cursor, codex, claude и kimi, докупить что ли ещё koda для коллекции?

Читать полностью…

Pavel Zloi

Веу, Cursor сделали рефералки

Дают бонус тем кто привёл людей, поэтому если планируете прикупить себе подписку на Cursor, то сделайте это через мою ссылку:

https://cursor.com/referral?code=6SICLABLN4K6

Вам скидка, мне бонус на счёт ;)

Читать полностью…

Pavel Zloi

🎮 Самый неоднозначный девайс NVIDIA

Брал я тут в марте 7шт. DGX Spark.
Очень хотелось попробовать этот девайс давно - ещё со старта хотел его купить. Но появляться по вменяемым ценам они начали только сейчас.

NVIDIA обещала крутую производительность в FP4.

Но что мы имеем по факту?
1. Очень медленную unified memory LPDDR5x.
2. Коробки очень горячие и уходят в троттлинг. Temperature cap стоит где-то на 70C.
3. DGX Spark инференсит Qwen3.6-35B-A3B в NVFP4 со спекулятивным декодингом DFlash со скоростью 100-200 tok/s. на оптимизированном VLLM с кастомными ядрами под GB10.

Соответственно ШЕСТЬ DGX Spark в реальности у меня дают 700-1500 tok/s.
Для сравнения - ОДИН GPU RTX Pro 6000 Blackwell Workstation даёт 1000-1200 tok/s.
Нагрузка 1-в-1 одинаковая.

Простая математика
RTX Pro 6000 Blackwell стоит примерно 1-1.1M руб.
DGX Spark стоит ~500к руб.

6x DGX Spark = 3M руб. и это в лучшем случае 1500 tok/s, но 768GB памяти на скорости 273 GB/s.
Рабочая станция с 2x RTX Pro 6000 Blackwell - те же 3M руб.(дада, можно и дешевле) и 2200 tok/s, а это всего лишь 192GB VRAM на скорости 1792 GB/s.

И это я ещё не говорю про то, как в реальности работают все эти кольца из 200Gbit/s линков между тремя спарками. Спойлер: плохо.

Выводы
DGX Spark проигрывают примерно везде и по всем фронтам. Обещания NVIDIA - пустой маркетинг.
Коробки вообще никому не рекомендую даже для экспериментов, даже с QLoRa. Для трейна не годится. Для инференса - тоже.
Лучше за те же деньги собрать ПК с игровой видеокартой.

Единственное годное применение - тихий локальный AI-ассистент для дома. Вот только вопрос - сколько он прослужит с такими рабочими температурами.

Читать полностью…

Pavel Zloi

Самая бесполезная трата 8 баксов

Некоторое время назад закончилась Pro подписка на ChatGPT, продлевать особого смысла не было, но вот одной фишки прям не хватало, а именно правки и генерации картинок по описанию. Думаю ну Plus и Pro наверно покупать будет жирно, возьму что-то небольшое, скажем Go за 8 баксов.

Запускаю чат с моделью, даю картинки, прошу внести правки, она делает дичь, прошу стилизовать - тоже дичь, в общем где-то с два десятка экспериментов провёл, нормально базовая чат модель картинки генерить отказывается, по поведению она похожа на какую-то mini-бестолкушку.

Короче потраченных денег жаль, не повторяйте моей ошибки, либо берите Plus (а лучше сразу Pro), либо проходите мимо ChatGPT.

UPD. Забыл сказать, помучился на Go и доплатил за Plus.

Читать полностью…

Pavel Zloi

Продолжаю опыт по работе с документацией и тасками через mcp-atlassian, в общем нашёл своего рода дзен пользования данной системой.

Прежде всего исходники документов стоит хранить не в Markdown, а в HTML, так как это родной для Confluence формат документов, не позволяйте агенту конвертировать текст в Markdown, потеряете кучу метаинформации.

Далее, оказалось, что линковать документы через html намного проще чем через абсолютные ссылки, например:

<ac:link>
<ri:page ri:content-title="Тестовая ссылка"/>
<ac:plain-text-link-body><![CDATA[Тестовая ссылка]]></ac:plain-text-link-body>
</ac:link>

Данный код при рендере страницы будет отрисован как внутренняя ссылка.

Можно организовать рекурсивное скачивание всех публикаций пространства (включая все аттачменты) с сохранением на диск.

Ещё оказалось, что через данный MCP можно выгрузить все задачки из Jira рекурсивно, ограничив выгрузку скажем по эпику, тегам, или cпринту, или пользователю.

Плюс опять же рулить тасками и просить агента делать отписки в комментариях.

Короче мегарекомендос, это третий полезный MCP-сервер (после context7 и tgsearch) из всех что я пробовал.

Читать полностью…

Pavel Zloi

Пробежал пару кругов по пионерскому парку, встретил утку с утятами.

Читать полностью…

Pavel Zloi

Спешу поделиться новостями о проекте Coddy Agent

Зарелизил версию 0.9.0, в ней:
- добавил белую тему
- пофиксил проблему с созданием джобов шедулера, а так же добавил возможность менять job_id у задачек
- пофиксил проблему с событием ask permissions, теперь агент спрашивает можно ли выполнить команду через run_command тул и может запомнить что всегда запускать
- добавил защиту от 429 ошибки и опции для защиты от rate limits
- обновил стиль окна с сообщениями, чтобы всё выглядело ровненько и по ширине input что внизу
- в случае изменения конфигурации и если сервер не стартует после этого агент автоматически откатывается к последней рабочей конфигурации
- небольшие правки режима plan, там был тул apply_patch который модель вызывала по ошибке, теперь только тулы для чтения файлов остались

Ну и конечно же добавил новых багов, чтобы в следующих релизах было чего фиксить ;)

PS. Скачать бинарники тут.

Читать полностью…

Pavel Zloi

Послушал занятную лекцию о применении генетических алгоритмов в стратегической игре Factorio.

Читать полностью…

Pavel Zloi

Чем программист с агентом отличается от программиста без него?

Давно размышляю на эту тему, вопрос такой, вот вы оформили себе агента, он пишет за вас код, вы делаете в разы больше работы, но кому от этого хорошо? Фишка в том, что далеко не всегда вам. Вот об этом как-раз и пофилофствую, а так же о том, что с этим делать в новой публикации на Boosty.

Читать полностью…

Pavel Zloi

В рамках развития вчерашней истории про мой дзен построения минималистичных агентных решений подготовил репозиторий agent-template с двумя описанными в посте подходами, через coddy и через opencode в формате docker compose и простенького харнес.

Указанный шаблон интересен тем, что в нём ничего лишнего, только базовый функционал который по желанию допиливается в любом направлении.

PS. Там я кстати сразу подготовил интеграцию с Hub Neuraldeep, так что вам надо будет только ключик подкинуть и можно пользоваться.

Читать полностью…

Pavel Zloi

Дзен построения агентных систем

Ну чтож, месяц агентности предлагаю начать с базированного поста про то как я собираю агентные системы.

Большинство моих решений выглядят просто и лаконично, словно конструктор лего, обычно это связка из небольших кубиков в которые входят агент, MCP-серверы, консольные тулы и скилы.

Обвязку (то бишь harness) подбираю под задачу. Чем менее перегружена система, тем проще её развивать, ну и не забываю про закон Люссера, который гласит "каждый дополнительный узел в системе понижает качество её работы".


Агент - ядро

В качестве ядра системы обычно выбираю минималистичный кодовый агент, к примеру OpenCode, его запускаю в режиме Agent Client Protocol (ACP) и затем подключаю через OpenAI-прокси acpbox, либо использую мой Coddy Agent, так как он умеет и ACP и HTTP из коробки.

Реже на Ralph-loop пишу кастомные решениие, когда нужна минималистичность и возможность глубокой интеграции, а иногда беру большие агенты типа Codex, Claude, Hermes, OpenClaw, но с этим есть свои риски.

Кстати OpenAI-совместимая API-шка нужна если агент должен работать во внешнем интерфейсе, типа Open WebUI или LibreChat.


MCP - для внешних систем

Как правило подбираю готовые MCP-серверы, реже пишу кастомные решения под задачу, потому как почти все MCP-серверу уже придуманы и написаны не один раз, повторяться смысла особого нет.

Для Confluence и Jira чаще всего беру mcp-atlassian, для почты и календаря беру Google Workspace MCP от Google, иногда просят интеграции во всякие Notion, Linear, MediaWiki, у каждой системы свои MCP, их тоже подбираю в зависимости от задачи.

Реже нужны системы электронного документооборота навроде Мой Офис или Google Docs, файловые хранилища типа S3 и СУБД навроде MySQL, PosgtreSQL и так далее, тут уже смотрю, есть ли готовый нормальный MCP или проще через CLI всё настроить.

К слову сказать избранную коллекцию MCP-серверов вы можете найти в разделе MCP портала Neuraldeep.


CLI - для ёмких задач

Для редких или тяжёлых операций предпочтительнее использовать консоль, например вместо GitHub MCP берём gh, для GitLab берём glab, для S3 брём aws-cli, а для скачивания видео yt-dlp и так далее.

Консольные тулы удобны ещё и тем, что их легко собрать в скрипт, а его уже упаковать в skill, к примеру нам хочется сделать пайплайн вида yt-dlp -> метаданные в MySQL -> видео на S3, мы просим агента автоматизировать эту историю в виде шельника, затем выполнить и показать результат.

Подборочку консольных тулов в вы можете найти в разделе CLI на Neuraldeep.


Skills - когда описываю флоу

Skills я использую, чтобы научить агента работать с MCP и CLI по необходимым в рамках проекта правилам, фишка скилов в том что их очень удобно тюнить под задачу не ломая кукуху базовому агенту, плюс скилы позволяют подключать уже готовые реализации некоторых историй.

Подборочку скилов вы сможете найти в разделе Skills, опять же, на Neuraldeep.


Что и когда выбирать


Если в вашем проекте есть некая частая процедура типа поиск по базе знаний или предполагается работа с защищённой системой к которой напрямую вы доступа давать агенту не желаете, тогда лучше выбрать MCP, это безопаснее прочих вариантов, плюс тул этот всегда под рукой.

Если операция редкая и/или сложная, тогда практичнее использовать консольные тулы, в своих проектах я иногда перечисляю список команд в промте, хотя и без этого будет работать, но дольше, потому что агент будет их искать сам.

Если нужна сложная цепочка из нескольких MCP и CLI, тогда пишу скрипт и кладу его в скил, хотят тут тоже своя боль, промт заточенный под одну модель (скажем, написанный в условном opus 4.8), на другой (gpt 5.5, qwen 3.6) может давать осечки примерно 50 на 50, под каждую модель иногда приходится его тюнить.


Итого

Используя данный подход вы через любой кодовый агент сможете получить решение под свою задачу, просто пишете из каких кубиков хотите что собрать, потом проверяете результат и можете приступать к внедрению. Главное не заниматься искусством ради искусства и не раздувать систему ради красоты архитектуры.

#МесяцАгентности

Читать полностью…

Pavel Zloi

Партизанский рефакторинг - методология улучшения качества кода с устранением техдолга без ведома и санкции руководства.

Читать полностью…

Pavel Zloi

Харнесс от PewDiePie

И ещё раз здравствуйте девочки и мальчики, на этот раз я пришёл к вам с новостями про harness за авторством PewDiePie, помните был такой игровой блогер на заре ютуба? Ему ещё канал забанили за форму одной запрещённой организации, вот этот парень.

Ну и так вот, оказалось последние пару лет указанный опальный блогер развивается в направлении on-premise нейросетей и кодовых агентов, а пару часов назад он зарелизил свой собственный harness для создания автономного рабочего пространства под названием Odysseus.

Как человек с опытом первым делом в интерфейсе данного проекта прииметил стиль однотипных дизайнов Claude Code да и название как-то подозрительно отсылает нас к стилизации под греческую мифологию отдалёно созвучно с агентом Mythos от Antrpoic.

Скачал, полез смотреть в исходники, видно что систему делает человек который плохо представляет как подобные системы делать, много каких мелочей не учтено, плюс это всё же python код, то есть много зависимостей, проект перегружен кодом и так далее и тому подобное. При этом он всё же работает, его можно как докер поднять, а можно через systemd настроить, если скрипты ручного запуска и установки.

Выдал агенту указивку скачать и сравнить с Coddy Agent, получилось вот это:
Coddy Agent - это тонкий harness в одном Go-бинарнике. Он говорит по протоколу ACP (JSON-RPC over stdio), встраивается в Cursor, Zed, CI или Docker sidecar и крутит ReAct loop с native function calling, MCP, skills и project rules. UI, scheduler, memory и Telegram gateway. Философия "harness first" - coding agent это профиль поверх протокола, а не монолитное приложение. Если нужен agent-as-a-service с минимальным runtime и стандартным wire protocol, Coddy ближе к тому, что PewDiePie называл harness в контексте Aider - обвязка вокруг модели, а не весь рабочий стол.

Odysseus - другая крайность, self-hosted AI workspace на Python/FastAPI. Agent loop там тоже есть (на базе opencode, fenced tool blocks + schemas), но он живёт внутри толстого приложения вместе с чатом, Cookbook для подбора моделей, Deep Research, blind Compare, редактором документов, почтой, календарём, заметками и vector memory на ChromaDB. Это не протокольный слой для IDE, а личная AI-ОС "как ChatGPT, но у себя дома". Выбор между ними - не "кто лучше", а тонкий harness для automation и редакторов против полноценного hub'а, где agent одна из многих вкладок повседневной работы.

Если кратко, то минималистичный distroless противопоставляется мастхевному настольному приложению.

В целом данным проектом пользоваться можно, его относительно просто настроить, есть нюански в промтах агентов, видно что систему делал новичок, но полагаю она обретёт такую же популярность как в своё время OpenClaw, а потом ещё и систему хранения заметок некоей Лилу Даллас, что лично мне намекает о том, что не так важно хороший у вас агент или нет, сколько имя его создателя.

В интересное время живём.

Читать полностью…

Pavel Zloi

С каждым промтом отправленным claudecode и полученным результатом всё больше понимаю чем она так многим заходит, хотя и сам по себе агент в чистом виде мне не очень нравится, но в сочетании с методами которые месяцами оттачивал на курсоре, а так же mcp-серверами и скилами которые нашёл/написал получается очень комфортно, в целом как через кодекс, но благодаря тому что моделька чуть сильнее заточена под кодинг складывается впечатление что получается лучше, ощущение на кончиках пальцев.

Чем больше вожусь тем больше хочется устроить что-то типа большого теста разных кодовых агентов...

Читать полностью…

Pavel Zloi

Продолжаем наблюдение, на этот раз claudecode на подписке 20 баксов, сессию 5 часовую трачу в среднем за 1-3 часа, за сутки использования пред-топовой модели потратил только 20% недельных лимитов, при этом я юзаю opus 4.6 (а на кодексе была gpt 5.5).

Интерфейс у консольного приложения такой же отвратительный как у кодекс, до opencode им расти и расти, но сама работа агента, вероятно в сочетании с моделями, ощущается чуточку приятнее чем кодекс. Заметил, что мне надо реже уточнять агенту что надо сделать, обычно хватает какого-то подробного уточнения и потом если с первого раза агент делает что-то не так достаточно пары уточнений. Ах, да, забыл сказать, агентов я тестирую на исходниках моего coddy agent.

Если мои расчёты верны, то в таком режиме мне будет хвататть клода на один активный проект в один момент времени и недельных лимитов будет достаточно, но для чистоты эксперимента ещё надо проверить топовую модель, имею ввиду opus 4.8. на ней полагаю токены будут улетать будто бы их не было.

Читать полностью…

Pavel Zloi

Как я M$ Outlook 2013 с агентом подружил

Давненько я хотел реализовать поиск по базе с письмами в рабочем аутглюке 2013, самый простой вариант это не заниматься ерундой и настроить работу по IMAP, однако, оказалось что IMAP, POP и SMTP по политикам безопасности отключены, при этом к почтовому ящику можно подключиться через сайтик и через, да простит меня Линус, виндовый Аутглюк Эспрессо. Поэтому пришлось искать альтернативный вариант решения проблемы.

Первая мысля которая возникла это запилить плагинчик для браузера, чтобы моделька могла работать с письмами сразу в хроме, но мне вовремя подсказали, что можно экспортировать аутлуковичный архивчик с расширением PST (к сожалению эта фича есть только на виндовой программке), типа эдакий бэкап всех папок и сообщений.

Сделал пару экспортов, в первом папку в которую закинул пару черновиков тестовых и второй со всеми письмами. Далее выдал агенту первый архив, попросил разузнать про PST, проанализировать и написать план реализации MCP-сервера который бы подгружал такой архив и позволял в дальнейшем работать с ним словно с базой данных. В качестве ЯП выбрал Go, так как можно собирать приложения в формате одного небольшого самодостаточного бинаря.

Получился вот такой проект:
https://github.com/EvilFreelancer/outlook-pst-mcp

Работает он в два простых шага:
1. ставим бинарь:

curl -fsSL https://raw.githubusercontent.com/EvilFreelancer/outlook-pst-mcp/main/install.sh | bash

2. подключаем в IDE:
{
"mcpServers": {
"outlook-pst": {
"command": "outlook-pst-mcp"
}
}
}


После запуска в нужной папке говорим агенту что-то типа импортируй почтовый архив demo/backup.pst, по завершению в текущей директории будет создана папка .outlook-pst-mcp_data, а в ней будет извлечённый архив писем в sqlite формате и все вложения, с которым уже можно будет спокойно работать.

PS. Из занятных моментов, начал пилить код в codex, потом через cursor тестировал работу MCP-сервера и давал кодексу рекомендации о том, что надо подправить, потом как убедился что всё окей подключил историю в coddy и через него него и gpt-oss-120b сделал небольшую выгрузку с анализом писем из архива.

Читать полностью…

Pavel Zloi

Мальчик - вайбкодит агентами.
Мужчина - вайбкодит вайбкодерами.
Дед - продолжает сидеть в vim.

Читать полностью…

Pavel Zloi

Ещё один факт из серии байки капитана очевидность вам в ленту на ночь и всё на этом.

Короче апнул я значамо подписку на ChatGPT до Plus, в коменты пришли люди и начали рассказывать про codex-cli, дай думаю ещё разик попробую поставить да настроить, но как обычно упёрся в мою любимую ошибку 403 country is not supported, а мы все знаем что надо делать чтобы эта ошибка ушла.

Однако, держать постоянно включенный туннель мне не очень хочется, мне больше нравятся проксики, помню чтобы codex запустить надо было писать что-то типа:

HTTPS_PROXY="http://127.0.0.1:4242" codex

Что сами понимаете такое себе, а писать в .bashrc мне этот проксик тоже не комильфо, потому что тогда все тулы начнут ходить через него.

Полез в исходники и вижу там dotenv, в голове мысля раз codex в качестве домашней папки использует ~/.codex может он оттуда ещё и .env сможет прочесть.

Создаю такой файл ~/.codex/.env следующего вида:
http_proxy=http://127.0.0.1:4242
https_proxy=http://127.0.0.1:4242
HTTP_PROXY=http://127.0.0.1:4242
HTTPS_PROXY=http://127.0.0.1:4242
WS_PROXY=http://127.0.0.1:4242
WSS_PROXY=http://127.0.0.1:4242

Запускаю в консоли codex и... моя кантря стала супортед.

Прошерстил доку и спеки исходников, фича незадокументированная, вероятно это какой-то баг или просто авторы не знают о ней.

Такой вот простенький рецепт, надеюсь и вам пригодится.

UPD. Небольшое уточнение, на локалхосте у меня сидит http-врапер, который пробрасывает запросы на socks5, нужно это чтобы через носки можно было пускать тулы которые умеют только в http, однако, в этих переменных прописать можно любой другой проксик, хоть внешний, хоть локальный.

Читать полностью…

Pavel Zloi

Занятный факт про телегу

Оказывается у телеги на домене t.me если открывать канал через префикс /s/ открывается простой сайт со статическим html, который содержит последние 10 сообщений канала, а прокрутка уже через js-логику реализована.

Например так: /channel/s/evilfreelancer

UPD. На чатиках не работает, на приватных каналах тоже, только на публичных каналах.

UPD2. Обновляется сайтик с задержкой примерно в минуту.

UPD3. Если добавить after то можно делать пагинацию, например: /channel/s/evilfreelancer?after=1

Читать полностью…

Pavel Zloi

Запилил для проекта Coddy свой сайтик: https://coddy.dev/

Там пока только про Coddy Agent говорится и про то как выполнить установку бинарника через install скрипт, енти самые скрипт само собой тоже запилил, и под виндовс и под операционные системы.

Маленькими шажками двигаюсь к цели, создам самый хороший, удобный и надёжный harness из доступных.

Читать полностью…

Pavel Zloi

Пилякаю для Coddy Agent поддержку Rules из Cursor/Claude/Codex, при этом основной синтаксис будет как у Cursor, ну и так вот, обратил внимание на очень большое сходство между Rules и Skills, такое ощущение сложилось, что скилы придумали насмотревшись на то как работают правила и просто собрали их формате эдаких redistributable packages.

Читать полностью…

Pavel Zloi

В очередной работая с on-prem инстансом GitLab пришла в голову идея, а есть какой кодовый агент, который бы позволил работать с проектами сразу через браузер на сайтик гитлаб, оказалось что есть, штука называется GitLab Duo Agentic Chat.

На эту тему есть несколько постов в блоге:
- Introduction to GitLab Duo Agent Platform
- Get started with GitLab Duo Agent Platform: The complete guide
- Getting started with GitLab Duo Agentic Chat

Пошерстил по блогам коллег-блогеров по ML цеху и нашёл только одно упоминание этой штуки у Валентина @valuableai, в контексте поста от руководителя GitLab, но вот кейсов о практическом применении и разёртывании увы не смог найти.

Пришлось разобраться, прежде сказу скажу, Duo это обычный чатик с нейросетями, ценность же представляет режим работы агента в контексте проекта, через чатик с агентом можно рулить кодом, работать с задачами и реквестами, генерировать документацию, гонять тесты, запускать ci/cd пайплайны и так далее.

Недостатком Duo является необходимость оформлять платную подписку, нужна лицензия Premium или Ultimate и дистрибутив GitLab EE, так как из GitLab CE фича Duo вырезана под корень, что мне кажется очень странным ведь воссоздать их решение не так уж и сложно учитывая современные кодовые агенты. Ещё как я понял Duo это и есть кодовый агент, а подключить что-то типа ClaudeCode или Cursor или Codex по ACP не получится, что значит на него придётся переделывать процессы разработки, правила и спецификации.

PS. Вот тут можно посмотреть интерактивную демку, а если зарегистрироваться на сайте GitLab то можно получить 30-дневный Trial для тестов.

Читать полностью…

Pavel Zloi

https://hub.neuraldeep.ru/

Вот и случилось 1000 регистраций на хабе
Сделано 700 коммитов
5000+ рестартов гейта
Вы сгенерировали 6 млрд токенов
Вызвали Дрифт более 100 000 раз!

Спасибо, что продолжаете тестировать то, что я делаю, и спасибо Паше за помощь в разработке хаба с инфраструктурной стороны!

И на канале уже 15 000 человек! Тоже приятная новость!

А я тем временем всё глубже погружаюсь в автоматизацию разработки хаба с помощью claude code cli и codex cli (напомню, я делаю это в одиночку, и всё это — очень большой эксперимент).

Читать полностью…

Pavel Zloi

Очень захотелось запилить композицию в стиле Техновикинга не тему Властелина Колец, получился такой вот забаный шортc.

PS. В тексте много отсылочек и пасхалочек, приятного прослушивания.

Читать полностью…
Subscribe to a channel