2608
Ділюсь про те як стати продуктивнішим використовуючи AI в програмуванні.
Claude Code тепер може клікати по твоєму Mac
що сталося: Anthropic випустили computer use для Claude Code. Пишеш /mcp у терміналі, вибираєш computer use — і Клод отримує доступ до GUI. Він реально відкриває апки, клікає по кнопках, робить скріншоти, аналізує що бачить, і фіксить баги сам
у демо показують SwiftUI-апку з піксель-арт восьминогом. Клод знаходить баг (buffer overrun), править код, ребілдить, перевіряє результат.
research preview, поки тільки macOS (Pro і Max). Windows обіцяють “coming soon”, Linux — тиша, ні дати ні roadmap
чесно кажучи не до кінця розумію що це принципово змінює — з CLI можна було те саме робити вже давно. ну ок, тепер він ще й по кнопках клікає. може для тестування GUI-апок це зручніше, але революцією поки не пахне))
що в коментах: класичний 2026-й рік Anthropic. Половина пише «take my job already 😭», інша половина — «за 3 хвилини роботи з’їдає 150 лімітів, пофіксіть спочатку usage limits а не нові фічі».
x.com/claudeai/status/2038663014098899416
https://x.com/_chenglou/status/2037713766205608234
Тут навчилися дуже ефективно рахувати висоту тексту без DOM. Cheng Lou (автор react-motion, ReasonML у Facebook, зараз Midjourney) випустив Pretext — pure JS/TS бібліотеку для text measurement
ідея проста: замість getBoundingClientRect (який тригерить layout reflow і вбиває перфоманс) він юзає canvas.measureText() — той самий font engine браузера, але без reflow.
Один раз робимо prepare(), далі layout() — чиста арифметика по кешованих ширинах
різниця — 300-600x. 500 текстових блоків: DOM = 15-30мс і 500 reflow, Pretext = 0.05мс і нуль reflow
побудовано з Claude + Codex, тижнями тренували на browser ground truth по всіх мовах, емодзі, RTL. 5.6k зірок за пару днів
bun install @chenglou/pretext
🔄 Ralph technique — продовження
Після минулого поста хочу поділитися ресурсами і критикою цього підходу.
🔧Що таке Ralph loop насправді:
• Це while true bash loop який запускає агента знову і знову
• Loop існує *ззовні* агента — вбиває і перезапускає свіжий інстанс кожну ітерацію
• Source of truth — зовнішні файли (MD, JSON, progress.txt, git), не внутрішня історія чату
• Агент не йде по задачах послідовно — кожну ітерацію сам обирає найпріоритетнішу задачу з плану
• Уникає складності паралелізму — лінійна робота, менше конфліктів
⚠️Проблеми:
• Context rot все одно є — деталі губляться якщо не закріплені в зовнішніх файлах
• Плагін для Claude Code інвертує логіку — замість того щоб loop контролював агента ззовні, агент контролює loop зсередини. Постійний overflow і compaction вбивають весь сенс
• Хаотичність — процес недетермінований, результати важко передбачити
• Витрати на токени — Ralph loops споживають значно більше токенів
• Drift — агент може відхилятися від початкового задуму і ламати базові припущення
• Prototype hell — без нагляду отримаєте працюючий, але брудний код
• Потребує сильних специфікацій — без тестів, type-checking і чітких spec не працює
• Потрібен постійний oversight — не можна просто запустити і забути
❌ Коли НЕ юзати:
Якщо просто хочете щоб агент не зупинявся раніше часу — це не про Ralph
✅ Коли юзати:
• Оркестрація задач з PRD лінійно
• Дуже складні ітеративні проєкти (оригінальний автор писав цілу мову програмування)
• Коли є зовнішня персистентність і добре організована кодова база
📹 Ресурси:
• Подкаст з експертами — там небагато саме про Ralph, але загалом цікавий контент про AI-розробку
• Детальний розбір з критикою — конкретніше про проблеми і коли це працює
Сам ще не пробував, але виглядає цікаво якщо правильно облаштувати. Спробую на Селестії і поділюсь результатами)
🧵 5 типів тредів в AI-інженерії — розбираємось як працювати з агентами ефективніше
Нещодавно натрапив на цікаву концепцію від IndyDevDan — Thread-based Engineering. По суті, це класифікація того, як ми взаємодіємо з ШІ-агентами. І знаєте що? Виявляється, я інтуїтивно вже використовував деякі з цих патернів, навіть не знаючи що вони так називаються!
1️⃣ Base Thread — базовий цикл
Класика жанру: промпт → агент працює → результат. Один запит — одна відповідь. Це те, з чого всі починають, і це фундамент для всього іншого.
2️⃣ P-Thread (Parallel) — паралельний
Тут вже цікавіше! Запускаєте кілька агентів *одночасно* на різні задачі:
• Один пише фронтенд
• Другий — бекенд
• Третій — тести
Поки один думає, інші вже працюють. Але тут дуже уважно треба слідувати щоб їхні задачі не перетиналися, паралелизуйте лише те, що можна, щоб уникнути конфліктів
3️⃣ C-Thread (Chained) — ланцюговий
Розбиваєте складну задачу на фази з валідацією між ними:
• Phase 1: План → ✅ перевірили
• Phase 2: Код → ✅ перевірили
• Phase 3: Тести → фінальний результат
4️⃣ F-Thread (Fusion) — злиття
Моя улюблена тема — даєте *одну й ту саму* задачу різним агентам або моделям (Claude, GPT, Gemini) і порівнюєте результати. Часто одна модель бачить те, що інша пропустила. Fusion — це про якість, не про швидкість.
5️⃣ L-Thread (Long) — довгий
Тут вже складніше, треба дуже гарний промпт, і багато задач, іноді додаткові інструменти щоб робота не зупинялася. Також є проблема — коли контекст роздувається до нескінченності, агент починає “тупити”, втрачати інструкції і галюцинувати.
💡 Практичні поради:
• Для простих фіксів — Base Thread достатньо
• Для великих фіч — Chained з покроковою валідацією
• Для code review — Fusion (порівнюйте Claude vs GPT)
• Відчуваєте що агент “поплив”? — це L-Thread, час рестартити
Другий день користуюсь clawd.bot і дуже вражений
Насправді, ще давно були думки створити самому подібного бота, але так як це зробили тут - я б точно не став так заморочуватись
Мій кейс - скинув клоду цей сайт, описав свій кейс: бот що працює в одній групі (розробники Селестії), має доступ до продакшн бази/логів/трейсів, отримує повідомлення він мене, аналізує питання і відповідає в групі по результату
Фактично, використовує клод код на сервері (де є підписка), і допомагає швидше виявляти баги і створювати ішʼю, ну і звісно - виправляти їх
Тобто телеграм бот - це просто інтерфейс.
А ще, проєкт - опенсурсний (бот на js), тому можна попросити клода поправити його роботу так як вам треба.
Дуже дуже раджу
🤖 Cursor виклали гайд по роботі з AI-агентами
Зібрали всі best practices в одну статтю. Більшість з цього я вже юзаю в Claude Code, але це дійсно непоганий гайд для тих хто досі не став ШІ євангелістом.
Головні інсайти:
•Shift+Tab— Plan Mode, агент спочатку планує, потім кодить. Плани зберігаються в.cursor/plans/Від мене: Дуже важливо створювати план якщо очікувані зміни більше 100-200 рядків коду
• Довгі чати = втрата фокусу. Новий чат на кожну нову задачу
• Rules (.cursor/rules/) — статичний контекст для кожного чату. Skills (див. Claude agent skills)
• TDD з агентом працює найкраще — тести дають йому чітку ціль для ітерації
• Debug Mode — генерує гіпотези, додає логування, аналізує runtime. Для складних багів
• Можна запускати декілька моделей паралельно через worktrees і порівнювати результати
AI-generated code can look right while being subtly wrong
Не з першого промпту але додав візуалізацію коли говориш)
Читать полностью…
Після цих двох опитувань — ось вам корисний відос на цю тему. Там розповідають про "AI-код: хайп vs реальність" і чому люди часто роблять криві висновки.
TL;DR:
- AI реально піднімає output (більше задач/PR’ів/коду)
- рев’ю + валідація стають вузьким горлом (інколи навіть гірше по часу)
- довіра і якість ростуть, коли є тести + quality рев'ю + нормальний контекст (а не "тримай, моделько, 2 файли і роби магію")
Попросив клод кода згенерити звуки інтерфейсу через елевенлабс, деякі варіанти реально прикольні. ну і клод повністю займався промптингом цього
Читать полностью…
це як ціла команда задротів-рев'юерів, яку запхали в один плагін. Кожен «агент» там відповідає за свою порцію болю:
1. code-reviewer: Шукає баги і перевіряє, чи не наговнякав ти в стилі коду.
2. comment-analyzer: Палить, де коментарі застаріли або де ти набрехав у доці.
3. pr-test-analyzer: Дивиться, чи ти реально написав тести, чи просто зробив вигляд (check coverage & quality).
4. silent-failure-hunter: Оце топчик — шукає порожні catch блоки та місця, де помилка може «мовчки» покласти прод о третій ночі.
5. type-design-analyzer: Душнить за типи й архітектуру.
6. code-simplifier: Твій особистий ворог, якщо ти любиш оверхенд — каже, як переписати твій «геніальний» код простіше.
Можна запускати все разом через review-pr або окремо, якщо тебе цікавлять тільки тести чи тільки спрощення.
Думаєте ви готові деплоїти в прод? спробуйте в клод коді цю команду і подивитися що він знайде
Результат може вас удивить!
1. /plugins
2. Шукаємо:
plugin:pr-review-toolkit@claude-plugins-official
Зведені дані з різних джерел показують, що поширеність РАС і РДУГ серед програмістів знаходиться на рівні або дещо вищому за середньопопуляційний.Читать полностью…
Так, частка людей з розладом аутистичного спектра у ІТ-спільноті за різними оцінками коливається від ~2,6% до ~4,3%, залежно від способу опитування.
Для РДУГ оцінки коливаються в межах приблизно 5–11% (хоча офіційно діагностованих може бути менше). Для порівняння, у всьому світі близько 15–20% людей вважаються нейровідмінними (сюди входять не лише РАС і РДУГ, а й дислексія тощо)
Зокрема, глобальна поширеність саме РАС оцінюється приблизно в 1–3% (у дитячій популяції США – до 3,2%), а РДУГ – близько 5% . Таким чином, показники серед програмістів знаходяться трохи вище середніх значень по населенню, але все ще далекі від будь-яких стереотипних припущень про «половину айтішників з аутизмом» чи подібних перебільшень.
Для багатоагентної розробки він топ, бо задачі вирішує лише трішечкі гірше gpt5.2 на максималках. Але опус в рази 2-3 швидше відчувається по часу
Читать полностью…
https://pretext-breaker.netlify.app/
Читать полностью…
🔥 Вже бачили як AI-бот сам знаходить баги і робить PR?
Тепер у нас є помічник для дебагу Селестії. Скидаємо йому баг-репорт, він сам:
• Дивиться логи і контекст
• Знаходить причину в коді
• Пише звіт з локацією проблеми
• Робить PR з фіксом
• Проганяє lint
На скрінах — реальний кейс. Чомусь транскрипція не юзає smart mode. За 5 хвилин Orbit знайшов що smart_mode=False захардкоджено в коді, створив issue і PR з фіксом.
Раніше писав пост про подібне з Clawd.Bot — це воно)
Дуже зручно коли не хочеш перемикати контекст — скинув проблему в чат і пішов далі, а бот сам розбереться і зробить PR який залишається тільки змержити.
🔄 Вже чули про Ralph technique?
Є така проблема: чим більше токенів в контексті, тим “тупішим” стає агент до кінця. Ralph technique — це рішення для амбітних планів, де контексту завжди буде забагато.
🔧 Як це працює:
• Агент працює в межах бюджету токенів (зазвичай ~80k)
• Коли ліміт досягнуто — агент “вмирає” і стартує новий з чистого аркуша
• Новий Ralph читає загальний план, визначає де зупинився попередній, продовжує роботу
• Прогрес зберігається між ітераціями, але контекст — ні
По суті це альтернатива compaction (стисненню контексту). Замість того щоб компресувати історію і передавати далі — просто починаємо з нуля, але зі збереженим станом роботи.
✅ Коли юзати:
• Великі амбітні плани де контексту точно не вистачить
• Довгі цикли розробки
• Коли compaction не дає потрібної якості
⚠️ Що важливо:
Щоб Ralph працював — кодова база має бути добре організована: маленькі файли, чітко розділені плани, легка навігація. Бо кожен новий Ralph “тупий” і має швидко зорієнтуватися де він і що робити далі. Також потрібен supervision — не можна просто запустити і забути.
Фактично це клод код в телеграмі)
Читать полностью…
⚙️ Очікування vs Реальність вайбкодингу
Налаштовую собі cron job: щодня о 9:00 запускаються два sub-agents паралельно — один парсить GitHub Issues, інший лізе в ClickHouse аналізувати логи. Main Agent порівнює результати і кидає звіт в телеграм. Thinking: High. Краса!
Прокидаюсь, відкриваю телефон…
{"type":"error","message":"Overloaded"}
В Селестії новий формат резюме історії чату, публікується кожний день)
Кому цікаво в своєму чаті спробувати — додавайте її до свого чату, а я допоможу налаштувати і закину пробний баланс)
Можливо ви вже це чули, але Gemini 3.0 Pro неймовірно круто робить UI дизайн!
продовжую роботу над голосовим асистентом)
попросив джеміні зробити редизайн)
🚗 TRINITY — AI-агент на колесах від will.i.am
will.i.am (William James Adams Jr.) — американський музикант, продюсер, учасник Black Eyed Peas.
Але він також давно в tech-тусовці: інвестує в стартапи, співпрацює з компаніями типу Intel, і ось тепер показує власний AI-транспорт на CES.
Тепер розв’язка
Я спеціально підкинув цих сферичних коней у вакуумі — щоб спіймати одну штуку: коли люди бачать фразу "багів стало більше" і автоматом читають це як "якість стала гірше". Ну і зв'язав це з ШІ)
Але є неочевидні моменти, які зазвичай губляться:
- "Багів стало більше" часто означає "краще ловимо" (Sentry/логування/QA/coverage).
- ШІ-рев’ю/перевірки теж можуть зробити "більше багів" — бо починаєш знаходити те, що раніше тупо пролітало. І це не завжди погано
- Важливіше не те скільки багів, а severity + вплив на юзера.
- Є лаг у часі: інциденти сьогодні можуть виникати відразу, а помітні потім.
- Юзерів/трафіку стало більше → багів “стало більше”, бо їх просто частіше тригерять і краще видно. Те, що при 100 юзерів вилізало раз на тиждень, при 10k юзерів вилізе 100 разів на день 🙃
- І взагалі, з ШІ часто росте темп і кількість змін (PR/коміти/фічі).
Тому, багів більше може бути просто наслідком більше змін. Дивитись краще на баги на одну зміну/фічу і на інциденти після релізів (а їх буде менше, якщо будете постійно юзати ШІ-рев'ю)
От і все. Тепер, якщо хтось кидає «через ШІ стало більше багів» без контексту — ну… ви зрозуміли 😌
Продовжую свій шлях до того, щоб взагалі не торкатися клавіатури.
TL;DR по стеку:
• Викатив апдейт свого голосового асистента: тепер там є режим транскрипції.
• Забив шорткат Alt + T, який миттєво кидає розшифрований текст у кліпборд.
• Юзкейс: наговорив правки голосом -> вставив у Claude code -> асистент сам усе пофіксив
А ще нагенерив прикольних звуків з elevenlabs
Нагадую що в нас є чат, але там "своя" атмосфера (читаємо опис)
/channel/bot_devs_novice
🎊 Цей момент настав! я пишу новорічний пост 6 днів після нового року
@ai_celestia_bot тепер спілкується в пп!
Наша команда продовжує працювати в новому році і завозити класні апдейти в бота, фіксити баги, попереду ще дуже багато оновлень
Детальніше про всі оновлення робитиму пост в каналі новин Селестії ➡️.
Трохи вечірньої драми) чому відписався від ооо нейро
коротко: нещодавно додали селестію до їхнього чату на роль модератора, сьогодні знайшли edge case баг, але замість написати мені — мовчки прибрали бота і поставили бота конкурента. я виправив за хвилини, написав що це не по-товариськи. у відповідь отримав купу виправдань і посилання на непотизм. вийшов з чату — він там написав «божечки, які ж ці ваші айтішники вразливі персони»
ну ок 👍
в коментарях розгорнута версія для тих кому цікаво моє ниття)
Хочу поділитися, що дуже вражений і задоволений opus 4.5 для кодингу і взагалі автоматизації
не можу припинити юзати, дуже надійний, достатньо розумний для більшості задач, швидкий.
Хахаха
А хочете прикол? Якщо люди платять зірки в вашому боті, то за те що ця функція увімкнена - треба відвалити 15% зірок Телеграму що вам платять