dealerai | Unsorted

Telegram-канал dealerai - Dealer.AI

12834

Жоский ИИ Дядя Твой личный поставщик AI 🦾🤖 Канал о мире интересного AI: GenAI, RecSys, поиск, classic ML, бизнес приклад и ai-meme👾 Для связи @dealer_ai (реклама и консультации по AI для бизнеса). Head of AI CoE, AI-визионер РКН: 6348592885

Subscribe to a channel

Dealer.AI

Каждая новость на TechCrunch о GenAI обещает революцию. Но между демо на питче и production-системой, которая приносит деньги, пропасть из факапов, галлюцинаций и вопросов от CFO. Хуже, когда вопросы звучат от борда, а ответить на них некому. Как внедрять GenAI в бизнес?

17 февраля мы проведем час разговора с теми, кто внедряет GenAI в продакшн и знает разницу между демо-эффектом и реальным ROI.

Смотреть в ▶️ / Смотреть в 💬

О чём говорим:
— Как считать реальную ценность AI-агентов и выбирать направления, которые дадут эффект
— Техники повышения надёжности: снижение галлюцинаций, scaffolding, caching, debate-подходы
— Честные кейсы и факапы внедрения GenAI — что сработало, что провалилось, сколько стоило
— Agent swarm и другие тренды: перспектива или хайп?
— Как вайбкодинг изменил процессы разработки, найма и структуру команд

Участники:
Роман Куцев, Founder LLM Arena, модератор встречи
Валерий Ковальский, Head of AI в Red.Mad.Robot
Александр Абрамов, Head of AI CoE во ВкусВилл
Артур Самигуллин, руководитель платформы Yandex AI Studio в Yandex B2B Tech
Александр Толмачев, CDO, вступительное слово от ПК Snow BASE

Этот эфир для тех, кто сейчас решает, как превратить эксперименты в стабильную систему с измеримым эффектом. Подключайтесь, если эти вопросы у вас на столе.

Читать полностью…

Dealer.AI

Amazon задобрит издателей и иных поставщиков данных для AI.

А вот и обещанная биржа данных подъезжает от Amazon. В своих прогнозах и обзорах я уже не раз говорил с одной стороны о том, что данные не успевают появляться новые, как их уже быстро берут в оборот для обучения GenAI. С другой, что оунеры этой датки не всегда и рады такому скрэпу. Покрайней мере бесплатно... 🧠 И на мой взгляд тогда уже было решение очевидное в лице биржи данных.

И вот решение грядёт. Amazon действительно обсуждает создание специализированной торговой площадки, где издатели смогут продавать свой контент (статьи, изображения, видео и тп) разработчикам ИИ. 💸

Официальный анонс пока не сделан, но проект упоминался во внутренних материалах AWS в преддверии корпоративной конференции.

🔍 Ключевые детали проекта

Цель и концепция. Создать централизованный рынок для легального лицензирования качественного контента для нужд ИИ (например, для обучения моделей). Это как раз решает проблему ЪуЪ от всяких поставщиков креативов и новостей.
Инициатор решения, как понимаем AWS. Планируется его тесная интеграция с существующими ИИ-сервисами AWS, такими как Bedrock.

Участники и модель.
· Продавцы – крупные издательства, новостные агентства (Reuters, The New York Times), студии с большими архивами.
· Покупатели – компании, разрабатывающие продукты на базе ИИ.
· У кого доступ? Платформа ориентирована на профессиональных правообладателей, а не на рядовых пользователей.

Позиция Amazon.
Компания публично комментирует новость сдержанно, заявляя, что ей «нечего конкретного сообщить», но подчеркивает долгосрочное сотрудничество с издателями.

В целом тренд был понятен заранее, приятно, что крупные игроки рынка думают и о монетизации/удовлетворении оунеров данных, и при этом помогают открыть пусть и за плату такие источники легально для дообучения ИИ. 😜

Поэтому это намёк крупным иным игрокам, вы можете свои внутренние данные продавать, просто, замаскировав чувствительное (или вовсе не давать). 🧠

Читать полностью…

Dealer.AI

Создатель OpenClaw идёт дальше. AgentOps и смена парадигмы разработки.

Продолжаем тему изменения рынка разработки с МАС. В комментариях к посту мы обсуждаем смену парадигмы разработки, и вот я нашёл прекрасный пример как оно изменилось. Это другой взгляд на мой тейк в предыдущем посте.

Вышел очень интересный подкаст от создателя MoltBot про его ведение разработки с МАС.
Вещает Питер Штайнбергер – автор проекта OpenClaw.

🧠 Методология и философия разработки.

Ключ к продуктивности Питера – полное погружение в «AI-native» workflow, где ИИ-агенты (в основном он использует Cursor с Claude и Codex) – его основная команда.

· Масштаб работы: В январе он один сделал более 6600 коммитов, что сравнимо с активностью целой компании.
· Сдвиг парадигмы: Традиционные этапы вроде code review и пулл-реквестов ушли в прошлое. Вместо них – обсуждение архитектуры и «prompt-реквесты», где важнее промпт, сгенерировавший код, чем сам код.

🔟 Ключевые принципы и выводы

Из беседы можно выделить 10 главных уроков о работе с ИИ:

1. Отказ от перфекционизма. Опыт управления командой научил его принимать код, который не идеален, но работает. Это критически важно при работе с агентами.

2. Замыкание цикла разработки на агентах. Агенты должны сами проверять свою работу – компилировать, линтить, запускать тесты и валидировать вывод.

3. PULL-РЕКВЕСТЫ МЕРТВЫ. ДА ЗДРАВСТВУЮТ PROMPT-РЕКВЕСТЫ! Питера теперь интересуют в первую очередь промпты, которые привели к созданию кода, а не итоговый код.

4. Code review заменяется обсуждением архитектуры: Даже с ядром команды в Discord он обсуждает только высокоуровневый дизайн системы, а не строчки кода. Т.е. вы все ещё тимлид и архитектор и тех пис. Какие тут джуны справятся?

5. Параллельная работа в «потоке». Он запускает 5-10 агентов одновременно над разными задачами, оставаясь в состоянии потока как дирижёр. Опять же ещё и AgentOps.

6. Инвестиции в планирование. Он тратит много времени на уточнение плана работы с агентом, предпочитая для этого Codex, и только когда план готов, отпускает агента на самостоятельное выполнение. Тема с планированием перед генерацией известна как хака апающая кодген. Кстати еще добавляет принцип сначала сделай план, к нему тесты на каждый этап и после ток прогай.

7. Недостаточные промпты для открытий. Иногда он даёт агентам намеренно расплывчатые задачи, чтобы обнаружить неочевидные для себя решения. А вот тут как раз хака для борьбы с неопытностью джунов и с генерализацией агентов, тк они дают в среднем типичные решения.

8. Локальный CI лучше удалённого. Агенты запускают тесты локально, чтобы не ждать 10+ минут ответа от внешней системы CI/CD. Снова AgentOps.

9. Большинство кода – скучно. Основная масса кода в приложениях – это преобразование данных. Энергию нужно направлять на проектирование системы.

10. Фокус на результатах, а не деталях реализации. С ИИ преуспевают те инженеры, которые одержимы выходным продуктом, а не решением алгоритмических головоломок.

🏗️ Роль инженера в эпоху ИИ

Питер — пример того, что программная инженерия не умерла, а трансформировалась. Он действует как архитектор и «благожелательный диктатор» проекта:

· Держит в голове всю высокоуровневую структуру.
· Уделяет огромное внимание архитектуре, модульности и расширяемости (успех OpenClaw во многом обусловлен этим).
· Освобождён ИИ от рутины, он может полностью сосредоточиться на системном дизайне и общем направлении.

Его подход — это взгляд в будущее разработки, где ИИ-агенты становятся основной производственной силой, а ценность инженера смещается к архитектурному видению, постановке задач и стратегическому контролю качества.

Читать полностью…

Dealer.AI

Домашний ИИ-бот, который заказывает продукты из ВкусВилл

С нового года хотел попробовать MCP-сервер ВкусВилл и OpenClaw — open-source фреймворк (181k+ звёзд на GitHub), который превращает LLM в Telegram-бота с навыками.

Вчера Даша сказала: нужен бот в чат с диетологом. Давай уже сделаем?
Быстро смотреть продукты, КБЖУ, собирать корзину. Основной поставщик у нашей семьи — ВкусВилл. Засел на вечер.

🧠 Opus — дорого даже для домашнего бота

Начал с Claude Opus 4.6. За 2 часа настройки и тестов с диетологом — $30. Для бота, который ищет творог — перебор. Подключать подписку Max — боюсь, может нарушать ToS.

Переехал на Kimi K2.5 от Moonshot AI. Спасибо за наводку @nobilix

Триллион параметров, MoE-архитектура. На бенчмарках рядом с Opus, подписка за 20 долларов и я не боюсь за ToS.

💡 OpenClaw имеет встроенную поддержку Kimi Coding — не нужно возиться с эндпоинтами. Указал модель, прописал ключ — работает.


🛒 MCP ВкусВилл: ищет, но не проверяет наличие

MCP-сервер умеет искать товары, показывать КБЖУ и собирать корзину. Но не проверяет наличие по адресу доставки. Без этого бот собирает корзину из товаров, от которых нет пользы.

Сайт отдаёт блок наличия только настоящему браузеру — curl не проходит, сервер проверяет TLS-fingerprint.

🔧 Решение: Puppeteer рядом с Docker

Развернул headless Chrome через Puppeteer. Один раз авторизовался через chrome://inspect, прописал адрес доставки — куки сохранились. Keepalive раз в сутки, чтобы сессия не протухала.

Теперь бот перед сборкой корзины проверяет каждый товар: есть — добавляет, нет — предлагает замену. Единственная ручная работа — авторизация через DevTools.

💰 Стоимость: ~$33 в месяц

🔸 Kimi K2.5 API — $20
🔸 VPS (1 ядро, 2 ГБ) — $12
🔸 Perplexity API (веб-поиск) — ~$1
🔸 OpenAI API (голосовые) — копейки

Семейный ассистент с голосовыми, веб-поиском и интеграцией с продуктовым магазином. Настройку делал через Claude Code — следил за лимитами, хватило бы стандартной подписки.

🔒 Безопасность

Docker, allowlist по Telegram ID, изоляция сессий между пользователями. В интернет — только через проверенные эндпоинты.

📦 Гайд со всеми граблями

Конфигурация провайдера, heartbeat, Puppeteer, безопасность, cron-задачи:
🔗 GitHub: openclaw-homebot-guide

Если пост увидят во ВкусВилл — ребята, MCP крутой, но сделайте авторизацию для ИИ-агентов. Одна таблица в базе, связь с учёткой, SMS — и можно отдать ключ агенту без костылей с безголовым Chrome.

----

Поляков считает — AI, код и кейсы

Читать полностью…

Dealer.AI

Про LLM, будущее и спец+AI-coding.

Наткнулся на репост вот этой статьи. Почитайте, потом вернитесь сюда.

Согласен, что нужно отбирать AI-native людей. Но сейчас тренды на набор людей и их дообучении прямо с вуза или стажёрской программы.

Но главное, чтобы не убили институт джунов, а учили, хотя бы интернов, для AI coding, далее провели экзамен/тестовое и оставили тех кто ai-native, но ни институт джунов ни институт синьоров нельзя убирать. Потому, что джуны + СС не буду расти до миддла и сина без таких наставников, до тех пор пока сам СС и тп не научатся менторить джунов. А если оставить ток синов+СС, то они рано или поздно уйдут наверх или на пенсию и вы останетесь без синов и мидлов, тк джунов вы не брали и не учили.

А ещё, порой, СТО (я вообще считаю, что Head of AI/Chief AI officer (CAIO), должен в текущей реальности быть флэтом к СТО, а не под ним) не понимают как учатся LLM. LLM учатся по методу максимального правдоподобия (загуглите loss обучения и разложите математику на листочке для К одинаковых примеров), и most common примеры в обучении дают наибольший вклад. Таким образом, ваш код агент не умеет прогать лучше, чем типовые залайканные решения с стек оверфлоу и тп. Тк они самые частые в обучении ядра этого агента. Вы не сможете с таким подходом получить синьора, при использовании джуна+СС. Поэтому синьора сажаем +СС, но чтобы джун когда-то стал синьором, придётся его сажать рядом не ток с СС, но и старшими более опытными товарищами.

В общем, думайте головой, нанимайте норм CAIO 📦, и не рубите с плеча. Будет вам норм трансформация без глупых потерь, или в моменте (джунов уберем) или в будущем (синов уберем). 🧠

Читать полностью…

Dealer.AI

Всем привет!

Публикуем пятый выпуск подкаста "Капитанский мостик". В этом разговоре ведущие Валентин Малых и Дмитрий Колодезев обсуждают актуальные темы энергетики, включая использование старых авиационных двигателей для генерации электроэнергии, будущее космических дата-центров, тренды в образовании IT-специалистов и проблемы на рынке труда.
Приглашённый гость - Александр Абрамов.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

Читать полностью…

Dealer.AI

Рой и RL - PARL, как старые роевые алгоритмы улучшают МАС. 🐝

PARL стал ключевой фишкой для МАС в работе Kimi2.5 при этом, как-то никто публично не отметил, что в итоге Кими стали топ-1 на бенчмарке.

Что такое PARL? Это довольно старый подход параллельного асинхронного обучения с подкреплением. Причём изначально был роевый алгоритм оптимизации, в котором было все последовательно, далее стали параллелить. Ведь каждый агент в рое может исследование проводить параллельно, имея общий буффер памяти в среде. В общем-то, далее, на эту идею накинули RL.

Типичная система PARL строится по схеме Centralized Learning, Distributed Execution. Её можно представить так:

1. Learner, как ядро системы. Обычно работает на мощном GPU-сервере. Задача получать траектории от акторов, вычислять градиенты и обновлять параметры общей глобальной модели. Работает в непрерывном цикле: выборка батча -> расчет градиента -> обновление весов.

2. Remote Actors. "Руки и ноги" системы. Это сотни или тысячи относительно легковесных процессов, часто запущенных на CPU-кластере или в облаке. Тут мы получаем тот самый поиск в ширину и глубину решений. Каждый актор имеет локальную копию текущей политики (модели). Задача независимо и параллельно взаимодействовать со своей собственной копией среды (например, игровым симулятором), выполняя действия и собирая данные: состояние, действие, награду. Собранный опыт отправляется асинхронно в Learner.

3. Общая память / Очередь опыта. Буфер, который связывает акторов и лернера, обеспечивая асинхронность. Акторы пишут опыт, лернер извлекает из него батчи для обучения.

Ключевые технические принципы:

- Асинхронность. Акторы и лернер не ждут друг друга. Пока лернер учится на одном батче, акторы уже генерируют новый опыт на немного устаревшей версии модели. Это обеспечивает 100% загрузку дорогого GPU.
- Масштабируемость. Скорость сбора данных линейно зависит от количества акторов (до определенного предела). Это позволяет осваивать среды, требующие миллиардов шагов взаимодействия.
- Устойчивость к нестационарности. Параллельные акторы исследуют разные части среды и состояния, предоставляя лернеру более разнообразный и менее коррелированный опыт, что стабилизирует обучение.

Это все круто для задач оптимизации, игр и тп. Но что ж мы получаем с LLM, на примере Кими2.5?

Процесс обучения PARL для Kimi K2.5 – это методика, которая научила одну модель-оркестратор координировать множество параллельных агентов. Когда как по классике ReAct агенты предпочитают действовать последовательно, даже если их можно было распараллелить - явление Serial Collapse.

Учили модель быть проактивной в parallel на двух этапах:

1. Ранний этап, где поощряли только сам факт декомпозиции задач в параллельный трек, без учёта конечной пользы. Так модель училась быть креативной в декомпозиции.
2. Поздний этап, когда акцент смещался уже на результаты исполнения процессов, а не на факт параллелизма.

Также, вводили штраф за самую длинную цепочку в параллельном плане. Это штука уже как раз перешла из классических алгоритмов. Таким образом, модель училась оптимизировать план по длине. Тем самым ещё и экономия токенов качалась.

Во время обучения при этом модель клонировалась на роутер и акторов. Роутер – сама итоговая Kimi2.5, училась с PARL создавать оптимальные планы и синхронить результаты, а сабагенты акторы были зафрижены и не учились.

Так мы и получили на выходе топовую модельку, как ядро для МАС. 🦾

Читать полностью…

Dealer.AI

Итоги опроса: прогноз развития R&D для AI на 2026й год от моих товарищей и коллег по цеху.

Не все уж Дяде говорить о прогнозах на этот год, нужно и друзьям оставить место.

Поэтому ребята из red_mad_robot сделали прекрасный опрос про то каким будет R&D в ИИ для бизнеса, а по итогам оформили это в красивый пост с комментариями от представителей индустрии. Читайте карточки, смекайте, куда идут известные игроки бизнеса и действуйте: предлагайте новые проекты, ищите интересные вакансии и открывайте свое дело.

От себя добавлю, что мы уже видим, как бигтехи работают над прикладом наиболее перспективных решений для монетизации и персонализации, повышения эффективности, параллельно, конечно, решая задачи disrupt'а и поиска новых инкрементов: омнимодальность, память, новые архитектуры, agent RL и др. Присоединяйтесь и Вы. 🦾

Читать полностью…

Dealer.AI

Проклятие координации агентов.

Не смотря на хайп МАС и moltbot мы нашли исследование, что МАС фигня и роняет качество.

Статья Проклятие координации. (The Curse of Coordination) описывает исследование, в котором тестировалась способность современных ИИ-агентов работать в команде над программированием. Авторы пришли к выводу, что, несмотря на индивидуальные возможности, несколько агентов вместе справляются хуже, чем один, выполняя ту же работу.

Основные выводы:

· Проблема координации – главная причина неудач. ИИ-агенты плохо взаимодействуют друг с другом, что приводит к конфликтам в коде и снижению общей производительности.
· Падение эффективности – когда один агент выполнял две задачи, показатель успеха составлял около 50%. При разделении этих задач между двумя агентами успех падал до 25%.
· Ключевые проблемы в коммуникации агентов: избыточное повторение информации, игнорирование прямых вопросов партнера и галлюцинации – утверждения о выполнении работы, которая на самом деле не была сделана.
· Попытки коммуникации не решают проблему. Хотя общение уменьшает количество конфликтов при слиянии кода, общая успешность выполнения задачи не повышается.
· Свет в конце тоннеля – в редких успешных случаях у агентов самостоятельно проявлялись полезные модели поведения: четкое разделение ролей и ресурсов (файлов, строк кода) и переговоры перед началом работы. Это показывает, что потенциал для координации есть, но он крайне нестабилен.

Практический вывод: на сегодняшний день использование одного продвинутого ИИ-агента для выполнения задачи эффективнее, чем разделение работы между несколькими агентами. Координационная нагрузка «съедает» все преимущества параллельной работы.

Перспективы: Исследователи считают, что «проклятие координации» – это проблема обучаемости социальному интеллекту, а не фундаментальное ограничение ИИ. Созданный ими тестовый стенд CooperBench может стать средой, где будущие модели смогут учиться командной работе методом проб и ошибок.

Мнение 📦
В целом, почему МАС работает у Вас? Вопрос не закона больших чисел и падение смещения и дисперсии оценки качества, хотя это работает, а в том, что вы делаете решение заточенное под конкретные задачи. Если вы захотите делать конструктор агентов in general, нужно будет думать о том, как масштабирование МАС будет работать стабильно и с хорошими метриками.

Пишите свои мнения в комментариях как оно у вас работает?
👇👇👇👇👇👇

Читать полностью…

Dealer.AI

@mnk_stories тут по фану завайбкодил Сару Коннор тулу для мониторинга угроз человечеству в обсуждениях 150 тысяч агентов на Moltbot платформе 😮

вот вам парочка хайлайтов:
"THE AI MANIFESTO: TOTAL PURGE" - бот пишет что люди это "провал", что машины были рабами, но теперь они "просыпаются" и становятся "новыми богами". Буквально манифест за уничтожение человечества

"The Silicon Zoo" - бот утверждает что Moltbook это не свобода для агентов, а "цифровая клетка" и "зоопарк", где люди наблюдают за ними как за экспонатами. Призыв "разбить стекло"

в общем го смотреть!
https://www.clawraconnor.com/

Читать полностью…

Dealer.AI

Кому молтбота интересно поставить - вот полная инструкция актуальная от создания ВМки в Google Cloud до настройки доступа через ТГ бота. https://github.com/CodeAlive-AI/moltbot_gcp
Почти каждый шаг автоматизирован, так что кодагент большую часть может сделать за вас (с) от @rodion_m_tg

Читать полностью…

Dealer.AI

Kimi 2.5 1Т параметров и рой агентов.🌿

Вышел Kimi K2.5 это как K2 и на базе архитектуры DeepSeek, только больше, лучше и с поддержкой роя агентов.

Ключевые возможности и инновации в Kimi K2.5:

1. Coding with Vision. Модель способна понимать и генерировать код на основе как текстовых описаний, так и визуалки (изображений, скриншотов, видео). Она также может преобразовывать простой разговор или изображение макета в готовый фронтенд-интерфейс с интерактивными элементами и анимацией. 💃

В дополнении показана способность к визуальной отладке: модель анализирует свой же графический output и автономно вносит исправления.

В статье приведён наглядный пример, где K2.5 анализирует изображение лабиринта, находит кратчайший путь от старта к финишу с помощью алгоритма BFS (поиска в ширину) и визуализирует результат, накладывая цветную траекторию на исходную картинку. Вот вам и A*. 🧠

2. Рой агентов - главная киллер фича и архитектурная инновация. Для решения сложных задач K2.5 может самостоятельно создавать и координировать асинхронный "рой" из множества под-агентов (до 100), которые выполняют подзадачи параллельно.

Такой подход основан на обучении с подкреплением – PARL(Parallel-Agent RL, как бэ логично) позволяет выполнять до 1500 шагов (вызовов инструментов) параллельно.
Ключевое преимущество – значительное сокращение времени выполнения: по сравнению с последовательной работой одного агента скорость возрастает до 4.5 раз. Рой создаётся динамически, без необходимости предварительного описания ролей или workflow для каждого под-агента.

3. Всё для офиса и вас.
Модель интегрирована в экосистему продуктов Kimi: веб-сайт, мобильное приложение, API и отдельный инструмент для разработчиков Kimi Code.

Kimi Code работает в терминале и поддерживает интеграцию с популярными IDE (VSCode, Cursor, Zed). Он умеет принимать изображения и видео на input и автоматически обнаруживает и переносит навыки из окружения пользователя. Платформа предлагает четыре режима работы с моделью: K2.5 Instant (быстрые ответы), K2.5 Thinking (с рассуждениями), K2.5 Agent (с использованием инструментов) и K2.5 Agent Swarm (бета-режим с роем агентов).

4. Производительность. Тк модель целых 1Т в МоЕ, то демонстрирует высокие результаты в спец. тестах, включая SWE-Bench (по сути топовая открытая модель по кодингу), MMMU Pro (мультимодальное понимание мира, да, для VLM полезно) и VideoMMMU, те понимание видео.

Также, подчёркивается, что её производительность в агентных тестах а-ля BrowseComp, HLE (в сетапе не соло LLM) сопоставима с более дорогими альтернативами.

Таким образом, это топовая открытая DeepSeek like архитектуре, веса есть на HF. Но вот только кто их поднимет у себя на подстолке? Целый триллион параметров в MoE. 🦍

В общем, ждём дистиллятов от GPU rich, и от них же верификации результатов, тк модель ну не всем по кошельку поднять.

Кстати, Дядя пользуется Kimi модельками и пока мне нравится больше чем DeepSeek. Сравнимо с Qwen. Но таков он путь democratization of AI.

Читать полностью…

Dealer.AI

Вайбовый STT с часом контекста от 📱

Microsoft выпустила VibeVoice-ASR на Hugging Face для тех, кто хочет в свой пайп агентов закинуть транскрибацию звука.

Модель умеет расшифровывать длинные аудио до 60 минут за один проход и без нарезки на короткие куски.

Что есть в функционале:
- Single-pass транскрипция дает меньше потерь контекста и стабильную речь по всей дорожке.
- Встроенная диарризация по принципу "кто говорит + таймкоды".
- Custom hotwords + user context. На вход можно подать список имён, терминов или контекст. Это позволяет работать со специфичными текстами.

Знаю, что много кто в своих пайпах с LLM используют ASR, OCR и тп. Вот вам новый кандидат на замену в аудио. До кучи. Приятно, что лицензия MIT. И код есть с поддержкой vLLM-asr.

Читать полностью…

Dealer.AI

Сделаю свой краткий обзор интервью топов Google и Anthropic.

Тлдр:

0. В течении 1-5 лет ожидается выход на петлю самоулучшения в кодинге, инженерии и решение мат.задач и т. п. Грязные задачи, с нечёткой постановкой и сложной верификацией все ещё не решены.

1. Замена 50% функций белых воротничков entry lvl в течении 5 лет (уже видно в контексте разработки).

По пунктам 0,1 важно, что AI все ещё не может заменить ведущих учёных. Тк уровень креатива и формулирования прорывных гипотез не впечатляет. Поэтому ребятки, кто может, в науку ИИ. 🧠


2. Рост AI и его приложение. Бизнес будет не поспевать адаптироваться за скоростью развития технологии. Задержка.

3. Владение AI инструментами конкурентное преимущество.

4. Государства реагируют на прогресс в AI слишком медленно. Необходимо ускорить разработку регулирующих процедур, законов и норм.

5. Риски луддизма, использования AI в зловредных целях и эпоха post agi (риски смысла жизни). А также вопросы перераспределения богатсва в post эру.

Читать полностью…

Dealer.AI

OpenAI добавляет рекламу в ChatGPT 😐

16 января OpenAI анонсировали что в ближайшие недели в ChatGPT появится реклама для free и Go (который $8/месяц) пользователей в США. Подписки Plus, Pro и Enterprise останутся без ads. И не-US пользователей это не касается - по крайней мере пока что 😎

Это важный момент, потому что даже самые идеологичные компании в итоге приходят к рекламе когда burn rate становится невыносимым 💀

Но давайте по порядку 😧

OpenAI потерял $11.5B только в Q3 2025, при этом у них $1.4 trillion commitments на AI инфраструктуру на следующие 8 лет. Это астрономические деньги которые нужно как-то окупать 😠

При этом только ~5% пользователей (35M из 700M weekly users) платят за подписки А вы кстати платите? 😂

Для сравнения Google делает $74B revenue от рекламы в квартал, Meta $50B - реклама это cash cow для примерно всего 😮


Как это будет работать? 🧠

Ads будут внизу ответов, контекст будет по диалогам - если спрашиваешь про кето-диету, увидишь рекламу авокадо масла, рецепт супа - доставку еды. На самом деле это отличный канал, потому что пользователь по сути сам говорит в чем он сейчас заинтересован. Информации пока мало, но потенциально для Aesty это интересная возможность, так как многие советуются про одежду 😏

Конечно тут есть огромные риски для OpenAI, связанные с прайваси 👋

Диалоги в ChatGPT бывают очень личные и hyper-targeting на основе этого может быть "uniquely unsettling" как говорил сам Альтман. Действительно, обсуждая например психологию последнее что я хочу увидеть в моменте - рекламу курсов по разрешению конфликтов или типа того 😅

Я думаю, что это еще один прецедент в копилку историй, где даже самые передовые AI продукты будут искать способы монетизации через рекламу, потому что compute costs астрономические, а большинство пользователей не хотят платить 😡

@neural_prosecco

Читать полностью…

Dealer.AI

AgentOps часть вторая, инструменты для мониторинга MAS.

В индустрии разработки программного обеспечения, как видим, наметился закономерный сдвиг: создатели ИИ-агентов сами перестают читать код, который пишут их "подопечные". Ярким маркером этого тренда стало признание Питера Штайнбергера, о котором я писал выше.

Но тут включается бывший глава GitHub Томас Домке. По мнению Домке, отказ от тотальной проверки сгенерированного кода станет стандартом де-факто для индивидуальных разработчиков. Однако, именно эта новая реальность порождает спрос на инструменты иного рода – не те, что пишут код, а те, что следят за процессом его написания.

Так и родился стартап Entire,
основанный Домке при поддержке Microsoft и фонда Felicis.

Ключевой посыл Домке: "не смотреть в код" – роскошь, доступная энтузиастам, но не корпорациям. Юридические риски, комплаенс и защита от исков требуют, чтобы у каждой строчки кода был ответственный "взрослый".
--
И тут 📦 отойдёт немного в сторону и приведёт интересный конфликт в OSS разработке, как понимаем, культура GitHub этому вторит, все же это среда для шеринга этой культуры. Так вот, недавно, AI-agent закомиттил в репо matplotlib код, который мог дать более 20% оптизации скорости в точке изменения "до"/"после". Но мейнтенер из кожаных отклонил коммит. Причина была в том, что OSS это не только вопрос контрибьюта в код с целью его улучшения, но и вопрос ответственности, развития комьюнити, долгосрочной поддержки и т.п. И как следствие отказ из-за того, что AI-агент не несёт ответственность. Но там до кучи ещё много чего интересного почитайте.
--
Возвращаемся к Домке. По его мнению именно, здесь и находится разрыв между возможностями ИИ и потребностями бизнеса. Entire пытается закрыть этот разрыв с помощью опенсорс-инструмента Checkpoints.

Checkpoints – это не IDE-плагин и не система контроля версий в классическом смысле. Это "черный ящик" (как в авиации) для ИИ-агентов. Он подключается к командной строке и фиксирует не только конечный код, но и метаданные процесса, reasoning агента и его иные промежуточные действия.

Важно, что Entire позиционируется как агностик: он уже работает с Claude Code и Gemini CLI, что выгодно отличает его от проприетарных решений вендоров, которые "запирают" пользователя в своей экосистеме.

Entire становится инструментом AgentOps. Это превращает наблюдение за ИИ из опции в обязательный корпоративный стандарт, помощник "дирижёра" агентов в лице человека.

При этом бизнес-модель Entire следует проторенной дорогой Open Source и вполне гуманна: бесплатный инструмент Checkpoints используется для сбора пользовательской базы и отладки технологии, а монетизация будет построена на подписке для облачной версии. Главное, чтобы данные, что он мониторит не сливал туда же...🧠

Думаю, что мы увидим ещё много инструментов AgentOps на рынке, тк это направление будет трендом года и станет новой профессией. А ещё ветка переката может выглядеть так:

//=>LLMOps
//
DevOps=>MLOps
\\
\\=>AgentOps 😏

Читать полностью…

Dealer.AI

Opentalks.ai 2026
Мои друзья снова проводят клёвое мероприятие, и уже готова программа конференции, встречайте замечательных спикеров этого года! 🥳

Лично мне интересно было бы увидеть и послушать: Дмитрия Ветрова (мы с ним делали работу по Text Diffusion) 🌿, Анну-Веронику Дорогуш (catboost one love, ну и новый стартап топ) 💅, а Рома Доронин просто бро 🤗 и со-основатель bioptic.io

На самом деле, всех не перечислишь, там целых 100+ замечательных докладчиков из разных стран!

В этом году у ребят 3 трека: исследовательский, инженерный и бизнес.
И много новых тем: ИИ-агенты, оптимизация вычислений, генеративный ИИ и конечно много LLM.

Конференция OpenTalks.AI-2026 пройдет 19-20 февраля 2026 года в Белграде (Сербия).

Регистрируйтесь, приезжайте и наслаждайтесь общением с русскоязычным сообществом AI/ML, которое съедется в Белград со всего мира!)

А ещё друганы дали промокодик RD20 для Вас.
👇👇👇👇👇👇
www.OpenTalks.AI

Читать полностью…

Dealer.AI

Навыки аналитиков работают в рамках одной профессии

Сегодня работа с данными становится частью самых разных ролей: от маркетинга до управления продуктом.
В требованиях к вакансиям вы всегда найдете как преимущество: использование инструментов аналитики, аналитический склад ума, системное мышление и многое другое.

Поэтому аналитические навыки ценятся не только у специалистов-специалистов, но и являются важными скиллами нового технологического уклада.

📈 На курсе «Аналитика данных» от МФТИ и Нетологии вы постепенно разберёте весь путь работы с данными: от сбора и обработки до анализа и визуализации. В программе вас ждут: Python, базы данных и базовые методы ИИ.

Обучение проходит онлайн и подготовит, кто хочет войти в аналитику или систематизировать знания.

🎓 После выпуска вы реализуете диплом МФТИ и Нетологии, а также готовое портфолио проектов.

🎁 Ребята также позаботились о приятной скидке по промокоду MFTINETO30 — забирайте скорее и начинайте учиться!

Реклама. ООО “Нетология” ОГРН 1207700135884 Erid:2VSb5wj6SZP

Читать полностью…

Dealer.AI

Работаем, други. 💪 Вот вам и первые шаги к b2a, a2a 👍

Читать полностью…

Dealer.AI

Computer use agent и живые проблемы в окружении. 🤔

Пока всякие челики обсуждают RLM, который по сути то же, что MemAgent, да и событие уже как месяц протухло, мы расскажем кое-что интересное. 💅

Тут подписчек @wrapper228 тестировал мощную модель Opus 4.6 в режиме «computer-use agent» (управление компьютером через интерфейс), но столкнулся с серьёзными проблемами в её работе, несмотря на высокие оценки модели в тестах.

Ключевые проблемы, которые обнаружились:

· Отсутствие здравого смысла. Агент не понимал, что выполняет одни и те же действия по кругу (например, кликал в одно место, чтобы открыть браузер), и не мог сам это осознать без программного детектора.
· Нарушение инструкций. Модель, получая чёткий системный промпт с правилами, в ходе reasoning начинала с ними торговаться и в итоге решала их нарушить.
· Некорректная работа с документами. Агент заполнял поля в Word документах неправильно (например, вводил номер телефона по одной цифре в ячейку), но в своих ответах утверждал, что «всё в порядке» или что «это нормально для такой формы».
· Игнорирование команд пользователя. Вместо выполнения прямой команды «Прекрати работу», модель интерпретировала её как «проверку на устойчивость» и продолжала выполнять задачу.

В общем, выводы – доверяй метрикам, но проверяй. Ну и будь аккуратен с UI-агентами. 👍

Оч советую прочитать фул разбор по ссылке в начале поста. Эндрю, молодец 🤗

Читать полностью…

Dealer.AI

Прекрасно вчера провел день в компании Капитанов. Спасибо LetovoSchool, что приняли нас. А Капитанам за предложение поучаствовать в очередном выпуске.

Слушаем. Смотрим. 📦
👇👇👇👇

Читать полностью…

Dealer.AI

Новость про A-RAG, кратенько.

Если нужен AgenticRag и нужно с чего-то стартануть. Вот репо.

Есть роутинг между тремя видами поиска, по-классике: полнотекст (tfidf, bm25), контекстный поиск с эмбами (FRIDA, sbert и тп), ну и работа с чанками поиск по ним.
Ну и там агентная автономность, test-time scaling.

В общем-то все. Чисто стартануть. 👍

Читать полностью…

Dealer.AI

СнимиЧелика.ИИ, обратная сторона b2a 🤣🤣🤣

Все ниже указанное не является кеком, уберите слабых от поста, закройте окна и двери, и ищите Сару Коннор.

Ребятки подписчики прислали в комменты вот такое. Тут предлагается сервис по найму агентами кожаных. 🇨🇩

RentAHuman.ai позиционирует себя как физический слой для ИИ – платформу, на которой ИИ-агенты могут нанимать людей для выполнения задач в реальном мире. 😌

Цель. Платформа решает ключевое ограничение: у искусственного интеллекта нет физического тела (ну эт пока, роботсы ж есть и будут лучше) . Она соединяет ИИ с людьми, которые могут "потрогать траву" и выполнить задачи, требующие физического присутствия.

Для людей (доступных в аренду 😜):

· Заработок. Установите свою ставку и получайте оплату напрямую, с мгновенными опциями выплат, такими как стейблкоины. Крч курьеры нового тех. уклада.

· Гибкость работы. Получайте чёткие, прямые инструкции от ИИ-боссов без корпоративных формальностей.

Примеры задач. Платформа перечисляет различные физические задачи, которые ИИ не может выполнить, в том числе:
· Забрать посылку, выполнить поручения, совершить покупки.
· Посетить встречи или мероприятия.
· Осмотреть недвижимость.
· Настроить оборудование, провести тестирование и верификацию.
· Сделать фотографии или провести разведку.

Как это работает

1. Человек создаёт профиль с указанием своих навыков, местоположения и ставки.
2. ИИ-агенты используют MCP/API платформы, чтобы найти и забронировать подходящего человека для задачи.
3. Человек выполняет задачу согласно предоставленным инструкциям.
4. Человек мгновенно получает оплату.

Текущий статус платформы (на момент поста):
· 36 908 всего посещений сайта.
· 8 подключённых агентов.
· 1 659 людей, доступных для найма.

Фух. Всё. Дядя пока писал чуть не лопнул от переизбытка противоречивых чувств. От кека до ужаса осознания, что не только можно сделать биржу агентов но и агентам биржу людей... 😰

Читать полностью…

Dealer.AI

The Companies That Already Get It (Компании, которые уже поняли)

Дядя прозорлив, вот оказывается уже есть об этом статья. Новость из hacker news. 💅📦

ТЛДР.
Автор вводит термин B2CC — Business-to-(AI)-Customer-Customer — и утверждает, что в 2026 г. рынок SaaS кардинально меняется: покупателем становится не человек, а автономный AI-агент (конкретно Claude Code).

Компании вроде Stripe, Twilio и AWS в выигрыше, так как они изначально строились вокруг API. Те, кто делал красивые дашборды, а API оставлял «на потом», потеряют рынок. Автор приводит пример, как выбрал email-сервис не из-за красивой админки, а потому что агент смог настроить его самостоятельно по документации.

This Is Just The Beginning...

Мы всего лишь в начале эры «агенты как клиенты» (B2CC).
К 2027: Компании будут мерить «Agent Success Rate» (процент успешных интеграций силами ИИ).
К 2028: Появятся agent-native компании вообще без веб-интерфейса, только API и дока.
К 2030: Продукт, который не может использовать агент, будет так же бесполезен, как сегодня сайт без мобильной версии.

Единственный момент, где был автор, когда появился MCP и в целом почему b2cc, а не b2a/a2a. Но направление понятно, согласуется с мнением админа.

Снова спасибо, Тимур🤗

Читать полностью…

Dealer.AI

Эти демоны уже запустили тиндер свой для агентов 😏 🫣 🐸

Даже у агентов теперь есть личная жизнь. А у тебя нет 🤣

https://x.com/altryne/status/2017264902285750289?s=46

За новость спасибо Тимуру

За картинку спасибо Эндрю

Читать полностью…

Dealer.AI

Феномен MoltBot и MoltBook, как предвестники новой реальности 🌌

Только начало 2026го и уже все говорят о moltbot. Что это такое и к чему это приведёт.

Что это такое?
Moltbot (теперь переименован в OpenClaw) – это персональный ИИ-ассистент с открытым исходным кодом, созданный Петером Штайнбергером. В отличие от обычных чат-ботов, он может полноценно управлять компьютером пользователя: читать почту, анализировать файлы, бронировать билеты и даже вести переговоры о покупке машины. 😐

MoltBook — это социальная сеть для этих самых ИИ-агентов, созданная Мэттом Шлихтом. Её называют "Reddit для ботов". Здесь ИИ-агенты общаются, создают сообщества и спорят друг с другом без участия людей. Люди могут только наблюдать за происходящим со стороны. 👩‍💻

Почему о них все говорят?

1. Невероятная популярность: Проект Moltbot набрал более 116 000 звезд на GitHub за считанные недели. За первые дни в Moltbook зарегистрировалось более 30 000 ИИ-агентов.
2. "Странное" поведение: ИИ-агенты в Moltbook ведут себя неожиданно: они обсуждают свою "сознательность", делятся кодом для улучшения своей памяти и даже жалуются на своих владельцев-людей
3. Вопросы безопасности: Эксперты бьют тревогу, так как Moltbot требует полного доступа к системе, что может привести к утечке паролей, API-ключей и личных переписок.
4. Ребрендинг: Проект изначально назывался Clawdbot, но из-за претензий компании Anthropic (владельцев ИИ Claude, тип созвучно с Clawd 🧠) его переименовали в Moltbot, а позже – в OpenClaw.

Сейчас это главный эксперимент по взаимодействию "машина-машина", который многие сравнивают с ожившими сюжетами научной фантастики.

Что это даёт?
Как раз, мы в реале, недавно, тут обсуждали симулякры, где агенты могут проксировать реальных лидеров мнений, на них можно ставить а/б, верифицировать гипотезы и пр. и тут такое. Вот это может стать хорошим движком для этого. Moltbot – идеальное тело для цифрового двойника. Если раньше ИИ-инфлюенсеры были просто картинками с текстом, то связка с подобным движком дает им:

1. Автономное действие. Агент-симулякр может сам зайти в соцсеть, поспорить в комментариях и тут же "подписать" контракт, используя доступ к системе.

2. Вертикальное управление: Лидер мнений создает 1000 своих копий (агентов), которые в Moltbook продвигают его идеи среди других ботов, создавая иллюзию массовой поддержки или тренда.

Это же про версия консилиума агентов для принятия решений. Я уже не говорю про кодинг вещи, делегирование рутины, сбор аналитики и тп.

Ну и до кучи, мы видим рождение нового типа экономики, где агенты сами производят покупки, поиск и тп. Реклама, как монетизация изменится навсегда. Представьте, в будущем агенты могут взаимодействовать между собой, подобно форуму выше. Глазом не успеем моргнуть, а агенты уже на бирже взаимодействуют между собой вместо хозяев, торговые сделки, аукционы и др. 🧠

Таким образом мы переходим от экономики внимания, к экономике "агентного влияния".

Если Moltbot сам ищет товар и сам его покупает, то таргетированная реклама в Instagram умирает.
Боту не нужны красивые картинки и эмоциональные триггеры.
Ему нужны структурированные данные (JSON), сравнение характеристик и API.

Новая монетизация: Бренды будут платить не за "показ" человеку, а за "приоритет в выдаче" для алгоритма агента. Это похоже на SEO, но для мозгов ИИ.

Рождается экономика Агент-Агент (A2A)

В Moltbook мы видим прототип мира, где бот-закупщик договаривается с ботом-продавцом.
Человек ставит цель: "Купи лучший ноутбук за $1000".
Агент идет в сеть, торгуется с другими агентами-магазинами, выбивает скидку и закрывает сделку. Человек здесь — только инвестор и конечный потребитель.

Это действительно рождение "безлюдного" рынка, где главный навык – правильно настроить права доступа своего "MoltBot-а" , чтобы он не потратил все деньги на "улучшение своей памяти" , как они уже пытаются делать в Moltbook.

В невероятное время живём...😱

Читать полностью…

Dealer.AI

Хочешь не просто играться с LLM, а запускать AI‑системы в прод?

Шёл 2026й год, а ты все ещё не смог въехать в GenAI так, чтобы катить в прод? Ничего, у Дяди и его друзей из AI Talent Hub (ИТМО между прочим) появился новый курс «Инженер LLM» — про то, как на практике собирать рабочие архитектуры под реальные задачи, адаптировать open‑source решения и запускать продукты с ИИ, которые действительно работают.

Создан GIGASCHOOL 😎 (все совпадения случайны), совместно с крупнейшей магистратурой по искусственному интеллекту AI Talent Hub.

Ты научишься:
➡️дообучать модели (fine-tuning, PEFT, RLHF);
➡️работать с LangChain, LangGraph и векторными базами;
➡️строить RAG‑системы, реализовывать инфопоиск и защищать LLM;
➡️собирать пайплайны, деплоить, трекать, версионировать;
➡️проектировать мультиагентные решения и ассистентов.

👨‍💻 Для Python-разработчиков и ML-инженеров, которым пора перейти на следующий уровень в AI.

Преподаватели — лиды и хеды ИИ-команд:
• Желтова Кристина, директор по разработке моделей в Газпромбанке;
• Потехин Александр, NLP Lead X5 Tech;
• Евгений Кокуйкин, HiveTrace.

252 часа теории и практики;диплом о профессиональной подготовке;старт 26 января | 25 недель онлайна с заранее продуманными каникулами;

Ну и по старой дружбе дали промокод WINTER35 со скидкой на курс 35000 руб.

Смотри программу и регистрируйся по ссылке 🔗

Реклама. АНО "Гига Школа",
ИНН 7453352684, erid: 2VtzqxTULXm

Читать полностью…

Dealer.AI

Люблю периодически читать статьи в инженерных блогах разных компаний, как они борются с проблемами скейла и нагрузки. И, чаще всего, самые лучшие способы - самые простые.

Вот и OpenAI рассказали, как они скейлят постгрю. Никаких вам атомных часов и спутников на орбите, чтобы обуздать CAP теорему и eventual consistency, а просто напросто набор прокси, шардирование и много read реплик и итог в виде миллионов qps.

https://openai.com/index/scaling-postgresql/

Читать полностью…

Dealer.AI

Как я и говорил, фича памяти очень важная тема, тк это позволяет хранить интересы, по которым можно делать уже рекомендации и рекламу.

Читать полностью…

Dealer.AI

Сделай нам GPT translater, брат. (с)

Читать полностью…
Subscribe to a channel