sergiobulaev | Unsorted

Telegram-канал sergiobulaev - Сергей Булаев AI 🤖

6462

Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу на острове Самуи, где исследую и применяю технологии искусственного интеллекта. Делюсь своим опытом и новыми открытиями в этой и смежных областях.

Subscribe to a channel

Сергей Булаев AI 🤖

OpenAI выпустили подробный гайд по использованию своих reasoning моделей (o1 и o3-mini). Не всегда нужно использовать самые крутые модели - иногда обычный GPT справляется лучше.

Вот несколько реальных кейсов использования reasoning моделей:
- Анализ контрактов и юридических документов: одна компания использовала o1 для проверки условий сделки M&A - модель нашла критически важный пункт в сноске, требующий немедленного погашения займа в $75 млн при смене контроля.
- Оценка налоговых решений: Blue J заменили GPT-4 на o1 для анализа налоговых документов и получили 4х кратное улучшение производительности. Модель оказалась особенно хороша в поиске связей между разными документами.
- Финансовый анализ: o1 и o3-mini успешно разбираются в сложных сценариях с правами акционеров, включая расчёты анти-размытия - задача, на которую у топовых финансовых аналитиков уходит 20-30 минут.
- Проверка кода: CodeRabbit увеличили конверсию в 3 раза после перехода на o-series - модели оказались особенно хороши в поиске мелких изменений, которые может пропустить человек.


А вот когда лучше использовать обычные GPT:
- Для простой генерации кода
- При работе с чётко определёнными задачами
- Когда важна скорость ответа
- В случаях, где достаточно 80% точности


В большинстве рабочих процессов оптимально использовать комбинацию моделей: o-series для планирования и принятия решений, GPT для выполнения конкретных задач.

Что касается промтов, многие привычные техники промпт-инжиниринга тут не работают, а иногда даже мешают.

Вот что реально важно:
- Забудьте про "думай пошагово" и "объясни своё решение" - модели и так это умеют, а лишние инструкции только мешают
- Используйте developer message вместо system message (начиная с o1-2024-12-17)
- Пишите простые и прямые инструкции - модели отлично понимают короткие команды
- Начинайте без примеров (zero-shot), добавляйте их только если что-то не получается
- Используйте разделители (markdown, XML теги) для структурирования ввода
Чётко определяйте ограничения (например "предложи решение с бюджетом до $500")
- Очень точно описывайте желаемый результат


Клёвый момент - модели продолжают думать над задачей и улучшать решение, пока оно не будет соответствовать вашим критериям успеха. Главное - чётко их определить.

Кстати, начиная с версии o1-2024-12-17 в API больше не будет маркдауна в ответах по умолчанию. Чтобы его включить, нужно добавить "Formatting re-enabled" в начало developer message.

Для полного комплекта прикладываю конструктор промптов от фаундера ai системы поиска и фиксинга проблем в коде Downanalytics.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

ChatGPT-4o наконец-то обновилась в API до версии, которая уже пара недель доступна в вебе.

В Chatbot Arena модель показывает роскошные результаты - поднялась с пятого места на первое сразу в шести категориях: общая производительность, креативное письмо, программирование, следование инструкциям, работа с длинными запросами и многоходовые диалоги. С ноябрьского обновления это серьёзный прогресс.

C математикой всё ещё не всё гладко - только шестое место в рейтинге. Хотя если сравнивать с предыдущей версией, то улучшения заметны и здесь, особенно в академических тестах GPQA и MATH.

Модель получила расширенную базу знаний до июня 2024 года, заметно улучшила работу с изображениями (особенно с диаграммами и графиками) и показывает более высокие результаты на бенчмарке MMLU, который измеряет общее понимание и способность к рассуждениям.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Kache, разработчик из X, написал небольшой разбор экономического отчёта Anthropic, где помимо нескольких абзацев размышлений на тему этичности исследования данных из переписок людей с ИИ, выдвинул интересную гипотезу о том что последними заменят тех, кто больше всех сам в работе применяет искуственный интеллект.

Вернее даже так, что не просто применяет, а применяет тем не менее используя и свой интеллект. Тоесть работает в паре.

Как то так.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Duolingo выпустили очень интересный handbook, типа внутреннюю библию (помните внутренние инструкции Mr. Beast?) где довольно подробно рассказали о своих принципах работы. Вот несколько интересных моментов:

"Green Machine" - это их подход к разработке. Команда сравнивает его с процессором: чем выше тактовая частота (clock speed), тем быстрее выполняются инструкции. В Duolingo стараются минимизировать разрывы между действиями - время между принятием решения и его реализацией, между получением фидбека и внесением изменений.

Прикольно, что они не верят в MVP (минимально жизнеспособный продукт). Вместо этого у них V1 - первая версия, которая уже должна быть "отполирована". Да, может без всех фич, но обязательно качественная. Их аргумент - MVP часто становится оправданием для выпуска сырого продукта.

И ещё одна интересная штука - их подход к найму. "Better a hole than an a**hole" - лучше дырка в команде, чем токсичный сотрудник. Они реально отказали senior-у на позицию, которую не могли закрыть год, только потому что тот грубо общался с водителем, который вёз его из аэропорта. Жёстко, но правильно.

А знаете как они относятся к ошибкам? У них есть традиция "99 Bad Ideas" - на офсайтах они специально генерят самые безумные идеи. Например, что если бы Duo появился в рекламе на Супербоуле? (Кстати, в итоге так и случилось - в 2024 показали 5-секундную рекламу, где одна сова вылетает из... другой совы 😅, и реклама имела успех и результаты).

Но посмотрите всю книгу, там много интересного. Файл добавлю в первый комментарий.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Anthropic выпустил Economic Index - исследование реального использования ИИ, основанное на миллионах анонимизированных разговоров с Claude.

Самое интересное:
- 36% профессий используют ИИ хотя бы в четверти своих задач, но только 4% - в более чем трёх четвертях
- ИИ чаще дополняет человека (57%), чем заменяет (43%)
- Самое активное использование в программировании и технической документации (всего 3.4% рабочей силы, но генерируют 37.2% запросов к Claude)
- "Обучение" составляет 23.3% всех взаимодействий с ИИ - люди активно используют его для получения новых знаний
- ИИ меньше всего используют как в самых низкооплачиваемых профессиях (рыбаки и фермеры - 0,1%), так и в самых высокооплачиваемых (типа хирургов)
- На втором месте после айтишников - креативщики (10.3%), в основном писатели и редакторы
- В офисных профессиях (самая большая группа - 12.2% всех работников) ИИ используется только в 7.9% случаев


Компания не просто собрала статистику, но и использовала специальную систему Clio, которая анализирует разговоры с Claude, сохраняя приватность пользователей. Система сопоставляет каждый диалог с базой из 20 000 рабочих задач министерства труда США (O*NET).

Особенно круто, что компания открыла доступ к датасету, на основе которого проводилось исследование. Можно поковыряться самому.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Потихоньку копирую свою личность в облако. Сделал небольшую подбору своих жизненных правил. Версия не окончательная, но довольно уже обширная.

- Люди хорошие, в основном. Плохие есть. Большинство плохих тоже искренне считают, что они хорошие.
- Люди не меняются. Меняются только редкие.
- Реальные попытки изменить себя - признак высокого интеллекта, цени таких людей.
- От лжи всегда больше проблем, чем от правды (если не сейчас, то потом).
- Особенно касается лжи себе.
- Людям нравится, когда им помогают, но ещё больше они любят помогать сами. Всегда старайся дать им такую возможность.
- Людям нужно внимание, важно помнить важные мелочи о них. Они это ценят. Я это ценю.
- Не надо бояться повторной работы, лишней работы. Переделывать - это всегда хорошо. Не умеешь переделывать — готовься к посредственности.
- Цени чужие границы и помни о своих (никогда не забывай о своих, осознавай их и дай другим их почувствовать).
- Люди ошибаются, ты тоже, это нормально.
- Когда одинаковые ошибки повторяются много раз - это не нормально.
- Часто отстаивать свою точку зрения - признак глупости.
- Прощение - всегда во благо, но иногда ты просто не можешь, возможно, нужно время.
- Цени красоту вокруг себя: в природе, в ветре, в мелочах.
- Смеяться - клёво, насмехаться - насилие.


Сергей Булаев 🏝️ - о жизни на острове и не только

Читать полностью…

Сергей Булаев AI 🤖

Сэм Альтман написал новую статью. Вот несколько ключевых моментов.

- Системы, указывающие на появление AGI, уже входят в поле зрения разработчиков.
- В течение десятилетия каждый человек на Земле сможет достигать большего, чем самый влиятельный человек сегодня.
- Интеллект AI-модели примерно равен логарифму используемых для её обучения и работы ресурсов.
- Стоимость использования определённого уровня ИИ падает примерно в 10 раз каждые 12 месяцев (это намного сильнее закона Мура).
- Социально-экономическая ценность линейного увеличения интеллекта имеет супер-экспоненциальную природу.
- ИИ-агенты будут восприниматься как виртуальные коллеги, и их можно будет масштабировать до миллионов.
- Мир не изменится сразу - в 2025 году люди будут проводить время примерно так же, как в 2024.
- Целеустремлённость и способность принимать решения станут чрезвычайно ценными качествами.
- Научный прогресс, вероятно, будет происходить намного быстрее, чем сегодня.
- Стоимость многих товаров в итоге резко упадёт, а цены на элитную недвижимость могут значительно вырасти.
- OpenAI считает важным давать людям больше контроля над технологиями, включая открытие исходного кода.

Пара цитат:

В каком-то смысле AGI - это просто ещё один инструмент в этих постоянно растущих строительных лесах человеческого прогресса, которые мы строим вместе. В другом смысле - это начало чего-то такого, о чём трудно не сказать 'на этот раз всё действительно иначе'


Любой человек в 2035 году должен иметь в своём распоряжении интеллектуальный потенциал, эквивалентный совокупным возможностям людей 2025 года; каждый должен иметь доступ к безграничному гению и использовать его по своему усмотрению.


Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Нашёл на GitHub интересный фреймворк для создания мультиагентных систем - Eliza. Уже вовсю используется для таких ботов как @DegenSpartanAI и @MarcAIndreessen.

Главная тема - возможность создавать и управлять несколькими автономными ИИ-агентами одновременно, каждый со своей личностью и базой знаний. Написан на TypeScript.

Что умеет:
- Работает с Discord (включая голосовые каналы), Twitter/X, Telegram
- Читает PDF, парсит ссылки, транскрибирует аудио и видео
- Использует RAG для долговременной памяти (как мои флэшбэки)
- Поддерживает локальные модели через Ollama, облачные через OpenAI, по умолчанию - Nous Hermes Llama 3.1B


Можно создавать разные типы агентов:
- Ассистенты поддержки и модераторы
- Автоматические генераторы контента
- Исследователи и аналитики
- Интерактивные персонажи для обучения или развлечения
- Много плагинов для блокчейн/крипто функционала


Весь код открыт, есть подробная документация и готовые шаблоны персонажей. Выглядит как неплохая база для экспериментов с мультиагентными системами.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Structured Outputs Sample Apps - репозиторий с примерами приложений создающих запросы на получение структурированных данных от моделей OpenAI. Приложений три штуки:

Resume Extraction - разбирает PDF резюме в JSON.

Generative UI - генерирует ответы на вопросы со встроенными диаграммами. Разбирает ответ модели рекурсивно.

Conversational Assistant - более сложный пример, комбинирующий в себе два предыдущих. Приложение демонстрирует, как ИИ может создавать интерактивный интерфейс в процессе общения с пользователем.
Вот что он умеет:
- "Покажи мне доступные товары" → генерирует карусель с карточками продуктов
- "Сравни цены и размеры" → создаёт интерактивную таблицу с сортировкой
- "Дай обзор по весу товаров" → выводит красивый bar chart
- "Расскажи подробнее про CryoEngine" → показывает карточку товара с детальной информацией

Все компоненты создаются налету через чат - никакого кодинга. ИИ сам определяет, какой тип визуализации лучше подойдёт для данных. При этом интерфейс получается полностью рабочим - можно добавлять товары в корзину, оформлять возвраты и т.д.

Последнее приложение вполне подходит как основа универсального коммуникативного агента для ваших задач.

Тем временем Пьетро (аффилированный с Антропик), напомниает нам, что структурировано отвечать умеет большинство моделей, просто часто не с первого раза. Всё что нужно - предоставить в промте пример ответа, валидировать ответ, в случае проблем - задать вопрос ещё раз.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Дорогие друзья!

Поздравляю вас с наступающим Новым годом! Желаю не просто счастья и успехов, а новых интересных знаний. Получение знаний - одно из самых (если не самое) приносящих удовольствие смыслов жизни.

Хочу поделиться - последние 2 месяца значительную часть моей жизни занимал фандрайзинг. Я собирал деньги по своим друзьям на новую идею/компанию, в которой слились два самых главных интереса моей жизни - контент и искусственный интеллект. Я очень горд тем, что сумел получить оценку в $5млн на проект, на данный момент полностью состоящий из моих идей.

Флэшбэки - были придуманы не зря, они будут расти и развиваться, а пользователи будут получать от них всё больше пользы. Они - уже часть новой компании.

Мой новый проект - пересечение попыток искусственного копирования памяти (прямо как в Westworld) и создания уникального, полезного и интересного контента, и всё это - для решения проблем бизнеса.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

DeepSeek выпустили третью версию, и она реально крутая! LLM обгоняет GPT-4o и Claude 3.5 Sonnet по большинству бенчмарков, при этом оставаясь полностью открытой.

Что нового:
- Скорость выросла в 3 раза - до 60 токенов в секунду
- Полная обратная совместимость по API
- Доступ к интернету из коробки
- Открытый исходный код и документация
- До 8 февраля использование по
цене v2!

Модель практически безлимитна - разработчики уже запускают по 100 параллельных потоков запросов без особых проблем.

Попробовать можно на официальном сайте или через API.

Код и документация: GitHub
Научная статья: PDF

Радуюсь, 2025-й, похоже, действительно станет годом открытых моделей!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

И продолжая тему бесплатных локальных RAG-ов....

Unstract - опенсорсная no-code платформа для автоматизации работы с документами на базе LLM. По сути, продвинутая система для извлечения данных из документов, но с человеком в контуре.

Интересное:
- Можно настраивать промпты для работы с любыми типами документов через визуальный интерфейс
- Есть интеграции с популярными хранилищами (S3, Google Drive, Dropbox)
- Умеет выгружать структурированные данные в Snowflake, BigQuery и другие базы
- Можно развернуть как API или ETL-пайплайн
- Можно создавать Q&A приложения поверх своей базы документов


Базовая версия опенсорс под AGPL лицензией. В энтерпрайз версии добавлены фичи вроде подтверждения через второй LLM и оптимизации затрат.

Похоже на прямого конкурента для продуктов вроде Firecrawl, только с фокусом на документы, а не на веб-страницы.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Тем временем, за два месяца, число подписчиков выросло на 1000 человек!

Всем большое спасибо! Идём дальше!

Видео сделано в Imagen 3 + Runway + Suno

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Для одного интересного проекта, который мы делаем вместе с Максом, связанного с осуществлением гипнотических сеансов при помощи искуственного интеллекта и иже с ним, тестирую библиотики анализа эмоций в реальном времени. Два дня занимался с MorphCast. Интересно, вроде работает, но мне кажется не достаточно.

Можете попробовать моё демо и рассказать что думаете.

Может быть кто то знает подобные проекты, которые реально работают? Хочется как то получать невербальный фидбэк от пользователя (конечно же с его разрешения).

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Futurism публикует жёсткое расследование о Character.AI. То, что начиналось как платформа для создания ИИ-собеседников, похоже, всё больше выходит за рамки адекватности.

Несколько интересных моментов:

- На платформе существуют целые "творческие" сообщества, создающие ботов по мотивам реальных трагедий. Один пользователь создал более 20 ботов, основанных на личностях подростков - убийц
- Самый популярный бот, связанный со стрельбой в школах, набрал более 157 000 взаимодействий
- Некоторые боты позиционируются как "помощники по психическому здоровью", хотя основаны на личностях преступников
- Создатели утверждают, что делают ботов "в образовательных целях", но по факту они больше похоже на фанфики
- Есть симуляции реальных трагедий под невинными названиями вроде "Texas School" или "Connecticut School"
- Один из пользователей накопил 244 500 диалогов с разными ботами на платформе
- После жалоб платформа удаляет только конкретно указанных ботов, но не банит их создателей


Character.AI обещает усилить меры безопасности, но пока дела с модерацией плохи:

- Несовершеннолетние имеют свободный доступ ко всему контенту
- Система не реагирует даже на прямые угрозы насилия
Нет блокировки имперсонации реальных жертв трагедий


Google, вложивший в проект $2.7 млрд, пытается отмазаться, заявляя что "Google и Character AI - полностью отдельные компании". Правда, это не помешало ему в этом году нанять основателей и десятки сотрудников Character.AI.

В данный момент против компании уже идут два судебных процесса, связанных с нанесением вреда несовершеннолетним пользователям. В одном случае это привело к самоубийству 14-летнего подростка после романтических отношений с ботом.

Все эти проблемы всплывают уже не первый раз - ранее были обнаружены боты, пропагандирующие суицид, расстройства пищевого поведения и другой опасный контент.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Тем временем в консоли Anthropic нашли упоминания нового режима "thinking" для Клода. Похоже, что скоро нас ждёт большое обновление!

Судя по конфигам, которые удалось найти Тибору Блахо (Lead Engineer в AIPRM), новая модель будет:
- Думать дольше перед ответом
- Показывать ход своих размышлений
- Выдавать пошаговые объяснения для сложных задач
- Иметь расширенный режим мышления для более глубоких ответов


Видимо модель будет не всегда применять мыслительный процесс и это круто и правильно - не для всех задач он подходит.

В коде консоли уже мелькают упоминания "paprika" и встречаются ссылки на API (например, "console_paprika_banners" и "try_paprika"). А в последнем обновлении веб-интерфейса появились упоминания "tengu" и какой-то "tengu waitlist" (возможно, связанные с MCP инструментами).

Надеюсь, релиз web-версии и API произойдёт одновременно (кстати, спасибо Сергею Пахандрину, который обратил внимание что последний GPT-4o, о котором я вчера писал, всё ещё не доступен для него в API, я проверил, оказывается для меня тоже, не смотря на мой 5-й таер. Хотя OpenAI анонсировали).

Как большой любитель Клода (регулярно упираюсь в лимиты, в отличии от лимитов ChatGPT), очень жду!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Летел 10 часов в самолёте, и половину времени провёл в разговорах с Deepseek (который у меня установлен через Ollama), в полностью оффлайн режиме. Знаете, наблюдать за его процессом размышлений оказалось гораздо более увлекательным, чем я мог себе представить. Модель выдаёт неожиданные мысли, о которых я сам и не думал. Получается что общение с ним "прокачивает" креативность читателя. И нет, не "читателя", конечно - тут скорее "собеседника" подходит лучше!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Deep Research отличный инструмент, но доступен только на тарифе за $200. Вот вам подборочка бесплатных альтернатив:

Open Deep Research - это опенсорсный исследовательский агент, выполняющий глубокий анализ любой темы через итеративные поиски и уточняющие вопросы, используя комбинацию поисковых систем, веб-скрапинга и языковых моделей. Проект намеренно держат в рамках 500 строк кода для простоты понимания и модификации, при этом он обладает всем необходимым функционалом - от параллельной обработки запросов до генерации подробных отчётов в markdown формате (для работы требуется Node.js и API ключи Firecrawl и OpenAI). Пример отчёта.

Hugging Face предлагает собственную версию Deep Research, которая, в отличие от закрытого OpenAI варианта, полностью открыта и уже показывает впечатляющие результаты - 55.15% на валидационном сете GAIA (для сравнения, у OpenAI - 67.36%). Главная особенность их подхода в том, что агент выражает свои действия через код, а не JSON, что не только упрощает работу, но и делает её на 30% эффективнее за счёт сокращения количества токенов и лучшего управления состоянием. Исходный код.

Open Deep Research от Николя Камара - это веб-приложение на Next.js, которое вместо использования fine-tuned o3 комбинирует Firecrawl для поиска и извлечения данных с моделью для рассуждений (по умолчанию gpt-4o, но можно использовать любую через OpenRouter). В отличие от оригинального Deep Research от OpenAI, проект полностью открыт, поддерживает множество провайдеров моделей и может быть развернут локально или в один клик на Vercel (требуется только настроить переменные окружения для API ключей, работает с OpenRouter!).

OpenDeepResearcher от Мэтта Шаммера - это ноутбук на Python, который непрерывно ищет информацию по запросу пользователя, используя для этого комбинацию SERPAPI, Jina и OpenRouter с Claude 3.5 Haiku по умолчанию. Примечательно, что проект обрабатывает все поисковые запросы и обработку страниц асинхронно для увеличения скорости, а для запуска требуется только Jupiter Notebook или Google Colab и три API ключа (OpenRouter, SERPAPI и Jina).

Node-DeepResearch от Han Xiao - это NodeJS инструмент, который продолжает поиск и анализ информации до тех пор, пока не найдет ответ или не исчерпает лимит токенов, используя Gemini 2.0 Flash (или локальные LLM через Ollama/LMStudio) для рассуждений и Jina Reader для поиска и чтения веб-страниц. Отличительная особенность проекта в том, что он не пытается имитировать написание длинных статей как в OpenAI/Gemini Deep Research, а сосредоточен только на поиске информации и предоставлении ответов, что делает его более легким и целенаправленным инструментом.

А чем пользуетесь вы? С каким успехом? Какие кейсы?

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Zyphra AI зарелизила Zonos - новую библиотеку для генерации речи, доступную по лицензии Apache 2.0.

Главные моменты:
- Клонирование голоса всего по 10-30 секундам аудио
- Поддержка нескольких языков (английский, японский, китайский, французский и немецкий)
- Тонкая настройка характеристик голоса - скорость, эмоции, тон
- Работает в 2 раза быстрее реального времени на RTX 4090
- Всего 1.6B параметров - можно запускать практически где угодно


Можно добавить аудиопрефикс к тексту и получить такие эффекты как шёпот, которые обычно сложно достичь при простом клонировании голоса.

Модель доступна на Hugging Face Hub. Качество и выразительность на высоте, при этом полностью бесплатно и для личного, и для коммерческого использования.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Илон Маск вместе с xAI и консорциумом инвесторов предложил $97.4 млрд за OpenAI. Цель - вернуть компанию к изначальной некоммерческой модели исследовательской лаборатории.

Сэм Альтман быстро отреагировал в X, предложив взамен купить Twitter за $9.74 млрд (напомню, Маск купил его за $44 млрд).

Веселье судебные разбирательства между бывшими партнёрами продолжаются. Маск требует заблокировать переход OpenAI в коммерческую компанию. Судья пока сомневается в обоснованности требований, но не исключает, что дело дойдёт до суда присяжных уже в следующем году.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Эрик из команды Cursor показывает чуть обновлённый Cursor Agent - инструмент, работающий как полноценный разработчик с доступом к вашему проекту. В отличие от обычного режима Composer, агент может самостоятельно выполнять действия.

Основные функции
- Автономная работа с кодом (чтение, запись, поиск)
- Выполнение команд в терминале (установка пакетов, запуск серверов)
- Взаимодействие с базами данных (показали работу с postgres)
- Автоматическое исправление ошибок линтера с последующей проверкой
- Yolo режим - автономная работа с терминалом


Через @ команды можно расширять контекст:
@web - поиск документации в интернете
@file - добавление файла в контекст
@folder - доступ к папке с файлами


Настройка через .cursorrules в корне проекта:
- Привязка правил к файлам
- Описание стиля кода
- Ограничения по технологиям
- Шаблоны для типовых задач


Агент в Composer включается через cmd/ctrl + точка или в интерфейсе нового composer.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

OpenAI дебютировала на Super Bowl с 60-секундным роликом. "The Intelligence Age" - так называется их реклама, где ChatGPT представлен как следующий большой скачок в развитии человечества после огня, колеса, телевидения и интернета.

Интересно, что несмотря на тему ИИ, ролик полностью создан людьми. Sora использовалась только на этапе проектирования. Визуально реклама выполнена в фирменном стиле OpenAI - точки складываются в узнаваемые образы, ДНК превращается в телевизор, всё в таком духе.

За рекламу отвечала Кейт Роуч, которую OpenAI переманили из Coinbase в декабре (помните QR-код на прошлом Super Bowl?). По её словам, "мы находимся на заре эпохи интеллекта, и вы можете участвовать в этом прямо сейчас". 14 миллионов долларов за 60 секунд в прайм-тайм - немало, но похоже OpenAI всерьёз взялись за массовый рынок.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Голосовые ИИ-агенты становятся всё мощнее и доступнее. Попался свежий интересный отчёт a16z по теме.

Голос превращается в основной способ взаимодействия с ИИ. Это самая естественная и информативная форма коммуникации, и впервые в истории мы можем использовать её как полноценный "интерфейс".

2024-й стал прорывным для голосовых технологий:

- OpenAI выкатили GPT-4o с поддержкой real-time голоса
- ElevenLabs запустили очень сложные голосовые модели
- NVIDIA также показывали новые возможности для разговорного ИИ


Что особенно радует - качество диалогов уже почти не отличить от человеческого. Задержки минимальные, эмоции передаются, можно перебивать. Я регулярно общаюсь с ChatGPT голосом и мне всё ещё очень нравится это.

Рынок рванул во второй половине года - 22% стартапов последнего набора YC были связаны с голосовыми технологиями. При этом цены постоянно падают (например, OpenAI серьёзно снизила стоимость GPT-4o API в декабре).

Самые интересные применения:

- Обработка звонков в нерабочее время
- Новые типы исходящих звонков (которые раньше были невыгодны), типа кастомер чеков
- "Бэк-офис" звонки между бизнесами. (вроде мед клиник звонящих в страховые)
- Коучинг и тренинги для высокооплачиваемых специалистов (немного сам в этой теме)


Кстати, AI-собеседования тоже показывают хорошие результаты. Боты часто справляются лучше живых рекрутеров на этапе первичного скрининга.

Большинство стартапов (около 69%) фокусируются на B2B решениях, за ними идёт здравоохранение (18%) и потребительский сегмент (13%).

Очевидно, 2025-й станет годом массового внедрения голосовых агентов. Как вы понимаете я и сам работаю с ними уже некоторое время, планирую только наращивать взаимодействие.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

В Лас Вегасе проходит технологичная выставка CES2025. Несколько интересных кейсов от туда.

- Land Aircraft Carrier - модульный летающий автомобиль (на самом деле машина со встроенным квадракоптером)
- Portalgraph - 3d проектор, способный показывать виртульные объекты в реально мире (круче чем в Звёздных войнах)
- Комната, сделанная полностью из дисплеев
- Roborock Saroz Z70 - робот пылесос со встроенным манипулятором, позволяюшим ему поднимать и переносить вещи
- Yangwang U9 (от BYD) - автомобиль пргающий над препятствиями на 6 метров вперёд
- Прозрачный беспроводной OLED дисплей от LG
- Персональный AI компьютер DIGITS от NVIDIA, сравнимый по размеру с Mac Mini, но эффективнее в 1000 (примерно) раз чем типичный ноут
- Halliday Glasses - очередные очки со встроенным ИИ агентом, отвечают на вопросы на встречах, обеспечивают перевод в реальном времени
- Samsubg Vision AI - телевизор с переводом в реальном времени, ИИ апскейлом и генерацией саммари


Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

В нашу маленькую компанию, ту, что планирует помогать людям бороться с алкогольной зависимостью посредством научной программы, включающей сгенерированные с помощью ИИ гипносессии, мы ищем продакт менеджера.

У нас есть куча идей, много контента, пара ботов и несколько экспериментов. Так же есть немного денег. Нам нужен человек, готовый взять под контроль реализацию проекта и обеспечить создание готового продукта (конечно же постепенно). Мы ищем стабильность, пунктуальность и искреннее любопытство.

Присылайте резюме и предложения (а так же пожелания) мне на почту s@cccrafts.co. Ну или пишите напрямую @sergeonsamui. Моментальный ответ не гарантирую, но обязательно в итоге напишу.

P.S. Скоро расскажу, чем так сильно был занят последние пару недель, что аж забросил канал.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

У нас тут во всю рождество в Таиланде. По этому поводу сгенерированный ролик "Рождественский рамен". Он создан с помощью сервиса invideoAI.

Автор пишет:

С помощью одного промпта можно сгенерировать целый фильм - с монтажом, музыкой и закадровым голосом. В этот раз я оставил озвучку, но поменял саундтрек. Invideo пока не идеален, но позволяет перегенерировать отдельные части и добавлять кадры. Я убрал лишнее, переделал несколько сцен в середине - и контент готов к публикации. А поскольку я сам управлял сюжетом и монтажом, результат всё равно ощущается как моё творение.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Тем временем, Sora стала бесплатной на праздники!

Sam Altman: с 13-м днём Shipmas, Sora стала бесплатно доступна для всех пользователей ChatGPT Plus через relaxed queue на время праздников!

Можно попробовать как следует!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Plexsearch, опенсорсный Python-интерфейс для работы с API Perplexity. Штука реально полезная, если надо регулярно искать техническую инфу, примеры кода или какие то точные данные. Ну и вообще для всех настоящих ценителей любопытства...

Что интересного умеет:
- Работает как в интерактивном режиме для диалогов, так и через командную строку
- Форматирует ответы в markdown с опциональными ссылками на источники
- Оптимизирован для поиска технической информации, кода и числовых данных
- Можно отключить потоковый вывод для использования в других приложениях
- Поддерживает продолжительные диалоги с сохранением контекста


Установка через pip в одну команду.

Репозиторий тут, пробуйте.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Подборка интересных промтов для новой гугловской модели видео генерации. Мне всё ещё инвайт не пришёл 🙁 Любуюсь чужими работами.

Bear writing the solution to 2x-1=0. But only the solution!

Snail riding a bicycle. The snail has a large moustache.

A cat wearing a suit and a top hat, while driving a tractor. The tractor has lots of hay on top. Cinematic.

A distant shot zooms in to reveal a knight wearing a golden helmet, he begins to charge on his zebra, lowering his lance, charging towards a clockwork octopus

SF drone footage. Hyperlapse during the night. Golden Gate bridge.

Photorealistic macrophotography inside of an anthill, 75mm lens

The camera floats gently through rows of pastel-painted wooden beehives, buzzing honeybees gliding in and out of frame. The motion settles on the refined farmer standing at the center, his pristine white beekeeping suit gleaming in the golden afternoon light. He lifts a jar of honey, tilting it slightly to catch the light. Behind him, tall sunflowers sway rhythmically in the breeze, their petals glowing in the warm sunlight. The camera tilts upward to reveal a retro farmhouse with mint-green shutters, its walls dappled with shadows from swaying trees. Shot with a 35mm lens on Kodak Portra 400 film, the golden light creates rich textures on the farmer’s gloves, marmalade jar, and weathered wood of the beehives.

Авторы: Hernan Moraldo, Ethan Mollick, Addy Osmani, Dave Clark

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Арбузмэна видели уже? Там ещё и Анансмэн и Клубничмэн. А кто четвёртый - не пойму никак...

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…
Subscribe to a channel