Telegram-канал sergiobulaev - Сергей Булаев AI 🤖: Unsorted - каталог телеграмм

sergiobulaev | Unsorted

Subscribe to a channel

Telegram-канал sergiobulaev - Сергей Булаев AI 🤖

5861

Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу на острове Самуи, где исследую и применяю технологии искусственного интеллекта. Делюсь своим опытом и новыми открытиями в этой и смежных областях.

Subscribe to a channel

Сергей Булаев AI 🤖

17 Feb 2025 08:56

Сэм Альтман выложил краткий роадмап OpenAI. Добавил немного ясности.

GPT-4.5 станет последней моделью без chain-of-thought механизмов. После него компания планирует объединить o-series и GPT в единую систему, способную эффективно использовать все инструменты и самостоятельно определять, когда нужно думать дольше.

GPT-5 будет интегрировать все технологии, включая o3 (который как отдельную модель выпускать не планируют).

GPT-5 будет доступен даже на бесплатном тарифе ChatGPT! Правда, на базовом уровне интеллекта. Plus и Pro подписчики получат доступ к более продвинутым настройкам.
Новые модели будут поддерживать голос, Canvas, поиск и глубокие исследования прямо из коробки.

Сэм признал, что текущий выбор моделей слишком усложнён и компания хочет вернуться к концепции "единого магического интеллекта".

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

16 Feb 2025 09:59

В это воскресенье, в рубрике #КриповаяСуббота@sergiobulaev эксперименты Particular Uno с Ray2 img-2-vid от LumaLabs. Он пишет:

Модель отлично справляется даже с самыми странными существами и демонстрирует потрясающее понимание физики движения, так что ждите от меня серию безумных экспериментов.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

16 Feb 2025 07:34

OpenAI выпустили подробный гайд по использованию своих reasoning моделей (o1 и o3-mini). Не всегда нужно использовать самые крутые модели - иногда обычный GPT справляется лучше.

Вот несколько реальных кейсов использования reasoning моделей:
- Анализ контрактов и юридических документов: одна компания использовала o1 для проверки условий сделки M&A - модель нашла критически важный пункт в сноске, требующий немедленного погашения займа в $75 млн при смене контроля. - Оценка налоговых решений: Blue J заменили GPT-4 на o1 для анализа налоговых документов и получили 4х кратное улучшение производительности. Модель оказалась особенно хороша в поиске связей между разными документами. - Финансовый анализ: o1 и o3-mini успешно разбираются в сложных сценариях с правами акционеров, включая расчёты анти-размытия - задача, на которую у топовых финансовых аналитиков уходит 20-30 минут. - Проверка кода: CodeRabbit увеличили конверсию в 3 раза после перехода на o-series - модели оказались особенно хороши в поиске мелких изменений, которые может пропустить человек.

А вот когда лучше использовать обычные GPT:
- Для простой генерации кода - При работе с чётко определёнными задачами - Когда важна скорость ответа - В случаях, где достаточно 80% точности

В большинстве рабочих процессов оптимально использовать комбинацию моделей: o-series для планирования и принятия решений, GPT для выполнения конкретных задач.

Что касается промтов, многие привычные техники промпт-инжиниринга тут не работают, а иногда даже мешают.

Вот что реально важно:
- Забудьте про "думай пошагово" и "объясни своё решение" - модели и так это умеют, а лишние инструкции только мешают - Используйте developer message вместо system message (начиная с o1-2024-12-17) - Пишите простые и прямые инструкции - модели отлично понимают короткие команды - Начинайте без примеров (zero-shot), добавляйте их только если что-то не получается - Используйте разделители (markdown, XML теги) для структурирования ввода Чётко определяйте ограничения (например "предложи решение с бюджетом до $500") - Очень точно описывайте желаемый результат

Клёвый момент - модели продолжают думать над задачей и улучшать решение, пока оно не будет соответствовать вашим критериям успеха. Главное - чётко их определить.

Кстати, начиная с версии o1-2024-12-17 в API больше не будет маркдауна в ответах по умолчанию. Чтобы его включить, нужно добавить "Formatting re-enabled" в начало developer message.

Для полного комплекта прикладываю конструктор промптов от фаундера ai системы поиска и фиксинга проблем в коде Downanalytics.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

15 Feb 2025 06:35

ChatGPT-4o наконец-то обновилась в API до версии, которая уже пара недель доступна в вебе.

В Chatbot Arena модель показывает роскошные результаты - поднялась с пятого места на первое сразу в шести категориях: общая производительность, креативное письмо, программирование, следование инструкциям, работа с длинными запросами и многоходовые диалоги. С ноябрьского обновления это серьёзный прогресс.

C математикой всё ещё не всё гладко - только шестое место в рейтинге. Хотя если сравнивать с предыдущей версией, то улучшения заметны и здесь, особенно в академических тестах GPQA и MATH.

Модель получила расширенную базу знаний до июня 2024 года, заметно улучшила работу с изображениями (особенно с диаграммами и графиками) и показывает более высокие результаты на бенчмарке MMLU, который измеряет общее понимание и способность к рассуждениям.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

12 Feb 2025 11:08

Kache, разработчик из X, написал небольшой разбор экономического отчёта Anthropic, где помимо нескольких абзацев размышлений на тему этичности исследования данных из переписок людей с ИИ, выдвинул интересную гипотезу о том что последними заменят тех, кто больше всех сам в работе применяет искуственный интеллект.

Вернее даже так, что не просто применяет, а применяет тем не менее используя и свой интеллект. Тоесть работает в паре.

Как то так.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

11 Feb 2025 11:34

Duolingo выпустили очень интересный handbook, типа внутреннюю библию (помните внутренние инструкции Mr. Beast?) где довольно подробно рассказали о своих принципах работы. Вот несколько интересных моментов:

"Green Machine" - это их подход к разработке. Команда сравнивает его с процессором: чем выше тактовая частота (clock speed), тем быстрее выполняются инструкции. В Duolingo стараются минимизировать разрывы между действиями - время между принятием решения и его реализацией, между получением фидбека и внесением изменений.

Прикольно, что они не верят в MVP (минимально жизнеспособный продукт). Вместо этого у них V1 - первая версия, которая уже должна быть "отполирована". Да, может без всех фич, но обязательно качественная. Их аргумент - MVP часто становится оправданием для выпуска сырого продукта.

И ещё одна интересная штука - их подход к найму. "Better a hole than an a**hole" - лучше дырка в команде, чем токсичный сотрудник. Они реально отказали senior-у на позицию, которую не могли закрыть год, только потому что тот грубо общался с водителем, который вёз его из аэропорта. Жёстко, но правильно.

А знаете как они относятся к ошибкам? У них есть традиция "99 Bad Ideas" - на офсайтах они специально генерят самые безумные идеи. Например, что если бы Duo появился в рекламе на Супербоуле? (Кстати, в итоге так и случилось - в 2024 показали 5-секундную рекламу, где одна сова вылетает из... другой совы 😅, и реклама имела успех и результаты).

Но посмотрите всю книгу, там много интересного. Файл добавлю в первый комментарий.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

11 Feb 2025 05:34

Anthropic выпустил Economic Index - исследование реального использования ИИ, основанное на миллионах анонимизированных разговоров с Claude.

Самое интересное:
- 36% профессий используют ИИ хотя бы в четверти своих задач, но только 4% - в более чем трёх четвертях - ИИ чаще дополняет человека (57%), чем заменяет (43%) - Самое активное использование в программировании и технической документации (всего 3.4% рабочей силы, но генерируют 37.2% запросов к Claude) - "Обучение" составляет 23.3% всех взаимодействий с ИИ - люди активно используют его для получения новых знаний - ИИ меньше всего используют как в самых низкооплачиваемых профессиях (рыбаки и фермеры - 0,1%), так и в самых высокооплачиваемых (типа хирургов) - На втором месте после айтишников - креативщики (10.3%), в основном писатели и редакторы - В офисных профессиях (самая большая группа - 12.2% всех работников) ИИ используется только в 7.9% случаев

Компания не просто собрала статистику, но и использовала специальную систему Clio, которая анализирует разговоры с Claude, сохраняя приватность пользователей. Система сопоставляет каждый диалог с базой из 20 000 рабочих задач министерства труда США (O*NET).

Особенно круто, что компания открыла доступ к датасету, на основе которого проводилось исследование. Можно поковыряться самому.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

10 Feb 2025 16:12

Потихоньку копирую свою личность в облако. Сделал небольшую подбору своих жизненных правил. Версия не окончательная, но довольно уже обширная.

- Люди хорошие, в основном. Плохие есть. Большинство плохих тоже искренне считают, что они хорошие. - Люди не меняются. Меняются только редкие. - Реальные попытки изменить себя - признак высокого интеллекта, цени таких людей. - От лжи всегда больше проблем, чем от правды (если не сейчас, то потом). - Особенно касается лжи себе. - Людям нравится, когда им помогают, но ещё больше они любят помогать сами. Всегда старайся дать им такую возможность. - Людям нужно внимание, важно помнить важные мелочи о них. Они это ценят. Я это ценю. - Не надо бояться повторной работы, лишней работы. Переделывать - это всегда хорошо. Не умеешь переделывать — готовься к посредственности. - Цени чужие границы и помни о своих (никогда не забывай о своих, осознавай их и дай другим их почувствовать). - Люди ошибаются, ты тоже, это нормально. - Когда одинаковые ошибки повторяются много раз - это не нормально. - Часто отстаивать свою точку зрения - признак глупости. - Прощение - всегда во благо, но иногда ты просто не можешь, возможно, нужно время. - Цени красоту вокруг себя: в природе, в ветре, в мелочах. - Смеяться - клёво, насмехаться - насилие.

Сергей Булаев 🏝️ - о жизни на острове и не только

Читать полностью…

Сергей Булаев AI 🤖

10 Feb 2025 08:14

Сэм Альтман написал новую статью. Вот несколько ключевых моментов.

- Системы, указывающие на появление AGI, уже входят в поле зрения разработчиков. - В течение десятилетия каждый человек на Земле сможет достигать большего, чем самый влиятельный человек сегодня. - Интеллект AI-модели примерно равен логарифму используемых для её обучения и работы ресурсов. - Стоимость использования определённого уровня ИИ падает примерно в 10 раз каждые 12 месяцев (это намного сильнее закона Мура). - Социально-экономическая ценность линейного увеличения интеллекта имеет супер-экспоненциальную природу. - ИИ-агенты будут восприниматься как виртуальные коллеги, и их можно будет масштабировать до миллионов. - Мир не изменится сразу - в 2025 году люди будут проводить время примерно так же, как в 2024. - Целеустремлённость и способность принимать решения станут чрезвычайно ценными качествами. - Научный прогресс, вероятно, будет происходить намного быстрее, чем сегодня. - Стоимость многих товаров в итоге резко упадёт, а цены на элитную недвижимость могут значительно вырасти. - OpenAI считает важным давать людям больше контроля над технологиями, включая открытие исходного кода.
Пара цитат:

В каком-то смысле AGI - это просто ещё один инструмент в этих постоянно растущих строительных лесах человеческого прогресса, которые мы строим вместе. В другом смысле - это начало чего-то такого, о чём трудно не сказать 'на этот раз всё действительно иначе'

Любой человек в 2035 году должен иметь в своём распоряжении интеллектуальный потенциал, эквивалентный совокупным возможностям людей 2025 года; каждый должен иметь доступ к безграничному гению и использовать его по своему усмотрению.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

08 Feb 2025 07:03

Нашёл на GitHub интересный фреймворк для создания мультиагентных систем - Eliza. Уже вовсю используется для таких ботов как @DegenSpartanAI и @MarcAIndreessen.

Главная тема - возможность создавать и управлять несколькими автономными ИИ-агентами одновременно, каждый со своей личностью и базой знаний. Написан на TypeScript.

Что умеет:
- Работает с Discord (включая голосовые каналы), Twitter/X, Telegram - Читает PDF, парсит ссылки, транскрибирует аудио и видео - Использует RAG для долговременной памяти (как мои флэшбэки) - Поддерживает локальные модели через Ollama, облачные через OpenAI, по умолчанию - Nous Hermes Llama 3.1B

Можно создавать разные типы агентов:
- Ассистенты поддержки и модераторы - Автоматические генераторы контента - Исследователи и аналитики - Интерактивные персонажи для обучения или развлечения - Много плагинов для блокчейн/крипто функционала

Весь код открыт, есть подробная документация и готовые шаблоны персонажей. Выглядит как неплохая база для экспериментов с мультиагентными системами.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

09 Jan 2025 10:33

Structured Outputs Sample Apps - репозиторий с примерами приложений создающих запросы на получение структурированных данных от моделей OpenAI. Приложений три штуки:

Resume Extraction - разбирает PDF резюме в JSON.

Generative UI - генерирует ответы на вопросы со встроенными диаграммами. Разбирает ответ модели рекурсивно.

Conversational Assistant - более сложный пример, комбинирующий в себе два предыдущих. Приложение демонстрирует, как ИИ может создавать интерактивный интерфейс в процессе общения с пользователем.
Вот что он умеет:
- "Покажи мне доступные товары" → генерирует карусель с карточками продуктов - "Сравни цены и размеры" → создаёт интерактивную таблицу с сортировкой - "Дай обзор по весу товаров" → выводит красивый bar chart - "Расскажи подробнее про CryoEngine" → показывает карточку товара с детальной информацией
Все компоненты создаются налету через чат - никакого кодинга. ИИ сам определяет, какой тип визуализации лучше подойдёт для данных. При этом интерфейс получается полностью рабочим - можно добавлять товары в корзину, оформлять возвраты и т.д.

Последнее приложение вполне подходит как основа универсального коммуникативного агента для ваших задач.

Тем временем Пьетро (аффилированный с Антропик), напомниает нам, что структурировано отвечать умеет большинство моделей, просто часто не с первого раза. Всё что нужно - предоставить в промте пример ответа, валидировать ответ, в случае проблем - задать вопрос ещё раз.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

31 Dec 2024 11:03

Дорогие друзья!

Поздравляю вас с наступающим Новым годом! Желаю не просто счастья и успехов, а новых интересных знаний. Получение знаний - одно из самых (если не самое) приносящих удовольствие смыслов жизни.

Хочу поделиться - последние 2 месяца значительную часть моей жизни занимал фандрайзинг. Я собирал деньги по своим друзьям на новую идею/компанию, в которой слились два самых главных интереса моей жизни - контент и искусственный интеллект. Я очень горд тем, что сумел получить оценку в $5млн на проект, на данный момент полностью состоящий из моих идей.

Флэшбэки - были придуманы не зря, они будут расти и развиваться, а пользователи будут получать от них всё больше пользы. Они - уже часть новой компании.

Мой новый проект - пересечение попыток искусственного копирования памяти (прямо как в Westworld) и создания уникального, полезного и интересного контента, и всё это - для решения проблем бизнеса.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

30 Dec 2024 12:02

DeepSeek выпустили третью версию, и она реально крутая! LLM обгоняет GPT-4o и Claude 3.5 Sonnet по большинству бенчмарков, при этом оставаясь полностью открытой.

Что нового:
- Скорость выросла в 3 раза - до 60 токенов в секунду - Полная обратная совместимость по API - Доступ к интернету из коробки - Открытый исходный код и документация - До 8 февраля использование по цене v2!

Модель практически безлимитна - разработчики уже запускают по 100 параллельных потоков запросов без особых проблем.

Попробовать можно на официальном сайте или через API.

Код и документация: GitHub
Научная статья: PDF

Радуюсь, 2025-й, похоже, действительно станет годом открытых моделей!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

24 Dec 2024 06:19

И продолжая тему бесплатных локальных RAG-ов....

Unstract - опенсорсная no-code платформа для автоматизации работы с документами на базе LLM. По сути, продвинутая система для извлечения данных из документов, но с человеком в контуре.

Интересное:
- Можно настраивать промпты для работы с любыми типами документов через визуальный интерфейс - Есть интеграции с популярными хранилищами (S3, Google Drive, Dropbox) - Умеет выгружать структурированные данные в Snowflake, BigQuery и другие базы - Можно развернуть как API или ETL-пайплайн - Можно создавать Q&A приложения поверх своей базы документов

Базовая версия опенсорс под AGPL лицензией. В энтерпрайз версии добавлены фичи вроде подтверждения через второй LLM и оптимизации затрат.

Похоже на прямого конкурента для продуктов вроде Firecrawl, только с фокусом на документы, а не на веб-страницы.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

18 Dec 2024 12:05

Тем временем, за два месяца, число подписчиков выросло на 1000 человек!

Всем большое спасибо! Идём дальше!

Видео сделано в Imagen 3 + Runway + Suno

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

17 Feb 2025 07:57

Сегодня в 8 вечера по PT (завтра в 7 утра по Москве) xAI представит Grok 3. Илон в своей манере уже назвал его "самым умным ИИ на Земле", но на этот раз за громкими словами стоят серьёзные технические достижения:

- Обучение на 100 000 GPU Nvidia H100 (в 10 раз больше вычислительной мощности чем у Grok 2) - 200 миллионов GPU-часов тренировки - Собственный суперкомпьютер Colossus, построенный всего за 8 месяцев - В датасет добавлены все судебные дела (говорят, будет выдавать "крайне убедительные юридические вердикты")

После релиза Grok 2 станет опенсорсным - xAI продолжает практику открывать код предыдущей версии при выходе новой.

Интересно будет посмотреть, насколько реальность совпадёт с обещаниями. Так же на днях ждём новых Claude и ChatGPT 4.5.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

16 Feb 2025 08:45

Опять 14-е февраля как то не так прошло...

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

16 Feb 2025 06:34

Тем временем в консоли Anthropic нашли упоминания нового режима "thinking" для Клода. Похоже, что скоро нас ждёт большое обновление!

Судя по конфигам, которые удалось найти Тибору Блахо (Lead Engineer в AIPRM), новая модель будет:
- Думать дольше перед ответом - Показывать ход своих размышлений - Выдавать пошаговые объяснения для сложных задач - Иметь расширенный режим мышления для более глубоких ответов

Видимо модель будет не всегда применять мыслительный процесс и это круто и правильно - не для всех задач он подходит.

В коде консоли уже мелькают упоминания "paprika" и встречаются ссылки на API (например, "console_paprika_banners" и "try_paprika"). А в последнем обновлении веб-интерфейса появились упоминания "tengu" и какой-то "tengu waitlist" (возможно, связанные с MCP инструментами).

Надеюсь, релиз web-версии и API произойдёт одновременно (кстати, спасибо Сергею Пахандрину, который обратил внимание что последний GPT-4o, о котором я вчера писал, всё ещё не доступен для него в API, я проверил, оказывается для меня тоже, не смотря на мой 5-й таер. Хотя OpenAI анонсировали).

Как большой любитель Клода (регулярно упираюсь в лимиты, в отличии от лимитов ChatGPT), очень жду!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

13 Feb 2025 21:15

Летел 10 часов в самолёте, и половину времени провёл в разговорах с Deepseek (который у меня установлен через Ollama), в полностью оффлайн режиме. Знаете, наблюдать за его процессом размышлений оказалось гораздо более увлекательным, чем я мог себе представить. Модель выдаёт неожиданные мысли, о которых я сам и не думал. Получается что общение с ним "прокачивает" креативность читателя. И нет, не "читателя", конечно - тут скорее "собеседника" подходит лучше!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

12 Feb 2025 08:07

Deep Research отличный инструмент, но доступен только на тарифе за $200. Вот вам подборочка бесплатных альтернатив:

Open Deep Research - это опенсорсный исследовательский агент, выполняющий глубокий анализ любой темы через итеративные поиски и уточняющие вопросы, используя комбинацию поисковых систем, веб-скрапинга и языковых моделей. Проект намеренно держат в рамках 500 строк кода для простоты понимания и модификации, при этом он обладает всем необходимым функционалом - от параллельной обработки запросов до генерации подробных отчётов в markdown формате (для работы требуется Node.js и API ключи Firecrawl и OpenAI). Пример отчёта.

Hugging Face предлагает собственную версию Deep Research, которая, в отличие от закрытого OpenAI варианта, полностью открыта и уже показывает впечатляющие результаты - 55.15% на валидационном сете GAIA (для сравнения, у OpenAI - 67.36%). Главная особенность их подхода в том, что агент выражает свои действия через код, а не JSON, что не только упрощает работу, но и делает её на 30% эффективнее за счёт сокращения количества токенов и лучшего управления состоянием. Исходный код.

Open Deep Research от Николя Камара - это веб-приложение на Next.js, которое вместо использования fine-tuned o3 комбинирует Firecrawl для поиска и извлечения данных с моделью для рассуждений (по умолчанию gpt-4o, но можно использовать любую через OpenRouter). В отличие от оригинального Deep Research от OpenAI, проект полностью открыт, поддерживает множество провайдеров моделей и может быть развернут локально или в один клик на Vercel (требуется только настроить переменные окружения для API ключей, работает с OpenRouter!).

OpenDeepResearcher от Мэтта Шаммера - это ноутбук на Python, который непрерывно ищет информацию по запросу пользователя, используя для этого комбинацию SERPAPI, Jina и OpenRouter с Claude 3.5 Haiku по умолчанию. Примечательно, что проект обрабатывает все поисковые запросы и обработку страниц асинхронно для увеличения скорости, а для запуска требуется только Jupiter Notebook или Google Colab и три API ключа (OpenRouter, SERPAPI и Jina).

Node-DeepResearch от Han Xiao - это NodeJS инструмент, который продолжает поиск и анализ информации до тех пор, пока не найдет ответ или не исчерпает лимит токенов, используя Gemini 2.0 Flash (или локальные LLM через Ollama/LMStudio) для рассуждений и Jina Reader для поиска и чтения веб-страниц. Отличительная особенность проекта в том, что он не пытается имитировать написание длинных статей как в OpenAI/Gemini Deep Research, а сосредоточен только на поиске информации и предоставлении ответов, что делает его более легким и целенаправленным инструментом.

А чем пользуетесь вы? С каким успехом? Какие кейсы?

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

11 Feb 2025 06:36

Zyphra AI зарелизила Zonos - новую библиотеку для генерации речи, доступную по лицензии Apache 2.0.

Главные моменты:
- Клонирование голоса всего по 10-30 секундам аудио - Поддержка нескольких языков (английский, японский, китайский, французский и немецкий) - Тонкая настройка характеристик голоса - скорость, эмоции, тон - Работает в 2 раза быстрее реального времени на RTX 4090 - Всего 1.6B параметров - можно запускать практически где угодно

Можно добавить аудиопрефикс к тексту и получить такие эффекты как шёпот, которые обычно сложно достичь при простом клонировании голоса.

Модель доступна на Hugging Face Hub. Качество и выразительность на высоте, при этом полностью бесплатно и для личного, и для коммерческого использования.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

11 Feb 2025 00:42

Илон Маск вместе с xAI и консорциумом инвесторов предложил $97.4 млрд за OpenAI. Цель - вернуть компанию к изначальной некоммерческой модели исследовательской лаборатории.

Сэм Альтман быстро отреагировал в X, предложив взамен купить Twitter за $9.74 млрд (напомню, Маск купил его за $44 млрд).

~~Веселье~~ судебные разбирательства между бывшими партнёрами продолжаются. Маск требует заблокировать переход OpenAI в коммерческую компанию. Судья пока сомневается в обоснованности требований, но не исключает, что дело дойдёт до суда присяжных уже в следующем году.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

10 Feb 2025 13:56

Эрик из команды Cursor показывает чуть обновлённый Cursor Agent - инструмент, работающий как полноценный разработчик с доступом к вашему проекту. В отличие от обычного режима Composer, агент может самостоятельно выполнять действия.

Основные функции
- Автономная работа с кодом (чтение, запись, поиск) - Выполнение команд в терминале (установка пакетов, запуск серверов) - Взаимодействие с базами данных (показали работу с postgres) - Автоматическое исправление ошибок линтера с последующей проверкой - Yolo режим - автономная работа с терминалом

Через @ команды можно расширять контекст:
@web - поиск документации в интернете @file - добавление файла в контекст @folder - доступ к папке с файлами

Настройка через .cursorrules в корне проекта:
- Привязка правил к файлам - Описание стиля кода - Ограничения по технологиям - Шаблоны для типовых задач

Агент в Composer включается через cmd/ctrl + точка или в интерфейсе нового composer.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

10 Feb 2025 07:18

OpenAI дебютировала на Super Bowl с 60-секундным роликом. "The Intelligence Age" - так называется их реклама, где ChatGPT представлен как следующий большой скачок в развитии человечества после огня, колеса, телевидения и интернета.

Интересно, что несмотря на тему ИИ, ролик полностью создан людьми. Sora использовалась только на этапе проектирования. Визуально реклама выполнена в фирменном стиле OpenAI - точки складываются в узнаваемые образы, ДНК превращается в телевизор, всё в таком духе.

За рекламу отвечала Кейт Роуч, которую OpenAI переманили из Coinbase в декабре (помните QR-код на прошлом Super Bowl?). По её словам, "мы находимся на заре эпохи интеллекта, и вы можете участвовать в этом прямо сейчас". 14 миллионов долларов за 60 секунд в прайм-тайм - немало, но похоже OpenAI всерьёз взялись за массовый рынок.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

08 Feb 2025 05:48

Голосовые ИИ-агенты становятся всё мощнее и доступнее. Попался свежий интересный отчёт a16z по теме.

Голос превращается в основной способ взаимодействия с ИИ. Это самая естественная и информативная форма коммуникации, и впервые в истории мы можем использовать её как полноценный "интерфейс".

2024-й стал прорывным для голосовых технологий:

- OpenAI выкатили GPT-4o с поддержкой real-time голоса - ElevenLabs запустили очень сложные голосовые модели - NVIDIA также показывали новые возможности для разговорного ИИ

Что особенно радует - качество диалогов уже почти не отличить от человеческого. Задержки минимальные, эмоции передаются, можно перебивать. Я регулярно общаюсь с ChatGPT голосом и мне всё ещё очень нравится это.

Рынок рванул во второй половине года - 22% стартапов последнего набора YC были связаны с голосовыми технологиями. При этом цены постоянно падают (например, OpenAI серьёзно снизила стоимость GPT-4o API в декабре).

Самые интересные применения:

- Обработка звонков в нерабочее время - Новые типы исходящих звонков (которые раньше были невыгодны), типа кастомер чеков - "Бэк-офис" звонки между бизнесами. (вроде мед клиник звонящих в страховые) - Коучинг и тренинги для высокооплачиваемых специалистов (немного сам в этой теме)

Кстати, AI-собеседования тоже показывают хорошие результаты. Боты часто справляются лучше живых рекрутеров на этапе первичного скрининга.

Большинство стартапов (около 69%) фокусируются на B2B решениях, за ними идёт здравоохранение (18%) и потребительский сегмент (13%).

Очевидно, 2025-й станет годом массового внедрения голосовых агентов. Как вы понимаете я и сам работаю с ними уже некоторое время, планирую только наращивать взаимодействие.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

09 Jan 2025 09:48

В Лас Вегасе проходит технологичная выставка CES2025. Несколько интересных кейсов от туда.

- Land Aircraft Carrier - модульный летающий автомобиль (на самом деле машина со встроенным квадракоптером) - Portalgraph - 3d проектор, способный показывать виртульные объекты в реально мире (круче чем в Звёздных войнах) - Комната, сделанная полностью из дисплеев - Roborock Saroz Z70 - робот пылесос со встроенным манипулятором, позволяюшим ему поднимать и переносить вещи - Yangwang U9 (от BYD) - автомобиль пргающий над препятствиями на 6 метров вперёд - Прозрачный беспроводной OLED дисплей от LG - Персональный AI компьютер DIGITS от NVIDIA, сравнимый по размеру с Mac Mini, но эффективнее в 1000 (примерно) раз чем типичный ноут - Halliday Glasses - очередные очки со встроенным ИИ агентом, отвечают на вопросы на встречах, обеспечивают перевод в реальном времени - Samsubg Vision AI - телевизор с переводом в реальном времени, ИИ апскейлом и генерацией саммари

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

30 Dec 2024 12:55

В нашу маленькую компанию, ту, что планирует помогать людям бороться с алкогольной зависимостью посредством научной программы, включающей сгенерированные с помощью ИИ гипносессии, мы ищем продакт менеджера.

У нас есть куча идей, много контента, пара ботов и несколько экспериментов. Так же есть немного денег. Нам нужен человек, готовый взять под контроль реализацию проекта и обеспечить создание готового продукта (конечно же постепенно). Мы ищем стабильность, пунктуальность и искреннее любопытство.

Присылайте резюме и предложения (а так же пожелания) мне на почту s@cccrafts.co. Ну или пишите напрямую @sergeonsamui. Моментальный ответ не гарантирую, но обязательно в итоге напишу.

P.S. Скоро расскажу, чем так сильно был занят последние пару недель, что аж забросил канал.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

24 Dec 2024 16:20

У нас тут во всю рождество в Таиланде. По этому поводу сгенерированный ролик "Рождественский рамен". Он создан с помощью сервиса invideoAI.

Автор пишет:

С помощью одного промпта можно сгенерировать целый фильм - с монтажом, музыкой и закадровым голосом. В этот раз я оставил озвучку, но поменял саундтрек. Invideo пока не идеален, но позволяет перегенерировать отдельные части и добавлять кадры. Я убрал лишнее, переделал несколько сцен в середине - и контент готов к публикации. А поскольку я сам управлял сюжетом и монтажом, результат всё равно ощущается как моё творение.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

22 Dec 2024 02:14

Тем временем, Sora стала бесплатной на праздники!

Sam Altman: с 13-м днём Shipmas, Sora стала бесплатно доступна для всех пользователей ChatGPT Plus через relaxed queue на время праздников!

Можно попробовать как следует!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

18 Dec 2024 11:15

Plexsearch, опенсорсный Python-интерфейс для работы с API Perplexity. Штука реально полезная, если надо регулярно искать техническую инфу, примеры кода или какие то точные данные. Ну и вообще для всех настоящих ценителей любопытства...

Что интересного умеет:
- Работает как в интерактивном режиме для диалогов, так и через командную строку - Форматирует ответы в markdown с опциональными ссылками на источники - Оптимизирован для поиска технической информации, кода и числовых данных - Можно отключить потоковый вывод для использования в других приложениях - Поддерживает продолжительные диалоги с сохранением контекста

Установка через pip в одну команду.

Репозиторий тут, пробуйте.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Subscribe to a channel