12304
Стартапер, создал в том числе Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде, Бока Ратон. Тружусь над агентом по созданию контента на основе оцифрованной памяти человека: https://co.actor tg: @sergeonsamui in: linkedin.com/in/sbulaev
🔒📧 Proton запустил AI помощника для написания писем с повышенными вниманием к конфиденциальности.
Швейцарская компания Proton, известная своими приватными сервисами (и которой я пользуюсь уже довольно давно), представила Proton Scribe - AI-асистента для составления и редактирования писем.
Ключевые моменты:
- Работает полностью на устройстве пользователя, без отправки данных на сервер
- Основан на open-source модели Mistral 7B
- Не обучается на пользовательских данных
- Доступен под открытой лицензией GPL-3.0
Цель Proton - предложить безопасную альтернативу сторонним AI-инструментам, особенно для бизнес-пользователей, обеспокоенных утечкой конфиденциальных данных.
#ПриватностьИИ
@sergiobulaev - об AI и приватности
🎙️ Посмотрел очередной выпуск подкаста AI&I. Интервью со Стеф Смит о будущем создания контента в эпоху ИИ. Стеф - настоящий исследователь интернета, ведущая подкаста a16z и создатель множества проектов, включая Internet Pipes(инструмент для поиска новых интересных знаний) и книгу "Doing Content Right".
Вот несколько интересных моментов:
🎨 Стеф создала почти все иллюстрации для Internet Pipes с помощью ChatGPT и Midjourney. Она рассказала, как использовала тренд "make it more" для визуализации процесса выпечки картофеля, демонстрируя эволюцию идеи.
🔍 Поиск эстетики: Стеф просматривала главную страницу Midjourney, изучая промпты понравившихся изображений. Это помогло ей правильно артикулировать свои желания и создать уникальный стиль для проекта.
🤖 Стеф считает, что будущее за узкоспециализированными ИИ-инструментами. Она поделилась своими фаворитами:
Consensus
: ИИ-поисковик для научных запросов
Globe Explorer
: создает "оглавления" для каждого запроса
Архитектор из Турции Фатих Экши, делает из овощей и фруктов (и даже шаурмячного вертела) проекты концептуальных зданий с помощью AIR для SketchUp.
Это плагин, использующий ИИ для создания вдохновляющих архитектурных и дизайнерских визуализаций. Он даёт широкий спектр стилей рендеринга, от планировок до ручных эскизов. AIR позволяет быстро и легко генерировать качественные визуализации на основе моделей SketchUp, эскизов или фотографий, предоставляя дизайнерам мощный инструмент для воплощения их идей.
#Архитектура
Сергей Булаев AI 🤖 - об AI и не только
Эллисон Джонсон, больше 10 лет рассказывающая о фото технике, написала для The Verge статью о новой функции генерации изображений с помощью ИИ в смартфонах Samsung.
Samsung представила инструмент "sketch to image" (эскиз в изображение) в новом Galaxy Z Fold 6. Функция позволяет превращать простые наброски в реалистичные изображения с помощью ИИ.
Качество и реалистичность генерируемых изображений впечатляет, особенно при добавлении элементов в существующие фотографии. Смотрите примеры в оригинальной статье.
ИИ способен создавать элементы, которые органично вписываются в фотографии, учитывая масштаб и окружение. Не все получается идеально, но достойных вариантов хватает. Использование функции было очень увлекательным.
Ожидается, что Samsung расширит доступность этой функции на другие модели смартфонов Galaxy.
Сергей Булаев AI 🤖 - об AI и не только
🧠 Исследователи из Huawei Noah's Ark Lab и University College London представили EM-LLM - модель с эпизодической памятью, имитирующую некоторые аспекты работы человеческого мозга. Это очередной шаг в улучшении обработки длинных контекстов в AI. Полный текст публикации.
EM-LLM сегментирует информацию на события, используя уровень неожиданности (surprise) и графовые алгоритмы. Как это работает?1. Модель оценивает, насколько каждый новый токен неожидан в контексте предыдущих. Чем выше неожиданность, тем вероятнее, что это начало нового "события".
2. Далее используется матрица сходства между ключами внимания в слоях трансформера. Эта матрица рассматривается как граф, где токены - вершины, а сходство между ними - веса рёбер. Применяются алгоритмы кластеризации графов для уточнения границ событий.
Процесс извлечения памяти включает два этапа:1. Поиск по сходству: выбираются k событий, наиболее похожих на текущий запрос.
2. Сохранение временной последовательности: для каждого выбранного события добавляются соседние события из исходной последовательности.
Это имитирует эффекты временной смежности и асимметрии, наблюдаемые в человеческой памяти - тенденцию вспоминать события, близкие по времени и в определенном порядке.
Результаты тестировались на LongBench - наборе задач для оценки работы с длинными текстами:- 4.3% общий рост по сравнению с современными моделями
- 33% улучшение в задаче PassageRetrieval, где нужно найти исходный параграф по его краткому содержанию
EM-LLM можно применить к существующим моделям без переобучения, что упрощает внедрение
Этот подход перекликается с моим проектом https://flashbacks.ai, где я рабатаю над AI-ассистентом для людей которые боятся деменции (таких как я). Принципы EM-LLM могут помочь в создании подобного помощника, способного лучше организовывать и извлекать воспоминания.
Хотя EM-LLM показывает неплохие результаты, она все ещё очень далека от полного воспроизведения сложности человеческой памяти.
#AIMemory #flashbacksAI
@sergiobulaev - об AI и когнитивных технологиях
🚌 Добавил возможность проверять свою регистрацию на автобус в бота Ulcamp. Просто дал Клоду ещё одну функцию, позволяющую проверить, зарегистрирован ли пользователь на трансфер или нет.
{
"name": "check_bus_schedule",
"description": "Check which bus is user registered for using information that is kept in function database. Phone is optional. Just send a request to recieve schedule.",
"input_schema": {
"type": "object",
"properties": {"phone": {"type": "string"}},
},
},
Тем временем Anthropic удвоили размер максимального лимита количества сгенерированных токенов для Claude 3.5 Sonnet при запросах через API. Теперь он - 8192!
Чтобы воспользоваться, нужно добавить дополнительный заголовок в запрос на создание сообщения:"anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15"
Также увеличенное окно доступно в консоли. В Claude.ai пока не меняли, но планируют выкатывать.
Сергей Булаев AI 🤖 - об AI и не только
🤖 Исследователи Кембриджского университета обнаружили эмпатический разрыв в AI-чатботах, который особенно опасен для детей.
Основная проблема - дети воспринимают чатботов как живых собеседников, но AI не способен адекватно реагировать на их уникальные потребности.
Исследование выявило реальные случаи опасных ситуаций. Alexa посоветовала 10-летнему ребенку коснуться монетой электрической розетки, а My AI от Snapchat дал 13-летней девочке советы о том, как лишиться девственности. 😱
50% учеников 12-18 лет используют ChatGPT для учебы, но только 26% родителей знают об этом. Это показывает, насколько слабо контролируется использование AI детьми. 📚
Dr Nomisha Kurian предлагает рамочную концепцию из 28 пунктов для создания "детской безопасной AI". Некоторые ключевые моменты:- Оценка способности AI понимать детскую речь и сленг 🗣️
- Наличие встроенных фильтров контента и мониторинга 🛡️
- Поощрение обращения детей к взрослым по чувствительным вопросам 🤝
- Привлечение педагогов и экспертов по детской безопасности к разработке AI 👩🏫
Цель - сделать AI полезным инструментом для детей, а не источником потенциальной опасности.
#ДетиИИ
@sergiobulaev - об AI и не только
Рубрика #ДругПрислал
Друга тут встречал из РФ
пока его ждал, за 2 минуты GPT написал текст песни, а suno
спела песню
жанр правда я джазовый выбрал, но видимо сделал это как-то не так )
в целом здорово, устал смеяться
🤖 Инженеры Северо-Западного университета разработали новое устройство для создания мягких роботов, которое имитирует работу человеческих мышц.
Основа разработки - актуатор, который расширяется и сжимается подобно мышечной ткани.
С помощью актуатора создали робота-червя и искусственный бицепс. Червь смог пройти через узкую извилистую трубу, а бицепс поднял 500-граммовый вес 5000 раз подряд без сбоев. 💪
Стоимость материалов для одного актуатора - всего $3 (без учёта мотора). Это резко контрастирует с обычными жёсткими актуаторами, которые могут стоить сотни и тысячи долларов. 💰 Такая доступность может ускорить развитие мягкой робототехники.
#Роботы
@sergiobulaev - об AI и не только
Круто, конечно, рассуждать об инновациях и AI-революции, считать себя солопренёром, способным в одиночестве создавать и поддерживать большие коммерческие продукты.
А потом ты оказываешься без одной руки на три недели и исправлять всплывшие баги видео из Матрицы никак не помогает ;)
Ну, неделя прошла, осталось ещё две. Писать тексты и программы жутко неудобно ;)
@sergiobulaev - об AI и не только ;)
У Робби Уильямса дошли руки спросить у ChatGPT что он о нём думает. В ответ, после серии комплиментов, была предложена помощь с креативом ;)
Так же видно что Робби пользуется Grammarly. Я - тоже ;)
@sergiobulaev - об AI и не только
🚀 Hebbia привлекла $130 млн в новом раунде, который провел Andreessen Horowitz. Стартап разрабатывает AI-решения для финансового сектора.
Основной продукт компании, Matrix, позиционируется как переход от Software-as-a-Service к Service-as-a-Software. Суть в том, что AI не просто помогает в работе, а выполняет задачи целиком.
Matrix создает AI-агентов, которые анализируют данные и выдают готовые отчеты. И делают это в 60 раз быстрее человека: 2-3 часа работы превращаются в 2-3 минуты. ⏱️ Это уже заинтересовало крупные финансовых компаний и корпорации из списка Fortune 500.
Помимо финансов, Hebbia работает в сфере в юриспруденции, консалтинга и производства. Подобный рост эффективности естественно поднимает вопросы о потенциальном сокращении рабочих мест в аналитике.
Будущее SaaS от Hebbia - это "идеальный аналитик": всегда доступен, не делает ошибок, имеет бесконечное терпение. И судя по таким инвестициям, в это будущее многие верят. 💰
#HebbiaAI #a16z
@sergiobulaev - об AI и всём таком.
Мне кажется, мой любимый момент из «Матрицы» стал актуален как никогда и отлично демонстрирует творящуюся вокруг нас революцию.
@sergiobulaev - об AI и всём таком
Примерно час ушел у Андрея Карпаты, что бы сделать это видео из нескольких сцен из "Гордости и Предубеждения".
Использованный стэк:- Claude для генерации сцен и подсказок для создания изображений на основе первой главы книги.Ideogram AI
- для создания изображений по этим подсказкам.- Анимировал полученные изображения с помощью Luma Labs AI.ElevenLabs
- Добавил озвучку, используя .Veed Studio
- Собрал все элементы в единое видео с помощью .
Андрей написал, что было напряжно и он подустал копипастить.
@sergiobulaev - об AI и всём таком
🤖🐜 Исследователи из TU Delft опубликовали в Science Robotics работу о навигации крошечных роботов.
🧠💡 Задачей исследование было: как сделать так, чтобы крошечный робот мог самостоятельно ориентироваться в пространстве, имея минимум вычислительных ресурсов? Современные подходы к AI-навигации требуют мощных процессоров и большого объёма памяти.
🐜🧭 Исследователи обратили внимание на муравьёв. Они способны находить дорогу домой, имея "компьютер" размером с булавочную головку. Секрет муравьёв - в комбинации простого подсчёта шагов и запоминания ключевых визуальных ориентиров.
📏📸 Был разработан алгоритм навигации, который требует всего 1.16 килобайт памяти на 100 метров пути. Это позволило 56-граммовому дрону автономно летать на расстояния до 100 метров и возвращаться обратно, используя только встроенный микроконтроллер и простую камеру.
🧠🔍 Вместо попыток впихнуть огромную нейросеть в крошечное устройство, исследователи создали простой, но эффективный алгоритм, имитирующий природные механизмы.
🚀🌱 Такой подход открывает дорогу для создания целого класса микро-AI систем, способных выполнять сложные задачи с минимальными ресурсами. Представьте рой таких микродронов, мониторящих склады или теплицы, или крошечных роботов, исследующих труднодоступные места.
#МикроИИ
Сергей Булаев AI 🤖 - об AI и не только
🧠 Исследователи из Университета Эксетера и Школы менеджмента UCL провели исследование о влиянии ИИ на творческий процесс написания рассказов. Результаты, опубликованные в Science Advances, показывают интересные последствия использования ИИ в креативных задачах.
🔬 Как проходило исследование:- 300 участников писали "микро-рассказы" из 8 предложений.
- 3 группы: без ИИ, с одной идеей от ChatGPT, с выбором из 5 ИИ-идей
- 600 человек оценивали результаты
📊 Выводы:- ИИ повысил новизну идей на 8.1% и их "полезность" на 9%
- Рассказы стали более профессиональными: лучше написаны, интереснее, менее скучные
- ИИ особенно помог менее креативным авторам, улучшив их работы до 26.6%
- Но: Истории, написанные с помощью ИИ были более похожими друг на друга
🧠 Инсследователи использовали Divergent Association Task (DAT) для оценки базовой креативности участников. Оказалось, что менее креативные авторы получили наибольшую пользу от ИИ-ассистента.
⚠️ Профессор Оливер Хаузер предупреждает:
"Несмотря на улучшение индивидуальной креативности, существует риск потери коллективной новизны. Если издательская индустрия начнет активно использовать ИИ, истории могут стать менее уникальными в целом."
🏠💰 Роскошный особняк Сэма Альтмана за $27 млн оказался проблемным.
Генеральный директор OpenAI Сэм Альтман столкнулся с неожиданными проблемами в своём модном особняке в Сан-Франциско. Дом площадью около 880 кв. метров, расположенный на знаменитой улице Ломбард, оказался настоящим разочарованием с множеством дефектов.
🏊♂️ Бассейн-инфинити, нависающий над краем дома, протекает, заливая нижний этаж.
🚽 Неисправная канализация сливает сточные воды прямо в землю.
🌱 Система полива сада и смыва туалетов, использующая переработанную дождевую воду, даёт сбои.
🦇 C пещерой Бэтмена, ведущей в гараж, вроде всё ок.
Согласно судебному иску, поданному командой Альтмана, застройщик Troon Pacific намеренно исказил информацию о качестве недвижимости, чтобы продать её "как можно быстрее". Более того, некоторые подрядчики якобы "отомстили" за задержку оплаты, забив канализационные трубы мусором.
💰 Только ремонт бассейна оценивается в $4 млн, не считая других многочисленных проблем.
Интересно, что это не первый скандал с участием Troon Pacific. В мае компанию обязали вернуть $50 млн инвесторам за незавершенный проект реновации в Сан-Франциско.
Через неделю буду там - надо будет дойти посмотреть до дома вижвую :)
#СэмАльтман #OpenAI
Сергей Булаев AI 🤖 - об AI и не только
Андрей Карпаты, бывший глава отдела ИИ в Tesla и исследователь в OpenAI, запускает Eureka Labs - образовательную платформу с использованием ИИ. Цель Eureka Labs - создать ИИ-ассистентов для обучения, которые будут работать вместе с преподавателями, чтобы "каждый мог изучить что угодно".
Первый продукт компании - курс по ИИ под названием LLM101n, который научит студентов создавать собственный ИИ. Курс обещает показать как создавать веб-приложение, подобное ChatGPT, с нуля, используя Python, C и CUDA.
Точные детали о финансировании Eureka Labs, бизнес-модели и команде пока неизвестны.
Карпаты описывает Eureka Labs как кульминацию его 20-летней страсти к ИИ и образованию.
До этого Карпаты работал в Stanford University, OpenAI и Tesla, где руководил командой компьютерного зрения для системы Autopilot. Параллельно с работой над Eureka Labs, Карпаты ведет онлайн-курс "Neural Networks: Zero to Hero" и AndrejKarpathy">YouTube-канал с лекциями об ИИ и языковых моделях.
Я тут недавно по его видео разбирался руками как вообще работают трансформеры.
Сергей Булаев AI 🤖 - об AI и не только
Звёзды и их молодость
Сергей Булаев AI 🤖 - об AI и не только
🤖 Команда AutoGPT представила новое поколение своего инструмента для создания автономных AI-агентов. Это pre-alpha версия с открытым исходным кодом, доступная на GitHub.
Ключевые особенности нового AutoGPT:
Модульная архитектура на основе Блоков - функциональных компонентов для настройки поведения агентов. Двухкомпонентная структура: AutoGPT Server (бэкенд) и AutoGPT Builder (фронтенд для сборки агентов)
Есть несколько примеров - блоки для Reddit, Wikipedia, Discord.
На видео - процесс создания AI-агента для маркетинга на Reddit, показывая, насколько быстрым и простым стал этот процесс.
Пример блока для получения инфы из Wikipedia:
class GetWikipediaSummary(Block):
class Input(BlockSchema):
topic: str
class Output(BlockSchema):
summary: str
def **init**(self):
super().__init__(
id="h5e7f8g9-1b2c-3d4e-5f6g-7h8i9j0k1l2m",
input_schema=GetWikipediaSummary.Input,
output_schema=GetWikipediaSummary.Output,
test_input={"topic": "Artificial Intelligence"},
test_output={"summary": "Artificial intelligence (AI) is intelligence demonstrated by machines..."},
)
def run(self, input_data: Input) -> BlockOutput:
response = requests.get(f"https://en.wikipedia.org/api/rest_v1/page/summary/{input_data.topic}")
summary_data = response.json()
yield "summary", summary_data['extract']
Посмотрите на тестовый прогрев двигателей ускорителя Super Heavy. Он прошёл сегодня ночью (ну ночью то у вас, у нас то - день был). 33 двигателя Raptor! Мощнее Saturn V, ракеты, доставившей людей на Луну больше чем в 2 раза. 5-й полёт должен состояться в августе. Цель - точная посадка на стартовую площадку. Я смотрел прошлый запуск, под конец там всё очень сильно обгорело и разрушилось.
Сергей Булаев AI 🤖 - об AI и не только
Голодный, целеустремленный, извивающийся в игре жизни.
Пьетро Ширано, автор Claude Engineer, превратил Claude Sonnet 3.5 в змею, играющую в классическую змейку, и попросил рассказать о своих ощущениях.
3.5 Sonnet - единственная модель, у которой это получается.
Удивительно наблюдать за логикой его действий и как он проходит сквозь стены, чтобы получить еду быстрее и безопаснее.
Когда я говорю "единственная модель", я буквально имею это в виду. Я тестировал их всех. 3.5 S - единственная, которая может интеллектуально отобразить сетку в своем уме, найти еду и, что более важно, понять, что она может обходить стены. Независимо от того, насколько сложными были мои промпты, я просто не мог заставить работать эту игру с другими.
1. Уменьшил доску до 10x10, все работает очень медленно и дорого, видео сжато до 45 секунд из 11 минут.
2. Поменял центр координат на нижний левый угол, чтобы движение вверх означало прибавление координат, а не вычитание.
3. Добавил в промпт реальный кусок кода из функции, чтобы он лучше понял, как работают команды.
4. Еще раз уточнил, как именно меняют координаты движения команды в описании функции.
Тем временем Anthropic добавил в Claude паблишинг артефактов. Теперь их можно шэйрить и ремиксовать.
@sergiobulaev - об AI и не только.
На днях мой давний знакомый и бывший сотрудник, работавший когда-то в одной из моих компаний техническим директором, выпустил собственное мобильное приложение на аккаунтах моей компании (iOS и Android) 📱.
ReceiptiX - ещё одна попытка создать удобный трекер расходов 💸. Идея автора в том, чтобы пользователь просто фотографировал чеки 📷, а программа сама разносила их по категориям. Это позволяет облегчить ситуации, когда вы, например, хотите разделить расходы на обычные продукты и алкоголь 🍔🍷 (моя личная проблема). Как вы видите, это реально работает, даже с разными валютами 🌍 - что особенно впечатлило.
Но самое интересное, что Юра всю жизнь был бэкендером чуть больше чем полностью 👨💻. Однако в связи с развитием сами знаете чего решил попробовать себя в качестве солопренёра.
Создание приложения на Flutter при помощи ChatGPT и Claude заняло у него около 4 месяцев. Результат получился весьма достойным 👏.
Обязательно скачайте и попробуйте (ещё раз, iOS и Android версии) 📲. Приложение позволяет сканировать 10 чеков бесплатно. Если у вас есть какие-то вопросы к Юре, вы можете задать их в комментариях к этому посту, и он постарается ответить.
@sergiobulaev - об AI и не только 🤖.
А как вам мышь превращающаяся в мышку?
Смотрите, новые примеры тогоe, что умеет Gen-3 Alpha от Runway:
1. Мышь становится компьютерной мышкой 🐁➡️🖱️
2. Шишка трансформируется в броненосца 🌰➡️🦔
3. Яблоко превращается в бейсбольный мяч 🍎➡️⚾
Gen-3 Alpha создает сюрреалистичные и необычные переходы между самыми разными объектами, животными и персонажами. Это не просто морфинг, а настоящее волшебство! Почитайте промпты, использованные для создания этих видео:
1. A straight on art directed shot of a furry mouse running across a desk in a 1980s cubicle and transforming into a computer mouse.
(Постановочный кадр в лоб: пушистая мышь бежит по столу в офисном кубикле 80-х и превращается в компьютерную мышь.)
2. A dynamic motion shot of a pinecone morphing into an armadillo. The scales of the pinecone flatten and expand, forming overlapping armor plates. The camera pans as the cone's shape elongates, a tail and head emerging from opposite ends. Tiny legs sprout from the sides, the woody texture giving way to leathery skin. The transformation concludes with the armadillo blinking its small eyes and curling into a protective ball, its armor plates interlocking seamlessly.
(Динамичный кадр превращения шишки в броненосца. Чешуйки шишки сплющиваются и расширяются, образуя перекрывающиеся пластины брони. Камера панорамирует, когда форма шишки удлиняется, хвост и голова появляются с противоположных концов. По бокам вырастают крошечные ножки, деревянистая текстура уступает место кожистой коже. Превращение завершается тем, что броненосец моргает маленькими глазками и сворачивается в защитный шар, его пластины брони идеально соединяются.)
3. A cinematic first person POV shot of a hand holding an apple that morphs into a baseball.
(Кинематографический кадр от первого лица: рука держит яблоко, которое превращается в бейсбольный мяч.)
Хотите узнать больше о промптах для Runway? Загляните сюда: bit.ly/3Lgmgmj
#RunwayAI #Gen3Alpha #AIVideo #NeuroArt
@sergiobulaev - об AI и всём таком
Сын обработал мне ролик из матрицы, что бы смотрелся по-ярче на аватарке ;)
Читать полностью…
Meta представила новую систему под названием Meta 3D Gen (3DGen) для создания 3D-объектов на основе текстовых описаний. Это результат исследований подразделения GenAI в Meta.
🔶 Система может генерировать высококачественные 3D-модели с текстурами и материалами менее чем за минуту. Это полностью автоматический процесс от начала до конца (end-to-end).
🔶 3DGen создает высококачественные текстуры высокого разрешения и карты материалов.
🔶 По сравнению с существующими решениями, 3DGen производит результаты более высокого качества в 3-10 раз быстрее.
🔶 3DGen состоит из двух основных компонентов: AssetGen (создает базовую 3D-модель) и TextureGen (улучшает текстуры и материалы).
🔶 Система может не только создавать новые 3D-объекты, но и изменять текстуры уже существующих моделей по текстовому описанию.
🔶 3DGen показывает лучшие результаты в точности соответствия текстовому описанию и качестве визуализации, особенно для сложных запросов.
🔶 Система использует технологию физически корректного рендеринга (PBR), что позволяет реалистично освещать созданные объекты.
🔶 Профессиональные 3D-художники высоко оценивают качество результатов 3DGen по сравнению с другими системами.
Технология может найти применение в создании игр, дополненной и виртуальной реальности, спецэффектов для фильмов и других областях.
@sergiobulaev - об AI и всём таком
Маленькие львёнок, котёнок, щенки и красная панда. 100% AI Gen-3. Вот тут есть ещё.
@sergiobulaev - об AI и всём таком.
Жизнь становится все интереснее ;)
@sergiobulaev об AI и всём таком