Пока большинство людей ленится освоить ИИ-инструменты, чтобы упростить себе жизнь, криптомиллиардеры вроде Майкла Сейлора из MicroStrategy уже вовсю используют их потенциал.
По данным Forbes, Сейлор лично владеет 17 732 биткоинами (BTC), а его компания MicroStrategy — целыми 158 245 BTC!
Подсмотрел у Сергея прикольный промпт:
Cutaway diagram of a [object], detailed with interior component, on a white background. High-resolution, with a focused technique and text callouts providing information about each part. Interior details, hyper-realistic appearance.
Новый квест для самых лучших чекеров ИИ-контента. Какое изображение сгенерировано?
Читать полностью…OpenAI представила Canvas — новый интерфейс для использования ChatGPT в написании текстов и программировани.
Ключевые особенности:
• Открывается в отдельном окне для совместной работы
• Позволяет выделять части текста для фокусировки AI
• Предлагает быстрые действия для редактирования и улучшения контента
Для кода:
• Обзор и улучшение кода
• Добавление логов и комментариев
• Исправление ошибок
• Перевод на другие языки программирования
Уже доступен для подписчиков Plus и Team, скоро — для всех пользователей
Для тех кто хочет иметь больше контроля над генерацией подкаста из текста и сразу на русском, обратите внимание: https://huggingface.co/spaces/lamm-mit/PDF2Audio
Читать полностью…Подкаст на основе постов моего блога "Айтишник из Москвы". Не влез в основной пост.
Читать полностью…Появилась еще одна задачка. Надо развернуть LLM’ку типа Mistral на клиентском сервере и потестировать ее под разные задачи: в основном суммаризация текста.
Дальше все по классике, если вам интересно и нужные навыки есть — пишите в личку. Я вас сведу.
Пока все обсуждают новую модель от OpenAI — искусственный интеллект, наконец-то сделал прорыв.
Нашел прикольный контрлнет, который позволяет прибраться дома, выкинуть лишнюю мебель или посмотреть на свою будущую квартиру при живой бабушке.
OpenAI выкатила новую модель o1, которая показывает серьезный прогресс в решении сложных задач.
Главное отличие o1 от GPT4o - улучшенная способность рассуждать, что позволяет эффективнее решать задачи в программирования, математики и науки.
Модель использует метод "цепочки рассуждений" (Chain of Thought, CoT) в базе и лучше анализирует проблему перед ответом. Благодаря этому o1 превосходит GPT-4 во сложных задачах (на графике - синий столбик 4o).
Например, в соревнованиях по программированию она достигает 89-го процентиля, тогда как GPT-4 - только 11-го.
Однако, улучшенные возможности o1 требуют больше вычислительных ресурсов, что делает её использование дороже. Модель доступна платным подписчикам ChatGPT и разработчикам, потратившим более $1000 на API.
Пока в неделю можно отправить не больше 30 сообщений в старшую версию o1-preview и и 50 в маленькую o1-mini. В API ограничений нет, разве что стоимость запросов. Там очень дорого.
Уже раскатывают по платным пользователям, погнали тестить.
Ого, только сейчас увидел, что в Suno можно наиграть свою мелодию и на ее базе сделать трек. А вы молчите…
Читать полностью…Уже второй день играюсь с натренированной на моем лице LoRa и Flux — даже захотелось более мощный комп купить, чтобы не арендовать мощности для генерации.
Кстати, если кому-то надо создать LoRa и у вас есть пачка (около 50-100) фотографий. Пишите — сделаем. Для оформления постов — полезная вещь.
Думаю, что на этом можно закрыть историю с «мертвым блогером» и «живой актрисой».
А как вы оценивает арт-перфоманс Дарьи Свистуновой?
🔥— круто
👾— отстой
А вот это уже интересно. Оказывается, это совсем не «мертвый блогер», а живая актриса — Дарья Свистунова.
И видимо цифровой аватар сделали без ее ведома.
Уууууу. Такое можно в «Черное Зеркало» отправлять.
А сколько еще подобного нас ждет…
Никогда не думал, что придется погружаться в задачи связанные с векторизацией изображений. И вообще я думал, что там все сложно и не стоит туда лезть.
Но появилась задачка, сделать анимированные стикеры для телеграм c конкретным персонажем.
Вроде все просто, беру "персонажа", отправляю его на фотосессию, скидываю фотографу странное ТЗ "5 кадров затылка, 5 кадров правого уха и 5 левого...".
Получаю сет для обучения LoRa, тренирую FLUX. Составляю специальный промпт, чтобы генерировать в стиле стикеров на белом фоне.
И вот осталось все это анимировать... но все ИИ-модели для анимации, сильно портят качество картинки.
Вот и пришлось искать инструменты для векторизации растра и анимировать ручками. Вам показать что получилось?
Многие догадались или узнали, так что нет смысла скрывать — все это генерация Flux.
Читать полностью…Сделал себе аватарку для Not Pixel - потратил 10 минут. А год назад я бы и за пару дней не осилил.
Вы кстати играете в "пиксель батл" от команды Ноткоина? Максимально рекомендую.
FLUX обновился до FLUX1.1 [pro] - уже доступно по API.
Скорость генерации повысили в два раза, как и качество картинки.
Надо попробовать подцепить свою LoRa и потестировать, улчшилось ли качество.
Эту волну не остановить!
Оказывается вы не только помогаете друг-другу решать ИИ-шные задачи, но и пилите крутые проекты. Горжусь вами, друзья!
Один из подписчиков, мой тезка — Артём, еще неделю назад прислал ссылку на свое приложение — AiFitrix.
Это пищевой дневник для iPhone: что съел и сколько калорий потребил.
Но Артём добавил туда ИИ-фишку, благодаря которой уже неделю я пользуюсь им чаще чем мессенджерами.
Распознавание блюда по фотографии — сфотографировал гречку на тарелке и нейронка сама распознало блюдо и прикинуло объем порции.
Очень удобно! Да еще и бесплатно, но видимо только пока.
Заметили, что в последнее время мало пишу. Скажу правду — почти нет времени ни на что.
Так обложился проектами, что даже приходится выкраивать время на сон. Думаете, жалуюсь? Нет — хвастаюсь! Так интересно и продуктивно давно не жил.
Десятки созвонов в неделю, сотни открытых вкладок и бесконечный поток предложений. Это кайф.
Только на прошлой неделе добрался до изучения notebooklm.google.com — и это отвал башки! Никогда еще ИИ-инструмент не был для меня настолько эффективным.
Давайте расскажу, как я его приспособил для своих нужд.
Часто перед созвоном с новым человеком я иду почитать его канал. Так сложилось, что у 90% моих визави есть личные блоги — изучение которых обязательно перед началом общения. Раньше я выборочно читал несколько десятков постов, и на это уходили часы подготовки перед звонком. Потом я стал их парсить и закидывать в ChatGPT, чтобы получить краткое содержание.
С появлением notebooklm.google.com — просто закидываю туда все посты и нажимаю кнопку «сгенерировать подкаст». С вечера закидываю 3-4 подкаста в телефон, и пока утром иду в офис, прослушиваю их все. В итоге на звонке я почти все знаю про человека, а что не знаю, уточняю в LLM в моменте.
Для примера выкладываю переведенный подкаст на базе моего личного блога, так как пока гугловский сервис не может генерировать на русском. Страшно представить, что будет завтра…
Помните писал про то, что ко мне часто обращаются компании в поисках людей разбирающихся в нейросетях и смежных темах.
Задача проста: нам нужно, чтобы ты взял наши промпты и сделал их умнее, интереснее и разнообразнее. Сейчас они выдают видео про осьминогов (да, осьминогов, серьезно), и это не ок. Твоя миссия — настроить промпты так, чтобы они выдавали огненные сценарии как для коротких видео, так и для длинных, проверяли факты, были логичными и цепляли зрителя. Сможешь сделать это? Отлично, мы ждем тебя!
Кстати о стоимости новых моделей o1-mini и o1-preview через API
- o1-preview в 5 раз дороже o1-mini
- o1-mini в 20 раз дороже модели gpt-4o-mini
- o1-preview в 6 раза дороже gpt-4o-2024-08-06
ИИволюция
У меня к вам серьезный вопрос. Есть идея запустить проект «цифрового клонирования» на базе поминики. Что он будет делать:
1. Создаст LoRa из вашего датасета фотографий, на выходе вы получите фаил, который сможете использовать с FLUX или другим генератором изображений, чтобы создавать фотографии с собой.
2. Зафайнтюненая LLM, тренированная на ваших переписках в соцсетях, телеграм, ватсап и т.д, чтобы писать в вашем стиле.
3. Эмбединг (RAG) из ваших постов, как «долговременная память», чтобы использовать ваши знания.
Есть еще вариант собрать текстовые описания ваших фотографий и модель голоса. Получается ваш «клон на флешке», который вы сможете использовать сразу, например общаться с самим собой или использовать его, чтобы вести социальные сети или завещать свою «копию» потомкам.
Собственно мой вопрос: как этично поступить с переписками, которые нужны для обучения LLM? Вы готовы руками проверять, чтобы там не было чувствительной информации перед тем как выгрузить ее на внешний ресурс?
Вопрос номер два: как вам вообще такая идея?
Kling теперь позволяет генерировать 10-ти секундные видео. Правда очередь на три дня.
Читать полностью…На Github выложили код ostris ai toolkit — при помощи него я создал свой LoRa, использовав для обучения более двухсот фотографий со мной.
А сегодня запустил FLUX, подключил к ней LoRa и пошел генерировать себя в разных эпохах, получилось неплохо.
Вчера мы обсуждали, как ИИ «испортил» жизнь девушки.
Да, да, я про скандал с «мертвым» блогером.
Сегодня я к вам с хорошими новостями — умные очки Ray-ban wayfarer, помогают слабовидящей девушке ориентироваться в городе.
Они озвучивают все, что происходит вокруг, читают надписи на упаковках и даже выступают в роли навигатора.
Кстати, если потом еще распознавать все, что девушка «видела» в течение дня и отправлять в эмбединг LLM — можно сделать навигацию по «воспоминаниям».
Сначала вы скажете, что это кринжатина. Потом подумаете, а почему бы и нет.
Пишите в комменты, что вы думаете о «мертвых блогерах».
Ну и давайте проголосуем:
👾— это кринж
🔥— это будущее