Ну все, выдыхайте ребята и показывайте, что вы от нас все лето скрывали. Надеюсь, это будет значительно круче того, что за это время натренили китайцы.
Читать полностью…Если вы уже получали дропы в Notcoin, Dogs, Hamster и т.д. Проверьте в PAWS — сколько вам за это полагается дополнительно «лапок».
Ничего там тапать не нужно, механика, как в DOGS — просто получаешь и всё. Видимо это проект BLUM’а, так что прокатить не должен.
Помню времена, когда этой штукой управлял не искусственный интеллект, а донаты подписчиков. Ну и испытатели были разные.
Читать полностью…А еще новый Клод значительно лучше стихи сочиняет. Кстати, если играете в телеграмовские миниапки, залетайте в Уток - их залипательно разводить.
🔈 звук включите
Antropic сделал апдейт: удалил упоминания о своей большой модели Opus 3.5, которую он планировал запустить до конца года и обновил оставшиеся модели.
Но, главная новинка - "computer use" :
- Это экспериментальная функция, которая позволяет #Claude 3.5 new использовать компьютер как человек
- Он может перемещать курсор, нажимать кнопки, печатать текст
- Пока это работает не идеально (бывают ошибки)
- Доступно только через API
- Функция находится в бета-тестировании
А я пойду тестировать насколько умным стал «новый» Claude привычным мне способом. Попрошу его написать игру DOOM.
Не расходитесь, скоро выложу, что он мне выдаст.
Не жмитесь на реакции, а то я так и не соберусь упаковать остальные инструменты в пост. А по количество «сохранений» видно, что вам это нужно :)
Читать полностью…Пока большинство людей ленится освоить ИИ-инструменты, чтобы упростить себе жизнь, криптомиллиардеры вроде Майкла Сейлора из MicroStrategy уже вовсю используют их потенциал.
По данным Forbes, Сейлор лично владеет 17 732 биткоинами (BTC), а его компания MicroStrategy — целыми 158 245 BTC!
Подсмотрел у Сергея прикольный промпт:
Cutaway diagram of a [object], detailed with interior component, on a white background. High-resolution, with a focused technique and text callouts providing information about each part. Interior details, hyper-realistic appearance.
Новый квест для самых лучших чекеров ИИ-контента. Какое изображение сгенерировано?
Читать полностью…OpenAI представила Canvas — новый интерфейс для использования ChatGPT в написании текстов и программировани.
Ключевые особенности:
• Открывается в отдельном окне для совместной работы
• Позволяет выделять части текста для фокусировки AI
• Предлагает быстрые действия для редактирования и улучшения контента
Для кода:
• Обзор и улучшение кода
• Добавление логов и комментариев
• Исправление ошибок
• Перевод на другие языки программирования
Уже доступен для подписчиков Plus и Team, скоро — для всех пользователей
Для тех кто хочет иметь больше контроля над генерацией подкаста из текста и сразу на русском, обратите внимание: https://huggingface.co/spaces/lamm-mit/PDF2Audio
Читать полностью…Подкаст на основе постов моего блога "Айтишник из Москвы". Не влез в основной пост.
Читать полностью…Закрывая тему наказания кожанных мешков за незнания математики начальных классов, поясню, что же там такое происходит на видео.
Да, ИИ меня отшлепал…
Не, ну, конечно, сам виноват — позволил холодным микросхемам поднять «руку» (и даже опустить) на мою теплую щеку.
Рассказываю по порядку: недавно Anthropic обновила Claude 3.5 Sonnet, в базе которого вышел режим автономного управления компьютером (Claude Computer Use). Это когда ИИ может смотреть, что у тебя на мониторе происходит, мышкой клацать и клавишами стучать. Сам. Дали, правда, пока только API, но дали же.
Поэтому я, долго не думая, сделал такой сетап: «шлепатель» — это такая карающая длань, прикрученная к двигателю от коптера и управляемая распберри. Написал простенький код, который при нажатии на кнопку «slap» лупил меня от всей своей цифровой души. А Claude Computer Use попросил отслеживать мой чатик с ИИ, где меня экзаменовали на предмет знания таблицы умножения. Ну и если я ошибаюсь (а я в умножение не силен), жать на кнопку. Вот и получилось, что на втором примере я посыпался, ИИ это увидел и влепил звонкую оплеуху за то, что не чту царицу наук.
Так что выходит, я первый кожаный за всех вас пострадал? Завтра думаю и вторую щеку подставить (первая болит сильно). Хотя не буду, закроем все же тему с садо-мазо и издевательствами над кожаными.
Ответил в подкасте Дмитрия Позина и Сергея Свиридова (подписывайтесь на их каналы, кстати) на первые вопросы новичков при знакомстве с искусственным интеллектом:
⁃ На чем обучается искусственный интеллект?
⁃ Заменит ли нейросеть интернет?
⁃ Что такое профессия «prompt-инженер» и почему ей осталось существовать недолго?
⁃ В каких из профессий можно максимально зарабатывать, используя искусственный интеллект?
⁃ Какие профессии может полностью заменить искусственный интеллект?
⁃ Как связаны инвестиции с искусственным интеллектом?
⁃ К чему приведет развитие искусственного интеллекта в мировом масштабе.
Приятного просмотра: https://youtu.be/WZzFQvjYRfI
Просили поближе показать «шлепатель». Вот такая машина возмездия, сделанная руками человека и оказавшийся во власти искусственного интеллекта.
Читать полностью…Кто желает автоматизировать работу через нейросетки, ваша остановочка 😐
Anthropic обновила Claude 3.5 Sonnet, на основе которого вышел режим автономного управления компьютером (Claude Computer Use). Пускай бета, не чатиться и не взаимодействует с Google, но она просто работает по задачам на компьютере.
В видео я попросил ее авторизироваться в дейтинге, дал свой лог и пароль, затем попросил поставить лайк 3 блондинкам. Человеческая задача, но её выполнила нейросеть. Нажала куда надо без ошибок. Даже подтвердила полиси, закрыла офферы и свайпала анкеты. Не быстро, 120 рублей по токенам, зато есть результат.
Для сравнения, чтобы такую автоматизацию сделать через код, нужно собрать адреса кнопок с верстки, добавить ограничения на ненужные окна, прикрутить анализ фото в текст, прописать алгоритм шагов и молиться, чтобы не всплыл отказ на одном из этапов. С Claude Computer Use можно сделать тоже самое без ныряния в код. Кстати, попробуйте:
1. Скачайте Docker и заведите аккаунт
2. Получите API ключ из Claude
3. Пропишите команду в терминале, убрав проценты и добавив ключ export ANTHROPIC_API_KEY=%your_api_key%
docker run \
-e ANTHROPIC_API_KEY=$ANTHROPIC_API_KEY \
-v $HOME/.anthropic:/home/computeruse/.anthropic \
-p 5900:5900 \
-p 8501:8501 \
-p 6080:6080 \
-p 8080:8080 \
-it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest
4. Ловите челюсть, когда запустите
Прежде, чем это войдёт в рабочий мейнстрим, скорее всего ускорят процессы за счёт новых моделей. А ещё лучше — выкатят песочницу, где такое запускать можно в 3 клика ☺️
🤖 InNeuralNetwork
Протестирова Нового Клода через создание DOOM'а
Ну кстати, очень хорошо и с первого раза. Градиенты предусмотрел на стенах, движение рук при ходьбе, ничего не разваливается.
Во второй итерации попропшу подгрузить спрайты врагов и пусть еще монеткой стреляет.
P.S промпт для рук с монеткой и музыки, тоже Клод написал.
https://huggingface.co/spaces — Много раз советовал и продолжаю настаивать, ищите тут узкие инструменты под свои задачи. Часто там я находил какие-то модели, тестировал их, а потом покупал к ним доступ или устанавливал их с гитхаба локально. Вообще, свой день я начинаю с поиска, что нового придумали ребята. Иногда из этого рождаются прикольные бизнес-модели. Например там есть такое:
1. https://huggingface.co/spaces/gokaygokay/Tile-Upscaler - апскейл изображений плохого качества
2. https://huggingface.co/spaces/gokaygokay/Gemma-2-llamacpp - бесплатная языковая модель
3. https://huggingface.co/spaces/prithivMLmods/STABLE-HAMSTER - генерация изображений
4. https://huggingface.co/spaces/KwaiVGI/LivePortrait - анимация лица
5. https://huggingface.co/spaces/mukaist/DALLE-4K - генерация больших изображений
6. https://huggingface.co/spaces/gokaygokay/Inspyrenet-Rembg - убрать фон
7. https://huggingface.co/spaces/predatortoabuse/Realistic-Image-Generator-Model - создание реалистичных фото
8. https://huggingface.co/spaces/black-forest-labs/FLUX.1-dev - генерация изображений
9. https://huggingface.co/spaces/finegrain/finegrain-object-eraser - стирание объекта
10. https://huggingface.co/spaces/not-lain/background-removal - удалить фон
11. https://huggingface.co/spaces/Kwai-Kolors/Kolors-Virtual-Try-On - сменить одежду
Буду постепенно делиться, пока вы тут 200🔥 набираете
Мои ИИ-инструменты, которые использую (почти) каждый день
Часто спрашивают на консультациях, какие базовые инструменты нужно освоить, чтобы работать (и получать) за десятерых.
Делюсь своим арсеналом нейронок и сервисов. Кидайте в комменты, что вы используете в работе. Кстати, кто отгадает, сколько я трачу в месяц на подписки?
Генерация текста и чат-боты
#Claude 3.5 (LLM от Anthropic) — сейчас это мой основной чат-бот, перешел на него с ChatGPT пару месяцев назад. Пока все устраивает
#ChatGPT — использую, как запасной, потому что там много GPTs полезных создал
#Gemini — когда лимиты на первых двух LLM заканчиваются, перехожу на него
#NotebookLM — Поддержка большого контекста и куча функций, Gemini на борту. Генерирую там подкасты и анализирую контекст ТГ каналов
Генерация изображений
#Flux — Мой основной инструмент для создания изображений
#Midjourney — Популярный генератор изображений
#DALL-E 3 — ИИ для создания изображений от OpenAI
#Ideogram — Генератор изображений, хорош для работы с продуктом, текстом на изображениях и вообще у него свой вайб
#Krea — Платформа для генерации изображений в реальном времени, а еще видео делает
#Magnific — Инструмент для повышения качества изображений
Генерация видео
#Minimax (Hailuoai) — Высокоинтеллектуальный генератор видео, балдею от него
#Kling 1.5 — Крутой генератор видео, но в последнее время висит даже с подпиской
#Runway — Популярный инструмент для создания видео, мой запасной (дорогой) вариант
#Luma — Использую как генератор лупов
#Pika — Генератор видео от Stanford (с ограничениями). Использую его спецэффект в монтаже
Обработка аудио и музыки
#ElevenLabs — Инструмент для синтеза речи
#MacWhisper — Приложение для Mac для преобразования речи в текст
#Udio — Продвинутый инструмент для работы со звуком, генератор песен и композиций
#Suno — Мой настольный генератор музыки и песен
Виртуальные аватары
#HeyGen — Создание говорящих голов
#Hedra — Генерация виртуальных персонажей
Поиск и обработка информации
#Perplexity — ИИ-ассистент для поиска информации
Инструменты для разработки
Cursor.com: IDE с интегрированным ИИ
v0.dev: Инструмент для разработки фронтенда
replit.com: Онлайн IDE с ИИ-агентом
bolt.new: Инструмент для разработки
Редактирование видео и изображений
Capcut: Видеоредактор с ИИ-функциями
VideoProc: Улучшение качества видео
Topaz Gigapixel: Повышение качества изображений
Topaz Video: Улучшение качества видео
Если интересно могу поделиться более расширенным списком сервисов для узких задач. Давайте если наберм 200 🔥 - выложу, а то там больше сотни, надо все это упаковать еще.
Никогда не думал, что придется погружаться в задачи связанные с векторизацией изображений. И вообще я думал, что там все сложно и не стоит туда лезть.
Но появилась задачка, сделать анимированные стикеры для телеграм c конкретным персонажем.
Вроде все просто, беру "персонажа", отправляю его на фотосессию, скидываю фотографу странное ТЗ "5 кадров затылка, 5 кадров правого уха и 5 левого...".
Получаю сет для обучения LoRa, тренирую FLUX. Составляю специальный промпт, чтобы генерировать в стиле стикеров на белом фоне.
И вот осталось все это анимировать... но все ИИ-модели для анимации, сильно портят качество картинки.
Вот и пришлось искать инструменты для векторизации растра и анимировать ручками. Вам показать что получилось?
Многие догадались или узнали, так что нет смысла скрывать — все это генерация Flux.
Читать полностью…Сделал себе аватарку для Not Pixel - потратил 10 минут. А год назад я бы и за пару дней не осилил.
Вы кстати играете в "пиксель батл" от команды Ноткоина? Максимально рекомендую.
FLUX обновился до FLUX1.1 [pro] - уже доступно по API.
Скорость генерации повысили в два раза, как и качество картинки.
Надо попробовать подцепить свою LoRa и потестировать, улчшилось ли качество.
Эту волну не остановить!
Оказывается вы не только помогаете друг-другу решать ИИ-шные задачи, но и пилите крутые проекты. Горжусь вами, друзья!
Один из подписчиков, мой тезка — Артём, еще неделю назад прислал ссылку на свое приложение — AiFitrix.
Это пищевой дневник для iPhone: что съел и сколько калорий потребил.
Но Артём добавил туда ИИ-фишку, благодаря которой уже неделю я пользуюсь им чаще чем мессенджерами.
Распознавание блюда по фотографии — сфотографировал гречку на тарелке и нейронка сама распознало блюдо и прикинуло объем порции.
Очень удобно! Да еще и бесплатно, но видимо только пока.
Заметили, что в последнее время мало пишу. Скажу правду — почти нет времени ни на что.
Так обложился проектами, что даже приходится выкраивать время на сон. Думаете, жалуюсь? Нет — хвастаюсь! Так интересно и продуктивно давно не жил.
Десятки созвонов в неделю, сотни открытых вкладок и бесконечный поток предложений. Это кайф.
Только на прошлой неделе добрался до изучения notebooklm.google.com — и это отвал башки! Никогда еще ИИ-инструмент не был для меня настолько эффективным.
Давайте расскажу, как я его приспособил для своих нужд.
Часто перед созвоном с новым человеком я иду почитать его канал. Так сложилось, что у 90% моих визави есть личные блоги — изучение которых обязательно перед началом общения. Раньше я выборочно читал несколько десятков постов, и на это уходили часы подготовки перед звонком. Потом я стал их парсить и закидывать в ChatGPT, чтобы получить краткое содержание.
С появлением notebooklm.google.com — просто закидываю туда все посты и нажимаю кнопку «сгенерировать подкаст». С вечера закидываю 3-4 подкаста в телефон, и пока утром иду в офис, прослушиваю их все. В итоге на звонке я почти все знаю про человека, а что не знаю, уточняю в LLM в моменте.
Для примера выкладываю переведенный подкаст на базе моего личного блога, так как пока гугловский сервис не может генерировать на русском. Страшно представить, что будет завтра…