Канал Кирилла Морозова. Рассказываю о полезных сервисах на ИИ и не только. @mmmorozov Связь и реклама: @krllmrzv ТикТок: www.tiktok.com/@mmmorozov № 4945710981
Вот так автоматизирует 50 задач одновременно китайский ИИ-агент Manus 😮💨
Неплохая фабрика троллей или целый отдел сотрудников, не нуждающихся в перекурах и больничных. Может применяться как для ведения кампаний в социальных сетях, так и для трейдинга, исследований, поддержки и много другого.
Накопилось новостей и полезных штук за неделю. Держите 🤡
1️⃣ Аудио в текст от ElevenLabs
До 9 апреля в открытом доступе инструмент для перегона аудио в текст. Автоматически определяет язык, участников разговора и раскидывает их по ролям. Превосходно для лекций, а еще, кажется, великолепный инструмент для создания субтитров.
2️⃣ Fiverr Go — спасение для фрилансеров?
Fiverr запустил площадку, где фрилансеры могут продавать свои работы для AI-обучения. Это значит, что разработчики могут закупать и лицензировать голоса топовых дикторов, дизайнеров. Но зачем потом нужен будет матерый диктор, когда модель будет повторять его голос в точности? Посмотрим, будет ли работать роялти. Но для фрилансеров новость определенно хорошая.
3️⃣ GPT-4.5 уже здесь
OpenAI рекомендуют его для креатива и повседневных задач, слабее o1 и o3, но в цирке не выступает из-за отсутствия размышлений. Доступен через API и 200-долларовой подписки, на следующей неделе раздадут в Plus. Но не вижу серьезных причин не дать к нему доступ льготникам — на пятки уже наступают и французы, и китайцы.
4️⃣ Pika 2.2 с Pikaframes
10-секундные AI-видео, 1080p, трансформация картинок в видео — VFX-мастера, забирайте.
5️⃣ Perplexity теперь умеет анализировать корпоративные файлы
Подключаем Google Drive, OneDrive и SharePoint, делаем глубокий анализ данных и веба. Все безопасно — так они говорят, но здравый смысл подсказывает другое.
И раз уж вы дочитали до конца — разыгрываем 3 годовых подписки на Perplexity Pro!
Условие: прожать буст канала. Может, на истории насобираем или хотя бы один жалкий смайлик в реакты. Итоги через неделю, а пока прожмите наши скучные дефолтные эмодзи.
Создаем GTA в чатботах и снимаем блокбастеры 😮💨 Скромный дайджест перед выходными.
1️⃣ Pikaswaps
Новая функция в Pika меняет любой элемент на видео по текстовому промту или картинке-референсу. Релизный ролик впечатляет, в комменты закину другие примеры.
2️⃣ GTA на Grok 3
Еще одна демонстрация возможностей Grok 3 в геймдеве 😮💨 Если помните первые две части Grand Theft Auto, то без проблем узнаете в квадратах воришку, автомобили и жителей города. Можете попробовать то же самое, повторяя промты.
3️⃣ Кино на Google Veo 2 и его добавление на Freepik
Студия Nicéphore за две недели смонтировала отличный ролик к парижскому AI-саммиту. Великолепный монтаж и работа виртуального оператора с композицией и планами. Кто угадает, к какому событию 130-летней давности он отсылает?
Саму модель Google Veo 2 добавили на Freepik, бесплатно можно прожать только генерацию с их промтом 😮💨
Кстати, про Grok 3. Товарищ из социальной сети X сделал игру Portal в два промта. Если вы не понимаете, что на экране, вспомните графику первого Wolfenstein.
Читать полностью…Пришло время для гига-поста с новыми нейросетями из заметок. Видео, аудио и многое другое за последнее время 😮💨
🎥 Видео
Goku (1 и 2 ролик)
Новое чудо из КНР с крайне реалистичными генерациями товаров и людей. ИИ использует технологию Rectified Flow для анализа всех вводных изображения, из которого мы будем генерить видео – освещение, композиция и сама сцена. С помощью аудиофайла может сразу выдать озвученное видео, где звук будет синхронизирован с действием.
Судя по всему, прикрутят к условному AliExpress, а карточки товаров заиграют.
Pikadittions от Pika (3 ролик)
Эту штуку выкатили с призывом «добавь что угодно к чему угодно». К вашему видосу можно прикрутить годзил, покемонов и прочую нечисть, которая будет весьма органично смотреться в кадре.
Starlight от Topaz (4 ролик)
Диффузионная модель для апскейла и реставрации видео.
🎵 Аудио
Zonos от Zyphra (закинул демку в комменты)
Клонирует голоса с пугающей точностью. Открытый код, можно попробовать в веб-версии и Hugging Face. Есть API.
💬 Чатботы
Kimi (5 ролик)
Еще один китайский аналог DeepSeek и ChatGPT 🤖 Не поверите, они тоже заявляют, что мощнее конкурентов. Анализ файлов, подобие Deep Research и многое другое. Доступно в веб-версии.
Опять жду реактов, если подобный монструозный формат вас все еще устраивает. Старался отформатировать для максимально комфортного чтения. Ну а я побежал на завод.
Еще один убийца ChatGPT, теперь из Парижа. Mistral AI вернулись на радары с Le Chat, приятный чатбот с приложениями для iOS, Android и веб-версией. Пока генерит ответы очень быстро, это они и называют своим главным преимуществом.
В бесплатном тарифе есть выход в сеть, анализ файлов, и генерация картинок в Flux Ultra. Pro стоит 15 баксов, на 5 дешевле, чем ChatGPT или Claude.
Кажется, раньше это называлось «фанфики» 🤡
Сделано в Hailuo.
Что-то перебор с DeepSeek в инфополе. Вот вам лучший бесплатный генератор моделек Hunyuan 3D V2, его можно запускать локально с помощью Pinokio.
Доступен и на Hugging Face.
Китайцы настроены серьезно. Они вынуждают ChatGPT выкатывать обновления как можно быстрее и давать больше возможностей бесплатным аккаунтам. На телефоне я стал чаще пользоваться DeepSeek.
ChatGPT пока спасает то, что я закинул ему в память много информации. Но ее можно выгрузить одним промтом.
На iOS можно скачать тут, на Android здесь.
Китайский убийца ChatGPT, удивительная песочница в KREA AI и встроенный в Runway генератор изображений. Небольшой дайджест в этот солнечный день.
1️⃣ Китайский чатбот DeepSeek
Начнем со слона в комнате. Китайский чатбот DeepSeek релизнул модель R1 и она уделывает GPT-4 от OpenAI и Claude 3.5 Sonnet в математических тестах. Для ежедневных задач отлично заменяет ChatGPT, предлагает 50 бесплатных запросов в день, а API в десятки раз дешевле. Можете потыкать сами, интерфейс скопирован примерно как Marvel Rivals с Overwatch.
2️⃣ Коллажи в KREA AI
Создаете идеальную композицию с помощью 3D-моделей, вертите объекты, затем KREA натягивает на это реалистичные текстуры.
3️⃣ Runway Frames
Runway запустила свой генератор картинок Frames. В нем можно сгенерить визуальную базу для вашего проекта, а потом перейти к анимации.
4️⃣ Пол Шредер против ChatGPT
Сценарист «Таксиста» Пол Шредер заявил, что ChatGPT превзошел его в написании сценариев. Говорит, что AI генерирует более удачные идеи и пути их реализации, а на запрос сделать сценарий в его стиле ChatGPT прислал нечто, что Пол оценил выше своих рукописей. У сценариста десятки номинаций на Оскары, Глобусы и несколько статуэток.
Мои нейросетевые находки за первую неделю года 😮💨
🎥 TransPixar: генератор видео без фона. Идеально для генерации эффектов огня, порталов, дыма и прочих VFX. Или можно приклеить на ваше видео какого-то персонажа. Тестируем на Hugging Face.
📸 Реалистичность сгенерированных людей резко взлетела. Сначала сгенерили фотографии во Flux, потом анимировали в Kling. Во многом такой эффект достигается с помощью имитации картинки и экспозиции самой популярной фотокамеры в мире — iPhone.
🔍 Нашел сервис для начинающих детективов, определяющий локацию по одной фотографии. С чемпионами GeoGuessr тягаться еще не может, но закоулки Москвы угадывает.
✨ В Gemini 2.0 появился удобный редактор фотографий по промту. Можно удалять объекты, превращать автомобили в кабриолеты и совмещать фотки. Например, посмотреть, как ваш кот выглядел бы вышивкой на подушке или стикером на скейте.
Бонусом забирайте воистину проклятый кликер. Примерно так выглядит день с СДВГ. Только не запускайте, если вы на работе 🤡 И это, реактов не жалейте!
Ловите новый достойный апскейлер InvSR. Хорош тем, что не слишком фантазирует и не рисует отсебятину.
Можно потестить на HuggingFace или посмотреть на GitHub.
Есть вопрос! Как бы вы доказали, что этот ролик сделан AI? 😮💨
За исключением того, что пингвины обязаны носить шлем при полетах на глайдере.
Вот вам новогоднее настроение от Google Veo 2 😮💨 В паре фреймов колеса на скейте появляются с двух сторон, но уверен, что многие охотно верят в этот двойной кикфлип. Или как это называется, есть эксперты?
Кстати, попробуйте пройти тест на определение авторства картин (ИИ или художник), интересен средний результат: ai-art-turing-test.com
Чем ближе новый год, тем больше новостей. Главное в пунктах 🔽
1️⃣ Google Veo 2 — генератор видео от Гугла только появился и сразу стал лучшим среди аналогов как минимум в физике. Получить доступ можно через waitlist, тут есть инструкция. Первые четыре видео в посте сделаны в Veo.
И это не все от Google. Расширение для Chrome под названием Project Mariner само серфит интернет, заполняет формы и взаимодействует с контентом, а Gemini Advanced Deep Research анализирует 20-30 источников на каждую тему перед тем, как дать ответ или написать вашу курсовую с ссылками первоисточник.
2️⃣ Suno 4 перешла в бесплатный доступ. Попробуйте сравнить на тех промтах, что использовали в третьей версии.
3️⃣ Генератор видео Kling обновился до версии 1.6. Прикреплю их анонсирующие видео, так как сам сильной разницы не вижу. Но можете потестить лично за бесплатные кредиты, хватит на дюжину видео.
4️⃣ В Krea появилась замечательная функция выбора объекта для замены или трансформации. Раньше нужно было выделять кистью, можно было задеть лишнее. Но кисть тоже осталась, с ее помощью можно размещать новые объекты.
Не скупись на реакции, коли хочешь, чтобы я и дальше подшивал эти новости вместо игры в Path of Exile 2 😮💨
Аларм, дайджест за неделю! 🔥
Но перед прочтением прожимаем 😮💨 буст каналу 😮💨 и выигрываем одну из трех годовых подписок на Perplexity Pro. Это чатбот с Deep Research, ChatGPT, Claude Sonnet 3.7 и прочими наворотами. Каждый буст участвует отдельно, чем их больше, тем выше шанс выиграть. Разроллю уже в воскресенье.
1️⃣ Может ли робот сочинить симфонию?
Обойдемся без мема про обезьяну, но, как оказалось, — может. Только ленивый не попробовал нейросети Suno или Udio, но NotaGen обучена на полутора миллионах композиций и нотах 150 классических композиторов.
👉 Демка, пейпер и код тут.
2️⃣ Инструмент Restyle в Runway
В Runway появился новый инструмент для стилизации видео. Оригинал сгенерирован в Google Veo 2, затем первый кадр пропущен через Retexture в Midjourney, а после — анимирован в Runway Restyle.
📸 Pikadditions и Pikaswaps теперь в Full HD (1080p)
О них уже рассказывал выше, а теперь Pika выдали мне полный доступ к генерациям и анлиму. Закидывайте идеи или видео на тест.
💡 Во Франции замечен рекламный щит стартапа Lovable
Надпись гласит: «Не апп для дейтинга, но здесь ты запилишь этот апп сам». Остроумно. Готов поспорить, в 2025 многие будут использовать ИИ для бытового программирования. Сейчас это уже называют вайб-кодингом — когда 20 раз просишь машину исправить код вместо того, чтобы полистать его самому, но так не хочется.
Как-то плохо состарились новости за прошлую неделю. Любимый многими разработчиками чатбот Claude обновился до версии 3.7, за последние сутки из него выжали такое ⬇️
⛏️ Клон Minecraft
🏎 Клон Mario Kart
🔮 Клон Покемонов
🖥 Прототип сайта для SaaS с бэкендом
И на десерт — они доучили Claude проходить игру Pokémon самостоятельно. Говорят, что бились над этим год, а нужно это было для тренировки к задачам из реального мира.
Кстати, по всем иным дисциплинам, кроме разработки, Claude отстает от конкурентов. Но как говорил Брюс Ли:
Я не боюсь того, кто изучает тысячи различных ударов. Я боюсь того, кто изучает один удар тысячи раз.
Grok 3 открыли бесплатно для всех пользователей. Непонятно, временная ли акция. Говорят, что до момента, как сервера начнут плавиться. Доступно внутри приложения X или тут: x.com/i/grok
Потестируйте сегодня Think, Deep Research и сравните с ChatGPT.
Perplexity запустили свой Deep Research, а я протестировал его на запросе, который мучает меня последний месяц.
Едва мне перевалило за 30, я каждую ночь засыпаю с мыслями о том, чтобы купить Ниву 😮💨 Оказалось, что моих ровесников постигла та же участь. Кажется, второе пришествие Римской империи. Попросил Perplexity выяснить, в чем дело.
Получился вот такой реферат, можно почитать внутри Telegram. Нравится тренд — ChatGPT показывают что-то крутое, закрывают это в дорогих тарифах, а конкуренты повторяют дешевле или бесплатно. На скрине видно цепочку размещений и приличное количество источников.
И я не шучу, пожалуйста, дайте Ниву на тест-драйв, я буду самым продажным блогером, лишь бы потыкать эти блокировки дифференциала и понижайки.
Вам уже попадаются нейрофотки еды в доставках? Какие эмоции испытываете? 🍣
Вижу экономию на фуд-фотографе, неумелое использование какой-то древней модели для генерации картинок и весьма высокие цены на блюда.
Если бы стояла задача одурачить людей, могли бы генерировать по референсам настоящих фотографий и использовать хотя бы Flux.
Картинкы стырены из аккаунта ux_from_hell в 🌐
На что стоило обратить внимание за последние несколько дней 😮💨
📸 OmniHuman-1
Генератор дипфейков по фотографии от ByteDance. Грузим фото и аудио, на выходе получаем видео с реалистичной артикуляцией и мимикой. Есть демка (пока прилегла) и страница на GitHub, тут еще больше занятных примеров.
🧠 OpenAI
Deep Research в ChatGPT оправдал надежды, это не «вау, нейросеть научилась гуглить». Чатбот серфит интернет от 5 до 30 минут, сопоставляет факты, спорит сам с собой и на выходе показывает самодостаточную статью. Аналитика, тренд-репорты, поиск лучшего на планете рецепта лазаньи — все можно.
Чтобы не быть голословным, вот пример финансовой аналитики по NVIDIA: chatgpt.com/share/67a10a0c-e198-8004-9803-55cf77b8cf59
🎵 Riffusion
Продолжаю пользоваться обновлённым генератором музыки Riffusion вместо Suno и Udio. В рамках теста лимитов нет, интерфейс копирует Suno, а возможностей куда больше, не говоря уже о том, что даже на русском языке вокал звучит гораздо лучше, а аранжировки более изобретательные.
Разработка Telegram-бота на нейросетях без знаний Python 😮💨
Наконец-то контент без кликбейта и личный опыт. Потратил 10 часов, 5 долларов на API OpenAI и немного нервов. Делюсь опытом разработки бота в Telegram.
⚡️ Задача: я работаю в маркетинге, бот должен раз в сутки анализировать все посты конкурентов и присылать мне выжимку. Для этого он парсит контент и анализирует его с помощью OpenAI.
🧩 Выбор инструментов: мне потребовались бесплатные версии ChatGPT, DeepSeek, Claude. Все отлично пишут начальный код, но для исправления багов мне приходилось переносить ошибки и код между чатботами.
💡 Полезная фишка ChatGPT — даже в бесплатной версии при запросе кода справа вылезает IDE, где можно сразу посмотреть результат. Запускать там ничего не нужно, но для наглядности — суперудобно. Ошибки он фиксит построчно.
🚀 Шаг 1. Пишем подробное ТЗ
Опишите, что должен уметь бот.
✅ Функционал
✅ Какие кнопки в меню (лучше, чем команды через слэш)
✅ Закиньте API-ключи нужны или спросите, какие потребуются (OpenAI, Telegram)
❗️ Важно: не храните ключи в коде. Запишите их в файл .env внутри проекта.
💻 Шаг 2. Получаем код и запускаем
Где запускать?
🔹 Онлайн-IDE (например, Python Anywhere) — но могут быть ограничения по мощности.
🔹 Локально в PyCharm — лучше, так как бесплатные облачные среды не всегда поддерживают нужные библиотеки (например, Telethon).
📌 Что делаем дальше?
✅ Устанавливаем зависимости через терминал
✅ Запускаем код
✅ Если бот завелся, он начнет работать в Telegram на вашем компьютере
🔥 Шаг 3. Танцы с бубном
Если бот чуть сложнее шуруповерта, ошибки неизбежны. Я потратил несколько часов, копируя ошибки из PyCharm в ChatGPT. На 10-м цикле исправления багов бот наконец заработал 😮💨
✨ Шаг 4. Доработка промта и функционала
📌 В коде легко найти, какой запрос отправляется в OpenAI. Можно:
🔹 Изменить стиль дайджестов
🔹 Добавить аналитику
🔹 Улучшить формат ссылками и смайликами
🔎 Выводы:
✅ Бесплатный Claude — отлично объясняет ошибки, но быстро выдыхается требует Pro-версию
✅ DeepSeek — шустрый, но может отваливаться на волне популярности
✅ ChatGPT — с встроенным IDE лучше всего подходит для отладки
Если хотите видео от начала и до конца, прожмите реакций на свой вкус. И жду советов от настоящих программистов. Например, где лучше крутить таких ботов круглосуточно.
Кстати, ловите совет – если пишете пост, но лень искать под него смайлики, попросите ChatGPT их добавить. Я дед и не знаю, где какие находятся, очень удобно.
Под видео про DeepSeek определился самый популярный вопрос. Могли бы и сами вбить, он бесплатный.
Читать полностью…Вечер новых фич нейросетей для видео и картинок 👹
1️⃣ В KREA теперь можно тренировать стили и модели. Персонажи, объекты и стилизация всегда будут стабильны. Мощно для продуктовой фотографии или для тех, кто угорает по созданию виртуальных инфлюенсеров. Тренировка производится здесь.
2️⃣ Pika открыла ранний доступ к версии 2.1, записываемся здесь.
3️⃣ Kling докрутил Elements, одна из лучших реализаций среди аналогичных сервисов. Совмещаем несколько статичных фотографий, получаем видео.
В ChatGPT добавили Automated Task Scheduling или отложенную автоматизацию задач 🕒
Можно попросить каждый день напоминать о тренировке и присылать новую мотивационную речь в духе Рокки 🏋️♂️
Напоминания устанавливаются через промт или интерфейс, аналогичный напоминалкам в iPhone с указанием дат или периодичности.
Должно неплохо работать для еженедельных автоматизированных дайджестов новостей по определенной тематике. Например, каждую неделю присылать все самое интересное из мира NBA и результаты всех матчей.
Можно использовать для анализа событий в будущем. Например, попросить прислать усредненную рецензию на фильм после его премьеры.
Минуса два — доступно до 10 активных автоматизаций и только на платных подписках.
Ну что, с наступающим. Если вы пережили этот год, вы уже большие молодцы 😮💨
А я улетаю на своем SUR-RON с помощью нейросети Kling 😮💨
Если горите желанием сделать доброе дело, можно задонатить в детский хоспис «Дом с Маяком».
🧠 Machine Learning — авторский канал, где собрана вся база по ИИ и машинному обучению.
Senior разработчик AI-алгоритмов и автономных агентов, разбирает гайды, редкую литературу и код топовых моделей машинного обучения и искусственного интеллекта.
В 2025 году ИИ выйдет на совершенно новый уровень тот, кто не успеет за прогрессом - отстанет, а кто разберется - сорвет куш.
Стоит подписаться: t.me/ai_machinelearning_big_data
#Recommended
🎯 Нашёл, чем можно удивить вас и прокачать ваш 2025 год
Знаете, кто заменит психологов, маркетологов и половину всех профессий?
Нет, не ИИ. Их заменят те, кто научится использовать ИИ.
🛠 26 декабря Университет искусственного интеллекта при Иннополисе проводит практикум, где вы узнаете:
- Как создавать ИИ-агентов под свои задачи.
- Как внедрять их в бизнес, увеличивая доход в 2–10 раз.
💬 Если вы уже пробовали нейросети вроде MidJourney или ChatGPT, этот практикум покажет, как пойти дальше — от игрушек к серьёзным инструментам.
📲 Как попасть: Добавляйтесь в бота Университета и готовьте вопросы. Ссылка тут: https://turing.getcourse.ru/registraciya2612/mmmorozov?erid=2W5zFJEdzNk
🔗 Бонус: Университет выдаёт дипломы гос. образца и первым в России получил лицензию Минобра по ИИ-программам.
⚡ А пока делитесь в комментах, что вас впечатлило больше всего из мира ИИ: автоматизация, генерация контента или что-то своё?
Невиданная щедрость — Pika теперь бесплатная на три дня 😮💨 Но с полным функционалом и Ingridients.
Это весело, как минимум. Берем совершенно разные фотки в качестве ингредиентов, придумываем связующий промт и смотрим на результат.
Все новости сегодня предсказуемо про генераторы видео. Ну почти.
1️⃣ Пользователи Grok 2 увлеклись некромантией и активно генерят проклятые картинки с покинувшими наш прогнивший мир знаменитостями. Затем анимируют это в Kling и Hailuo. В это же время Sora отказывается генерить видео в духе медведь ест рыбу
, слишком шокирующий контент.
2️⃣ В Pika добавили Ingridients. Собираем видео из картинок, закидываем фон, главное действующее лицо и объект, например. Потом можем отдельно менять каждую из этих составляющих.
3️⃣ В DomoAI добавили три новых стиля: Realistic, Anime и Cartoon. Можно даже потыкать бесплатно за стартовые кредиты.