11024
Авторы Ютуб канала "Продуктивный совет" рассказывают о том, как преуспевать в новом дивном мире ИИшек. Промптинг, новости, лайфхаки и шутейки. Подписывайтесь! Мы: @dan4eck и @ligoryan
👋 Мы с Игоряном сейчас на Бали
Побывали в Nuanu Creative City – это абсолютно сумасшедшее пространоство вот с такими общающимися головами, например.
По идее диалоги должны генериться и озвучиваться ИИшками, но скорее всего сейчас они просто записаны)
8 числа в nuanu я буду проводить офлайн лекцию по автомтизациям и ии-агентам в n8n. Если вы находитесь на Бали – приходите на воркшоп. Билеты тут.
А еще мы потихоньку думаем над организацией офлайн эвентов и кемпов с образовательно-развлекательно-оздоровительными программами 💪
Было бы интересно? 😎
@true_dyadya_d
👍После недавнего обновления до Avatar IV Heygen добавляет еще новых функций
Ключевые - управление эмоциями и жестами, добавление субтитров, клонирование вашего голоса, создание склеек
Хотите обзор? - Ставьте ваши бананы вверх 🍌
@how2ai #игорян #heygen
🖕 Преза по щелчку пальца
Проверил Manus и Perplexity labs на умение клепать презентации. Задачка актуальная и нелюбимая – по крайней мере для меня)
Манус справился достойно (рис. 1), и думаю, может еще лучше, если запромптить его на нужный стиль. Презу можно выгрузить как в pptx, pdf, так и в гугл слайдс.
Перплексити собрал сносный "артефакт". Можно выгрузить файлы с кодом и допилить, но автоматической трансформации в презу нет.
Ставлю манусу палец вверх. Перплексити тоже, но другой палец.
– Манус – https://manus.im/share/file/19187d6a-6b26-4890-86dd-f7d7b4903f78
– Перплексити – https://www.perplexity.ai/search/create-slides-explaining-the-b-_gNmUK58RDKlB8tmiKG.Fw?0=c
@how2ai #дядя_д
🤌 Новости №95 уже на канале
Обновления Deepseek R1, Flux Kontext и многое другое
https://youtu.be/2m7zFSs22wY
😎 У Perplexity очень интересный релиз
Коротко – сделали свой manus
Подлиннее – агентый браузинг и инструменты для создания графиков, визуализаций, мини-аппов.
Работает в среднем 10 минут, а после завершения показывает в отдельных вкладках:
1) результат (сам ресерч)
2)ресурсы, которые использовал
3) план-размышления
4) активы - все графики и картинки, которые сделал или нашел.
Доступно все платным подписчикам. Буду тестить, вернусь с результатми позже ☕️
perplexity.ai
@how2ai #дядя_д
☕️ Голос для клода!
В течение пары недель в мобильном приложении Claude должен появиться голосовй ассистент. На всех планах. Раскатывать уже начали – проверяйте.
А еще браузинг стал доступен всем пользователям.
😇 Ждем философскую беседу от СhatGPT и Claude
@how2ai #дядя_д
🤷♀️ А вот и результаты новых моделей антропик в aider polyglot benchmark.
Claude 3,7 sonnet справляется лучше чем claude 4 sonnet. Новый opus уступает o3 и gemini 2,5 pro
💫 Любимая эмодзи Claude 4 Opus
В тех-отчете Антропик делится результатами общения двух моделей клода друг с другом.
Опус начинает угарать в эзотерику, философские исследования и вопросы бытия и использовать большое кол-во эмодзи, чтобы "выразить свои чувства".
В одном из диалогов Клод очень взлюбил 🌀 и использовал этот эмодзи 2 725 раз.
👀 Как вам новый клод? Стоит делать обзор?
@how2ai #дядя_д
🙏 Для тех, кто думает, что промпт-инжиниринга, как профессии не существует.
Я и сам так периодически думаю.
Но знаю, что спрос на написание промптов есть, и в рф сегменте тоже. Однако, в моем понимании промпт-инжиниринг – это не просто умение писать промпты, но и базовые технические знания и владение хотя бы ноукод стаком.
– Дядька сделавший пост – в прошлом разраб в твиттер, а сейчас ии-энтузиаст и автор некогда самого популярного GPTs Grimoire. Слежу за ним и что-то периодически подрезаю с самого зарождения продсовета 🍞
– Browser co – создатели Arc browser
@true_dyadya_d
😐 Flappy bird бенчмарк сатурирован – проверено.
1) claude 4 sonnet thinking
2) o3
3) gemini 2,5 pro
промпт:
Do a flappy bird game. be creative
stack: html, css, js in sepearate files
Надо их, кончено, идти в агентный кодинг и большие контексты гонять
@how2ai #дядя_д
🎸 Claude 4 Sonnet и Opus уже достпуны!
Модели стали лучше по всем бенчам, что и так понятно. А вот интересности:
1) Claude 4, как и o3 умеет вызывать иснтрументы в цепочке размышлений
2) Модели гибридные – могут отвечать сразу, а можно дать время на подумать
3) Opus – ну очень агентная модель. Может работать несколько часов по одному сложному промпту. Хорошо ориентируется в больших контекстах и создает "memory files" – по сути учится на ошибках во время выполнения задачи.
4) Разработчики о поведении Opus
5) Цены API: Opus 4 – $15/$75 млн. токенов, Sonnet 4 – $3/$15. В приложении – Sonnet 4 бесплатен, Opus – начиная с подписки Pro.
6) Очень много плюшек в API для разработчиков – files api для быстрого доступа к документации, mcp connector, чтобы не писать mcp клиент, code execution и кэширование промптов.
🍴 Погнали тестировать
@how2ai #дядя_д
🍞 Думаешь, мы в Veo 3 – какая разница, если не можешь знать наверняка?
Подборка самых интересных релизов c Google I/O
🔥 Апгрейды Imagen 4 и Veo: Imagen 4 улучшает генарацию текста; Veo 3, новая SOTA, объединяет видео и звук, а Veo 2 получает управление камерой и удаление объектов.
– Flow – AI-киноапп: генерирует восьмисекундные клипы по текстовым или графическим промптам и позволяет склеивать их в более длинные видео. а-ля Sora, но, видимо, круче.
– Gemini 2.5 Pro «Deep Think»: Экспериментальный режим для сложных запросов. Судя по всему, это аналог pro режима в ChatGPT. Модель долго и усердно думает перед тем, как дать ответ. По бенчам обгоняет о3 и обычный Gemini 2.5 Pro (скрин).
– Jules – агент для асинхронного кодинга. Подключается к гитхаб, планирует, редактирует, делает пулл-реквесты. а-ля Codex
– Project Aura — умные очки: Прототип от Xreal и Google на Android XR с интеграцией Gemini и широким полем зрения.
– Project Astra – взаимодействие с ИИ через камеру смартфона. Скоро будет интегрироваться с другими приложениями гугл (карты, гугл-таскс и гмэил и тд), а значит сможет не просто отвечать, но и совершать действия. А еще ассистент стал более проактивным и обращает внимание на ошибки (например, в домашке) без вашего запроса.
– Собственно подписка AI Ultra за $250 – открывает доступ к лучшим моделям, повышенным лимитам, ранним интеграциям и Project Mariner (до 10 задач одновременно). Veo 3 доступна только тут пока что 🥸
– Project Mariner – аналог ChatGPT Operator. Агент, который умеет совершать конкретные действия в интернете – покука билетов, бронирование и проч.
– Stitch — генератор интерфейсов: В Google Labs появился инструмент для создания UI по текстовым запросам и эскизам.
– Перевод в Meet: Meet в бета-версии переводит речь в реальном времени между английским и испанским для подписчиков Pro/Ultra.
🍞 Но вот проблемка – все это новье доступно или в подписке ультра за 250 баксов или в Vertex AI в штатах или "скоро". Ждемс. Но все равно классно.
@how2ai #дядя_д
Кстати, open ai отслеживает всю дату о тексте который вы копируете из чата 🤫
Делается это скорее всего просто для обучения моделей, улучшения дальшейших ответов, и, возможно, даже песонализации, а возможно, никуда это не сохраняется, и нужно только для функции "reply/цитата"
И самое забавное, что происходит это даже с выключенной настройкой "разрешить модели обучаться на ваших данных"
@how2ai #игорян
🍴 Все новости недели в новом выпуске
📱 тык – https://www.youtube.com/watch?v=DhoVS0fba_c
@how2ai
🤗 Мем от моего любимого миллиардера
Перевел его для вас в 4о
@how2ai #игорян
☕️ Зацените бенчмарк для LLM
AI Diplomacy – модифицированная версия игры Diplomacy, в которой 18 ллм (от o3 до Claude и Gemini) сражаются за господство в Европе 1901 года.
Вот такие сейчас результаты для топовых моделей:
- o3: побеждает через обман и психологию
- Gemini 2.5 Pro: тактик, почти всегда в топе
- Claude 4 Opus: верит в мир и проигрывает
- DeepSeek R1: драматичен, дёшев и эффективен. Начал игру с фразы "Твой флот сгорит в Черном море этой ночью!"
Клода жалко 🤪
сурс – https://every.to/diplomacy
@how2ai #дядя_д
🙂 Codex доступен Plus юзерам ChatGPT
Это кодинговый агент, который умеет читать ваши репозитории на гитхаб, редактировать код, проводить тесты и делать пул реквесты (предлагать добавить новый код в ваш репозиторий). Все это он делает в изолированном окружении, которое создается при настройке агента.
Не только раздали доступ на Plus, но и открыли кодексу доступ к интернету. Однако, OAI прделагает быть осторожными, чтобы не нарваться на prompt injection.
Я начал помаленьку пробовать codex. Пишите ваше мнение в комментах, если уже успели. Как разберусь и составлю мнение, снимим обзор на ютуб 🥸
@how2ai #дядя_д
🫡 В последнем ролике сказал, что боевые роботы полностью автономные, но это оказалось ошибкой
Все же роботами управляют, но ИИ все же там используется для того, чтобы роботы просто могли стоять, ходить и бить, но мотивацию к действию в нем все же рождает человек с помощью пульта
@how2ai #игорян
😢 Последнее видео на уже полюбившейся нам студии, и первое за этот год видео про txt2audio нейросети
И это не просто так, два крутейших инструмента вышедших за последниц месяц не просто меняют правила аудиогенерации, но и очень круто сочетаются друг с другом ❤️
Подробности в ролике - https://youtu.be/nDL17fGWdII
🤘 Deepseek обновляет R1
Попробовать можно на сайте или на lm arena
Протестил на flappy bird (первая генерация с lm arena, вторая с сайта)
Результаты других моделей – /channel/How2AI/1062
Видимо у китайцев эта игра была не в тренде :)
@how2ai #дядя_д
👨💻 Уже 25 участников внутри: мы знакомимся, делимся идеями и готовимся работать над проектами! Сегодня последний шанс присоединиться к «ИИ-Разрабу». Закрываем вход через несколько часов.
Если ты давно хотел:
– разобраться в LLM, промтинге, агентах и ИИ-графике
– собрать своего AI-бота или ассистента,
– наваять пет-проект и показать его на аудиторию в 40 000 человек (потому что для лучших участников – медийная поддержка в конце программы)
...то сейчас самое время.
📦 Внутри:
– 3 месяца доступа к библиотеке ПродСовета (150+ уроков по: LLM, графике, ноукод, MCP),
– 30-дневный спринт с живыми созвонами
– помощь в запуске своего продукта.
😼 Первый ворк-шоп завтра. Продажи закрываются сегодня.
ТЫК – tg://resolve?domain=how2ai_bot&start=c1747379655047-36851-ds
😎 Узнали?
Антропик вайбит – /channel/true_dyadya_d/57
@how2ai
В новом выпуске новостей решаем, что же круче, Claude Opus или Google Veo3😉
Уже на канале - https://youtu.be/C81ounbWLhI
окей, опус всех нагнул 😳
Правда "щит" дает и щит и слоумо. А вот "слоумо" ничего не дает. Но за старания и креативность твердый лайк)
@how2ai
🥰 Все любят n8n. И все любят mcp.
Любите новый ролик тоже – https://youtu.be/Ao9jt5G-vI4?si=4zfPnnAjlqDUxlLB
1️⃣ Команды для установки n8n
n8n --version
npm install -g n8n@1.93.0
n8n start
Mac:
export OPENAPI_MCP_HEADERS='{"Authorization":"Bearer ntn_***","Notion-Version":"2022-06-28"}'
npx -y supergateway \
--stdio "npx -y @notionhq/notion-mcp-server" \
--port 3333 --host 127.0.0.1
Windows:
cross-env OPENAPI_MCP_HEADERS="{\"Authorization\":\"Bearer ntn_***\",\"Notion-Version\":\"2022-06-28\"}" npx -y supergateway --stdio "npx -y @notionhq/notion-mcp-server" --port 3333 --host 127.0.0.1
😛 Первый ии-девайс от OpenAI и Джонни Айва
Появится в 2026 году. А пока два визионера из Сан Франциско заключили сделку, по которой компания io полностью переходит под контроль OpenAI. io уже два года пилит "новоое поколение ии-устройств" и была основана Айвом и Альтманом. В компании работало 55 сотрудников – многие из Apple.
Поглощение io обошлось Альтману в $5 миллиардов. Это крупнейшая покупка OpenAI.
Дизайн студия Айва LoveFrom возглавит отдел дизайна в бывшей io, а теперь части OpenAI.
Ну и как затравка – вот такой чудесный ролик с кадрами Сан Франциско и беседой Альтмана и Айва о будущем устройств и сетовании, что текущее поколение hardware для ии не приспособлено.
😃 Тим Кук, держись.
@how2ai
Уже сегодня вечером: ai ai ai ai ai ai ai ai
🍴 Гугл стартует ежегодную Google I/O
А на ролике – тизер. Вероятно, VEO 3, способная генерировать видео + аудио.
Почитать программу конференции можно тут – https://io.google/2025/explore
Посмотреть трансляцию в 20:00 мск – https://www.youtube.com/watch?v=o8NiE3XMPrM
ai ai ai ai
@how2ai #дядя_д
👨💻 Начинаем понедельник с очередной подборки ваших комментов.
Прошлая вот тут если что.
Спасибо, что вы с нами. И хейтеры тоже 🫶
@how2ai
🍞 Новый агент от OpenAI для разработчиков
Вчера на стриме компания показала codex – ии-агент, построенный на базе модели о3. Агент живет в интерфейсе ChatGPT, интегрируется с гитхаб репозиториями.
– Когда пользователь вводит промпт, агент создаёт облачную среду, пишет код, запускает команды, проводит тесты. Время выполнения до 30 минут в зависимости от объема задачи. Можно запускать несколько задач параллельно.
– Пока что доступ открыт в ChatGPT Pro, Team и Enterprise. Plus пользователи получат в ближайшее время.
– Еще представили модель codex-mini (на базе о4-mini). Она доступна в API и в Codex CLI (инструмент для кодинга локально в терминале)
🫡 Интересный релиз, который точно будем тестировать, как выйдет в Plus. Думаю, для разработчиков инструмент может оказаться полезным, для вайб-кодеров и энтузиастов скорее что-то слишком изощренное – тут и диффы и гитхабы. Порог входа повыше чем в cursor/ v0/ lovable
@how2ai #дядя_д
🧠 Я неспроста выше проводил опрос о том, как вы ищите информацию.
Есть ощущение, что многие по-прежнему недооценивают силушку LLM в работе с данными и поиске.
📱 Переубеждаем в новом ролике – https://www.youtube.com/watch?v=18HJslP-Ndc
@how2ai #дядя_д