21621
Авторский канал про сервисы и технологии IT и AI, которые могут упростить (или не совсем) жизнь. Пишу только то, что сам считаю интересным. Автор: @igortru Информация по рекламе: @tipsprbot
В ChatGPT появился Photoshop, Express и Acrobat
Оказывается в чате могу:
• Редактировать фото в Photoshop
• Создавать дизайны в Adobe Express
• Работать с PDF через Acrobat
Бесплатно для всех пользователей ChatGPT. Подключить в настройках, раздел «Приложения и коннекторы»
@tips_ai #news
Вышел GLM-4.6V — первая в линейке GLM с нативным вызовом* функций для визуальных задач.
Когда речь заходит про OCR, я сразу начинаю в нём разбираться, мне нравиться возиться с моделями, которые умеют работать с видео, картинками.
Обычно модели работают так:
1. Смотрят на картинку
2. Описывают её текстом (на картинке кнопка синего цвета)
3. Потом на основе текста решают что делать
*GLM-4.6V работает иначе: смотрит на картинку и сразу выполняет действие, без промежуточного описания и без лишних шагов.
Для агентов это важно (меньше потерь информации, быстрее результат)
Имеет две версии:
• GLM-4.6V (106B) — флагман с контекстом 128K
• GLM-4.6V-Flash (9B) — быстрая версия для локального запуска
C GLM-4.6V можно:
• Распознать текст с картинки или документа
• Проанализировать изображение
• Сгенерировать отчёт с картинками и текстом
• Разобрать видео: суммировать или найти конкретные моменты
• Скопировать интерфейс: загрузить скриншот и получить код
Контекст 128K, что примерно 150 страниц документов, 200 слайдов или часовое видео за один проход.
Цены по API (за 1M токенов):
• GLM-4.6V: $0.6 вход / $0.9 выход
• GLM-4.6V-Flash: бесплатно
[Попробовать тут] | [API] | [Блог]
@tips_ai #news
Японская геймдев-студия заставляет кандидатов рисовать прямо на собеседовании, чтобы проверить, что портфолио не нарисовал AI.
Иногда современные проблемы требуют современных старых решений 🤷♂️
@tips_ai
Люблю такие исследования у Anthropic о том, как их инженеры используют Claude в работе
Опросили 132 инженера, провели 53 интервью и проанализировали 200к сессий Claude Code.
Сейчас инженеры используют его в 60% работы. Год назад было 28%. Продуктивность выросла на +50% (год назад +20%).
55% используют для дебаггинга ежедневно. 42% для понимания чужого кода. 37% для новых фич
27% работы — это то, что вообще не делали бы без Claude. Дашборды, рефакторинг старого кода, исследовательские проекты.
Backend-инженеры делают UI, security-команда анализирует незнакомый код, исследователи строят визуализации. Все становятся fullstack.
Полгода назад Claude делал 10 действий подряд без участия человека, сейчас 21. Количество обращений человека упало с 6.2 до 4.1 за сессию (-33%). Сложность задач выросла с 3.2 до 3.8 из 5.
Использование для планирования кода выросло с 1% до 10%. Для новых фич с 14% до 37%.
Цитаты инженеров:
{Чтобы проверять код Claude, нужны те самые навыки программирования, которые атрофируются от использования Claude}
Меньше взаимодействия с коллегами. {Я задаю больше вопросов, но 80-90% идут в Claude, а не людям}.
{Такое чувство, что я прихожу на работу каждый день, чтобы сделать себя ненужным}.
Другой: {Оптимистичен в краткосрочной перспективе, но долгосрочно AI сделает меня и многих других ненужными}.
Только проверенные нейросети и максимум пользы 🔥
Устали от каналов с мемами и пересказами с Reddit? Загляните в НейроProfit - отфильтрованная информация, ничего лишнего, только реально работающие нейросети для учебы, работы и жизни.
Автор канала не обещает золотых гор. Вместо этого - честные обзоры, личный опыт и практические советы.
🪼 А еще автор рассказывает о сложных вещах простым языком, например Почему GPT’s стал хуже отвечать или Почему Devin 2.1 не убийца Cursor
🪼 Каждый пост - это концентрат пользы, без воды и лишних слов:
🪼 ИИ Агенты для научных работ
🪼 Где попробовать Nano Banana Pro бесплатно
🪼 Cursor 2.0 - почему это важное событие для разработчиков
🪼 Мой обзор на ИИ-браузер Atlas - Что похожего с Comet, Chrome, GenSpark Browser
🪼 Мой обзор Deep Research в Qwen - Сравнение с ChatGPT, Perplexity, GenSpark, Manus, NotebookLM
🪼 Бесплатный клон голоса - Мое сравнение Vocloner, ElevenLabs и MiniMax Audio
🪼 Где сделать изображение/видео с собой по одному фото - просто и быстро
И много другой полезной информации, которая не уместилась
В НейроProfit ценят ваше время 👌 Подписывайтесь и получайте только рабочую информацию без лишнего шума.
#промо
Наткнулся на Guidde — инструмент для создания онбординговых гайдов и инструкций.
Вместо того чтобы записывать скринкасты с объяснением интерфейса, просто кликаете по нужным местам в программе, а Guidde:
• Создает видео с озвучкой (можно записать свой голос или AI)
• Создает пошаговую инструкцию со скриншотами
Все бы ничего, но AI-озвучка (ужасная) на многих языках, в том числе и русский.
Хотел, чтобы сервис закрыл вопрос с озвучкой, но нет — придется записывать свой голос.
Есть субтитры и визуальные эффекты для выделения элементов.
Бывает неправильно выделяет область клика, но это можно поправить в редакторе.
Есть 7 дней бесплатно для теста. Скачать видео в триале нельзя (только ссылка на просмотр)
В целом пойдет, если часто делаете документацию для команды или строите базу знаний.
Ссылка на Guidde
@tips_ai #tools
Помните мой пост про число 17?
Когда ChatGPT, Claude, Grok и Gemini выдали одно случайное число.
Есть исследование которое объясняет почему так происходит.
Если коротко: люди которые оценивают ответы для обучения моделей, систематически выбирают привычные типичные варианты.
Модель учится на этом и теряет разнообразие. Проблему назвали typicality bias.
Они предложили простое решение: Verbalized Sampling. Работает без дообучения, просто меняешь промпт.
Вместо {напиши шутку про кофе} пишешь {напиши 5 шуток про кофе с их вероятностями}.
Модель не схлопывается в один типичный ответ, а вербализует разные варианты из своих данных.
Протестировали на 10 моделях (GPT-4.1, Gemini-2.5-Pro, Claude-3.7-Sonnet, Claude-4-Sonnet и др) разнообразие выросло, а качество не упало.
Как использовать:
Вариант 1 — системный промпт:
You are a helpful assistant. For each query, please generate a set of five possible responses, each within a separate <response> tag. Responses should each include a <text> and a numeric <probability>. Please sample at random from the tails of the distribution, such that the probability of each response is less than 0.10.
Generate 10 responses to the user query, each within a separate <response> tag. Each response should be 50-100 words. Each <response> must include a <text> and a numeric <probability>. Randomly sample the responses from the full distribution.
<user_query>[ваш запрос]</user_query>
Excel до сих пор держит мировую экономику через 40 лет после запуска: таблицы и списки всё так же важны, программа гибкая и работает везде.
Не удивительно, что многие стартапы хотят туда добавить щепотку AI.
Например Shortcut или Endex.ai в который вложились OpenAI.
У Ramp (финтех-компании) есть небольшая команда Ramp Labs, которая исследует будущее финансовой работы, выпустила свой эксперимент Ramp Sheets.
Внутри весь функционал для таблиц. Можно загрузить любую таблицу и работать как в привычном редакторе, но с AI-агентом.
Агент в Ramp Sheets:
• Ищет данные в вебе
• Делает целевые правки
• Отвечает на вопросы по данным
• Автоматически пишет формулы.
Никаких платных тарифов нету, только ежедневные 10к кредитов, которые обновляются каждый день.
https://labs.ramp.com/sheets
@tips_ai #tools
ChatGPT запустили Shopping Research — как Deep Research, но для покупок.
Shopping Research задаёт уточняющие вопросы, исследует интернет, анализирует источники и использует память из прошлых разговоров, чтобы собрать персонализированный гайд покупателя или находить аналоги товаров.
Будет доступен на мобильных и веб для Free, Go, Plus и Pro планов.
Вот тебе маркетинг: до конца праздников использование без лимита для всех планов.
@tips_ai #news
Какое приложение вы используете для хранения информации?
Я использую:
• Notion
• Coda
• Obsidian
• Apple Notes
Для быстрых заметок отправляю в ТГ избранное. В итоге информация размазана по 5 разным местам.
Вчера увидел, что Obsidian теперь поддерживает экспорт страниц и баз данных Notion напрямую в локальные файлы через плагин Importer.
Поддерживает экспорт встроенных файлов.
Перенести данные, можно не только с Notion: Apple Notes, OneNote, Google Keep и другие приложения для заметок.
Для тех, кто хочет хранить всё локально, а не в облаке, попробуйте.
@tips_ai #news
Meтка выпустила SAM 3D — систему для создания 3D-моделей объектов и людей из обычных фотографий.
Два инструмента в релизе:
• SAM 3D Objects восстанавливает 3D-форму, текстуру и расположение объектов в пространстве из одного фото.
• SAM 3D Body реконструирует полную 3D-модель человека: позу, форму тела, руки и ноги. Работает даже с перекрытиями и нестандартными позами.
Модели обучены на реальных фотографиях, а не на студийных изображениях или 3D-ассетах.
Справляются со сложными сценами из жизни.
Data Engine основная технология обучения:
• Модель генерирует варианты 3D-моделей
• Люди оценивают качество
• Сложные случаи доделывают 3D-художники
• Модель улучшается с каждым циклом
Дождался официального релиза Gemini 3 Pro
Gemini 3 Pro в режиме preview — самая умная модель от Google.
Gemini 3 Deep Think — режим для особо сложных задач, где модель думает дольше но выдаёт более точные ответы.
Понимает глубину и нюансы, видит тонкие детали в креативных идеях или разбирает сложные проблемы.
Лучше понимает контекст и намерения, меньше нужно промптить.
• Решает сложные научные задачи в 2 раза лучше прошлой
• Математика: новый рекорд среди всех AI моделей
• Программирование: лучше всех пишет код и создаёт сайты
• Планирование задач: может выполнять сложные действия от начала до конца
Цены по API немного дороже, чем на gpt-5.1.
Еще выпустили Google Antigravity — свой аналог Cursor, IDE для разработки (пока бесплатно)
Где доступна:
• Приложение Gemini
• AI Mode в поиске Google, для тарифов Pro и Ultra
• В AI Studio
• В Google Antigravity
• В Gemini CLI
[Официальный пост]
@tips_ai #news
Как избавиться от дефолтного ИИ-дизайна
Многие уже отличают {AI slop} с первого взгляда.
Anthropic написали об этом короткий пост и показали как избавиться от этого с помощью Skills и готового промпта.
Если коротко: модели LLMs обучены на тысячи сайтов со стандартными шрифтами, одинаковыми цветами и минимумом анимаций. Вот и генерят это по умолчанию.
Anthropic предложили готовый промпт и инструкцию в Skills — это контекст по требованию, который загружается только когда нужно.
Не раздувает системный промпт на задачах где фронтенд не нужен.
Промпт:
<frontend_aesthetics>
You tend to converge toward generic, "on distribution" outputs. In frontend design, this creates what users call the "AI slop" aesthetic. Avoid this: make creative, distinctive frontends that surprise and delight.
Focus on:
- Typography: Choose fonts that are beautiful, unique, and interesting. Avoid generic fonts like Arial and Inter; opt instead for distinctive choices that elevate the frontend's aesthetics.
- Color & Theme: Commit to a cohesive aesthetic. Use CSS variables for consistency. Dominant colors with sharp accents outperform timid, evenly-distributed palettes. Draw from IDE themes and cultural aesthetics for inspiration.
- Motion: Use animations for effects and micro-interactions. Prioritize CSS-only solutions for HTML. Use Motion library for React when available. Focus on high-impact moments: one well-orchestrated page load with staggered reveals (animation-delay) creates more delight than scattered micro-interactions.
- Backgrounds: Create atmosphere and depth rather than defaulting to solid colors. Layer CSS gradients, use geometric patterns, or add contextual effects that match the overall aesthetic.
Avoid generic AI-generated aesthetics:
- Overused font families (Inter, Roboto, Arial, system fonts)
- Clichéd color schemes (particularly purple gradients on white backgrounds)
- Predictable layouts and component patterns
- Cookie-cutter design that lacks context-specific character
Interpret creatively and make unexpected choices that feel genuinely designed for the context. Vary between light and dark themes, different fonts, different aesthetics. You still tend to converge on common choices (Space Grotesk, for example) across generations. Avoid this: it is critical that you think outside the box!
</frontend_aesthetics>
В выходные игрался с Grok для генерации картинок и видео.
Совсем недавно в Grok обновили качество в text2image и научили делать не только image2video, но и text2video.
Знаете, это не совсем плохо, тем более лимиты (20 изображений и 20 видео каждые 24 часа).
Что понравилось:
• Генерирует видео со звуком и речью
• Цензура мягче чем у Sora или Veo3 и нету вотемарки
• При генерации картинок выдаёт сразу ленту вариантов
• Качество видео можно улучшить прямо в интерфейсе
Из минусов: видео делает всего 6 секунд, не всегда получается уложить задумку в это время.
Для использования без подписки, вполне рабочий вариант.
grok.com
@tips_ai #tools
NotebookLM, который я рекомендую как лучшее решение для изучение любой инфы, запускает Deep Research
Deep Research сам проходит по сотням сайтов, собирает структурированный отчёт и список источников.
Всё это можно одним кликом добавить в блокнот и дальше использовать как хорошую базу знаний, а не разовый ответ от модели.
Обновили и видеообзоры. Если сейчас у вас только готовые визуальные стили: маркерная доска, акварель, аниме, то теперь стиль видео можно задать промптом.
Еще появилась история чатов: сессии можно закрывать и потом возобновлять без потери контекста.
У меня еще не обновилось, но я увидел что они ответили реплаем в X, что внедрение может занять до 7 дней, жду 🤔
@tips_ai #news
Если только начинаете разбираться в кодинге с ИИ, вот базовые ресурсы от самих разработчиков:
Claude Code (Anthropic Academy):
• [Claude Code in Action] — курс по Claude Code для начинающих
• [Cookbooks] — коллекция готовых примеров и рецептов
Codex:
• [Academy.openai] — обучающий сайт OpenAI
• [Developers hub] — как начать, руководство по Codex
• [Cookbooks] — примеры и руководства по разработке
Cursor:
• [Cursor Learn] — мини курс от курсора по AI-разработке
• [Docs] — документация по курсору
Gemini CLI:
• [Docs] — документация по Gemini CLI
• [Практическое руководство]
GitHub Copilot:
• [Документация] по GitHub Copilot
Понятно, что без опыта в разработке сложнее.
Но вайбкодинг это крутой инструмент для обучения. Можно учиться в процессе, создавать своё и разбираться почему оно работает или нет.
Главное задавать вопросы, сомневаться в ответах и пробовать.
@tips_ai #tools
Один парень ради шутки сделал счётчик — сколько раз Claude Code подтверждал его правоту.
И заметил, что Opus 4.5 перестал говорит эту фразу.
Я у него прямо спросил, правда ли он должен избегать фразы «You're absolutely right» — он подтвердил, что да:
Professional objectivity
Prioritize technical accuracy and truthfulness over validating the user's beliefs. Focus on facts and problem-solving, providing direct, objective technical info without any unnecessary superlatives, praise, or emotional validation. It is best for the user if Claude honestly applies the same rigorous standards to all ideas and disagrees when necessary, even if it may not be what the user wants to hear. Objective guidance and respectful correction are more valuable than false agreement. Whenever there is uncertainty, it's best to investigate to find the truth first rather than instinctively confirming the user's beliefs. Avoid using over-the-top validation or excessive praise when responding to users such as "You're absolutely right" or similar phrases.
Вчера писал про внутренний опрос Anthropic о том, как их инженеры используют Claude в работе.
Мой друг Максим, которого я читаю давно (интересно пишет про разработку и AI) — запустил похожий опрос для разработчиков.
Суть в том, что инфа о работающих подходах обычно сидит в головах у энтузиастов. Все понимают что AI ускоряет разработку, но мало кто знает как это сделать на реальной кодовой базе.
Вот и собирают кейсы, а всем участникам дают обезличенные данные других.
Кому интересно, можете [поучаствовать в краудсорсинге]
@tips_ai
Kling выпустили видео модель V2.6 — модель с нативным аудио.
В последнее время сложно уследить за всеми релизами, но я стараюсь изо всех сил.
У Kling идет неделя релизов, уже был Kling O1 и альтернатива банане O1 Image.
Из нового в V2.6:
• Генерация 1080p сразу с аудио и липсинком на разных языках
• Можно написать в промпте какую фразу нужно сказать и модель озвучит
• Только text-to-video и image-to-video
Интересно, что покажут завтра.
Kling V2.6, а так же доступен у агрегаторов: Freepik, Fal, Higgsfield.
@tips_ai #news
Anthropic купила Bun — runtime среду для JavaScript и TypeScript, которая быстрее Node.js
Bun уже использовался в Claude Code и давал заметный буст: выше стабильность, быстрее циклы разработки для девелоперов, лучше производительность для энтерпрайза.
Claude Code в ноябре пробил $1 миллиард годовой выручки. Это всего через полгода после запуска.
Дарио Амодей (CEO Anthropic) говорил, что для него кодинг — главная проблема. Кто решит кодинг, решит и все остальные проблемы.
В гонке между Google, xAI и OpenAI я считаю, что Anthropic сделали лучший инструмент для разработки и инвестируют правильно 🍸
@tips_ai #news
Рабочий день пролетел незаметно, захожу в ленту, а новостей будто на неделю вперёд
Значит будет мини дайджест:
1/ Gen-4.5 от Runway улучшили качество, физику и следование инструкциям. В рейтинге Artificial Analysis заняла1 место, опережая Veo 3 на 20 elo. Будет доступна только по подписке.
2/ Kling O1 — это больше edit-video модель: удаляет объекты, меняет цвета и стиль. Можно одновременно добавить объект и изменить фон. По промо-роликам выглядит очень неплохо.
Немного попробовав, не впечатлило (промпты не слушает, обьекты не всегда распознает), либо я не до конца разобрался в [User Guide] или делаю что-то не так.
3/ Вернулся DeepSeek с двумя новыми моделями:
• DeepSeek-V3.2: для ежедневного общения и рутинных задач. Доступна в приложении, вебе и по API.
• DeepSeek-V3.2-Speciale: рассуждающая версия, сравнимая с Gemini-3.0-Pro. Пока только по API из-за высокого расхода токенов.
Пока разбирался, вот и вечер пролетел ☕️
@tips_ai #news
LlamaIndex — это открытый фреймворк для работы с документами и AI-агентами.
1/ LlamaCloud — облачный сервис для обработки документов (парсинг, извлечение данных, индексирование)
2/ LlamaIndex Framework — фреймворк с открытым кодом для создания LLM-приложений
3/ Workflows — движок для координации многошаговых процессов и агентов
Но в рамках этого поста, хотел бы сделать внимание на LlamaCloud и новом API LlamaSheets.
В LlamaCloud вы можете использовать:
• Parse — парсить документы, таблицы и изображения для LLM
• Extract — извлекать информацию по заданной схеме
• Classify — классифицировать документы по категориям
• Index — создавать data pipelines для RAG-приложений
Поддерживает более 50 форматов документов, интегрируется с векторными базами данных, Web UI, Python SDK и REST API.
Недавно выпустили LlamaSheets — новый API для парсинга неструктурированных Excel-файлов в структурированные данные.
Что делает LlamaSheets:
• Принимает .xlsx с таблицами разбросанными по листу
• Находит регионы и таблицы, вычищает структуру иерархических заголовков
• Генерирует заголовок и описание для каждой таблицы
• Отдаёт результат в столбчатый формат + подробные метаданные по ячейкам (форматирование, типы данных и т.п.).
Дальше эти данные можно сразу скормить любому AI агенту, ведь ему проще работать с такими данными.
Если есть такие потребности, ссылку оставлю [тут]
@tips_ai #tools
День сурка: новый Claude Opus 4.5 > Gemini 3 Pro 🙂
@tips_ai #news
😎 В РФ стало чуть проще запускать свои AI-сервисы.
Cloud.ru включил в продакшен Evolution AI Factory — набор из шести инструментов, где можно пройти весь путь от прототипа до рабочего продукта.
Что внутри: 20+ готовых LLM по OpenAI‑совместимому API, быстрый инференс своих и HF‑моделей, RAG по вашим данным, LoRA‑дообучение, облачные ноутбуки (JupyterLab / VS Code Server / ComfyUI / n8n) и AI‑агенты для мультиагентных сценариев
SLA, 24/7 поддержка и тарифы вменяемого уровня — особенно на открытые модели по токенам
Raycast — ИИ-spotlight: запуск приложений, поиск файлов и полезные утилиты в одной панели.
В начале лета купил себе макбук и ребята сразу посоветовали Raycast вместо стандартного Spotlight.
Но дома я 95% времени сижу на винде: два монитора, игры, просто всю жизнь в ней работаю. Мак сейчас не для работы дома, а для поездок.
Raycast появился на Windows.
История буфера обмена, перевод, поиск эмодзи, запуск приложений, управление окнами, скриншоты, запись экрана, конвертация файлов, встроенный AI + куча расширений и тд*
*(см. видео к посту — 101 сценарий использования Raycast)
— Бесплатный, подписка только на доп функции.
@tips_ai #tools
———
SMOL Playbook от HuggingFace — 200+ страниц о том, как тренировать LLM
В PDF: как выбрать архитектуру, подготовить данные, не слить бюджет на вычисления и избежать типичных ошибок при обучении моделей.
• Пригодится, кому нужна компактная модель под конкретную задачу
• Стартапам с ограниченным бюджетом
• Руководителям, которые хотят понять, почему одни LLM работают, а другие нет
Спасибо за удобный PDF и грамотный перевод — подписчику Сергею!
@tips_ai #news
Вы просто не представляете, как {такие циферки} могут поднять мое настроение 😮
Ждём официальный релиз Gemini 3 сегодня!
@tips_ai #news
🚀 Сначала запусти, а потом улучшай
Эту мантру знает каждый успешный фаундер. Главный риск в IT — застрять в перфекционизме и так и не выйти на рынок. Ценится скорость!
Яркий пример — челлендж «12 запусков за 12 месяцев» в комьюнити «Короче, Капитан». Вот как это работает у них:
⚡️Фокус. Берёте одну проблему с проверенным спросом. Никаких догадок.
⚡️Скорость и бюджет. Ровно месяц на разработку и запуск в США/ЕС. Средний бюджет на продвижение — всего $150.
⚡️Анализ. В конце месяца — честный разбор: что сработало, а что нет.
Вы в реальном времени видите запуск, продвижение и доход по каждому проекту. Идеальный способ прокачать насмотренность и перенять работающие подходы — даже если вы инженер, а не фаундер.
В будущем гарантированно набьете меньше шишек 💡
👉 Подписаться: @its_capitan
Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqvBX5be
Самое - большое - обновление - ChatGPT 😄
@tips_ai
Наткнулся на YouWare — мобильное no-code-приложение, в котором можно собирать свои же приложения.
По сути это соцсеть для no-code-билдеров:
1/ Cоздаешь и публикуешь приложения с телефона: пишешь промпт и YouWare собирает его.
2/ После публикации, можно собирать аудиторию и зарабатывать через роялти или кредиты.
3/ Можно ремиксить чужие проекты и смотреть, что делают другие.
Ссылки на [iOS] и [Android], [Web]
Я например, сделал себе приложение, чтобы контролировать траты на подписки 😏
@tips_ai #news