tsingular | Unsorted

Telegram-канал tsingular - Технозаметки Малышева

2604

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Subscribe to a channel

Технозаметки Малышева

Higgsfield.ai выкатили нанобанану для видео.

HiggsField Popcorn - меняет актеров в видеоряде с удержанием консистентности в пределах 8 секунд.

В качестве референса можно загрузить до 4х фото и расписать до 4х сцен последовательно с отдельным описанием для каждой.
таким образом можно получить пол минуты разных планов с одинаковыми героями в кадре.

Есть ежедневные бесплатные кредиты.
Для генераций в бОльшем объеме нужна платная подписка от $9 в месяц. С Veo3 - от $17 (сейчас скидки у них).

Под капотом - Veo 3.1. Функционал сам по себе оттуда.
Не забываем, что Higgsfiled - обёртка над различными генераторами типа:
Veo3, Hailuo 02, Seedance Pro, Kling 2.1, Kling 2.5, Wan 2.2, Wan 2.5, Sora 2, Veo 3.1

Но удобно, что у них такой вот общий редактор-комбайн с единым интерфейсом.

#HiggsFiled #Veo #нанобанана #нейрорендер
———
@tsingular

Читать полностью…

Технозаметки Малышева

🤔 А что, если Дубай был СССР

Читать полностью…

Технозаметки Малышева

а вот и доступные роботы подоспели.

Bumi от Beijing NOETIX Robotics по цене $1400

Это, конечно, не Unitree, но цена!

#роботы #Bumi #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

Утро в офисе xAI в день запуска Грокипедии.

Маск строит конкурента Википедии, который якобы будет непредвзят.

Как-то в молодости на запуске прямоэфирных сервисов на ТВ тоже в офисе ночевали 😀, так что очень близко.

Респект товарищам за целеустремлённость.

#Grokipedia #xAI
------
@tsingular

Читать полностью…

Технозаметки Малышева

OpenAI в данный момент релизит "свой" браузер со свтроенным ChatGPT (никаких сюрпризов).
Но глядя на этот скрин, кажется можно увидеть как начинают нервничать инвесторы Xbow. 😁

Пойду собирать списки страниц где попрошу Atlas браузер поискать мне XSS 😏

PS: Открывается шикарный пласт скрытых промт инъекций, которые поймают доверчивых юзеров и их ai-агентов вместе с их кредитными картами 😂

Читать полностью…

Технозаметки Малышева

🎬 Veo 3.1 + Flow: Google апгрейдит AI-видеопроизводство

275 миллионов видео за 5 месяцев — Flow показал, что люди хотят не просто генерить видео, а полноценно режиссировать.

Google услышал: выкатили Veo 3.1 и расширили творческий контроль.

Главное обновление — аудио теперь везде:
- Ingredients to Video — создаёшь сцену из референсов + звук
- Frames to Video — задаёшь начало и конец, AI делает переход с аудиодорожкой
- Extend — удлинняешь клипы до минуты и больше с синхронизированным звуком

Veo 3.1 под капотом:
- State-of-the-art качество аудио и видео
- Улучшенное следование промптам (особенно при превращении изображений в видео)
- Фотореалистичные текстуры и освещение

Новые инструменты редактирования в Flow:
- Insert — добавляй объекты с корректными тенями и освещением прямо в видео сцену (Нанобанана для видео)
- Remove (скоро) — убирай лишнее, AI восстановит фон как будто его там никогда не было

Доступность:
Veo 3.1 уже в Gemini API, Vertex AI для enterprise и в Gemini app. Новые функции редактирования работают через API.

#Veo #Flow #Google #нейрорендер
———
@tsingular

Читать полностью…

Технозаметки Малышева

D1 от Direct Drive Tech

Сайт компании

D1 завезли ограниченной серией - пока 50 штук, но есть Тита:

Tita

Ощущение что компания специализируется на двухколёсных роботах. Их прям много, разных размеров и часть из них так же собирается парами.

#роботы #Китай #DirectDriveTech
———
@tsingular

Читать полностью…

Технозаметки Малышева

🚀 Битрикс24 запустил MCP-сервер для AI

Битрикс24 запустил MCP-сервер для AI-агентов, специально созданный для работы с REST API.

🔧 Что меняется
🔹 AI получает данные напрямую из официальной документации – без задержек, без устаревания.
crm.lead.add, а не CRM.LEAD.ADD
PHONE[0].VALUE, а не просто PHONE
– точные типы, обязательные поля, валидация – все как в реальности.

🔹 Не текст. Структура.
AI не «думает», что нужно – он видит правильный JSON:

```json
{
"fields": {
"NAME": "Иван",
"PHONE": [{"VALUE": "79001234567", "VALUE_TYPE": "WORK"}]
}
}
```


🔹 Подсказки по контексту
– Какие поля обязательны для сделок?
– Как передать кастомные USER_FIELD?
– Как обработать массивы и даты?

🛠 Как подключить
Работает в VS Code, Cursor, Claude Desktop, Gemini Code Assist.

1. Откройте настройки AI-ассистента.
2. Выберите «Подключить MCP-сервер».
3. Введите: https://mcp.bitrix24.com
4. Готово.

🔗 Подробнее о подключении в статье

Битрикс24 очень бодро вскочили на поезд ИИ с MCP.
Респект.
Всем вендорам на заметку!

#MCP #Битрикс24
———
@tsingular

Читать полностью…

Технозаметки Малышева

шедевры нейрослопа :)

предположительно Sora, но это не точно.

#юмор #нейрорендер #белочка
———
@tsingular

Читать полностью…

Технозаметки Малышева

FB принёс прекрасное:

Крупные корпорации в США вполне себе имеют внутренние метрики в духе "сколько LLM токенов использовал сотрудник", которые учитываются в performance evaluations.

Это к вопросу о том как некоторые измеряют эффективность внедрения ИИ.

Хотя, если подумать,- на первых этапах выглядит работоспособно.

Измеримо.
Наглядно.
Проверяемо.

То что и нужно для KPI.
Надо понимать, что там этих performance индикаторов может быть десятки.
И один такой занимает сравнительно небольшую долю в общем наборе.

#метрики
------
@tsingular

Читать полностью…

Технозаметки Малышева

Grok Code Fast 1 теперь в Visual Studio, JetBrains, Xcode и Eclipse

xAI встроила Grok Code Fast 1 во все основные IDE.

Невероятно быстрая и практически на равных с Sonnet 4.5

#Grok #xAI #Coding
------
@tsingular

Читать полностью…

Технозаметки Малышева

А вот это интересно.

Изменение графика S&P500 vs Total вакансий

Какие мысли?
😀

#SnP500 #jobs #статистика
------
@tsingular

Читать полностью…

Технозаметки Малышева

Sora2 теперь в HeyGen

Аватары теперь будут гиперреалистичные.

Помянем инстамоделей.

#HeyGen #Sora
------
@tsingular

Читать полностью…

Технозаметки Малышева

Неожиданно.
У Selectel есть майнер лайков :)

#Selectel
------
@tsingular

Читать полностью…

Технозаметки Малышева

Мем года, конечно :)

Неповторимый оригинал

#юмор
------
@tsingular

Читать полностью…

Технозаметки Малышева

DeepSeek-OCR: Одна картинка стоит тысячи слов

DeepSeek выпустил OCR-модель, которая превращает документы в изображения и обрабатывает их как визуальные токены вместо классических текстовых. Звучит странно, но работает - и может изменить архитектуру LLM.

Попробуем разобраться что за зверь выкатили китайцы на этот раз:
Вместо обработки текста токен за токеном, DeepSeek-OCR рендерит его в картинку и сжимает в визуальные токены.

Один токен изображения заменяет 10-20 текстовых токенов без особых потерь качества.

Ключевые цифры:
- 97% точность при сжатии в 10×
- 60% точность даже при сжатии в 20×
- 100 визуальных токенов против 6000+ текстовых на OmniDocBench
- 200k+ страниц/день обработки на одной A100-40G

Как работает:
DeepEncoder с window+global attention пропускает изображение документа через 16× compressor. Результат — компактное представление, которое LLM легко декодирует обратно в текст.

🔥 Даже Карпатый тут высказался:

"Может, вообще все входы в LLM делать картинками? Даже чистый текст рендерить и подавать пикселями."

Его аргументы:
- Компрессия - контекст в 10-20 раз короче
- Универсальность - не важно что на картинке,- жирный текст, таблица, цвета шрифтов
- Bidirectional attention — пиксели можно смотреть "в обе стороны"
- Смерть токенизатору — уходит весь багаж Unicode, дыры в безопасности, странности с распознаванием эмодзи, когда то, что человек видит одинаково, - машина интерпретирует по разному.

"Vision→text работает. Text→text можно сделать vision→text. Обратно — нельзя."

Карпатый уже планирует переписать наночат версию с пиксельным входом.

На практике это даст:
- Сверх-длинные по нынешним меркам диалоги - старые сообщения превращаются в картинки и сжимаются
- Механизм "забывания" - как в памяти человека: свежее будет чётче, старое размыто
- Безграничные контексты - теоретически возможны через прогрессивное сжатие
- Генерация трейнинг-данных для LLM/VLM в промышленных масштабах

Если идея зайдёт, токенизатор может стать артефактом истории, как дискеты.

Мы наблюдаем реально фундаментальные прорывы в ИИ со стороны Китая.
Эффект количественного превосходства отличников.

#DeepSeek #OCR #Karpathy #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

DEF CON 33 тёмное фильтрованное.

Нафильтровал для вас избранные доклады по ИИ взлому и угрозам (из 312 видео):

Thinking Like a Hacker in the Age of AI

Exploiting Shadow Data from AI Models and Embeddings

Red teaming fraud prevention systems with GenAI

Securing Agentic AI Systems and Multi-Agent Workflows

They deployed Health AI on us: We’re bringing the rights & red teams

How AI + Hardware can Transform Point of Care Workflows

How AI + Hardware can Transforming Point-of-Care Workflows (2)

Prompt Scan Exploit AI’s Journey Through 0Days and 1000 Bugs

Let AI Autogenerate Neural ASR Rules for OT Attacks via NLP

Loading Models, Launching Shells: Abusing AI File Formats fr Code Execution

AppleStorm - Unmasking the Privacy Risks of Apple Intelligence

Полный плейлист

#Defcon #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

Китай представил новые дроны трансформеры для доставки грузов универсальных миротворческих.

Интересно, что эти мини дроны могут собираться в одного большого и выполнять более сложные задачи.

Ну и запуск из подствольника,- это пять!

Теперь, благодаря ElevenLabs, можно не учить китайский. И на том спасибо ИИ.

#Китай #дроны
------
@tsingular

Читать полностью…

Технозаметки Малышева

OpenAudio ex Fish Speech TTS обновился.

https://fish.audio/app/

Новая модель S1
в 6 раз дешевле ElevenLabs,
Эмоциональная достоверность генераций.
есть клонирование голоса и поддержка русского языка (качество русского заметно хуже, чем английского) .

Дают бесплатные 8К кредитов ежемесячно
за $11/m 250К кредитов в месяц

Есть Opensource S1-mini

#TTS #Fish
———
@tsingular

Читать полностью…

Технозаметки Малышева

OpenAI выпускает свой браузер.

Пока работает только на Apple причем на не Intelовских процах.

Качать тут:
chatgpt.com/atlas/get-started/

С учётом количества пользователей chatGPT, шансы отжать аудиторию у Гугла очень приличные.

Вообще интересно наблюдать в том плане что кто бы мог подумать 5 лет назад, что кто-то сможет скинуть царя горы.
Уже сколько Microsoft пытался и с Bing и с IE.

И вот теперь с вопросами чаще ходят к GPT, чем к Гуглу, дальше замена браузера, видео платформу Sora в тикток формате запустили, дальше что?
Рекламу отожмут и все.. нет Гугла?

#OpenAI #Atlas
------
@tsingular

Читать полностью…

Технозаметки Малышева

Только мы пару недель назад обсуждали про робота-помощника, чтобы и грузы и носилки мог помочь понести.

Нате, получите, распишитесь.

COLA: Обучение координации действий человека и гуманоида для совместной переноски предметов 🤝🤖

COLA делает гуманоидов по-настоящему полезными в совместной работе — способными переносить предметы, толкать тележки или реагировать на команды человека.

Cогласует и координирует действия человека и гуманоида в различных двигательных паттернах через проприоцепционную политику.

Носилки в ролике тоже есть.

Paper: https://arxiv.org/abs/2510.14293
Project: https://yushi-du.github.io/COLA/

#COLA #роботы
———
@tsingular

Читать полностью…

Технозаметки Малышева

⚡️ Qwen Deep Research получил полезное обновление

Теперь он создаёт не только исследовательские отчёты, но и готовые веб-страницы и подкасты по вашим ресерчам.

Работаем связка Qwen3-Coder, Qwen-Image и Qwen3-TTS.

👉Попробовать: chat.qwen.ai/?inputFeature=deep_research

@ai_machinelearning_big_data


#Qwen #AI #DeepResearch #Qwen3 #AItools

Читать полностью…

Технозаметки Малышева

IBM CyberPal 2.0: инструкция по обучению малых моделей для кибербеза

IBM Research показали, как обучить специализированные модели CyberPal 2.0 (от 4B до 20B параметров), которые решают задачи по кибербезопасности лучше больших универсальных моделей.

Почему это важно:
- Большие модели (ChatGPT и т.д.) плохо работают в кибербезопасности из-за ограничений guardrails
- Компании не могут отправлять секретные данные во внешние API
- Нужны локальные решения с реальной экспертизой

Как они это сделали:
- Эксперты создали форматы ответов для 105 типов задач по безопасности
- AI ищет доказательства в документах перед ответом (чтобы не выдумывать)
- Модель умеет выбирать: когда нужен длинный разбор, а когда — быстрый ответ

Главное открытие:
Обучение "с нуля" работает в 2.7 раза лучше, чем дообучение готовых моделей типа ChatGPT.

Результаты:
- Маленькая модель (4B) обгоняет GPT-4o
- Средняя (20B) — на 1-м месте, опередив все frontier-модели включая o1

Вывод:
- Экспертный датасет важнее размера модели. Модель с 4B параметрами с правильным обучением работают в 10 раз лучше, чем универсальные модели.

Сами модели IBM не выложили, но детально описали методику.
Сможем повторить ? :)

#CyberPal #IBM #Cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

Gemini CLI Extensions - собственный MCP hub от Гугла

А вот и Гугл включился в гонку MCP каталогов.

Теперь в режиме командной строки в Gemini CLI можно подключить такие популярные инструменты, как Figma, Elastic, Postman, Shopify, Stripe, Postgres и многие другие.

Всего их уже более 70ти и количество будет только расти.

В России таких порталов пока не много, кстати, рекомендую обратить внимание на https://mcpgate.ru
Товарищи очень активно развивают портал и инструментов уже там больше, чем у Гугла, причем с фокусом именно на Российские решения, в отличии от.

#Gemini #Extensions #Google #MCPGate
———
@tsingular

Читать полностью…

Технозаметки Малышева

Новый Figure 03 уже завтра.

Теперь в свитере :)

Это те самые товарищи, что сборкой BMW занимаются уже 5 месяцев.

#Figure #роботы
------
@tsingular

Читать полностью…

Технозаметки Малышева

Тяжелая легкая атлетика в Сора.

Что там писали про понимание физики?

Но залипательно невыносимо. Реальный brainrot.

@cgevent

Читать полностью…

Технозаметки Малышева

Samsung выпустил рекурсивную модель на 7М параметров, которая обошла DeepSeek-R1 и o3-mini

Tiny Recursive Model от Samsung показал результаты лучше гигантов на ARC-AGI.
Модель в 10 000 раз меньше конкурентов работает по-другому: сначала черновик ответа, потом внутренний цикл самокритики до 6 раз, затем новый черновик. Весь процесс повторяется до 16 циклов.

Результаты:
- Sudoku-Extreme: 87,4% точности
- Maze-Hard: 85,3%
- ARC-AGI-1: 44,6%
- ARC-AGI-2: 7,8%

Получается двуслойная рекурсивная сеть работает лучше больших трансформеров.

Для бизнеса это означает копеечные затраты на инференс вместо аренды GPU-кластеров.

Важное уточнение:
Это не в полной мере nlp
Это решалка тестов.
Возможно ее встроят в LLM как пару дополнительных слоев и это поможет лучше решать сложные задачи и использовать инструменты

SLM + TRM будут работать как LLM
Или TRM станет частью MoE
В любом случае экономия.

Кто умеет читать,- читать тут

Похоже кто-то все-таки навайбкодил GPT-6 :)

#Samsung #TRM #Reasoning
------
@tsingular

Читать полностью…

Технозаметки Малышева

Chrome DevTools через MCP для ИИ-агентов

Google запустил MCP-сервер для Chrome DevTools — теперь ИИ-агенты получают прямой доступ к инструментам отладки браузера.

Агенты могут анализировать производительность, мониторить сетевые запросы, инспектировать рантайм и отлавливать ошибки через стандартизированный протокол.

Технически это адаптер между MCP и Chrome DevTools Protocol, который маппит высокоуровневые запросы на CDP команды.

Ограничения безопасности встроены — системные команды с высокими привилегиями заблокированы, чтобы предотвратить эскалацию доступа к файловой системе или сети.

Поддерживается headless и headful режимы, работает кроссплатформенно включая контейнеры.

Теперь можно дебажить навайбкоженые сайты не покидая Cursor.
Особенно приятен headless.

#MCP #ChromeDevTools #dev
------
@tsingular

Читать полностью…

Технозаметки Малышева

Selectel запускает Foundation Model Catalog.

В среде так же сразу развернут OpenWeb UI.

Антон Чунаев вообще интересно про базу эффективного внедрения GenAI рассказыает.

Смотрите онлайн или потом в записи.

#Чунаев #agents #обучение #inference #Selectel
------
@tsingular

Читать полностью…

Технозаметки Малышева

Посмотрим что есть для ML&AI
Online: http://techday.selectel.ru/

#Selectel #конференции
------
@tsingular

Читать полностью…
Subscribe to a channel