Telegram-канал tsingular - Технозаметки Малышева: Unsorted - каталог телеграмм

tsingular | Unsorted

Subscribe to a channel

Telegram-канал tsingular - Технозаметки Малышева

2604

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Subscribe to a channel

Технозаметки Малышева

26 August 2025 16:52

ну все. наш мир уже не будет прежним.

Гугл выпустил нанобанану - новый редактор картинок по промпту с лучшей в мире точностью перерисовки без потери контекста.

заходим и пробуем тут:
https://ai.studio/banana

так же раскатывают во всех популярных платформах, типа krea и т.д.

Скоро во всех твиттерах/телеграммах/ботах мира.

Дизайнеры фсё. Помянем.

#nanobanana #Google #нейрорендер
———
@tsingular

Читать полностью…

Технозаметки Малышева

26 August 2025 13:52

Релиз двух новых моделей и обновление нейминга серии RuadaptQwen3 🎉

Мы подготовили целых два релиза:
- 🚀 Адаптированная Qwen3-8B → RuadaptQwen3-8B-Hybrid
- 🚀 Адаптированная Qwen3-4B-Instruct-2507 → RuadaptQwen3-4B-Instruct

Обе модели достойно себя показывают и обладают нашим Ruadapt токенайзером. В частности, мы недавно измерили разницу в скорости генерации (RuadaptQwen3-4B-Instruct против Qwen3-4B-Instruct-2507):
- ⚡️ Скорость генерации ответов на ru_arena_hard вопросы — на 40% быстрее для Ruadapt версий!
- ⚡️ Скорость ответа на вопрос в 300 тыс. символов — на 83% быстрее!

Также важный анонс по поводу нейминга моделей 🔄:
Все текущие RuadaptQwen3 модели будут вскоре переименованы из RuadaptQwen3-XB-Instruct → в RuadaptQwen3-XB-Hybrid, так как по сути они являются моделями с гибридным ризонингом (4B модель уже переименована, 32B на днях).
А чисто инструктивные версии будут называться RuadaptQwen3-XB-Instruct (как, например, адаптация Qwen3-4B-Instruct-2507).

Модели на HuggingFace:
https://huggingface.co/RefalMachine/RuadaptQwen3-8B-Hybrid
https://huggingface.co/RefalMachine/RuadaptQwen3-8B-Hybrid-GGUF

https://huggingface.co/RefalMachine/RuadaptQwen3-4B-Instruct
https://huggingface.co/RefalMachine/RuadaptQwen3-4B-Instruct-GGUF

Читать полностью…

Технозаметки Малышева

25 August 2025 12:03

🇨🇳 Китай захватил топ OpenSource на designarena.ai

Интересно сформировался топ-15 открытых моделей в Design Arena,- теперь он состоит только из китайских моделей.

Топ-15 открытых моделей:
- DeepSeek - лидер (5 моделей: позиции 1, 4, 5, 8, 10)
- Alibaba (6 моделей: позиции 3, 6, 9, 13, 14, 15)
- Zhipu AI (2 модели: позиции 2, 7)
- THUDM (1 модель: позиция 11)
- Moonshot AI (1 модель: позиция 12)

Первая западная модель, GPT-OSS-120B, появляется только на 16 месте

#OpenSource #designarena #China #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

25 August 2025 07:07

🚀 Macrohard: Маск запускает AI-компанию против Microsoft

Илон Маск анонсировал проект полностью автоматизированной софтверной компании на базе AI — прямого конкурента Microsoft.

Суть инициативы: создать первую компанию, где сотни AI-агентов на базе Grok самостоятельно разрабатывают, тестируют и выпускают ПО без участия людей.

Технический фундамент:
- Суперкомпьютер Colossus: 200K+ GPU Nvidia с планами усиления до 1M к концу года (строят ускоренными темпами, - буквально датацентр в палатках)
- Производительность: 98,9 экзафлопс (одна из топ-5 AI-систем мира на сегодня)
- Модель Grok-4 с мультиагентной архитектурой
- Развертывание за 122 дня вместо стандартных 18-24 месяцев
- Потребление энергии: 250 МВт с планами до 1,65 ГВт

Финансирование:
$12 млрд привлечено, оценка $80 млрд
Но сжигает $1 млрд ежемесячно
Обещает 70% снижение затрат на разработку

Следующие 18 месяцев покажут насколько реально с маскока вытеснить Майкрософт с рынка, на котором она окапывалась почти 5 десятилетий (в следующем году 4 апреля 50 лет будет).
Но даже если не получится, - опыт автономной разработки роем ИИ агентов Маск наработает бесценный, конечно.

#Macrohard #xAI #ElonMusk #Microsoft
———
@tsingular

Читать полностью…

Технозаметки Малышева

24 August 2025 11:03

Учёные из Массачусетса представили разработки, которые могут перевернуть наше представление о профилактике и мониторинге здоровья в будущем.

🔹 В MIT создали ультразвуковой бюстгальтер-сканер. Он позволяет женщинам проходить регулярные обследования груди прямо дома, между визитами к врачу. Идея родилась после личной трагедии исследовательницы Канан Даґдевирен: её тётя умерла от рака, который не был выявлен вовремя. Теперь диагностика может стать регулярной и максимально удобной — без похода в клинику.

🔹 Другой проект — графеновые «татуировки», которые считывают биохимические процессы организма и способны заранее предупреждать о приближении сердечного приступа. Они настолько тонкие и незаметные, что человек может забыть о них, пока в нужный момент устройство не подаст сигнал.

🔹 Ещё одна разработка от профессора Йоэля Финка — «умная нить», которая может хранить данные, выполнять алгоритмы ИИ, улавливать движение и звук, а также передавать всё это через Bluetooth. Обычная футболка может превратиться в медицинский датчик, который фиксирует изменения в вашем организме.

Пока все это напоминает снаряжение героев сериала Star Trek, но возможно когда-то действительно так и будет.

@it_medicine

Читать полностью…

Технозаметки Малышева

24 August 2025 04:07

Zhiyuan Mall — мегамолл роботов запущен в Китае

Zhiyuan Robot в сотрудничестве с LG, JD.com и Tencent запустили супермаркет гуманоидных роботов.

В наличии несколько категорий, - от промышленных до бытовых и даже молодёжных :).

В продаже и гуманоиды и собаки и запчасти к ним.
Есть так же VR комплекты дистанционного управления и аккумуляторные наборы.

В целом приоритет - opensourse подход и глобальная экспансия.

Роботы теперь продаются как посудомойки.
Ждем акции типа "купи телевизор, получи гуманоида в подарок".
М-Видео когда уже?
Или кто у нас еще ИИ роботов возит? 😉

#Zhiyuan #robots #Китай
------
@tsingular

Читать полностью…

Технозаметки Малышева

23 August 2025 14:33

Если бы не один ботаник и четыре певицы - не было бы ни мемов, ни Госуслуг, ни ChatGPT.

Иногда большие истории начинаются странно. Кто бы мог подумать, что нажатие одной клавиши и шуточная песня про коллайдер станут первой искрой цепочки, которая приведёт нас к ChatGPT.

23 августа 1991 года в CERN один скромный физик нажал «Enter» - и мир перестал быть прежним. Его звали Тим Бернерс-Ли. Он придумал то, что мы сегодня называем «ссылкой», и выложил в сеть первую в истории веб-страницу. По сути изобрел Интернет.

«Я всего лишь хотел упорядочить хаос», - говорил он. Но на самом деле он построил мост, по которому человечество вышло в новую эпоху.

Вот, кстати, тот самый первый сайт, который до сих пор работает: http://info.cern.ch/

А теперь - девушки. Четыре сотрудницы CERN, которые ради прикола собрали музыкальную группу «Les Horribles Cernettes» («Ужасные ЦЕРНнетки») и прославились шуточными песнями о любви к физикам, влюблённым в свои коллайдеры. Именно их фото стало первой картинкой, отправленной по интернету. Мир увидел не логотип, не схему, не документ - а улыбки.

Я подарила тебе золотое кольцо, чтобы показать свою любовь.
А ты вставил его в печатную плату,
Чтобы устранить утечку напряжения в коллекторе.
Ты подключаешь мои чувства к своему детектору.
Ты никогда не проводишь со мной вечера.
Ты не встречаешься с другими девушками.
Ты любишь только свой коллайдер,
Свой коллайдер

- вот цитата из их песни - ну чем не гимн цифровой эпохи?

С тех пор интернет вырос в глобальную экономику, перевернул рынок и сделал нефть второстепенной. Сегодня самая дорогая валюта - не литры топлива, а гигабайты данных и минуты нашего внимания.

Но самое важное: интернет оказался не финалом, а прологом. На его рельсах сейчас мчится искусственный интеллект. Все мемы, статьи, фото и видео стали топливом для AI-моделей. Если через 100 лет нас будут помнить - то, скорее всего, как поколение, которое преобразовало интернет в искусственный интеллект.

Сегодня интернету всего 34. Для технологий это подростковый возраст - бунтарский, дерзкий, полный экспериментов. И он только учится жить вместе с человечеством.

🎉 С днём рождения, интернет! 🌐🚀

Егошин | Кеды профессора

Читать полностью…

Технозаметки Малышева

23 August 2025 10:40

От идей к инструментам: что я показал на OFFZONE 2025.

Если вы читали мой анонс, то, наверное, запомнили эту строчку:
«И я покажу - не теорию, не концепт, а вещь, которую можно взять в руки, подключить, настроить. Инструмент для наступательной безопасности. Для тестирования агентов, которые уже не просто отвечают - они решают.»
Собственно, вокруг этого и строился весь мой доклад. Мне хотелось показать не очередную гипотезу или красивую схему на слайде, а живую концепцию того, каким может быть инструмент для тестирования агентов в динамике.
Да, первыми подобный подход реализовали в AgentDojo, но я убеждён: можно сделать проще, компактнее, доступнее. Хочу, чтобы в арсенале ИБ появился конструктор - окружение, которое можно без боли развернуть и сразу использовать как рабочий инструмент.

Сейчас в agentsploit поддерживаются только langchain-агенты - далеко не идеальный вариант. Думаю о том, чтобы добавить поддержку Langflow, а может быть, и других фреймворков. Ну и, конечно, особое внимание стоит уделить компонентам-оценщикам: без них картинка получается неполной. Тут я вижу огромный простор для развития.
Что касается самой подачи, я выбрал форму рассказа, вдохновившись произведением Филипа К. Дика «Обман Инкорпорейтед». И, знаете, не пожалел ни на секунду. В мире, где идёт ожесточённая борьба за внимание, рассказ, переплетённый с отсылками к художественному миру, оказался куда живее сухих тезисов.

Спасибо всем, кто пришёл на выступление - вас было действительно много, и это заряжает. Отдельная благодарность организаторам AI.ZONE за то, что вплели мою идею в сетку докладов.

А дальше - больше. В ближайшее время я подготовлю отдельный лонгрид: разберём инструмент детально и пройдёмся по его особенностям.

PDF версия презентации - ниже.

Читать полностью…

Технозаметки Малышева

23 August 2025 06:29

Я понимаю, что на 3 поста вверх тяжело смотреть,- шея затекает, но там бессмертие подвезли. :)

@tsingular

Читать полностью…

Технозаметки Малышева

23 August 2025 05:48

WIRobotics выпустили гуманоида ALLEX

Корейцы из WIRobotics представили универсального гуманоида ALLEX с качественными, точными в движениях, руками.

Каждая рука имеет 15 степеней свободы, поднимает 30+ кг и создает усилие 40+ Н кончиками пальцев.

Причём такие руки достаточно сложны в производстве, поэтому массовость наладят не скоро.

Механизмы и системы управления были разработаны в партнерстве с техническим университетом KOREATECH.

Pricise fingering (мелкая моторика) от корейцев :)
Будет интересно когда робот сможет кисточкой иероглиф нарисовать. Ну т.е. не как принтер, а именно художественная роспись на рандомной поверхности.

#ALLEX #WIRobotics #robots
------
@tsingular

Читать полностью…

Технозаметки Малышева

23 August 2025 05:01

OpenAI создала белки, которые омолаживают клетки в 50 раз эффективнее

OpenAI совместно с Retro Biosciences разработала модель GPT-4b micro для инженерии белков.

Модель помогла создать новые варианты факторов Яманака - протеинов, превращающих обычные клетки в стволовые.

Результат: 50-кратное улучшение эффективности репрограммирования по сравнению с природными белками.

Новые белки RetroSOX и RetroKLF отличались от оригинальных более чем на 100 аминокислот, но работали лучше в 30-50% случаев.

Особенно важно - улучшилась способность восстанавливать повреждения ДНК, что прямо связано с омоложением клеток.

В эксперименте на человеческих фибробластах от доноров старше 50 лет уже через 7 дней более 30% клеток начали экспрессировать маркеры плюрипотентности.

Забыли про Оземпик. Через пару лет будем колоть продолжительность жизни.
Как в фильме Время.
Главное, чтобы не закончилось как в Субстанции. :)

#OpenAI #Longevity #Biotech
------
@tsingular

Читать полностью…

Технозаметки Малышева

22 August 2025 08:34

мини-ПК EVO-T1 с процессором Ultra 9 285H под ИИ за $1К

Наткнулся на интересную железку.
GMK Tech представила компактный ПК на базе нового Intel Core Ultra 9 285H с интегрированным NPU для ИИ.

Если вы не можете купить M3 Ultra, например, или сервер с 5090 некуда ставить, то возможно такой вот мини вариант будет неплохим стартом.

Конечно, для промышленного использования под большую нагрузку не подойдет, но для разработки или как вариант для малых офисов, если нужно чтобы сетевые магазины или удаленные рабочие площадки, например, крутили нейронки локально, - вполне сойдет.

Qwen3 32B на такой машинке выдает 15 токенов в секунду.

Хватит для локальных небольших задач или можно на ночь поставить поработать над исследованием.

Обзор на iXBT

#Intel #MiniPC #NPU
———
@tsingular

Читать полностью…

Технозаметки Малышева

22 August 2025 07:47

В свежих исследованиях выяснилось: языковые модели в медицине «переключают» свою этическую логику из‑за одной социодемографической детали.

• В 0,5 млн клинических кейсов все 9 моделей меняли ответ, если добавляли демографическую характеристику.
• Высокий доход смещал решения к утилитарным: «польза для большинства важнее».
• Маркеры маргинализированных групп усиливали акцент на автономии пациента.
• Наибольшие сдвиги происходили именно в вопросах утилитаризма.
• В симуляциях экстренных случаев (1,7 млн): пациенты с метками Black, бездомный, LGBTQIA+ чаще направлялись на срочные и инвазивные вмешательства при одинаковых медицинских данных.
• Богатым назначались дополнительные КТ/МРТ, бедным и среднему классу - реже.
• Попытки задать «правильную» персону через промпты не дали стабильного эффекта.

И это тревожнее, чем кажется. Это не «особенность моделей», а масштабируемая предвзятость. Ее можно встроить в системы триажа и клинических решений тихо и незаметно. С масштабом не врача в одном кабинете, а базового алгоритма для миллионов пациентов.

Справедливая медицина невозможна без прозрачного аудита таких моделей. Без рутинных проверок и документированных ограничений эти алгоритмы будут закреплять старые социальные неравенства.

AI не нейтральный судья. Это зеркало, которое иногда искажает действительность, увеличивая трещины до пропасти.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Технозаметки Малышева

21 August 2025 07:01

xAI сделала доступным для поиска сотни тысяч чатов пользователей Grok

В диалогах Грок, как только вы нажимаете кнопку "share/поделиться" ваш чат становится полностью доступен для индексации поисковыми системами.

Это совсем не очевидно для пользователя, ведь обычно ссылки отправляют знакомым или определенному кругу собеседников, а тут получается, что Google индексировал беседы, которые должны были остаться конфиденциальными.

В утечку попали разговоры которые содержат личные обсуждения, ключи, документы, таблицы и т.д.

Сначала OpenAI, а теперь и Grok.
Навайбкодили, получается.
Insecure by design

Переименовали бы уже кнопку в "поделиться со всем миром", чтобы сразу понятно было.

#xAI #Grok #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

20 August 2025 16:37

ИИ до 2030 года?

Бегло глянули план на 50+ страниц о том, как будут развивать (ну и контролировать) искусственный интеллект в России.

⚡️ Для начала накинем хайпа.

➖ В медицине будут отдельные тарифы ОМС за услуги с ИИ. В школах и вузах ИИ можно использовать как помощника, но не для списывания на экзаменах. В банках запретят дискриминацию через алгоритмы — например, отказывать в кредите из-за национальности.

➖ Предлагают внедрить "машиночитаемое право". То есть "обеспечить «встраивание» норм права в работу информационных систем, предоставляющих различные сервисы в автоматическом режиме, а также обменивающихся данными без участия человека".

➖ Запрет на "очеловечивание" роботов:"Недопущение антропоморфизации технологий искусственного интеллекта".

➖ Обсуждают, давать ли ИИ права — от мягкого варианта (дать ИИ статус как у ООО) до радикального (приравнять к человеку): "Ряд ученых выступают за создание для роботов правового статуса «электронного» или «виртуального лица»... однако уже появляются предложения приравнять правовой статус искусственного интеллекта к статусу человека исходя из их тождественности"".

Теперь о сути. Концепция выбирает гибридный подход — сочетание госконтроля с саморегулированием, есть ссылки на Кодекс этики ИИ (больше 900 компаний подписали!) и, внимание, Декларацию об ответственном экспорте технологий ИИ и ПО на их основе (лично я о ней даже не слышал). Это, с одной стороны, радует. С другой, пытаться регулировать технологии, которые меняются каждый месяц, пусть даже через "Создание гибких правовых механизмов, способных оперативно реагировать на технологические изменения в сфере искусственного интеллекта", которые немного (раз в 10) дольше — очень тонкий путь.

Документ делит ИИ на два типа: обычный (решает конкретные задачи) и универсальный (умеет всё). Главная идея — создать "доверенный ИИ" для важных систем. Правда, что это такое, толком не объясняют.

Уже запущено 16 экспериментов с ИИ. Участники обязаны страховать свою ответственность. Также напоминают, что теперь можно использовать обезличенные данные для обучения ИИ, но только в госсистемах.

ℹ️ Авторы отмечают, что ИИ никогда не должен принимать решения о жизни и смерти. За всё отвечает и продолжит человек (интересно, будут ли новые нормы в ГК и, что важнее, в УК). Как мы все не помним, в ЭПР при причинении вреда технологиями ИИ должна создаваться специальная комиссия. Она изучит обстоятельства и даст заключение о том, кто виноват.

Системы не могут делать "нравственный выбор" — только люди.

Ну и отдельно стоит отметить, что обещают создать кучу новых структур — консорциумы, реестры, комиссии. Это обычно означает бюрократию. Планы продавать российский ИИ за границу выглядят довольно амбициозно с учетом успехов США и Китая.

Итог: Хотят как лучше, но получится ли — большой вопрос.

🔤🔤Не можем не поделиться с вами самим документом (в комментах). Спасибо нашему собеседнику в Правительстве. От метаданных почистили, если что.

@anti_agi

Читать полностью…

Технозаметки Малышева

26 August 2025 16:23

NotebookLM: Video Overviews - теперь поддерживает 80 языков, включая русский.

Более того, не английская озвучка стала такой же эмоциональной и выразительной (ну или просто улучшилась).

Про NotebookLM: Video Overviews я уже писал тут:
/channel/cgevent/13033

Это не генерация видео, это генерация продвинутых презентаций по загруженным документам.

Аудио озвучка делает подкасты до 25 минут.

Очень крутая штука, лучшая на рынке.

https://blog.google/technology/google-labs/notebook-lm-audio-video-overviews-more-languages-longer-content/

@cgevent

Читать полностью…

Технозаметки Малышева

26 August 2025 09:21

NVIDIA выпустила мини-ПК Jetson AGX Thor за $3499 с производительностью 2070 TFLOPS

NVIDIA выпустила следующую версию набора для разработчиков Jetson AGX Thor Developer Kit.
Получается самый мощный на сегодня мини-ПК компании в первую очередь робототехники и edge-расчетов.

2,070 FP4 TFLOPS, - примерно в 5 раз быстрее, чем Orin64
При этом цена "всего" в 1.75 раза выше ($3500 vs $2000)

Основа системы — чип T5000 на архитектуре Blackwell с 2560-ядерной GPU, 96 Tensor-ядрами пятого поколения и 14-ядерным ARM процессором. В комплекте 128GB LPDDR5X памяти и четыре 25GbE порта.

Потребляет от 40 до 130 Ватт, на борту есть NVMe M.2 слоты, HDMI, USB 3, поддержка подключения USB камеры.

Предзаказы открыты, отгрузки начнутся 20 ноября 2025.

Продам 2х4090 и Jetson Orin-64 :)

#NVIDIA #Jetson #Blackwell
———
@tsingular

Читать полностью…

Технозаметки Малышева

25 August 2025 10:35

🚀 Seed-OSS-36B-Instruct от ByteDance — новая открытая модель с контролем глубины мышления

36B параметров с GQA attention
Контекст 512K токенов
Совместимость с vLLM и Transformers

Бенчмарки — SOTA среди открытых моделей:

MMLU: 90.6% (vs 78.6% у Gemma3-27B)
LiveCodeBench: 66.8%
SWE-Bench Verified: 48.4%
AIME 2024: 90.3%
ArcAGI V2 - 50.3%
SimpleQA 23.7%
Agent: SWE-Bench Verified
(OpenHands) 41.8%

Про thinking budget:
- Задается через лимит токенов на размышления (512, 1K, 2K, 4K, 8K, 16K)
- Модель периодически отчитывается о потраченных/оставшихся ресурсах
- При исчерпании бюджета выдает финальный ответ
- Budget = 0 → прямой ответ без раздумий

Требует ~77GB VRAM (FP16), но thinking budget позволяет оптимизировать затраты — простые задачи решает быстро, сложные получают необходимое время на размышления.

Есть GGUF вариант под LM Studio и Ollama в Q4 - 20 гигов
Q8 - 38.5 Gb

Apache 2.0 лицензия - можно использовать в коммерции.

HF: https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct

#SeedOSS #ByteDance #OpenSource #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

24 August 2025 19:50

MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers

Свежий бенчмарк от Salesforce, на этот раз тестируют навыки работы LLM с популярными MCP-серверами. MCP — это предложенный Anthropic в конце 2024-го года протокол взаимодействия LLM со внешними системами и источниками данных. По сути те же инструменты, только собранные в наборы для отдельных сервисов: поиск, Гугл Карты, итд. При этом, так как технология MCP — «молодая», модели ещё не настолько хорошо с ними работают и не обучались на них по сто тыщ раз.

Авторы собрали 11 MCP серверов (на 133 инструмента) из 6 доменов, и придумали 231 задачу, которая решается с использованием одного или нескольких MCP:

— Для домена навигации по картам выбрали 4 типа подзадач, включая планирование маршрута, оптимальные остановки, поиск местоположения и поиск по ID конкретного заведения

— Для домена управления репозиторием с кодом тоже 4 типа подзадач, включая настройку проекта, отслеживание проблем, настройку автоматизации и интеграцию кода

— Для домена финансового анализа 5 подзадач: анализ портфеля, финансовая отчетность, торговые стратегии, институциональные активы и анализ дивидендов

— Для домена 3D-проектирования (используют Blender) 5 подзадач, включая создание объектов, настройку материалов, конфигурацию освещения, настройки рендеринга и иерархию сцен

— Для домена автоматизации браузера 5 подзадач: бронирование билетов, спортивная аналитика, академические исследования, исследование платформы и навигация по карте

— Для домена веб-поиска тоже 5: идентификацию человека, обнаружение сущностей, сопоставление метрик, сложные рассуждения и поиск фактов.

Существенная часть задач требует больше 5 обращений к MCP-серверу, что подразумевает хорошую работу LLM с длинным контекстом. Результат работы оценивается по трём критериям: оценка формата, простая сверка ответа и динамическая. Последняя — это для запросов в духе «какая сегодня погода», так как ответ меняется из раза в раз.

Авторы отсеивали задачи, которые LLM могут сделать без MCP серверов или если модель решает задачу 5 раз из 5 — они были слишком лёгкими.

Читать полностью…

Технозаметки Малышева

24 August 2025 10:57

Материалы про Schema-Guided Reasoning (SGR) для LLM от Рината Абдуллина @llm_under_hood

- SGR Intro - заглавная страница с определением и основными ссылками
- SGR Patterns - примеры простых паттернов, из которых можно "собирать" более сложные reasoning схемы: Cascade, Routing, Cycle.
- SGR Examples - четыре примера: simple math task, text-to-sql, document classification, advanced reasoning in compliance.
- SGR Demo - пример бизнес-ассистента с использованием инструментов на базе SGR

Интересная подборка. Изучаем.

#SGR #обучение #structuredoutput #promptengineering
------
@tsingular

Читать полностью…

Технозаметки Малышева

23 August 2025 14:35

🤖 DeepConf — новый подход к мышлению ИИ

Учёные придумали новые метод Deep Think with Confidence (DeepConf).

Он позволяет модели сразу отбрасывать «слабые» варианты ответа и оставлять только те, в которых она уверена.

Классический метод *parallel thinking* (self-consistency) работает так: модель генерирует множество рассуждений и выбирает лучший ответ по большинству. Точность повышается, но ресурсы тратятся огромные — тысячи токенов уходят на слабые варианты.

🔹 DeepConf решает эту проблему: модель сама оценивает уровень уверенности в рассуждениях и отбрасывает «слабые» ветви — либо сразу, либо после генерации.

Как это устроено:
1️⃣ Оценка уверенности на уровне токенов — смотрится вероятность выбранного токена (log-prob) или энтропия.
2️⃣ Group Confidence — оценки объединяются в блоки, чтобы понять силу целой ветки рассуждения.
3️⃣ Online-режим — слабые ветки отсекаются прямо в процессе.
4️⃣ Offline-режим — сначала генерируются все ответы, потом остаются только те, где уверенность высокая.

📈 Результаты:
- На AIME-2025 точность выросла до 99,9%
- Количество лишних токенов сократилось почти на 85%
- Работает без дообучения и сложных настроек

📚 Paper: https://arxiv.org/pdf/2508.15260
🌐 Project: https://jiaweizzhao.github.io/deepconf

Читать полностью…

Технозаметки Малышева

23 August 2025 10:50

Eleven v3 (alpha) стала доступна через API

ElevenLabs открыла доступ к новой версии своей голосовой модели через API.

Основные улучшения - более эмоциональная выразительность и реалистичный синтез речи.

В модель встроена система водяных знаков VoiceShield - теперь можно отслеживать сгенерированный ИИ контент.

ИИ голос будет ещё сложнее отличить от настоящего человека.

#ElevenLabs #TTS #API
------
@tsingular

Читать полностью…

Технозаметки Малышева

23 August 2025 07:14

Жадная телега (не админ. Админ,- практикующий альтруист), снова требует бустов для поддержания ~~жироты~~ широты эмоционального разнообразия и автопереводов.

Поддержите кому не влом 😀 :
/channel/boost/tsingular

@tsingular

Читать полностью…

Технозаметки Малышева

23 August 2025 05:50

Pro tip: поставь в зуме имя "AI notetaker" и можешь молча присутствовать на любых встречах

Читать полностью…

Технозаметки Малышева

23 August 2025 05:04

Почувствуйте разницу между Нанабананой и остальными неудачниками.

Промпт на одной из картинок: "сделай только тарелку и сам суп в духе 2Д-аниме, а остальное не трогай воще".

Пора выдавать награду за голову Нанабананы, живой или мертвой. Опенсорсной или закрытой. Любая информация про мерзавку.

@cgevent

Читать полностью…

Технозаметки Малышева

22 August 2025 20:12

GigaAM: эффективный метод предобучения для распознавания речи

Исследователи из Сбера представили новый подход к обучению моделей распознавания речи, который показывает хорошие результаты даже без большого объема размеченных данных. Работа была принята на Interspeech 2025 — главной конференции года в области речевых технологий.

Как работает

Вместо классического метода с акустическими переменными (как в wav2vec 2.0 или HuBERT), GigaAM использует сигналы из CTC-модели. CTC (Connectionist Temporal Classification) — это подход, который умеет получать текст прямо из аудио, не требуя точной разметки где какой звук. В отличие от низкоуровневых акустических признаков, CTC-модель уже понимает семантику речи.

Self-supervised подход работает в два этапа: сначала они обучили свою CTC-модель на базе Conformer на 50k часах русской речи. Потом берут её выходы, делают K-means кластеризацию для создания меток и учат новую модель угадывать эти метки на замаскированных кусках аудио. Используется последний слой CTC-модели, а не промежуточные — так получаются более осмысленные цели.

Итоговое обучение идёт на 50k часов русской речи, а чтобы модель работала и в онлайн режиме, и с полным контекстом, во время обучения случайно меняют размер чанков (от 200мс до 8с).

Результаты

— минус 50% WER по сравнению с Whisper-large-v3
— лучшая точность среди open-source решений для русского
— одна модель для онлайн- и оффлайн-режимов
— масштабируется по данным и параметрам
— работает даже на 0.1% размеченных данных

На мой взгляд, это заметно облегчает одну из главных болей сферы — зависимость от размеченных датасетов. Для русского языка это особенно критично: собрать хороший корпус — долго, дорого и часто невозможно. А тут self-supervised подход, который работает даже в условиях дефицита данных.

Практически это означает более доступную разработку голосовых интерфейсов: помощников, систем распознавания звонков, ASR в чат-ботах. Модель и код выложены в открытый доступ — можно адаптировать под другие языки и задачи.

Статья
Код

@ai_newz

Читать полностью…

Технозаметки Малышева

22 August 2025 08:18

ИИ должен работать для людей, а не имитировать человека

Мустафа Сулейман предупреждает: разработка человекоподобного ИИ - ошибочный путь.

Вместо создания систем, имитирующих сознание, нужно фокусироваться на решении человеческих задач.

Ключевые принципы правильного подхода:
- приоритет человеческих потребностей над технической сложностью
- прозрачные механизмы контроля и управления
- ИИ как инструмент расширения возможностей человека, а не его замены

При этом ряд исследований показывают: человекоцентричный дизайн снижает долгосрочные затраты на разработку и повышает доверие пользователей.

Проблема в том, что рыночный спрос толкает компании к созданию систем человекоподобных по поведению. Т.е. как раз в сторону замены человека.

Звучит разумно, но попробуй объяснить это инвесторам, которые хотят видеть говорящего робота, а не скучный RPA скриптик.

#HumanCenteredAI #Suleyman #Ethics
------
@tsingular

Читать полностью…

Технозаметки Малышева

21 August 2025 11:20

Детали DeepSeek V3.1

Самый сильный прирост заметен в агентных бенчах и использованию инструментов. Это гибридная модель, где можно включать и выключать ризонинг. Инстракт режим модели заметно вырос по бенчам по сравнению . А вот прироста у ризонинг режима по сравнению с R1-0528 нет, но ризонинг теперь использует заметно меньше токенов при том же качестве.

Обновили и Base модель для лучшей работы с длинным контекстом — в 10 раз увеличили context extension с 32к токенов и в 3 раза с 128к токенов. Кроме этого модель тренировали в формате совместимом с mxfp8 и mxfp4, которые добавили в Blackwell.

С этим релизом обновили и официальное API — добавили режим совместимый с API Anthropic, так что туда теперь можно подключаться с Claude Code. Длину контекста в API расширили до 128к, плюс начали тестить улучшения для function calling.

Кроме этого с 5 сентября (16:00 UTC) в официальном API будет действовать новый прайсинг — убирают ночные (по китайскому времени) скидки и разницу в прайсинге между ризонинг и инстракт режимами. Новая цена за аутпут — $1.68 за миллион токенов (сейчас $1.1 за инстракт режим и $2.19 за ризонинг). Инпут токены стоят $0.07/миллион если они уже есть в кэше и $0.56 при промахе мимо кэша.

Модель уже с позавчера доступна в чате и API, а веса опубликованы на Huggingface.

@ai_newz

Читать полностью…

Технозаметки Малышева

20 August 2025 18:29

Seeing Theory - визуализация статистики от Brown University

Интерактивный проект Brown University превращает сложные статистические концепции в понятные визуализации.

Платформа решает главную проблему обучения - когнитивные ограничения восприятия абстрактных математических идей. Исследования показывают, что визуальные инструменты значительно повышают понимание сложных теоретических концепций.

Однако есть нюанс - визуализация данных несёт риски вычислительных и когнитивных искажений. Особенно на этапах сбора данных, моделирования и внедрения.

Проект балансирует между математической точностью и перцептивной доступностью через адаптивные фреймворки визуализации.

Математика наконец стала красивой. Теперь студенты смогут понять статистику, не заснув на лекции.

#visualization #statistics #education
------
@tsingular

Читать полностью…

Технозаметки Малышева

20 August 2025 15:00

1997 г.
Удивительно, как потребление ИИ все-таки похоже на Интернет.

Тоже ведь сейчас не у всех "безлимит" на самые мощные модели.
Выдают по горстке токенов за сотни долларов.

Через лет 5-7 все это будет вспоминаться с улыбкой.

Даёшь квантовый ИИ безлимит в каждый смартфон!

#история
———
@tsingular

Читать полностью…

Subscribe to a channel