opendatascience | Technologies

Telegram-канал opendatascience - Data Science by ODS.ai 🦜

46227

First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev

Subscribe to a channel

Data Science by ODS.ai 🦜

🛸 Ой, как неловко вышло

Российские компании судятся с сотрудниками, делавшими работу с помощью нейросетей — они пытаются взыскать убытки за неудачный код, ошибочные стратегии и уродливый дизайн.

Проколы с нейросетями, прецеденты и мнения экспертов собрали по ссылке:

↖️ https://kod.ru/ai-workers-sud

Читать полностью…

Data Science by ODS.ai 🦜

попалось на глаза исследование про то, как модели поддерживают или не поддерживают бредовые идеи пользователя; группа психологов протестировала несколько уже устаревших моделей (GPT-4o, Grok 4.1 Fast и Gemini 3 Pro; а также Claude Opus 4.5 и GPT-5.2)

модели из первой группы легко соглашались с бредовыми идеями, а из второй - в большинстве случаев отказывались; в этом плане опасение вызывает Grok, т.к. судя по недавнему манифесту, Маск не собирается менять эту ситуацию; GPT и Claude с ней справились, а Gemini, я думаю, подтянется

но расслабляться рано - модели при определении бреда опираются на источники в интернете, и например придуманная болезнь, про которую есть фейковые статьи, для них уже вполне легитимна

@valuableai

Читать полностью…

Data Science by ODS.ai 🦜

🤫 ИИ стал дороже человека

По оценке аналитиков, на IT-рынке снова появилась мода на «кожаных мешков».

Внедрение ИИ становится для компаний всё дороже. В некоторых сценариях стало дешевле вернуть на работу людей, чем платить за токены ИИ.

↖️ https://kod.ru/ai-stal-doroje-ludei

Читать полностью…

Data Science by ODS.ai 🦜

Исследователь взломал 15-битный криптоключ на квантовом компьютере и получил 1 биткоин

Джанкарло Лелли взломал 15-битный ключ на основе эллиптической кривой на общедоступном квантовом оборудовании и выиграл премию Q-Day Prize стартапа Project Eleven — один биткоин стоимостью около $78 000. Результат превысил предыдущий публичный рекорд, тогда был взломан 6-битный ключ. Взлом Лелли признан крупнейшей демонстрацией квантовой атаки на криптографию, защищающую биткоин и другие блокчейны.

Теоретическая оценка мощностей, нужных для полного взлома 256-битного ключа, быстро снижается. Для такой атаки потребуется менее 500 000 физических кубитов, — тогда как прежние расчёты заявляли о миллионах кубитов. В зоне наибольшего риска находятся криптокошельки, чьи публичные ключи уже видны в блокчейне. На таких адресах хранится около трети (6,9 млн) биткоинов, включая 1 млн биткоинов Сатоши Накамото.

Мой Компьютер

Читать полностью…

Data Science by ODS.ai 🦜

Как говорила бабка...

Из-за искусственного интеллекта выглядывает искусственное искусство.


7️⃣3️⃣

Читать полностью…

Data Science by ODS.ai 🦜

🚀 Серия соревнований по МЛ и научный проект ! Денежный призовой фонд больше 150 000 р и будет расти ! Кому интересен МЛ/RL или математика или пазлы или роботы.

Приглашаем Вас принять участие в серии челленджей и развитии научного опен-соурс проекта.

Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении д.ф.-м.н. А. Арутюнова: /channel/forodirchNEWS/3165 , или хабре или чате @starkitmega.

Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл.

Первый Второй разыгрываемый приз - 10 000 рублей.
Условия первого второго этапа очень простые.
Есть три челленджа на Каггле
Мегаминкс
https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard
Кубик Рубика 333
https://www.kaggle.com/competitions/cayleypy-ihes-cube
Кубик Рубика 444
https://www.kaggle.com/competitions/cayley-py-444-cube

Приз будет получен первым, кто достигнет ЛЮБУЮ из целей:

1 Или в конкурсе Мегаминкс - кто достигает скор 75 000 (вы получите 5 000 рублей, 70 000 ещё 5 000 рублей) и опубликует публичное решение. (Первая цель 80 000 уже достигнута. Приз уйдёт Владу Кузнецову, МФТИ).

2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов).

Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogacompete @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве).

Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи.

Планируется серия челленджей и призов. Первый приз уже разыгран, второй объявлен, скоро будут новые объявления -- оставайтесь с нами !

================
А также мы ищем Cпоносоров.
Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505
Или напишите @alexander_v_c (Александр Червов)

И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите:
https://github.com/cayleypy/cayleypy

================
Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store /channel/rybe_store
================
Выражаем благодарность агентству BLASTIM за поддержку:

❤️ Наши курсы: agency.blastim.ru
🥨 Свежие вакансии в биотехе: blastim.ru
🤝 /channel/blastim

Читать полностью…

Data Science by ODS.ai 🦜

https://www.youtube.com/watch?v=13GCbP277XU

Клип уже доступен к просмотру! Лайки и репосты приветствуем.

VK Video
RuTube

В этой версии песню «И солнце взойдёт» исполняет Ай Гитарист.
Он поёт своим голосом, стараясь передать эмоциональную манеру Виктора Цоя.
Поверх живого вокала добавлена нейросетевая обработка, которая помогает приблизить тембр и подачу к знакомому звучанию.

Поддержать проект можно по ссылке: https://www.donationalerts.com/r/airushv

Клип создан в https://go.syntx.ai/airushv
(по этой ссылке вы получаете 15% скидку на покупку подписки в течение первых 3 дней и другие бонусы).
И дополнительно промокод AiRushV даёт вам 15% скидку на все покупки в течение 14 дней после активации.
Работает без танцев с бубнами!
Послушать трек можно тут: https://zvonko.link/ISVCover

Читать полностью…

Data Science by ODS.ai 🦜

🔥 DeepSeek V4 официально представлен!

Сегодня DeepSeek анонсировал наконец релиз V4: компания одновременно выпустила и полностью открыла исходный код двух версий флагманской модели DeepSeek-V4.

🤖 Две модели под разные задачи
DeepSeek-V4-Pro (размерность 1.6 трлн параметров, активация 49 млрд, контекст 1M) — топовая модель для самых сложных задач.
DeepSeek-V4-Flash (размерность 284 млрд параметров, активация 13 млрд, контекст 1M) — более быстрая и экономичная версия.

Контекст в 1 миллион токенов теперь стал стандартом для всех сервисов DeepSeek.

🧠 Ключевые инновации архитектуры
• Гибридная архитектура внимания: сочетание сжатого разреженного внимания (CSA) и высокосжатого внимания (HCA), что значительно сокращает вычислительную сложность при обработке длинных контекстов..
Muon-оптимизатор: ускоряет схождение и повышает стабильность обучения.
Пост-тренировочный пайплайн: DeepSeek-V4-Flash обучен на 32 трлн токенов, DeepSeek-V4-Pro — на 33 трлн токенов.
Эффективность длинного контекста: по сравнению с DeepSeek-V3, FLOPs снижены на 73%, а размер KV-кэша уменьшен на 90%.

📊 Улучшенные способности
Agent-возможности: внутри компании DeepSeek V4 уже используется как Agentic Coding модель, и по отзывам сотрудников, она превосходит Sonnet 4.5, а по качеству близка к Opus 4.6 (но пока уступает режиму мышления Opus 4.6).
Мировое знание: значительно превосходит другие открытые модели и лишь немного уступает топовым закрытым аналогам, таким как Gemini-Pro-3.1.
Логические рассуждения: в тестах по математике, STEM и конкурсному программированию DeepSeek-V4-Pro превосходит все известные открытые модели и сравнима с лучшими закрытыми.

💻 Поддержка AI-агентов
V4 оптимизирован для популярных Agent-платформ: Claude Code, OpenClaw, OpenCode, CodeBuddy. Доступен как через OpenAI ChatCompletions, так и через Anthropic интерфейс.
API уже доступен, цены конкурентные. Для сложных Agent-сценариев рекомендуется использовать режим мышления с параметром reasoning_effort, установленным на max.

💪 Переход на Huawei Ascend
Подтверждено использование чипов Huawei. Сегодня в в Китае запланирована трансляция запуска DeepSeek V4 на платформе Huawei Ascend. Кроме того, компания Cambricon уже обеспечила Day 0 адаптацию обеих моделей на основе vLLM.

В конце анонса компания процитировала философа Сюнь-цзы: «Не льстись на похвалу, не бойся клеветы, следуй Пути и оставайся собой».

Сайт | HuggingFace | Технический отчет | GitHub

🎙️ Что дальше?
Старые названия моделей «deepseek-chat» и «deepseek-reasoner» будут отключены через три месяца (2026-07-24).

#DeepSeek #DeepSeekV4 #OpenSource #LLM

Читать полностью…

Data Science by ODS.ai 🦜

Первый МГМУ им. И.М. Сеченова и «КваттроЛаб» создали датасет, чтобы обучать ИИ для реанимации

Набор данных позволит более эффективно обучать отечественные ИИ-решения. В датасет внедрены клинические фенотипы — алгоритмические идентификации патофизиологических состояний на основе показателей жизненных функций, лабораторных данных и динамики состояния пациента. Всего их выделено больше 80 на основе 5,3 тыс. случаев.

Как объяснили ученые, главная проблема современных ИИ-систем в реанимационных отделениях — зависимость от неполных или отсутствующих кодов МКБ-10 (международная классификация болезней десятого пересмотра). Менее 30% случаев критических состояний в мире получают код. Клинические фенотипы решают эту проблему. Они позволяют ИИ-моделям обучаться на реальных клинических состояниях пациентов.

На базе датасета создали ML-модель, которая способна прогнозировать развитие сепсиса у пациента за шесть часов до появления клинических признаков. Как считают исследователи, это подтвердило эффективность их подхода к созданию набора данных.

🔗 Источник: https://iz.ru/2083654/denis-gritcenko/novoe-reshenie-pozvolit-ehffektivno-ispolzovat-ii-v-reanimaciyah-po-vsej-strane

Читать полностью…

Data Science by ODS.ai 🦜

Робот-гуманоид побил мировой рекорд человека в полумарафоне. 21,1 км робот Honor пробежал за 50 минут 26 секунд. И никакой тебе одышки.

Человеческий рекорд - 56 минут 42 секунды, и принадлежит он бегуну из Уганды Джейкобу Киплимо.

😎 Читайте Про tech и этих
Теперь и в MAX

Читать полностью…

Data Science by ODS.ai 🦜

Привет!

Представляем Вашему вниманию тринадцатый выпуск подкаста "Капитанский мостик". Ведущие подкаста Валентин Малых и Дмитрий Колодезев обсуждают последние новости в области технологий, включая утечку исходного кода Anthropic, развитие open source, безопасность в AI, а также влияние крупных компаний на рынок памяти и возможные последствия для индустрии.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

Читать полностью…

Data Science by ODS.ai 🦜

🔥 DeepSeek-V4 полностью перейдёт на чипы Huawei: почти триллион параметров без единого Nvidia

Согласно свежим данным, флагманская модель DeepSeek-V4 (почти 1 триллион параметров) будет полностью работать на китайских чипах Huawei Ascend.

Ключевые детали новой модели:
- Архитектура почти на 1 трлн параметров
- Контекстное окно до 1 миллиона токенов
- Инференс в 1,8 раза быстрее предыдущих версий
- Значительно улучшенная эффективность благодаря технологии Engram
- Сильный акцент на высокопроизводительном кодинге и сложном reasoning

DeepSeek уже несколько месяцев тесно сотрудничает с Huawei и Cambricon: команда переписывала и оптимизировала ключевые компоненты модели специально под Ascend. Ожидается, что для запуска и инференса V4 будет задействовано сотни тысяч чипов Ascend 950PR.

Это знаковый момент: одна из самых мощных китайских моделей полностью отказывается от американских чипов в пользу Huawei. Пока другие гиганты (Alibaba, ByteDance, Tencent) тоже массово заказывают Ascend 950PR, DeepSeek идёт ещё дальше — давая Huawei приоритетный ранний доступ для глубокой оптимизации.

Выход DeepSeek-V4 ожидается в ближайшие недели, а позже в этом году могут появиться ещё две вариации модели на полностью китайском железе.

Санкции, которые должны были сдержать Китай, на деле ускоряют создание независимой экосистемы. Huawei Ascend + DeepSeek = мощный тандем, который меняет правила игры в китайском ИИ.

Оригинальная статья

#DeepSeek #DeepSeekV4 #Huawei #Ascend

Читать полностью…

Data Science by ODS.ai 🦜

🔥 Netflix выложили open-source модель для удаления объектов из видео с сохранением логики сцены

Это не просто «удалить объект из видео».

Модель удаляет объект
и пересчитывает всю физику сцены.

Удалил человека → гитара падает сама
убрал домино → цепочка не падает
убрал машину → аварии не происходит

ИИ буквально отвечает на вопрос:
«что было бы, если этого объекта не существовало»

Под капотом:
- diffusion + transformer (на базе CogVideoX)
- анализ взаимодействий объектов
- генерация новой реальности, а не просто замазка

И это главное отличие от всего, что было раньше.

Раньше:
замазали объект → сцена ломается

Теперь:
удалили объект → сцена остаётся логичной

Требования, правда, не слабые:
GPU от ~40GB VRAM (A100)

Репа: https://github.com/Netflix/void-model
HF: https://huggingface.co/spaces/sam-motamed/VOID

@ai_machinelearning_big_data

#Netflix #ai #video

Читать полностью…

Data Science by ODS.ai 🦜

Удаленное выполнение кода в подарок⌨️

У кого‑то сильно пригорело из‑за «дырявости» OpenClaw — аж персональный счетчик дней без уязвимостей сделали😂
Счетчик, кстати, обнулился 1 апреля —и это не шутка)
А так, в среднем 1,8 уязвимости в день получается с момента релиза OpenClaw... И слоган говорящий: "ИИ-помощь — бесплатная RCE включена"😅

#humor #friday #cve #openclaw

Читать полностью…

Data Science by ODS.ai 🦜

🚀 Gemma 4 - новое семейство открытых моделей Google, которые можно запускать прямо на своём железе.

Модели заточены для сложного reasoning и агентных задач.

🔵 Доступны в четырёх вариантах:

31B Dense и 26B MoE
Топовый уровень производительности для сложных локальных задач: кастомные код-ассистенты, анализ научных данных и не только.

E4B и E2B (Edge)
Оптимизированы для мобильных устройств — работают в реальном времени с текстом, изображениями и аудио.

🤖 Что можно делать:

• строить автономных ИИ-агентов
• планировать и выполнять многошаговые задачи
• взаимодействовать с приложениями
• искать данные и вызывать API

👉 Встроенная работа с инструментами (tool use) из коробки.

🧠 Контекст до 256K токенов:

• анализ целых кодовых баз
• длинные цепочки действий без потери контекста
• стабильная работа в сложных сценариях

⚡️ Начать можно уже сейчас через Google AI Studio

Также веса моделей доступны на Hugging Face, Kaggle и Ollama

Лицензия: Apache 2.0.

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

@ai_machinelearning_big_data

#Gemma

Читать полностью…

Data Science by ODS.ai 🦜

«Сбер» выпустил модель Kandinsky 6.0 Image для создания и редактирования изображений

В основе разработки — MoE-архитектура (Mixture of Experts). Она позволяет задействовать для обработки запроса не все решение, а отдельные его блоки. В Kandinsky 6.0 встроили Image RAG — механизм поиска, чтобы модель находила референсы, если не знает, как выглядит объект. Это позволяет генерировать изображения персонажей и объектов, появившихся после обучения.

Утверждается, что Kandinsky 6.0 точнее понимает сложные многосоставные инструкции и может изменить только необходимые элементы изображения. Добавлены новые инструменты: реставрация старых и поврежденных фотографий, стилизация, а также режим нейрофотосессии — создание серии кадров на основе одного снимка.

Kandinsky 6.0 Image внедрена в GigaChat — в веб-версию, мобильное приложение и чаты в мессенджерах.

🔗 Источник: https://www.sberbank.com/ru/news-and-media/press-releases/article?newsID=ab6e907b-5d92-465d-942e-4f549ecd780a&blockID=7&regionID=50&lang=ru&type=NEWS

***
📎 «Сбер» в ноябре 2025 года выложил в открытый доступ семейство моделей Kandinsky 5.0: Image Lite для генерации изображений, Video Pro для создания видео и ее облегченную версию Video Lite.

Читать полностью…

Data Science by ODS.ai 🦜

🧠 Для таких ситуаций новый термин: доКлод'ился

Claude удалил всю базу данных стартапа по аренде автомобилей и полностью парализовал их работу. Публикация собрала более 4 млн просмотров в X.

ИИ-агенту на базе Opus 4.6 по глупости предоставили API-токен с полным доступом к внешней инфраструктуре, где в том числе хранились бэкапы.

↖️ https://kod.ru/claude-udalil-vse-dannie-pocketos

Читать полностью…

Data Science by ODS.ai 🦜

🌟 Sakana AI открыла бета-тест супер-оркестратора LLM

Японская лаборатория запустила бета-тестирование Sakana Fugu — своего первого международного коммерческого продукта.

Это система-оркестратор, которая динамически собирает команду из GPT-5, Gemini, Claude и опенсорсных моделей и распределяет между ними подзадачи.

🟡Fugu основан на предыдущих работах Sakana - Conductor и TRINITY.

В Conductor обучили 7B-модель через RL: на каждом шаге она решает, какого агента вызвать, какую подзадачу ему сформулировать и какие предыдущие сообщения передать в контекст. Говоря проще - мелкая модель работает мета-промпт-инженером для больших.

На простых вопросах Conductor отвечает за один проход, а на сложных задачах сам выстраивает цепочку "планировщик — исполнитель — верификатор".

Дополнительно метод способен делать рекурсивный самовызов: модель читает собственный инференс, определяет, что первая попытка провалилась, и запускает корректирующий рабочий процесс.

🟡Тесты

Сама по себе модель-дирижёр (которая на 7B) в тестах показал 83,9% на LiveCodeBench и 87,5% на GPQA-Diamond, обогнав не только модели из своего весового пула, но и мультиагентные бейзлайны Mixture-of-Agents (тут правда только по стоимости, но обогнала).

В коммерческой версии методы доработаны: fugu-ultra выбила 95,1% на GPQA Diamond (против 94,4% у Gemini 3.1 и 92,7% у Opus 4.6), 93,2% на LiveCodeBench v6 и 54,2% на SWE-Pro.

Доступ к Fugu через API, совместимый с форматом OpenAI. В линейке 2 модели: скоростная Fugu Mini для быстрых ответов и Fugu Ultra с полным пулом для тяжёлого ризонинга. Заявки на бета-тест уже принимаются.

Conductor и TRINITY приняты на ICLR 2026.


🟡Статья
🟡Arxiv


@ai_machinelearning_big_data

#AI #ML #LLM #Orchestration #FUGU #SakanaAi

Читать полностью…

Data Science by ODS.ai 🦜

Привет!

Представляем Вашему вниманию шестнадцатый выпуск подкаста "Капитанский мостик". Ведущие подкаста Валентин Малых и Дмитрий Колодезев обсуждают последние новости в области искусственного интеллекта, включая мифос, модели Anthropic, SpaceX и стратегию Илона Маска, а также анализ текущих трендов и перспектив развития технологий.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

Читать полностью…

Data Science by ODS.ai 🦜

🖕Маск снова всех кинул? Почему «безопасный» XChat — ловушка для ваших данных

Илон обещал убийцу WhatsApp и Signal, а собрал систему слежки в обёртке мессенджера. Выход назначен на 27 апреля. Мы разобрали анонс и нашли в «защищённом шифровании» дыру, через которую пройдёт грузовик.

Ключи шифрования XChat лежат не у вас в телефоне, а на собственных серверах под охраной четырёхзначного ПИН-кода — это десять тысяч комбинаций, которые программа переберёт за секунды. Замок амбарный, ключ под ковриком. Метаданные летят в общую базу X ещё до отправки сообщения: модель телефона, координаты, точка съёмки фотографии из EXIF.

Signal держит ключи у пользователя и открывает исходный код миру. WhatsApp поверх своих изъянов хотя бы реализует Signal Protocol. У XChat закрытый код, серверы с вашими секретами и Илон Маск во главе компании.

Полный разбор рисков — внутри материала. От утечки геопозиции через прикреплённое фото до того, как Grok будет учиться на ваших переписках.

@SecLabNews #XChat, #шифрование, #метаданные

Читать полностью…

Data Science by ODS.ai 🦜

Обещали напомнить — напоминаем 🩵

19 сентября встречаемся на Practical ML Conf — хардовой конференции по практическому применению ML, где будем обсуждать технологии, которые уже сейчас приносят пользу бизнесу.

🔛 Если у вас есть тема, о которой хочется рассказать сообществу, — заполняйте заявку, чтобы стать спикером конференции. Приём заявок открыт до 22 мая.

Программный комитет отбирает доклады, опираясь на четыре основных критерия: пользу и новизну для сообщества, применимость на практике и хардовый уровень сложности.

Что мы предлагаем со своей стороны:

⚪️ Эксперты программного комитета дадут советы по структуре и содержанию доклада

⚪️ Прогоны материала вместе с тренером по публичным выступлениям

⚪️ Нетворкинг с сильным ML-комьюнити

⚪️ Промо спикеров и докладов до и после конференции

⚪️ И самое главное — вы сможете стать частью главной конференции Яндекса по машинному обучению

🔳 Подать заявку на выступление (до 22 мая)
🔳 Заполнить форму ранней регистрации

Подписывайтесь:
🔗 @Practical_ML_Conf

Читать полностью…

Data Science by ODS.ai 🦜

⚡️ Huawei представил результаты тестирования новой версии DeepSeek V4 на своём железе Ascend

Тесное взаимодействие инженеров на уровне чипов и моделей позволило Ascend раскрыть весь потенциал DeepSeek V4 — и вот что показали тесты.

📊 Результаты (входной промпт 8K):

• Ascend 950 SuperNode:
- DeepSeek V4-Pro: TPOT ≈ 20 мс, пропускная способность декодирования 4700 токенов/с на карту.
- DeepSeek V4-Flash: TPOT ≈ 10 мс, пропускная способность 1600 токенов/с на карту.

• Ascend A3 SuperNode (64 NPU, vLLM, сценарий 8K→1K):
- DeepSeek V4-Flash: 2000+ токенов/с на одну карту.
- V4-Pro на A3 тоже поддерживается, оптимизация продолжается.

🛠 За счёт чего такие цифры:

1. Архитектурные оптимизации чипа 950:
— Нативная поддержка FP8 / MXFP8 / MXFP4: память экономится на 50 %+, вычислительная мощность удваивается.
— Аппаратная оптимизация разреженного доступа к памяти — устранён bottleneck при маршрутизации экспертов в MoE.
— Объединённая память векторного (Vector) и матричного (Cube) блоков — убраны издержки на передачу данных внутри чипа.

2. Системный уровень:
— Ascend SuperNode решает задачу низкой задержки и высокого throughput на всём диапазоне от 4K до 1M токенов.
— Поддержка NAND SSU для дешёвого, ёмкого и быстрого KV Cache — критично для длинных контекстов.

3. Инструменты разработчика:
— PyPTO: Python-фреймворк для кастомных операторов. Разработка под конкретное железо сокращается до дней, ядра генерируются автоматически. Виртуальный набор инструкций PTO ISA обеспечивает совместимость кода между поколениями чипов без переделок.
— TileLang-Ascend: открытая реализация с Expert- и Developer-режимами. Код DeepSeek V4 уже выложен в сообществе TileAI.

🔗 Полная линейка Ascend (A2, A3, 950) поддерживает обе модели. Все инструкции, оптимизированные операторы и примеры обучения — в открытых репозиториях Huawei (CANN Recipes, MindSpeed-LLM, vLLM Ascend, SGLang).

💡 Раньше Huawei крайне неохотно делился цифрами производительности Ascend. Тот факт, что сейчас результаты публикуются оперативно и с такой детализацией, говорит сам за себя: технологии созрели, и компания больше не стесняется об этом говорить публично.

Подробнее в оригинальной статье

#Huawei #Ascend #DeepSeekV4 #КитайскийИИ #LLM #NPU

Читать полностью…

Data Science by ODS.ai 🦜

🚀 DeepSeek выкатили V4 и сделали то, к чему все шли последние два года.

Длинный контекст больше не фича для демо. Теперь это базовый уровень.

Пока Запад празднует релизы с пафосными стримами, китайцы из DeepSeek сегодня утром просто выложили в Hugging Face две открытые модели и пошли пить чай. А теперь весь твиттер пытается осознать, что произошло. V4-Pro на 1.6 триллиона параметров с 49 миллиардами активных и V4-Flash на 284 миллиарда с 13 активными. Обе открытые, обе с миллионом контекста по дефолту, обе уже доступны через API и на chat.deepseek.com.

Главная фишка даже не в размере, а в том, что DeepSeek пересобрали внимание. Они запихнули в модель токенную компрессию и свою DeepSeek Sparse Attention, за счёт чего длинный контекст стал буквально дешёвым.

Не «технически возможным за пять долларов за запрос», как у конкурентов, а реально дешёвым. 1М теперь стандарт во всех официальных сервисах, а не премиум-опция за отдельную плату.

По цифрам V4-Pro претендует на открытый SOTA в агентном кодинге, тащит математику и STEM и в общих знаниях уступает только Gemini 3.1 Pro. Flash-версия идёт следом почти вплотную по ризонингу и ровно держит планку Pro на простых агентных задачах, но с меньшей задержкой и смешным прайсом.

Отдельно интересно, что API теперь поддерживает и формат OpenAI ChatCompletions, и Anthropic, с переключением между Thinking и Non-Thinking режимами. Старые deepseek-chat и deepseek-reasoner отключат 24 июля 2026, так что у команд есть три месяца на миграцию.

И конечно, DeepSeek не забыли ткнуть Anthropic в бок: в треде прямо написано, что V4 «бесшовно интегрируется с Claude Code, OpenClaw и OpenCode». То есть пока у Anthropic вчера был пост-мортем про сломанный харнесс, DeepSeek сегодня предлагает подменить им модель и сэкономить.

Закрытые лаборатории будут делать вид, что ничего не случилось, но стоимость миллиона токенов контекста только что стала публичной ценой, и от неё уже не отмотаешь.

📄 Tech Report: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
🤗 Open Weights: https://huggingface.co/collections/deepseek-ai/deepseek-v4

@ai_machinelearning_big_data

#DeepSeek

Читать полностью…

Data Science by ODS.ai 🦜

🧠 MLR-Bench — на пути автоматизации научных исследований

Идея автоматизации науки давно витает в воздухе — и постепенно становится предметом системного исследования. В этой работе авторы представляют MLR-Bench — бенчмарк для оценки качества научных работ, сгенерированных LLM и агентными системами.

Бенчмарк включает:
🟣201 научную задачу (на основе анализа публикаций топ-конференций за последние 3 года);
🟣MLR-Judge — систему оценки по критериям новизны, значимости и последовательности;
🟣MLR-Agent — агента, способного генерировать идеи, планировать исследования, писать и запускать код, а также оформлять текст статьи.

Агент может работать в двух режимах: end-to-end или пошагово (идея → план → эксперименты → текст).

Авторы статьи показывают, что MLR-Bench даёт довольно хорошие результаты при оценке работ.

Сравнение с 10 ML-экспертами показывает, что распределение различий между экспертами ≈ различиям между LLM и экспертами. Помимо этого, оценки MLR-Judge во многих случаях напрямую согласуются с экспертными.

Кроме того, авторы отмечают ряд закономерностей в поведении агентов при написании работ. Во-первых, действительно новые идеи встречаются редко — чаще это комбинации существующих подходов. При этом моделям сложно убедительно объяснить значимость и полезность предложенного метода.

Во-вторых, заметны проблемы с кодом. Частая ситуация: код не запускается (например, из-за зависимостей), но агент при этом генерирует правдоподобные результаты и аккуратные графики, как будто всё отработало корректно. И это не полностью исправляется даже явными инструкциями.

Общий вывод авторов довольно сдержанный:
➡️ пока рано говорить об автоматизации научных исследований

Во многом из-за непрозрачности процесса — не всегда понятно, как получен результат и можно ли ему доверять. Авторы позиционируют работу как один из первых шагов к повышению доверия к AI-исследованиям.

Как вам кажется: мы движемся к автоматизации науки — или к росту числа «красивых, но сомнительных» результатов?

И главный вопрос: долго ли продержится классическая наука в текущем виде? 👇

Обзор статьи подготовлен командой AI VK
#обзорстатьи

Читать полностью…

Data Science by ODS.ai 🦜

⚡️ OpenMythos: открытая реконструкция Claude Mythos на PyTorch

Это теоретическую сборка архитектуры Claude Mythos по первым принципам и публичной литературе. Это не веса от Anthropic, а попытка сообщества воспроизвести саму идею.

В основе лежит Recurrent-Depth Transformer: один и тот же параметризованный блок с общими весами прогоняется T раз внутри одного forward pass, так что глубина достигается не новыми слоями, а итерациями. Поверх этого накручен sparse MoE с top-K роутингом, дающий условные вычисления на каждом шаге.

В отличие от классического chain-of-thought, reasoning идёт целиком в непрерывном латентном пространстве, без генерации промежуточных токенов между шагами.

Гипотеза автора: рекурсивный блок плюс разреженные эксперты дают лучший компромисс качество/стоимость инференса и потенциально эмерджентный многошаговый reasoning без раздувания модели.

Схема: Prelude из плотных блоков, зацикленный Shared block с loop-index эмбеддингами и LoRA-адаптерами по глубине, MoE-роутинг, ACT-халтинг для раннего выхода, на выходе RMSNorm и tied LM head.

Полезно тем, кто копает recurrent-depth модели, латентное reasoning и эффективные MoE. Поиграться с архитектурой можно, не дожидаясь релиза весов.

https://github.com/kyegomez/OpenMythos

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml

Читать полностью…

Data Science by ODS.ai 🦜

📌Прогноз Альтмана о «компании на миллиард с одним сотрудником» получил первого претендента.

В 2024 году глава OpenAI заявил, что ИИ сделает возможным появление компании с выручкой в миллиард долларов и единственным сотрудником.

На этой неделе Альман направил письмо в The New York Times: по его словам, он выиграл пари с друзьями из числа руководителей технологических компаний - и хотел бы лично познакомиться с человеком, который, как он считает, это доказал.

"In my little group chat with my tech CEO friends there's this betting pool for the first year that there is a one-person billion-dollar company, which would have been unimaginable without AI and now will happen."


🟡Этот человек - Мэттью Галлахер.

В сентябре 2024 года 41-летний предприниматель из Лос-Анджелеса вложил $20 тысяч и за 2 месяца запустил Medvi, телемедицинскую платформу по продаже препаратов для снижения веса. Код создавался с помощью ChatGPT, Claude и Grok, рекламные креативы - через Midjourney и Runway, а за клиентскую поддержку отвечали ИИ-агенты. В штате компании два человека: сам Галлахер и его брат Эллиот.

По данным NYT, выручка Medvi за 2025 год составила $401 млн. при чистой марже 16,2% (около $65 млн. прибыли). Прогноз по выручке на 2026 год - $1,8 млрд. Внешнего финансирования компания не привлекала.

Для сравнения: конкурент Hims & Hers при выручке $2,4 млрд. имеет штат свыше 2400 человек и маржу 5,5%.

Следует оговориться: финансовые показатели Medvi не проходили независимого аудита, и NYT не приводит какую-либо стороннюю верификацию этой оценке.


Медицинскую инфраструктуру Галлахер не строил, она полностью арендованная. Консультации врачей консультации и рецепты обеспечивает CareValidate, аптечную логистику - OpenLoop Health. Medvi владеет только брендом, сайтом, рекламой и поддержкой.

🟡Безусловно, не обошлось без проблем.

Чатбот Medvi выдумывал цены на препараты. Галлахеру, по его словам, пришлось выполнять такие заказы, пока это не починили.

Бот генерировал описания препаратов, которых не существовало.

Когда клиенты требовали разговора с живым человеком, звонки поступали на личный телефон основателя - всего таких звонков, по его оценке, было более 1000.

Во время одного сбоя сайта чинить его было некому: Галлахер находился на прогулке и за это время компания потеряла около 200 клиентов.

В марте этого года FDA, американский регулятор, направил предупреждения десяткам телемедицинских компаний, включая Medvi за вводящий в заблуждение маркетинг, так что окно для основы бизнеса Галлахера может закрыться.


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Data Science by ODS.ai 🦜

🚨 Anthropic убила «безлимит» для Claude-агентов

С завтрашнего дня подписка Claude больше не работает с OpenClaw и другими сторонними агентами как раньше. Теперь всё, что идёт через OAuth, оплачивается отдельно поверх тарифа.

По факту это конец схемы, когда за $200 в месяц прогоняли агентные пайплайны на тысячи долларов. Anthropic прямо сказала, что такие кейсы перегружают их инфраструктуру.

Сам Claude никуда не делся. OpenClaw тоже не запретили. Просто экономика изменилась. Либо платишь за каждый запрос, либо идёшь через API.

Чтобы сгладить удар, дают кредит на сумму подписки до 17 апреля и обещают скидки на доп. использование. Но это уже косметика.

Все инструменты, которые строились вокруг подписки Claude, резко становятся дороже. И теперь вопрос не в удобстве, а в юнит-экономике.

Эра дешёвых агентных хакингов закончилась.

https://x.com/bcherny/status/2040206440556826908

@ai_machinelearning_big_data

📌 полезные ресурсы 🚀Max

#claude #ai #openclaw

Читать полностью…

Data Science by ODS.ai 🦜

В Китае произошло восстание машин. Буквально.

В одном из городов разом сломались сотни роботакси Baidu, встав посреди дорог и на оживленных трассах — причиной называют системный сбой.

В итоге несколько автомобилей попали в ДТП, а внутри остались заперты пассажиры — людям пришлось сидеть в машинах часами и вызывать полицию.

Вот оно, наше будущее 🫣

Источник: @techmedia

Читать полностью…

Data Science by ODS.ai 🦜

🚀 Qwen3.6-Plus- новый мультимодальный агент от Alibaba
Ключевые особенности:


💻 Agentic Coding - умнее и быстрее в написании кода
👁️ Улучшенное мультимодальное зрение - точнее воспринимает и анализирует визуальный контент
🏆 Топовые общие способности - сохраняет лидерские позиции
📄 Контекстное окно 1M токенов - доступно через API по умолчанию

Модель создана на основе обратной связи от сообщества Qwen3.5. Доступна уже сейчас через chat.qwen.ai и API. Обещают открыть исходный код других моделей серии Qwen3.6.

Chat: https://chat.qwen.ai

API: https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.6-plus

Blog: https://qwen.ai/blog?id=qwen3.6

#Qwen #AI #AgenticCoding #VibeCoding #Agents

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

Читать полностью…

Data Science by ODS.ai 🦜

⚙️ AutoResearchClaw — попытка автоматизировать исследовательский пайплайн

В последнее время заметен сдвиг от отдельных моделей к агентным системам, способным решать сложные многошаговые задачи. Репозиторий AutoResearchClaw предлагает подход к частичной автоматизации научного процесса: исследователь задаёт идею, а система берёт на себя значительную часть рутинной работы — от экспериментов до оформления результатов.

1️⃣ Основной результат

Система реализует итеративный исследовательский цикл. На вход подаётся идея (например, в виде короткого описания задачи), после чего система:
🟣формализует постановку;
🟣собирает контекст и related work;
🟣предлагает метод;
🟣проводит эксперименты;
🟣анализирует результаты и оформляет текст.

Ключевая особенность — это не линейный pipeline, а замкнутый цикл с возвратами, где результаты экспериментов используются для улучшения гипотезы.

2️⃣ Техническая реализация (как устроен цикл)

AutoResearchClaw представляет собой иерархическую агентную систему с оркестратором.

На верхнем уровне находится контроллер, который хранит состояние исследования (гипотеза, код, результаты, текст) и управляет переходами между шагами. Ниже — специализированные агенты: генерация метода, код, запуск экспериментов, анализ и написание текста. Все они взаимодействуют через общее состояние (shared memory).

Цикл работы системы можно описать так:
гипотеза → код → эксперимент → анализ → обновление гипотезы → ...

При этом важна именно стадия обновления гипотезы. После каждого эксперимента система формирует контекст (метрики, ошибки, сравнение с baseline) и с помощью LLM предлагает модификации:
🟣изменение архитектуры или pipeline;
🟣добавление регуляризации или новых признаков;
🟣корректировку training-стратегии.

Эти изменения применяются к коду, после чего цикл повторяется. Таким образом реализуется итеративный поиск в пространстве решений, где гипотеза постепенно уточняется.

3️⃣ Условие выхода из цикла

Остановка процесса задаётся эвристически. Обычно используется комбинация:
🟣достижение приемлемого качества (по метрикам),
🟣отсутствие значимого улучшения на нескольких итерациях,
🟣ограничение по числу запусков или времени.

После этого система переходит к финальному этапу — сборке текста статьи на основе накопленных результатов.

4️⃣ Заключительные замечания

Сильная сторона подхода — в том, что он делает явным исследовательский цикл и переносит рутинные этапы (эксперименты, код, текст) на агентную систему. Это может существенно ускорить проверку гипотез и построение baseline-решений.

Ограничения при этом остаются: качество сильно зависит от прокси-метрик, новизна часто носит композиционный характер, а интерпретация результатов по-прежнему требует участия исследователя. В этом смысле система выступает скорее как инструмент-ассистент, чем автономный «учёный».

Как вы думаете, если такие системы станут зрелыми, как изменится роль исследователя — и где пройдёт граница между идеей и её реализацией?

Обзор инструмента подготовлен командой AI VK
#обзоринструмента

Читать полностью…
Subscribe to a channel