opendatascience | Technologies

Telegram-канал opendatascience - Data Science by ODS.ai 🦜

46227

First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev

Subscribe to a channel

Data Science by ODS.ai 🦜

🎬 Алхимия кино в вашем смартфоне: Китайский Wan 2.6 бросает вызов Sora и меняет правила игры

Пока все обсуждали Sora 2, китайская компания Alibaba тихо выпустила оружие массового творения — модель Wan 2.6, которая не просто генерирует клипы, а создаёт целые фильмы.

📈 Что случилось?
Alibaba представила новое поколение мультимодальных моделей Wan 2.6. Это не просто апгрейд, а качественный скачок:
Глобально: Одна из самых комплексных семейств моделей для генерации видео.
Впервые в Китае: Модель с функцией «ролевой кастомизации», сохраняющей не только внешность, но и голос персонажа.
Технический прорыв: Длительность ролика до 15 секунд, интеллектуальное управление сценами («контроль раскадровки») и кинематографическое качество.

🌟 Главные фишки Wan 2.6
Модель понимает не только текст, но и контекст. Вот что это значит на практике:

1. Ваш личный актёрский состав (Reference Video)
Загрузите любое видео с человеком, животным или предметом — и Wan 2.6 сделает его «звездой» нового сюжета, идеально копируя мимику, движения и даже тембр голоса!
Формула промта: «@[персонаж] + [действие] + [реплика] + [сцена]».

2. Режиссёр в кармане (Multi-shot Narrative)
Модель сама разбивает ваш сценарий на профессиональные планы: общий, средний, крупный.
Формула промта: «[Общее описание сцены]. Кадр 1 [0-3 сек]: ... Кадр 2 [3-7 сек]: ...».

3. Кино без бюджета
Детализация: Пар на очках, микро-морщинки, реалистичная текстура кожи.
Эмоции: Модель передаёт тонкие изменения в выражении лица героев.
Синхронизация: Идеальное совпадение артикуляции и звука.

🖼 Не только видео: Апгрейд для изображений
Wan 2.6 также серьёзно прокачала генерацию статичных картинок:
• Точное воспроизведение художественных стилей (от масляной живописи до пиксель-арта).
• Улучшенная работа с текстом внутри изображения (постеры, инфографика).
• Генерация сложных комбинаций объектов и сцен.

Wan 2.6 даёт беспрецедентный контроль над повествованием, образами и звуком. Она стирает границу между профессиональной студией и любительским творчеством.

Сайт Wan | Блог

#КитайскийИИ #КитайAI #ГенеративноеВидео #Wan26 #Alibaba

Читать полностью…

Data Science by ODS.ai 🦜

мы с вами живем в интересное время:

в США фейки с бомжами заполонили соцсети (первая картинка) - скидываешь фотку соседу, и смотришь, как он прибегает с горящим седалищем

в Британии случайно "разрушили" ж/д мост (вторая картинка), так что на полтора часа перестали ходить поезда

а у нас появился новый вид мошенничества со страховкой - сгенерированные фотографии повреждений на машинах

грань реальности и вымысла стала неприятно тонкой, и нам теперь с этим жить

@valuableai

Читать полностью…

Data Science by ODS.ai 🦜

🚀Релиз HY World 1.5 (WorldPlay)

Команда Tencent Hunyuan открыла исходный код HY World 1.5 (WorldPlay) - одного из самых продвинутых и фреймворков для интерактивного моделирования миров в реальном времени.

В версии 1.5 представлен WorldPlay - стриминговая video diffusion-модель, позволяющая создавать и исследовать интерактивные 3D-миры с долгосрочной геометрической согласованностью.

3D-миры можно создавать по тексту или изображениям, свободно перемещаться по ним, осматриваться и взаимодействовать с окружением, как в видеоигре.

Ключевые особенности:

- Реальное время
Генерация длинных видеопотоков со скоростью 24 FPS с высокой стабильностью сцен.

- Геометрическая согласованность
Используется механизм Reconstituted Context Memory, который динамически пересобирает контекст из предыдущих кадров и предотвращает деградацию памяти.

- Точное и устойчивое управление
Dual Action Representation обеспечивает корректную реакцию на ввод с клавиатуры и мыши.

- Широкие сценарии применения
Поддержка вида от первого и третьего лица, событий, управляемых промптом, и бесконечного расширения мира.

Проект полностью открыт.

Попробовать: https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay
Проект Page: https://3d-models.hunyuan.tencent.com/world/
GitHub: https://github.com/Tencent-Hunyuan/HY-WorldPlay
Hugging Face: https://huggingface.co/tencent/HY-WorldPlay
Technical Report: https://3d-models.hunyuan.tencent.com/world/world1_5/HYWorld_1.5_Tech_Report.pdf

@data_analysis_ml

Читать полностью…

Data Science by ODS.ai 🦜

Всем привет!

Встречайте двадцать четвёртый выпуск подкаста "Капитанский мостик". В этом выпуске обсуждаются актуальные темы в области робототехники и науки, включая возможности роботов Optimus, финансирование исследований в США, качество научных публикаций и необходимость пересмотра системы оценки научных результатов. Ведущие подкаста - Валентин Малых и Дмитрий Колодезев.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

Читать полностью…

Data Science by ODS.ai 🦜

📌Как превратить систему Grace-Hopper в настольный компьютер.

Занимательная история Дэвида Ноэля о том, как он купил ИИ-оборудование корпоративного класса, разработанное для серверных стоек с жидкостным охлаждением, которое затем переоборудовал под воздушное охлаждение, потом снова переоборудовал под водяное, пережил множество ситуаций, близких к катастрофе, и, в итоге получил настольный компьютер, способный запускать модели с 235 миллиардами параметров дома.

Это рассказ о сомнительных решениях и нестандартном подходе к решению проблем. И немного о том, что происходит, когда пытаешься превратить оборудование для ЦОДа в домашний сетап.

Если вы когда-либо задавались вопросом, что нужно для запуска действительно крупных моделей локально, или если вы просто хотите посмотреть, как кто-то разбирает оборудование стоимостью 80 000 долларов, полагаясь лишь на надежду и изопропанол, то эта статья не оставит вас равнодушным.

🔜 Читать рассказ полностью

@ai_machinelearning_big_data

Читать полностью…

Data Science by ODS.ai 🦜

Сегодня вышел техрепорт Alice AI

Ниже — краткий обзор ключевых технических решений и результатов, а подробнее обо всех деталях, экспериментах и выводах можно почитать в полной версии отчёта на Хабре.

Alice AI LLM

На этапе претрейна улучшили качество данных: фильтрация и аугментация повысили фактологичность ответов (+4–7% на внутреннем бенчмарке). Также собрали специализированные данные по школьным предметам, что дало прирост на образовательных задачах — модель обошла конкурентов по истории, литературе, математике и русскому языку. Усилили навыки программирования и математики за счёт алгоритмических и кодовых данных (+4,5 п.п. на LiveCodeBench). В alignment-фазе перешли к единому RLHF-пайплайну с мультиаспектным ревордом (полезность, фактологичность и др.) вместо одного «суперсигнала».


Alice AI LLM Search
Пайплайн объединяет планировщик поисковых запросов, фильтрацию и ранжирование результатов и генерацию ответа, а также поддерживает мультимодальные источники — тексты, изображения, видео и геоданные — для более полных ответов. Для обучения использовали RLHF с мультиаспектными ревордами вместо одной метрики, что упростило оценку сложных ответов. В RL-тренировке перешли к онлайн-методу GRPO, сократили этапы обучения, повысили эффективность GPU и в итоге улучшили полезность и актуальность ответов.


Alice AI ART
Обучающий датасет проанализировали с помощью Alice AI VLM, извлекли структурированные JSON-описания изображений и выявили дисбалансы в данных. На основе этого датасет для файнтюна переработали и дополнили недостающими категориями запросов, чтобы лучше соответствовать реальным пользовательским сценариям. Архитектура модели сделана двухступенчатой: на первом этапе формируется общая композиция изображения, на втором — прорабатываются высокочастотные детали. Дополнительно обучили отдельный «рефразер» — компактную LLM, которая преобразует сырые пользовательские промпты в детализированное описание сцены, сохраняя исходный смысл перед генерацией.


Alice AI VLM
Объём данных претрейна увеличили с 400 до 600 млрд токенов и расширили контекст до 32 тыс. Обновили OCR-датасет, улучшив качество чтения текста с изображений, включая рукописный, и описание визуального контента. VLM тесно интегрирован с текстовой LLM и обучается с теми же RLHF-подходами. Дополнительно в систему добавлен специализированный VLM-«решатель» для задач, требующих глубокой визуально-математической экспертизы.


Инфраструктура инференса
Инференс оптимизировали, повторно использовав KV-кэш для одинаковых частей промпта. Также помогла полная FP8-квантизация весов, активаций и KV-кэша. За счёт этого объём KV-кэша сократился почти вдвое. Дополнительно внедрили спекулятивное декодирование EAGLE-3, повысив пропускную способность генерации.
В результате новый инференс-стек обеспечивает около 5,8× ускорение по сравнению с BF16 и примерно 1,3× относительно лучших открытых решений, что позволило достичь целевых показателей скорости.


ML Underhood

Читать полностью…

Data Science by ODS.ai 🦜

всем привет, напоминаем, что до 31 декабря открыт прием заявок на Премию в области обработки естественного языка имени Владимира Иосифовича Левенштейна (на фото), автора знаменитого расстояния редактирования

хочу поделиться новостью, что компания Selectel выделила 100 000 бонусов лауреату премии (этого хватит на два месяца аренды GPU Nvidia A100 в облаке)

выдвигаться можно самостоятельно или выдвинуть кого-то из коллег; заявки принимаются тут

Читать полностью…

Data Science by ODS.ai 🦜

Nvidia будет отслеживать геолокацию своих ИИ-чипов

Ресурс Reuters сообщил, что Nvidia разработала технологию, которая позволит определить страну, где фактически находится каждый её ИИ-чип. Речь идет о простом пинге: ускоритель будет отправлять запросы на служебные серверы Nvidia, и по времени отклика до каждого можно определить примерное местоположение. Этот функционал будет встроен в систему отслеживания состояния GPU-фермы клиента.

Изначально такая технология появится в новейших ускорителях Blackwell, которые имеют расширенные средства аттестации и защиты. В будущем она может появиться на более старых решениях Hopper и Ampere. А значит в теории Nvidia может устроить такую же слежку за видеокартами обычных пользователей и запрещать их работу в санкционных странах.

Мой Компьютер

Читать полностью…

Data Science by ODS.ai 🦜

AI platform for generating online courses just announced a 16M round by a16z

The product looks good but it wasn’t what clicked for me. I couldn’t help to notice the new trend of providing refined videos in the posts to share key updates. That’s something which just entered our life with the spread of AI.

Website: oboe.com
Source: https://x.com/nirzicherman/status/1998770866809712839

#AI #AI_adoption

Читать полностью…

Data Science by ODS.ai 🦜

🖥 Малоизвестный факт о Python random.seed(), который может поломать ваш код

Документация создаёт впечатление, что любое целое число просто используется как seed (это “начальная точка” для генератора случайных чисел.).

Но Python перед использованием просто берёт абсолютное значение.

То есть:

➡️ seed(3) и seed(-3) - порождают один и тот же поток случайных чисел.

Это значит, что разные seed не всегда дают разные последовательности -

Python гарантирует только обратное: одинаковый seed → одинаковые числа.

Почему так?
В исходниках CPython есть строка, которая буквально делает:

seed = abs(seed)

И знак просто теряется, хотя алгоритм случайных чисел мог бы учитывать его.

🧠 Вывод:

Не используйте небольшие вариации seed (например 5 и -5) как способ получить разные потоки случайностей — это небезопасно.
Если вам нужны независимые RNG — создавайте их явно, а не полагаясь на “умные” seed.

[1] https://docs.python.org/3/library/random.html
[2] https://github.com/python/cpython/blob/main/Modules/_randommodule.c#L321C13-L321C30

@pythonl

Читать полностью…

Data Science by ODS.ai 🦜

в продолжение обсуждения ICLR: не знаю, кто это начал, может быть это был Грэхэм Ньюбиг (1 картинка), но люди из Pangram Labs засучили рукава и сделали анализ

они проанализировали рецензии от 2021 года, предсказуемо почти 100% было оценено, как написанные людьми (2 картинка); а вот в текущем году уже 21% полностью сгенерирован, и еще 4% почти полностью, то есть 1 из 4 рецензий написана LLM (3 картинка)

интересно, что в плане рейтинга модели предсказуемо завышают оценки; но разница всего в три десятых балла, думаю, что статистически это неотличимо (4 картинка)

рекомендую посмотреть полные результаты, там много чего еще есть; кстати, коллеги выпустили препринт по своей системе EditLens, c помощью которой анализ делали (из забавного, процитировали моих бывших коллег, Катя, Лаида, привет!)

на мой взгляд бороться с волной ИИ-рецензий бессмысленно, нужно это возглавить; Ян ЛеКун как раз недавно рекламировал специальный сайт, куда можно загрузить статью и получить сгенерированную рецензию

@valuableai

Читать полностью…

Data Science by ODS.ai 🦜

🤖 Крах ИИ-стратегии ❗️ Microsoft и стремительный взлет ❗️Google Gemini

Microsoft столкнулась с критическим падением спроса на свои флагманские ИИ-решения и была вынуждена резко сократить внутренние планы продаж. Свежая аналитика FirstPageSage за декабрь 2025 года фиксирует квартальный рост аудитории Google Gemini на уровне 12% против стагнирующих 2% у продукта Copilot. Инсайдеры издания The Information сообщают, что менеджеры «изо всех сил пытаются» закрыть сделки на фоне очевидного технологического превосходства конкурентных больших языковых моделей.

Эксперты подчеркивают, что принятая генеральным директором Сатьей Наделлой стратегия «выпускай сейчас, чини потом» привела к появлению на рынке откровенно слабых продуктов с низкой отказоустойчивостью. В то время как конкуренты выстраивают полный стек собственных технологий, Microsoft рискует потерять статус инноватора и превратиться в обычного посредника на рынке вычислительных мощностей.

У корпорации есть всё еще солидные 14% рынка и огромный корпоративный сегмент, но если катастрофический тренд сохранится, то Copilot потеряет статус второй платформы мира в 2026, уступив место Google Gemini.

@Russian_OSINT

Читать полностью…

Data Science by ODS.ai 🦜

🧠 Продвинутая типизация Python, о которой почти никто не знает

Статья показывает, что Python уже давно вышел за рамки простых List[int] и Optional[str].

Главные идеи:

✔️ TypeGuard и новый TypeIs позволяют писать функции, которые доказательно сужают типы - например, проверка превращает Any в конкретный тип для дальнейшего кода.

✔️ assert_never из typing помогает ловить случаи, когда ты забыл обработать один из вариантов, что особенно важно в match и сложных условных ветках.

✔️ Python 3.13+ добавляет улучшенный вывод типов и строгие проверки, чтобы типизированный код стал надёжнее.

✔️ Поддержка typed function overloading - теперь можно описывать разные сигнатуры для одной функции, и анализаторы понимают их корректно.

📌 Вывод из статьи - Python типизация уже стала инструментом для архитектуры и предотвращения ошибок, особенно в больших проектах. Но большинство разработчиков использует только её простейший слой.

Кому полезно:
• работаешь с крупными кодовыми базами
• пишешь библиотеки
• хочешь меньше скрытых багов и более предсказуемые refactor-ы

Источник: martynassubonis.substack.com/p/advanced-overlooked-python-typing

Читать полностью…

Data Science by ODS.ai 🦜

Китайцы собрали своего терминатора

Гуманоид T800 от EngineAI пинает генерального директора Чжао Туняна.

Мой Компьютер

Читать полностью…

Data Science by ODS.ai 🦜

Большое сравнение производительности мобильных чипов

Китайцы собрали более 70 смартфонов с разными процессорами и протестировали их все, собрав в единую табличку.

Вышло довольно интересное сравнение!

За базу в 100 баллов принят Snapdragon 8+ gen 1.

За результат теста CPU взято соотношение 25% однопотока + 75% многопотока Geekbench 6.
GPU: 50% Wild Lige Extreme + 50% Aztec 1440P
Общий результат 65% CPU + 35% GPU

Итог таков:
За 10 лет производительность CPU увеличилась в 9 раз.
Производительность GPU в 22 раза!

Ещё из интересного:
Уже несколько лет подряд мобильные чипы от Apple не самые быстрые в текущем поколении.
Последние пару лет решения от MediaTek по графике чуть быстрее Snapdragon.

Источник

@HWvsSW

Читать полностью…

Data Science by ODS.ai 🦜

Запись семинара

Астемир Гонгапшев (Университет "Сириус”), Обзор методов безопасного федеративного обучения. YouTube | Дзен | RuTube (~1 час).

Читать полностью…

Data Science by ODS.ai 🦜

Meta releases sound segmentation model SAM audio.

Model can cut or play certain audio tracks based on text or visual input — think typing “speech” and hearing only a speech without a background noise.

Release post: https://ai.meta.com/samaudio
Playground: https://aidemos.meta.com/segment-anything/editor/segment-audio

#dl #sound

Читать полностью…

Data Science by ODS.ai 🦜

Забавный факт: пузырь ИИ вернул цену акций Cisco на уровень пузыря доткомов. Таким образом, восстановление после того краха, когда компания потеряла 90% стоимости, заняло 25 лет.

Cisco вместе с Microsoft, Intel и Dell была одним из главных бенефициаров и символов дотком-эры

Мой Компьютер

Читать полностью…

Data Science by ODS.ai 🦜

В прошлом квартале я внедрил Microsoft Copilot для 4000 сотрудников.

30 долларов за рабочее место в месяц.

1,4 миллиона долларов в год.

Я назвал это «цифровой трансформацией».

Совету директоров понравилась эта фраза.

Они одобрили ее за одиннадцать минут.

Никто не спросил, что она на самом деле будет делать.

В том числе и я.

Я сказал всем, что это «увеличит производительность в 10 раз».

Это не реальная цифра.

Но звучит как реальная.

Отдел кадров спросил, как мы будем измерять это 10-кратное увеличение.

Я ответил, что будем «использовать аналитические панели».

Они перестали задавать вопросы.

Через три месяца я проверил отчеты об использовании.

47 человек открыли его.

12 использовали их более одного раза.

Один из них был я.

Я использовал их, чтобы обобщить электронное письмо, которое я мог прочитать за 30 секунд.

На это ушло 45 секунд.

Плюс время, которое понадобилось, чтобы исправить галлюцинации.

Но я назвал это «успехом пилотного проекта».

Успех означает, что пилотный проект не потерпел явного провала.

Финансовый директор спросил о рентабельности инвестиций.

Я показал ему график.

График шел вверх и вправо.

Он измерял «возможности ИИ».

Я придумал этот показатель.

Он одобрительно кивнул.

Теперь мы «имеем возможности ИИ».

Я не знаю, что это значит.

Но это есть в нашей презентации для инвесторов.

Старший разработчик спросил, почему мы не используем Claude или ChatGPT.

Я ответил, что нам нужна «безопасность корпоративного уровня».

Он спросил, что это значит.

Я ответил: «соответствие требованиям».

Он спросил, каким требованиям.

Я ответил: «всем».

Он выглядел скептически.

Я назначил ему «беседу о карьерном росте».

Он перестал задавать вопросы.

Microsoft прислала команду для изучения кейса.

Они хотели представить нас как историю успеха.

Я сказал им, что мы «сэкономили 40 000 часов».

Я рассчитал это число, умножив количество сотрудников на число, которое я придумал.

Они не проверяли его.

Они никогда не проверяют.

Теперь мы на сайте Microsoft.

«Глобальная компания достигает 40 000 часов прироста производительности с Copilot».

Генеральный директор поделился этим на LinkedIn.

Он получил 3000 лайков.

Он никогда не пользовался Copilot.

Ни один из руководителей не пользовался.

У нас есть исключение.

«Стратегическая направленность требует минимального отвлечения внимания на цифровые технологии».

Я написал эту политику.

Лицензии продлеваются в следующем месяце.

Я прошу о расширении.

Еще 5000 мест.

Мы не использовали первые 4000.

Но на этот раз мы «будем стимулировать внедрение».

Внедрение означает обязательное обучение.

Обучение означает 45-минутный вебинар, который никто не смотрит.

Но его завершение будет отслеживаться.

Завершение — это показатель.

Показатели попадают в дашборды.

Дашборды попадают в презентации для совета директоров.

Презентации для совета директоров помогают мне получить повышение.

К третьему кварталу я буду старшим вице-президентом.

Я до сих пор не знаю, что делает Copilot.

Но я знаю, для чего он нужен.

Он нужен, чтобы показать, что мы «инвестируем в ИИ».

Инвестиции означают расходы.

Расходы означают обязательства.

Обязательства означают, что мы серьезно относимся к будущему.

Будущее — это то, что я говорю.

До тех пор, пока график идет вверх и вправо.

Читать полностью…

Data Science by ODS.ai 🦜

⚡️ GigaChat 3 Lightning в GGUF: максимум скорости для локального запуска

Мы подготовили три официальные сборки модели. Теперь вы можете выбрать оптимальный баланс между скоростью и качеством под ваше железо:
🔘bf16 - Максимальное качество и стабильность.
🔘q8_0 - Золотая середина: отличное качество при меньшем потреблении памяти.
🔘q6_k - Оптимально для ноутбуков и домашних ПК: высокая скорость и экономия памяти без заметного снижения качества генерации.


💻 Function Calling

Мы расширяем поддержку функционала в популярных инструментах:
🔘vLLM: Официально появится в следующем релизе >0.12.0. Уже сейчас работает в dev-сборке (от коммита 21bb323) с флагом --tool-call-parser gigachat3.
🔘SGLang: Подготовили временное решение, доступное в отдельной ветке.
🔘llama.cpp: Отправили PR с полноценной реализацией. В текущей версии вызов функций работает с ограничениями — инструкция доступна в описании модели на HuggingFace.

Мы продолжаем работу над интеграцией GigaChat 3 Lightning в экосистему open-source инструментов. Следите за обновлениями — впереди ещё больше возможностей для локального запуска и кастомизации.

🧭 Делитесь опытом использования и задавайте вопросы — ваш фидбэк помогает делать модель лучше!

➡️ HuggingFace ⬅️

Читать полностью…

Data Science by ODS.ai 🦜

🌟 "ИИ-отцы" получили главную ежегодную награду журнала Time «Человек года».

Их объединённый портрет, вдохновлённый культовой фотографией «Обед на небоскрёбе», украсил обложку.

В числе тех, кого редакция назвала главными архитекторами новой технологической эры: Илон Маск, Марк Цукерберг, Лиза Су (AMD), Джeнсен Хуанг (Nvidia), Сэм Альтман (OpenAI), Демис Хассабис (DeepMind), Дарио Амодей (Anthropic) и Фэй-Фэй Ли (World Labs).

Как отмечает издание, в 2025 году потенциал ИИ был полностью реализован, а эта группа визионеров окончательно утвердила наступление эпохи мыслящих машин.


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Data Science by ODS.ai 🦜

⚡️ Новый пост Andrej Karpathy : автоматическая оценка десятилетних обсуждений Hacker News с позиции «задним числом»

Он взял все 930 материалов и обсуждений с главной страницы Hacker News за декабрь 2015 года и прогнал их через GPT 5.1 Thinking API, попросив модель определить самые дальновидные и самые ошибочные комментарии.

Примерно 3 часа ушло на написание кода и ещё час и ~$60 - на запуск.

Почему это важно:

1. Анализ «задним числом»- мощный инструмент для тренировки собственного навыка прогнозирования. Чтение таких выводов помогает лучше понимать, где именно люди предугадывали будущее, а где промахивались.
2. Стоит задуматься, как будет выглядеть мир, когда будущие LLM смогут делать такие исследования намного дешевле, быстрее и точнее. Любой ваш комментарий в интернете может стать объектом глубокого анализа - бесплатно и в огромном масштабе. Как автор писал ранее: «будьте хорошими, будущие LLM за вами наблюдают».

🎉 Топ-10 аккаунтов: pcwalton, tptacek, paulmd, cstross, greglindahl, moxie, hannob, 0xcde4c3db, Manishearth и johncolanduoni - GPT 5.1 Thinking признал их комментарии самыми точными и дальновидными в декабре 2015 года.

🔗 Полные материалы:

- Подробный разбор: karpathy.bearblog.dev/auto-grade-hn/
- Репозиторий проекта: github.com/karpathy/hn-time-capsule
- Готовые результаты: karpathy.ai/hncapsule/

@data_analysis_ml

Читать полностью…

Data Science by ODS.ai 🦜

«Норникель» выпустил открытую языковую модель MetalGPT-1 и бенчмарк Alloy-Bench для металлургии

MetalGPT-1 обучена на 10 Гб текстов по металлургии и горнодобывающей промышленности. Это больше чем 1 млн документов, недоступных в открытых источниках. Данные прошли очистку и анонимизацию, чтобы предотвратить раскрытие коммерческой тайны. При обучении также использовалось около 500 тыс. вопросно-ответных и инструктивных пар на основе производственных и научных задач.

Модель содержит 32 млрд параметров. Она спроектирована для работы с профессиональной терминологией, аббревиатурами и сложными технологическими цепочками. «Норникель» создает на базе MetalGPT-1 персональных ИИ-ассистентов и автономных агентов, которые внедряются в операционные процессы компании.

Промышленный бенчмарк Alloy-Bench состоит из набора вопросно-ответных пар, которые относятся к различным процессам горно-металлургической отрасли. Как утверждают разработчики, MetalGPT-1 в тестах превосходит открытые универсальные модели.

👉🏻MetalGPT-1 и Alloy-Bench на Hugging Face

🔗Источник: https://nornickel.ru/news-and-media/press-releases-and-news/metalgpt-1-nornikel-vypustil-bolshuyu-yazykovuyu-model-dlya-metallurgii/

Читать полностью…

Data Science by ODS.ai 🦜

28 ноября Андрей Яковлев разобрал статью от OpenAI  «Why Language Models Hallucinate?»

🎬Выкладываем запись встречи и делимся выводами:
🛑галлюцинации возникают из-за статистического обучения (модель учится «угадывать» токены);
🛑post-training не избавляют модель от галлюцинаций;
🛑бинарные метрики бенчмарков поощряют угадывание, из-за чего модели оптимизированы быть "хорошо сдающими экзамены", а не честными;
🛑решение — использование "честных" методов оценки и вознаграждения моделей.

#reading_group #recording #llm

Читать полностью…

Data Science by ODS.ai 🦜

🚀 Вышел Qwen-Image-i2L от DiffSynth-Studio - первый open-source инструмент, который умеет делать LoRA-модель из одной картинки. 🖼️➡️🧠

Что можно извлекать из изображения:

🎨 Style — только стиль и эстетика
🧩 Coarse — стиль + содержание сцены
Fine — улучшение детализации 1024×1024 (используется вместе с Coarse)
⚖️ Bias — подстройка под фирменный визуальный почерк Qwen-Image

Модель построена на SigLIP2 + DINOv3 + Qwen-VL.

Итог — можно взять одну картинку и быстро натренировать под неё собственную LoRA, без больших датасетов.

🔗 ModelScope: modelscope.cn/models/DiffSynth-Studio/Qwen-Image-i2L/summary
💻 Код: github.com/modelscope/DiffSynth-Studio/blob/main/examples/qwen_image/model_inference_low_vram/Qwen-Image-i2L.py

Читать полностью…

Data Science by ODS.ai 🦜

Недавно завершилось соревнование по памяти в LLM для диалогов – GigaMemory: global memory for LLM (хабр)

Основной метрикой выступала Accuracy.

1-е место (86,6%) Вместо классического RAG для каждого чанка текста модели отдельно задают вопрос: Релевантен ли этот текст заданному вопросу?. Модель должна ответить токеном Да или Нет. По logprobs этих токенов рассчитывается уровень уверенности. В итоге возвращается список чанков, где уверенность выше порога 0.5. На основе этой информации формируется первичный ответ, который затем используется для итогового решения.

2-е место (84,5%) Подход технически сложнее, но концептуально похож на решение победителя.

3-е место (74,5%) Классический RAG с энкодером bge-m3 – этого оказалось достаточно для призового места.

Решения звучат интересно, но кажется в топ 2 решениях, под каждый запрос все прошлые диалоги перечитываются заново, а не берутся из уже готовой краткой выжимки 🤔

Читать полностью…

Data Science by ODS.ai 🦜

☁️ МГТУ и «Росатом» открыли доступ к облачной квантовой платформе

Специалисты МГТУ им. Баумана, ВНИИА им. Духова и «Росатома» запустили облачную платформу Bauman Octillion. Она позволяет удаленно проводить эксперименты на реальных квантовых сопроцессорах.

🔜Пользователям предоставляется круглосуточный доступ к квантовому сопроцессору SnowDrop 4Q на базе четырех сверхпроводниковых кубитов. Точность выполнения однокубитных операций на нем составляет 99,89%, двухкубитных — 99,1%.

☝️С 10 по 20 декабря будет открыт тестовый доступ к более мощному устройству — SnowDrop 8Q с восемью кубитами и повышенной точностью. Это позволит ученым тестировать более сложные алгоритмы.

Подпишитесь на Электричку

Читать полностью…

Data Science by ODS.ai 🦜

📌Адвент-календарь по ML и DL.

Towardsdatascience запустил декабрьский Адвент-календарь "Machine and Deep Learning", котором предлагает разобраться, что под капотом у ML-процессов.

Фреймворки, например scikit-learn, сделали нас ленивыми. Вызов model.fit стал настолько обыденным, что в эпоху Gen AI кажется, будто обучение модели -это просто подбор параметров.

ML-инженеры жонглируют моделями со сложностью, которая растет в геометрической прогрессии, но при этом они не всегда способны вручную пересчитать и объяснить результаты даже самых простых алгоритмов: линейной регрессии или классификатора.

Модели превратились в "черные ящики", и это огромная проблема, ведь знание, что стоит за каждой функцией, критически важно для понимания процесса.


Фишка в том, что весь материал разбирается в Excel. Звучит диковато, но в этом и есть гений. В отличие от кода, где операции скрыты за функциями, в Excel каждая формула, каждое число, каждый расчет - всё на виду. Никаких "черных ящиков".

Уже вышло 7 статей:

🟢День 1 : k-NN Regressor

🟢День 2 : k-NN Classifier

🟢День 4 : GNB, LDA и QDA

🟢День 5 : GMM (Gaussian Mixture Model)

🟢День 6 : Decision Tree Regressor

🟢День 7 : Decision Tree Classifier

Цикл поможет ответить на вопросы, которые часто остаются за кадром: как грамотно обрабатывать категориальные признаки, когда масштабирование не является правильным решением, и как измерять важность признаков, интерпретируя их напрямую с моделью, минуя модель-агностические пакеты LIME и SHAP.

Серия будет полезна студентам для осмысления формул, и менеджерам для понимания какой ML-метод необходим для бизнеса. А для разработчиков это шанс наконец-то понять теорию.

В общем, это маст-рид для тех, кто хочет перестать быть оператором библиотек и по-настоящему понять, как работает ML-движок.

🔜 Мониторить выход новых статей можно тут, обещают публикацию до конца декабря в формате "один день - одна статья".



@ai_machinelearning_big_data

#AI #ML #DL #Tutorial #Excel

Читать полностью…

Data Science by ODS.ai 🦜

Всем привет!

Встречайте двадцать третий выпуск подкаста "Капитанский мостик". В этом эпизоде обсуждаются последние новости в области робототехники и автоматизации, а также рассматриваются вопросы безопасности смарт-контрактов и их уязвимости. Ведущие подкаста - Валентин Малых и Дмитрий Колодезев.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

Читать полностью…

Data Science by ODS.ai 🦜

🚀 Google представила Titans + MIRAS - новую архитектуру, которая даёт ИИ долговременную память 🧠
Теперь модель может обновлять свои знания прямо во время инференса, а не только при обучении.

Что делает Titans важным:

• Классические Transformer-модели хорошо работают с коротким контекстом, но резко дорожают по вычислениям при его увеличении.
• Альтернативы вроде RNN и state-space экономят ресурсы, но теряют детали при сжатии информации.
• Titans предлагает гибрид: краткосрочная память через attention плюс глубокая нейронная память, которая обновляется «на лету» и запоминает только действительно новое.

Как работает память:

Модель записывает в память только те данные, которые оказались неожиданными.
Это помогает:

✔ фильтровать шум
✔ хранить не весь текст, а смысл
✔ удерживать контекст больше 2 миллионов токенов
✔ сохранять линейную скорость обработки

Практические результаты:

- Улучшение reasoning
- Сильные результаты на задачах длинного контекста
- Более устойчивое качество по сравнению с продвинутыми Transformer-подходами

Итог: Titans + MIRAS — это шаг к ИИ, который не просто держит окно контекста, а умеет помнить, забывать и учиться прямо в процессе генерации.

📌 Статья: https://research.google/blog/titans-miras-helping-ai-have-long-term-memory/
📌Видео: https://www.youtube.com/watch?v=mI6mv2c7RK0

@vistehno

Читать полностью…
Subscribe to a channel