data_analysis_ml | Unsorted

Telegram-канал data_analysis_ml - Анализ данных (Data analysis)

48228

Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚

Subscribe to a channel

Анализ данных (Data analysis)

🎥 КК ИИ-слоп теперь влияет на политические решения

В Польше заявляют, что в TikTok завирусилист сгенерированные ИИ ролики, убеждающие молодёжь поддержать выход страны из ЕС, так называемый “Polexit”.

Польское правительство просит ЕС открыть расследование против TikTok по линии Digital Services Act.

По их словам, ролики выглядят как организованная кампания.

Особенность таких видео в том, что:

• ИИ создаёт реалистичных “говорящих людей”
• сценарии можно быстро менять
• таргетинг идёт точечно, например, на аудиторию 15–25 лет
• масштабирование происходит автоматически

То есть за короткое время можно запустить сотни убедительных роликов, создающих ощущение «органичного мнения общества», хотя за ними может стоять один оператор.

Вопросы, которые теперь обсуждают в ЕС:

• как отличать реальных людей от ИИ-персонажей
• кто несёт ответственность за массовую манипуляцию
• как соцсети должны реагировать на такие кампании

ИИ меняет не только технологии, он начинает менять и общественные дискуссии.

notesfrompoland.com/2025/12/31/poland-calls-for-eu-action-against-ai-generated-tiktok-videos-calling-for-polexit/

Читать полностью…

Анализ данных (Data analysis)

OpenAI готовит новую аудио-модель в связке с собственным аудио-устройством.

OpenAI активно развивает свои технологии голосового ИИ, готовя платформу для будущего персонального устройства с упором на голосовой интерфейс, релиз которого ожидается примерно через год.

Внутренние команды уже объединены, а новая архитектура голосовой модели должна выйти в первом квартале 2026 года.

Что уже известно по ранним результатам:

• нас ждет более естественная и эмоциональная речь
• мгновенный ответа
• понимание мгновенных перебиваний

Все это критически важно для голосового ассистента, который не просто отвечает на вопросы, а активно взаимодействует и помогает пользователю в повседневной жизни.

https://www.theinformation.com/articles/openai-ramps-audio-ai-efforts-ahead-device

#AI #OpenAI #VoiceAI #Innovation #Future

Читать полностью…

Анализ данных (Data analysis)

💰 Цены на видеокарты в 2026 году могут резко подпрыгнуть и снова причина в памяти.

Сообщается, что уже в начале года AMD может поднять цены (январь), а Nvidia подтянется в феврале. И эти подорожания могут тянуться месяцами.

Причина проста: память стала главным элементом себестоимости. В среднем она занимает до 80% BOM у видеокарт, а её стоимость к Q2 2026 может вырасти ещё на 40%.

ИИ разогрел рынок настолько, что 64 ГБ DDR5 подорожали с $150 до $500 меньше чем за два месяца. В 2025 году производителей спасали фиксированные контракты на поставку памяти, они сглаживали скачки VRAM. Теперь контракты заканчиваются, и рост DRAM/GDDR напрямую попадает в себестоимость.

В итоге доля «чип GPU + VRAM» может подбираться к тем же 80% стоимости платы.

По утечкам, флагманские RTX 5090 в 2026 году могут добраться до ценника около $5000 - главным образом из-за огромного спроса со стороны индустрии ИИ.

Ждать «чудесных скидок» по видеокартам в ближайшее время не стоит.

Источник: wccftech .com/amd-and-nvidia-are-expected-to-hike-gpu-prices-early-2026/

Читать полностью…

Анализ данных (Data analysis)

🙂 Tongyi Lab, похоже, вот-вот выпустит Qwen-Image-Edit-2512

Вчера, на просторах сети Х, Tongyi Lab запостила тизер "новогоднего подарка, который уже в пути".

Так как все очень сильно и давно ждут Z-Image Base и Edit и Omni, сверхразумы Redditа пошли разгадывать таинственный пост.

Розыскную бригаду собирать не пришлось - новинку спойлернул gemini-code-assist в репозитории Modelscope : это будет qwen-image-2512


#news #ai #ml

Читать полностью…

Анализ данных (Data analysis)

👨‍🎓 Harvard выложил в открытый доступ учебник по ML-системам и это редкий случай, когда материал действительно полезный.

В учебнике показан полный цикл: от понимания основ до построения продакшн-систем, которые можно запускать в реальном мире.

Что в книге и почему она стоит внимания:

- вы самостоятельно собираете autograd, оптимизаторы, attention и мини-PyTorch — чтобы увидеть, как устроены фреймворки изнутри

- разбираетесь в базах: батчи, архитектуры, процесс обучения
- учитесь оптимизировать производительность: работать с ускорителями, бенчмарками и настраивать модели

📚 То есть это не вводная книжка, а полноценный roadmap от теории к продакшну.


📌Репозиторий: https://github.com/harvard-edge/cs249r_book
📌PDF: https://mlsysbook.ai/assets/downloads/Machine-Learning-Systems.pdf

Читать полностью…

Анализ данных (Data analysis)

Хотите построить собственного торгового робота и запустить его в облаке?

Мы запускаем курс, где вместе с вами создадим полноценного торгового робота для онлайн-торговли на российской бирже.
Вы пройдете весь путь от идеи до работающего сервиса.

💪 Что будет реализовано на курсе «ML для финансового анализа»:
- работа с реальными биржевыми данными
- реализация торговой стратегии (алгоритмы / ML)
- тестирование её на исторических данных
- настройка риск-менеджмента и мониторинга
- развернём робота в облачной среде


Результат: не абстрактный ноутбук, а живой финтех-проект.

Кому подойдёт:
- студентам IT и технических направлений
- начинающим ML / Data / Backend-инженерам
- всем, кто хочет понять, как реально работают торговые системы

☝🏻Опыт в трейдинге НЕ обязателен - мы дадим все основы.

Если хотите не просто учиться, а делать реальные системы - это к нам.
Постройте торгового робота. Запустите его в облаке. Сделайте шаг в финтех.

🔥 Успейте оставить заявку, старт 14 января: https://otus.pw/6dCB/

🎄Учитесь в новом году по старым ценам!
Максимальная скидка 30% 🎁 на обучение до 31.12.2025:
1 курс — тающая скидка 10% до 29.12 и 5% до 31.12
2 курса −25%, 3 курса −30%
Учиться системно — выгоднее!

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ", ИНН: 9705100963

Читать полностью…

Анализ данных (Data analysis)

Статья Step-DeepResearch где показано, что даже 32B-модель может делать по-настоящему глубокие исследования при очень низкой стоимости инференса.

📊 На бенчмарке ResearchRubrics модель получает 61.42, а полный отчет стоит меньше 0,50 RMB.

Идея проста: большинство агентов ведут себя как поисковики. Они собирают факты, но не превращают их в проверенный, связный отчет.

Здесь исследование понимается как длинный цикл: понять реальную задачу - составить план - искать источники - сравнивать и проверять - исправлять ошибки - писать отчет.

🧩 Цикл разбили на 4 базовых навыка:
• планирование
• поиск информации
• рефлексия и проверка
• написание отчета

Данные собирали из реальных отчетов, восстанавливая исходные вопросы и планы, а также из вопросов, связанных с базами знаний и документами.

⚙️ Обучение шло в 3 этапа:
1) сначала обучают базовым навыкам
2) затем учат полным цепочкам с инструментами
3) далее добавляют обучение через попытки и проверку, где чек-лист оценивает отчет и награда дается только за полностью пройденный результат

📌 Авторы также представили ADR-Bench, где эксперты сравнивают два отчета бок о бок, а рейтинг строится по системе Elo.

https://arxiv.org/pdf/2512.20491

Читать полностью…

Анализ данных (Data analysis)

💰 ИИ-лабы начали платить начинающим исследователям на уровне опытных инженеров - фактически «закрепляя» таланты ещё на старте.

Сегодня стажировки и junior-позиции в топ-лабораториях - это уже не подработк, а прямой вход в исследование: со стипендией и собственным бюджетом на эксперименты.

Примеры программ
- Anthropic - AI Safety Fellows
~ $3 850 в неделю + примерно $15 000 в месяц на вычисления.
По сути — стипендия плюс мини-грант на исследования.
Business Insider отмечает: 80% участников публикуют статьи — программа даёт результат.

- OpenAI Residency
~ $18 300 в месяц в течение 6 месяцев
формат как оплаченное обучение внутри фронтир-организации.


Если дать новичкам деньги + доступ к мощностям,
они начинают приносить ощутимый вклад почти сразу.

ИИ-карьера всё больше выглядит как полноценная научная работа с зарплатой и ресурсами - с самого старта.

businessinsider .com/top-paying-ai-internships-fellowships-residencies-openai-anthropic-meta-google-2025-12

Читать полностью…

Анализ данных (Data analysis)

🚀 MiniMax M2.1 - теперь open-source и один из лучших ИИ для разработчиков

— топ-результаты на кодинговых бенчмарках (SWE, VIBE, Multi-SWE)
— в ряде тестов обгоняет Gemini 3 Pro и Claude Sonnet 4.5
— MoE-архитектура: активны 10B параметров (230B всего)

И это не только цифры модель очень быста в инференсе и просто в деплоится, её можно запустить даже локально.

https://huggingface.co/MiniMaxAI/MiniMax-M2.1


@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🚀 FineTuningLLMs - понятный и честный разбор fine-tuning LLM

FineTuningLLMs - гайд который объясняет тонкую настройку языковых моделей без лишней теории.

Здесь показывают, как fine-tuning работает на самом деле, где он действительно нужен, а где его использование излишне.

Автор последовательно разбирает весь путь - от подготовки данных до оценки результата. Особое внимание уделено тому, как формат данных и инструкция влияют на поведение модели после обучения. Хорошо видно, почему плохой датасет нельзя «исправить» даже «хорошим» обучением.

Ее каждую задачу стоит решать дообучением, иногда промптинг или RAG дают тот же эффект быстрее и дешевле, а fine-tuning оправдан только там, где нужно устойчивое поведение модели.

Минимум магии, максимум практического смысла и здравого инженерного подхода.

https://github.com/dvgodoy/FineTuningLLMs/

Читать полностью…

Анализ данных (Data analysis)

🖥 NVIDIA открыла исходный код CUDA Tile dialect и байткода.

Компания выложила в open source проект CUDA Tile, который расширяет экосистему MLIR и даёт разработчикам новые инструменты для генерации CUDA-кода на более низком и контролируемом уровне.

Что входит в релиз:
- CUDA Tile MLIR dialect
- Поддержка сериализации и десериализации байткода
- Python-биндинги для MLIR, позволяющие программно строить IR
- Набор conformance-тестов

Что это даёт разработчикам:
- Возможность напрямую интегрировать CUDA Tile в свои проекты
- Генерацию CUDA Tile dialect или байткода нативно через MLIR
- Более тонкий контроль над вычислениями и оптимизациями под GPU

CUDA Tile - это шаг к более модульной, компиляторно-ориентированной экосистеме CUDA, где управление вычислениями смещается с ручного CUDA-кода в сторону формальных IR и автоматических оптимизаций.

Проект стал результатом совместной работы нескольких команд внутри NVIDIA и подчёркивает стратегию компании по развитию MLIR как ключевого слоя для будущих GPU-вычислений.

• NVIDIA Developer: https://developer.nvidia.com/cuda/tile
• CUDA Tile Specification: https://docs.nvidia.com/cuda/tile-ir/13.1/index.html

Читать полностью…

Анализ данных (Data analysis)

⚡️ CodeCut: автогенерация описаний для изображений прямо из PDF

Теперь можно конвертировать документ, пройтись по всем картинкам - и получить текстовые аннотации, которые модель создаёт автоматически.

Это удобно для:
- анализа больших отчетов, презентаций, научных статей
- автоматического извлечения подписей и описаний графиков
- подготовки данных для RAG/LLM-пайплайнов
- улучшения доступности контента

На примере: CodeCut извлекает изображение графика и сразу генерирует его описание — с упоминанием распределений, метрик, масштабов и ключевых наблюдений.

Минимальный код выглядит так:


from docling.document_converter import DocumentConverter

converter = DocumentConverter(...)
doc = converter.convert("report.pdf").document

for pic in doc.pictures:
print(pic.annotations[0].text)

Читать полностью…

Анализ данных (Data analysis)

MiniMax M2.1 официальный релиз 🚀

MiniMax M2.1 - это модель, созданная под реальные задачи разработки и AI-native команды. Подходит как для vibe-билдов и быстрых прототипов, так и для серьезных продакшен-воркфлоу.

Что важно
- SOTA open-source coding и agent модель
- 10B активных параметров
- Оптимизирована под агентные сценарии, инструменты и сложные пайплайны

Результаты в бенчмарках
- 72.5% на SWE-multilingual
- 88.6% на VIBE-bench - новом open-source бенчмарке
- Обходит ведущие закрытые модели, включая Gemini 3 Pro и Claude 4.5 Sonnet

- Open-source модель реально конкурирует с топовыми закрытыми решениями
- Сделана не только для чата, а для агентных систем и автоматизации
- Хорошо подходит для production-кодинга и AI-инфраструктуры

https://www.minimax.io/news/minimax-m21

Читать полностью…

Анализ данных (Data analysis)

Привет всем, в особенности тем, кто работает с медиапланированием ТВ-рекламы

Вы наверняка знаете, что ролики должны идти в конкретное время и с правильной частотой, чтобы их увидела нужная целевая аудитория. Мы в Авито понимаем, что это сложно, потому что сами регулярно занимаемся таким планированием. Но недавно мы собрали новый подход и решили о нём рассказать, чтобы вы тоже могли им воспользоваться.

Сняли новый фильм из цикла «Диванная аналитика», в котором Андрей Корнеев, аналитик в медиамаркетинге, простыми словами объясняет:
— Как измерить эффект от ТВ-рекламы.
— Почему наши старые методы работали неидеально.
— Как построить систему, которая сама подскажет, как лучше разместить рекламу.

Посмотрите, чтобы прокачать свой аналитический mindset:
🔼 YouTube
🔼 Rutube
🔼 VK Видео

Больше лайфхаков, кейсов, методик и вакансий — в нашем телеграм-канале «Коммуналка аналитиков». Подписывайтесь — будет полезно!

Читать полностью…

Анализ данных (Data analysis)

⚡️ Китайские учёные представили сверхбыстрый аналоговый чип до 1000× быстрее топовых цифровых процессоров.

Чип решает сложные математические задачи для ИИ и научных вычислений и в тестах обходит даже GPU NVIDIA.

Ключевая идея не ускорять цифру, а уйти от неё:
аналоговые вычисления позволяют считать напрямую, без дискретных шагов, что даёт резкий прирост скорости и энергоэффективности.

Это может изменить правила игры:
- ускорение обучения и инференса ИИ
- прорыв в научном моделировании
- новые архитектуры, выходящие за пределы GPU/TPU

Гонка вычислительных мощностей входит в следующую фазу.

Читать полностью…

Анализ данных (Data analysis)

🇨🇳 IQuest-Coder: Новая open-source модель для Кодинга, которая превосходит Claude Sonnet 4.5 и GPT-5.1 - и это модель всего 40B параметров.

На бенчмарках IQuest-Coder выглядит внушительно:

SWE-Bench Verified — 81.4%
BigCodeBench — 49.9%
LiveCodeBench v6 — 81.1%


Проект поддерживает хедж-фонд UBIQUANT, который уже много лет активно развивает ИИ
(команды AILab, DataLab, Waterdrop Lab).

Контекст до 128K токенов.

https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Instruct

Читать полностью…

Анализ данных (Data analysis)

🐳 DeepSeek начал новый год с серьёзной статьи.

В первый день года команда представила работу, посвящённую одной из самых болезненных проблем современных нейросетей: нестабильности обучения в сложных архитектурах.

И предложили решение: подход под названием mHC (Manifold-Constrained Hyper-Connections).

Смысл в том, что исследователи взяли мощную, но нестабильную архитектуру Hyper-Connections и ввели ограничения на внутренние связи.

1. Проекция на многообразие (manifold)
Вместо того, чтобы оставлять Hyper-Connections свободными, mHC накладывает на них ограничение, они проектируются на особое многообразие (матрицы с особыми свойствами).
Это восстанавливает identity-mapping, благодаря чему сигнал остаётся устойчивым даже через десятки или сотни слоёв.

2. Стабильность и масштабируемость
Благодаря этому ограничению сеть перестаёт «взрывать» или «затухать» сигнал при глубоком обучении, и её можно эффективно использовать в больших моделях без ухудшения качества и без сложных ухищрений.

3. Инфраструктурные оптимизации
Авторы также добавили инженерные улучшения:
- слияние ядер (kernel fusion)
- уменьшение накладных расходов по памяти
- эффекты смешанной точности
Это делает mHC быстрым и эффективным в реальных задачах даже при масштабных тренировках.

Результат впечатляет:

• обучение становится стабильнее на крупных масштабах
• модели лучше масштабируются
• повышается производительность
• снижается потребление памяти
• mHC обгоняет классические Hyper-Connections

Другими словами, DeepSeek показывает, что путь в будущее - не только большие модели, но и архитектуры, которые устойчивы изнутри.

#AI #DeepSeek #MachineLearning #NeuralNetworks #Research

https://arxiv.org/abs/2512.24880

https://www.youtube.com/watch?v=gT-0Qryi5KA

Читать полностью…

Анализ данных (Data analysis)

🎄🎄 Qwen-Image: обновление как раз к Новому году

Свежая версия Qwen-Image получила заметный апгрейд качества.

Модель стала генерировать намного реалистичнее и аккуратнее, особенно в сложных сценах.

Что изменилось:

• более естественные генерации людей, меньше «искусственного» эффекта
• детальнее лица и мимика
• улучшены натуральные текстуры: вода, шерсть, материалы, пейзажи
• намного аккуратнее текст на картинках: лучше верстка и точность в композиции

Модель прошла более 10 000 слепых сравнений на AI Arena и показала результат уровня топов среди open-source, оставаясь конкурентной даже рядом с закрытыми решениями.


Qwen Chat: https://chat.qwen.ai/?inputFeature=t2i
Hugging Face: https://huggingface.co/Qwen/Qwen-Image-2512
ModelScope: https://modelscope.ai/models/Qwen/Qwen-Image-2512
GitHub: https://github.com/QwenLM/Qwen-Image
Блог: https://qwen.ai/blog?id=qwen-image-2512
Демо HF: https://huggingface.co/spaces/Qwen/Qwen-Image-2512
Демо ModelScope: https://modelscope.cn/aigc/imageGeneration
API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=group-qwen-image-max

@ai_machinelearning_big_data

#qwen #qwenimage #openaimodels #imagemodels

Читать полностью…

Анализ данных (Data analysis)

🇨🇳 Китайские техногиганты устраивают охоту за ИИ-талантами

Крупные компании резко поднимают бонусы и зарплаты, чтобы никто не уходил к конкурентам.

ByteDance увеличивает бонусы на 35% и закладывает на пересмотр зарплат +150%. Вилки доходов расширяют по всем уровням - рынок перегревается.

Tencent активно переманивает специалистов: по сообщениям, отдельные оферы доходят до 2x от текущих зарплат. Плюс в компании появился новый главный AI-учёныйБ бывший исследователь OpenAI Яо Шунью.

Инженеры, которые умеют строить и поддерживать системы обучения и инференса LLM, на вес золота. Маленькая команда может тормозить целые продуктовые направления.

Внутри Tencent усиливают AI-инфраструктуру: распределённое обучение, масштабное развёртывание моделей, большие данные и ML-пайплайны.

И цифры это подтверждают: индекс новых вакансий по ИИ на платформе Maimai вырос на 543% за 2025 год.

Китай делает ставку на ИИ.


scmp.com/tech/tech-trends/article/3338168/chinas-tech-giants-offer-lavish-year-end-bonuses-amid-ai-talent-war

Читать полностью…

Анализ данных (Data analysis)

Южная Корея обвинила 10 человек, включая экс-топов Samsung, в утечке секретов DRAM в Китай 🏭🇰🇷➡️🇨🇳

Прокуратура утверждает, что группа передала Китаю производственные секреты Samsung по 10-нм DRAM, которые попали к ChangXin Memory Technologies (CXMT).


10-нм DRAM (Dynamic Random Access Memory) - это динамическая память с произвольным доступом следующего поколения, где «10 нм» указывает на технологический процесс уменьшения размеров транзисторов и ячеек памяти, позволяющий упаковать больше памяти на кристалл, повышая плотность и энергоэффективность.


DRAM производится через сотни строго упорядоченных шагов.

Небольшое отклонение - и хорошая пластина становится браком.

По версии следствия:

- сотрудник компании переписывал процесс вручную, обходя цифровой контроль
- заметки использовали, чтобы восстановить и адаптировать процесс под оборудование CXMT
- дело также затрагивает попытки получить технологии SK hynix через подрядчика

Сообщается, что 5 фигурантов арестованы, остальные проходят без задержания (обвинения по закону о защите промышленных технологий).

Ущерб Samsung оценивается в $7–13 млрд.

На создание такой памяти обычно уходят годы и приходится множество неудачных запусков.

news.yahoo.co.jp/articles/f2f6b69b1ba1395c51a0538a1b24328f776254de

Читать полностью…

Анализ данных (Data analysis)

⚡️ Эрик Шмидт (ex-CEO Google): «Всё, чему я учился годами: теперь делает ИИ»

Эрик Шмидт рассказал, что его молодость прошла за кодом: в 20 лет он писал программы днём и ночью: в колледже и аспирантуре и именно это построило его карьеру.

Сегодня всё иначе:

«Каждый из вас носит в кармане суперкомпьютер и суперпрограммиста.»


По словам Шмидта, теперь ИИ способен выполнять всё то, чему он учился годами.
Это не про «конец программирования», а про то, что правила игры меняются.

Выигрывать будут те, кто не сопротивляется, а учится работать вместе с ИИ, как с инструментом, который усиливает человека.

Читать полностью…

Анализ данных (Data analysis)

⚡️ Matrix Exponential Attention (MEA) - экспериментальный механизм внимания для трансформеров

MEA предлагает альтернативу классическому softmax-attention. Вместо нормализации через softmax используется матричная экспонента, что позволяет моделировать более сложные, высоко-порядковые взаимодействия между токенами.

Ключевая идея
Внимание формулируется как exp(QKᵀ), а вычисление экспоненты аппроксимируется через усечённый ряд. Это даёт возможность считать внимание линейно по длине последовательности, не создавая огромные n×n матрицы.

Что это даёт
- Более выразительное внимание по сравнению с softmax
- Higher-order взаимодействия между токенами
- Линейная сложность по памяти и времени
- Подходит для длинных контекстов и исследовательских архитектур

Проект находится на стыке Linear Attention и Higher-order Attention и носит исследовательский характер. Это не готовая замена стандартному attention, а попытка расширить его математическую форму.

Для ML-исследователей и инженеров, которые изучают новые формы внимания, альтернативы softmax и архитектуры для длинных последовательностей.

Экспериментально. Интересно. Не для продакшена - пока.

GitHub: github.com/yifanzhang-pro/MEA

Читать полностью…

Анализ данных (Data analysis)

Авито внедряет ИИ-помощников для покупателей и продавцов
На технологической платформе началось тестирование двух новых ИИ-ассистентов: Ави для покупателей и Ави Pro для продавцов. На текущем этапе они доступны только ограниченной группе пользователей.

Функционал помощников различается. Ави помогает покупателям: подбирает варианты по описанию, сравнивает товары, выделяет их сильные и слабые стороны, а также предлагает сопутствующие продукты, даже если запрос сформулирован нечетко. Ави Pro, в свою очередь, предназначен для продавцов и работает в их личных кабинетах. Этот ассистент анализирует статистику, отслеживает изменения и даёт рекомендации для повышения эффективности продаж.

Управляющий директор по искусственному интеллекту Авито Андрей Рыбинцев пояснил, что для компании диалоговый интерфейс представляет собой новый этап в развитии пользовательского опыта. По его словам, это решение сократит число действий для решения задач, повысит конверсию в успешные сделки и позволит платформе лучше понимать намерения клиентов.

Запуск ИИ-помощников является ответом компании на запросы рынка. Согласно внутренним исследованиям Авито, 59% пользователей заходят на платформу без четкой цели, при этом 43% уже готовы доверить выбор искусственному интеллекту. На дальнейшее развитие этих технологий в следующем году компания планирует направить около миллиарда рублей.

Читать полностью…

Анализ данных (Data analysis)

Маленькая модель - крутой результат: LFM2-2.6B-Exp набирает 42% на GPQA

Для модели всего 2,6 млрд параметров такой балл обычно недостижим его ждёшь от куда более крупных систем.

Фокус в том, что команда не меняла архитектуру.
Они просто добавили RL поверх того же чекпоинта: модель генерирует ответы, получает оценку по задаче и обучается чаще выдавать выигрышные варианты.

Почему это важно
GPQA - жёсткий набор по научным вопросам, где «угадывание по шаблону» не работает.

Что внутри LFM2-2.6B
• гибрид: 22 слоя + 8 слоёв внимания
• контекст — до 32 768 токенов
• веса в bfloat16

⚡ грамотный дизайн наград + RL способны сильно поднять качество даже у маленьких моделей — без усложнения архитектуры.

https://huggingface.co/LiquidAI/LFM2-2.6B-Exp

Читать полностью…

Анализ данных (Data analysis)

🎄 К Новому году Yandex Cloud и Forbes подготовили особый подарок для CDO, дата-инженеров и аналитиков! Что, если работа с данными превратится в увлекательную игру во вселенной, вдохновленной классикой — «Героями меча и магии»? ⚔️📊

Игра превращает привычные инструменты обработки данных (PostgreSQL, ClickHouse, Trino, DataLens и другие) в могущественные артефакты. Их можно получить у хранителей или создать самому в кибер-кузнице 🔧✨

В проекте можно найти пасхалки на любимую игру и примеры бизнес-сценариев из финтеха, ритейла и промышленности: помогите персонажам побороть дата-хаос и прокачать навыки работы с данными. Игра доступна на десктопе и телефоне 📱💻

На лендинге также собраны проекты компаний, которые уже используют возможности Yandex Cloud для решения бизнес-задач с данными.

Поиграй и вдохновись работой с данными в новом формате!
👉 Играй и узнай больше

Читать полностью…

Анализ данных (Data analysis)

Развернуть PostgreSQL в MWS Cloud Platform ⬜️ — быстрее, чем вспомнить пароль от pgAdmin. И точно быстрее, чем объяснить DevOps'у, зачем ещё одна база.

Всего несколько минут и у вас:

⏺️готовая база на сетевых или локальных дисках
⏺️постоянный primary endpoint
⏺️безопасное подключение через Private Link
⏺️автоматические бэкапы и обслуживания по твоему расписанию


🎄🎁 И грант до 10 000 ₽ на запуск — чтобы точно не пришлось вспоминать, как настраивать failover вручную.

➡️Развернуть кластер

Читать полностью…

Анализ данных (Data analysis)

🚀 28 готовых AI-проектов, которые можно реально использовать в проде или для портфолио.

Что внутри:

Проекты машинного обучения
→ Прогноз цен на жилье (Airbnb price prediction)
→ Калькулятор стоимости авиабилетов
→ Трекер успеваемости студентов

AI для здравоохранения
→ Обнаружение заболеваний грудной клетки
→ Прогноз сердечных заболеваний
→ Анализатор риска диабета

Генеративные AI-приложения
→ Живой чатбот на базе Gemini
→ Рабочий медицинский ассистент
→ Инструмент анализа документов

Проекты Computer Vision
→ Система отслеживания руки
→ Приложение для распознавания медикаментов
→ Реализации на OpenCV

Дашборды для анализа данных
→ E-commerce insights
→ Аналитика ресторанов
→ Трекер производительности игроков в крикете

И 10 продвинутых проектов, которые скоро появятся:
→ Детекция дипфейков
→ Классификация опухолей мозга
→ Система оповещения о сонливости водителя

Это не просто файлы с кодом.
Это end-to-end, рабочие приложения, которые можно запускать, тестировать и использовать.

💻 Репозиторий: https://github.com/KalyanM45/AI-Project-Gallery

Читать полностью…

Анализ данных (Data analysis)

✔️ Acontext- контекст как инфраструктура для AI-приложений

Acontext - это open-source проект, который решает одну из самых болезненных проблем AI-систем: управление контекстом, памятью и состоянием между запросами.

Проект создан командой MemoDB и нацелен на разработчиков, которые строят:
- LLM-приложения
- агентные системы
- RAG-пайплайны
- long-running AI-процессы

Что делает Acontext:

- Выносит контекст из prompt’ов в отдельный слой
- Даёт структурированную «память» вместо хаотичного текста
- Позволяет хранить, обновлять и переиспользовать контекст между вызовами модели
- Упрощает построение stateful AI-приложений
- Снижает токен-оверход и стоимость inference

Ключевая идея:
контекст — это не строка, а управляемый объект.

Почему это важно:
- prompt’ы перестают разрастаться
- поведение модели становится стабильнее
- проще отлаживать и масштабировать систему
- легче добавлять новые источники знаний

Acontext особенно полезен для:
- AI-агентов
- чатов с памятью
- multi-step reasoning
- инструментальных LLM-пайплайнов

Если ты строишь что-то сложнее одного запроса к модели — без слоя управления контекстом дальше будет только боль.

Репозиторий:
https://github.com/memodb-io/Acontext

Читать полностью…

Анализ данных (Data analysis)

⚡️ Итоги 2025 в Machine Learning: фиксация ключевых сдвигов индустрии

24 декабря в Telegram канале South HUB состоится онлайн-дискуссия, посвящённая анализу ключевых технологических, продуктовых и управленческих событий 2025 года в машинном обучении. Участники обсудят, какие решения и подходы действительно повлияли на практику ML и data-проектов, а также с какими выводами и ожиданиями индустрия заходит в 2026 год.

В дискуссии участвуют члены программного комитета Snow BASE:
Александр Толмачёв, Chief Data Officer, ex-Ozon — ML и измеримость бизнес-эффекта
Андрей Венжега, Head of Search & Recommendations, Avito — поиск и рекомендательные системы
Павел Пархоменко, руководитель ML, AI и логистических сервисов, Яндекс.Лавка — масштабирование ML в логистике
Андрей Кузнецов, Head of ML, Positive Technologies — устойчивость ML-систем в продакшене

🗓 24 декабря, 13:00–14:00 (МСК)
📍 Telegram канал South HUB

Читать полностью…

Анализ данных (Data analysis)

⚡️ Anthropic выпустили BLOOM - одно из самых важных исследований про безопасность ИИ за последнее время.

Если коротко:
BLOOM это попытка встроить безопасность и контроль в саму основу ИИ, а не латать проблемы постфактум.

Вот суть простыми словами.

1) Безопасность не фильтр, а часть архитектуры

Сегодня безопасность ИИ часто выглядит так:
- модель обучили
- потом добавили ограничения и фильтры

Anthropic говорит прямо:
так не работает в долгую.

В BLOOM безопасность должна:
- закладываться на этапе обучения
- быть частью внутренней структуры модели
- масштабироваться вместе с ростом возможностей ИИ

2) Надёжность важнее «умных ответов»

Модель должна:
- не только отвечать
- но и понимать, когда она не уверена
- уметь корректно отказывать
- не галлюцинировать в критических ситуациях

Проще говоря:
лучше честное «я не знаю», чем уверенная ошибка.

3) Контроль остаётся у людей

BLOOM подчёркивает:
- пользователи должны понимать, как ИИ принимает решения
- должно быть ясно, где проходят границы ответственности
- контроль и управление не опция, а обязательное требование

ИИ не должен быть «чёрным ящиком», который невозможно остановить или скорректировать.

4) Оценка рисков должна происходить системно, а не реактивно


Anthropic предлагает смотреть на риски ИИ:
- заранее
- на нескольких уровнях сразу
- техническом
- социальном
- экономическом

Не «исправлять, когда что-то сломалось»,
а предсказывать, где и почему может сломаться.

BLOOM - это не про очередную модель и не про рост бенчмарков. Это про смену подхода:
- от «быстрее и мощнее»
- к «надёжнее, предсказуемее и управляемее»

Главная мысль:
если ИИ становится мощнее человека, безопасность должна расти быстрее, чем его интеллект.

И именно этим Anthropic предлагает заниматься уже сейчас.

https://www.anthropic.com/research/bloom

Читать полностью…
Subscribe to a channel