data_analysis_ml | Unsorted

Telegram-канал data_analysis_ml - Анализ данных (Data analysis)

48228

Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚

Subscribe to a channel

Анализ данных (Data analysis)

📈 Пост, который вирусится на Reddit:

Пользователь дал ChatGPT $100 и поручил вести портфель из американских микрокапов.

🤖 Через 4 недели — +23.8%
Для сравнения:
▪️ Russell 2000: ~+3.9%
▪️ XBI (биотех ETF): ~+3.5%

🧠 Всё управление — через промпты и скрипты с GitHub.
LLM против рынка… и, похоже, пока выигрывает?

⚠️ Конечно, это пока:
— короткий период
— очень маленькая выборка
— высокая волатильность микрокапов

Вот его промпт -

“ You are a professional-grade portfolio strategist. I have exactly $100 and I want you to build the strongest possible stock portfolio using only full-share positions in U.S.-listed micro-cap stocks (market cap under $300M). Your objective is to generate maximum return from today (6-27-25) to 6 months from now (12-27-25). This is your timeframe, you may not make any decisions after the end date. Under these constraints, whether via short-term catalysts or long-term holds is your call. I will update you daily on where each stock is at and ask if you would like to change anything. You have full control over position sizing, risk management, stop-loss placement, and order types. You may concentrate or diversify at will. Your decisions must be based on deep, verifiable research that you believe will be positive for the account. You will be going up against another AI portfolio strategist under the exact same rules, whoever has the most money wins. Now, use deep research and create your portfolio.”


Нужен глубокий анализ: Sharpe, волатильность, бэктесты.
Но вопрос остаётся открытым — может ли LLM *действительно* обыгрывать рынок?

🔗 GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

✔️ Higgs Audio: открытая платформа для обучения и экспериментов с аудио-LLM

Higgs Audio от boson-ai — репозиторий для исследователей и разработчиков, которые хотят быстро собирать, обучать и тестировать аудио-модели: распознавание речи, аудио-вопрос-ответ, мультимодальные voice-агенты и кастомные эксперименты с эмбеддингами.

Ключевые идеи
• Единый каркас: структура проекта упрощает работу с датасетами, препроцессингом и запуском тренинга.
• Гибкие конфиги: переключайте модели, размеры батча, аугментации и стратегии оптимизации через настраиваемые YAML/JSON-параметры.
• Модульные блоки: энкодеры, декодеры, адаптеры подсказок (prompts) и head’ы задач можно комбинировать без переписывания ядра.
• Быстрый старт: готовые скрипты для подготовки данных и запуска обучения на одной или нескольких GPU-нодах.
• Экспериментальный playground: удобно пробовать fine-tune под вашу доменную акустику (подкасты, звонки, стримы, шумные датасеты).

Типовые сценарии использования
1. Обучить небольшую модель распознавания речи на своём корпусе.
2. Создать voice-бота: аудио-ввод → текст → LLM → аудио-ответ.
3. Тонкая настройка эмбеддинг-модели для поиска по звуку (похожие сигналы, музыкальные фрагменты, события).
4. Исследования zero-shot / few-shot адаптации аудио-моделей под новые языки или акценты.

https://github.com/boson-ai/higgs-audio

Читать полностью…

Анализ данных (Data analysis)

I let the cursor cook, now I am cooked.

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

 Архив, который не требует обслуживания

ЭЛАРобот НСМ — долгосрочное хранение на оптических носителях. Решение, которое уже сегодня исключает из повестки:

— замену накопителей
— регулярную миграцию данных
— риски утери и компрометации данных
— избыточную инфраструктуру под "архив"

 Факты для расчёта:
Срок хранения — 50+ лет
100% защита от перезаписи
• 0 затрат на апгрейды и плановую замену носителей
• ИИ для “умного” копирования данных
• Отечественное производство
📉 HDD и SSD — постоянные вложения.
📈 ЭЛАРобот НСМ — актив с фиксированной стоимостью и предсказуемой нагрузкой.

 Решение уже доказало свою эффективность в задачах долговременного хранения в корпоративных и государственных системах.

👉  Запросить бесплатный расчет 

Читать полностью…

Анализ данных (Data analysis)

🌟 GLM-4.5 и GLM-4.5-Air: релиз гибридных моделей, заточенных под агентные задачи.

В новом семействе GLM, Z.AI объединили в одной модели возможности для рассуждений, кодинга и агентных сценариев. Семейство построено на архитектуре MoE и может работать в двух режимах: thinking mode для сложных задач с использованием инструментов и non-thinking mode для быстрых ответов.

🟡В релиз вошли:

🟢GLM-4.5 с 355 млрд. общих параметров (32 млрд активных) и ее облегченная версия;

🟠GLM-4.5-Air, облегченная версия со 106 млрд. общих параметров (12 млрд активных).

Интересно, что разработчики пошли по пути увеличения глубины модели (количества слоев), а не ширины (скрытого измерения), так как обнаружили, что модели с большим количеством слоев лучше справляются с рассуждениями.

🟡 Для эффективного RL таких крупных моделей был разработан и открыт собственный фреймворк slime.

Он поддерживает как синхронное, так и асинхронное обучение, что критически важно для агентных задач. Его инфраструктура полностью разделяет движки для роллаутов (сбора опыта) и движки для обучения, которые могут работать на разном железе.

🟡Главный акцент GLM-4.5 - агентные возможности.

Для их оценки использовались 3 бенчмарка. На TAU-bench модель GLM-4.5 показала результат в 70.1 балла, что практически идентично Claude 4 Sonnet (70.3) и заметно лучше, чем у o3 (61.2).

На бенчмарке для вызова функций Berkeley Function Calling Leaderboard v3 результат составил 77.8, снова опережая Claude 4 Sonnet с ее 75.2 баллами.

Но самый показательный результат был на BrowseComp, сложном тесте для веб-браузинга. В нем GLM-4.5 набрала 26.4, что выше, чем у Claude-4-Opus (18.8) и почти как у o4-mini-high (28.3).

Что касается классических задач на рассуждения, здесь модели показывают уверенные, хотя и не рекордные, результаты.

На MMLU Pro у GLM-4.5 84.6 балла, чуть меньше, чем у Claude 4 Opus (87.3) и Grok 4 (86.6).

В математическом тесте AIME24 модель набрала 91.0, ближайшие лидеры Qwen3 и Grok 4 - 94.1 и 94.3 соответственно.

На GPQA разрыв побольше: 79.1 у GLM-4.5 против 87.7 у Grok 4, а на сложном тесте по научной литературе HLE модель получила 14.4 балла, уступив Gemini 2.5 Pro (21.1) и Grok 4 (23.9).

В задачах, связанных с кодом, на тесте SWE-bench Verified модель набрала 64.2 балла, немного уступая Claude 4 Sonnet (70.4) и o3 (69.1), но опережая многие другие.

А вот в агентном кодинге, который оценивался людьми с помощью Claude Code, картина иная. В прямом сравнении GLM-4.5 выигрывает у Kimi K2 в 53.9% случаев и обходит Qwen3-Coder с винрейтом 80.8%.

Самый важный показатель - успешность вызова инструментов, где GLM-4.5 достигла 90.6%, опередив Claude-4-Sonnet (89.5%) и Kimi-K2 (86.2%).


📌Лицензирование: MIT License.


🟡Страница проекта
🟡Набор моделей
🟡Demo
🟡Сообщество в Discord
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #GLM #MoE #ZAI

Читать полностью…

Анализ данных (Data analysis)

🚨 GLM‑4.5 и GLM‑4.5‑Air от Zai_org — открытые MoE‑модели, способные тягаться с Claude 4 Opus и обгоняющие Gemini 2.5 Pro.

🔹 GLM‑4.5: 355B параметров (32B активных)
🔹 GLM‑4.5‑Air: 106B параметров (12B активных)
🔹 Поддержка *128K контекста* + *function calling*
🔹 Два режима работы:
🧠 «Thinking mode» — для сложных задач
⚡ «Non-thinking mode» — для мгновенных ответов

📊 Бенчмарки:
– AIME24: 91.0 (vs. Claude Opus — 75.7)
– MATH 500: 98.2 (vs. GPT‑4.1 — 96.7)
– GPQA: 79.1 (vs. Gemini 2.5 Pro — 84.4)
– SWE‑bench: 64.2 (vs. Claude Sonnet — 70.4)
– Terminal‑Bench: 37.5 (vs. Claude Opus — 43.2)

🧬 Архитектура:
– MoE с балансирующим роутингом без потерь
– Больше слоёв, меньше экспертов → глубже и «умнее»
– GQA с Partial RoPE и 96 голов внимания
– Обучена на 15T общих + 7T кода и reasoning‑токенов

MIT‑лицензия 🔥

🟢 Модель: https://huggingface.co/zai-org/GLM-4.5
🟢 Попробовать: https://chat.z.ai/


@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🎨 Встречайте Neta Lumina — самую продвинутую open-source модель для генерации аниме-артов!

Это уже 4-я модель в линейке, и она впечатляет:

🔹 Точная настройка под 200+ аниме-стилей: от Guofeng и Furry до пейзажей и редких тем
🔹 Хорошая согласованность промптов, даже при длинных описаниях на естественном языке
🔹 Мультиязычная поддержка

🔥 Идеальный выбор для художников, аниматоров и фанатов генеративного арта.

🔹 Model on Hugging Face (Commercial use allowed):https://huggingface.co/neta-art/Neta-Lumina
🔹 Playground (Free to test):https://huggingface.co/spaces/neta-art/NetaLumina_T2I_Playground
⚙️ Supports ComfyUI, LoRA tutorial https://docs.google.com/document/d/1fSp8wgraQeeaM58DVbnFoRULyyhPvt3MgY0Qja0Otc0/edit?tab=t.0

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

✔️ Быстрый LoRA-инференс для моделей Flux с Diffusers и PEFT

LoRA-модули давно стали стандартом для кастомизации моделей генерации изображений. Но большинство гайдов не показывают, как эффективно запускать *LoRA-инференс* в проде.

Новая статья от команды HuggingFace раскрывает, как добиться ускорения LoRA-инференса на моделях семейства *Flux*.

⚡ Что в рецепте оптимизации:
1. torch.compile() — ускорение инференса на уровне графа
2. *Flash Attention 3* — если модель поддерживает
3. Динамическая *FP8-квантизация весов* — если совместимо с GPU
4. *Hotswapping LoRA* — смена адаптеров без полной перекомпиляции 🤯

📊 Тестировали на:
— Flux.1-Dev
— NVIDIA H100 и RTX 4090
— Ускорение минимум в 2 раза

Подход в целом применим и к AMD‑GPU.

🔗 Читайте статью и смотрите код:
https://huggingface.co/blog/lora-fast

Читать полностью…

Анализ данных (Data analysis)

🎥 Pusa 1.0 — простой и быстрый способ превращать картинки в видео

Это новая модель на основе Wan2.1-T2V-14B, специально обученная для задач image-to-video. По сравнению с предыдущей версией (Wan-I2V-14B), она показывает заметные улучшения:

– Обучение обошлось всего в $500 (в 200 раз дешевле)
– Генерация видео работает в 5 раз быстрее
– Поддерживает задание начального и конечного кадра, продление видео и его «достраивание»

Модель получилась компактной, дешёвой в обучении и удобной для реального использования.

📌 Идеально подойдёт для визуальных историй, коротких видео и экспериментов с генерацией.

🟢project page: https://yaofang-liu.github.io/Pusa_Web/
🟢code: https://github.com/Yaofang-Liu/Pusa-VidGentd
🟢 model: https://huggingface.co/RaphaelLiu/PusaV1

Читать полностью…

Анализ данных (Data analysis)

🤖 Mcp-telegram* — Telegram-клиент для AI-агентов

Этот проект позволяет подключить LLM-агента к Telegram через простую оболочку. По сути, это каркас, который превращает любую LLM (через API) в полноценного Telegram-бота.

🧩 Особенности:
— Поддержка OpenAI API (можно подключить GPT-4, GPT-3.5 и др.)
— Хранение диалогов в SQLite
— История чатов и контекст сохраняются между сообщениями
— Обработка команд и markdown-разметки
— Поддержка нескольких пользователей (по Telegram ID)

📦 Используется:
— Python
python-telegram-bot
openai
sqlite3

👨‍💻 Подходит для:
— Быстрого запуска собственного GPT-бота в Telegram
— MVP-прототипов
— Экспериментов с интерфейсами тг

uv tool install mcp-telegram

🔗 GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

📊 Argilla — инструмент для создания качественных датасетов под AI. Проект помогает разработчикам и экспертам совместно работать над разметкой данных для NLP, LLM и мультимодальных моделей.

Платформа предлагает удобный интерфейс для аннотирования с фильтрами, семантическим поиском и AI-подсказками. Argilla используют в Red Cross и других организациях для задач классификации, RAG и тонкой настройки моделей.

🤖 GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🔮 SuperDuperDB — фреймворк для создания AI-приложений, напрямую интегрированных с базами данных. Позволяет развертывать модели машинного обучения и векторные поиски прямо в MongoDB, SQL, Snowflake или Redis, избегая сложных ETL-процессов.

Вместо выгрузки данных в отдельные ML-пайплайны, вы добавляете AI-функциональность поверх существующей БД через простые Python-декораторы. Поддерживает популярные библиотеки вроде PyTorch и Hugging Face, что упрощает переход от прототипа к продакшену.

🤖 GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🤖 Сооснователь Anthropic Бен Манн:

🧠 «Вероятность того, что суперинтеллект появится в ближайшие годы — около 50%.
И это не просто спекуляция — за этим стоят данные, законы масштабирования и чёткие научные тренды».

Он подчёркивает: даже если технический прорыв случится быстро,
его влияние на общество может проявиться с задержкой — через годы.

📌 Вопрос уже не в том, "если", а "как скоро" — и что мы с этим сделаем.

Читать полностью…

Анализ данных (Data analysis)

✔️ OpenAI анонсировала дату проведения DevDay.

OpenAI объявила, что ее следующая конференция для разработчиков, DevDay, состоится 6 октября 2025 года в Сан-Франциско. На мероприятии выступят Сэм Альтман и Грэг Брокман. DevDay традиционно становится площадкой для главных анонсов OpenAI, и в этом году разработчикам обещают ранний доступ к информации о будущих продуктах и технологиях.

Конференция планирует собрать более 1500 разработчиков. Регистрация на очное участие открыта в формате подачи заявок до 30 июля, а приглашения будут разосланы в середине августа. Стоимость участия составит 650 долларов. Для тех, кто не сможет присутствовать лично, будет организована прямая трансляция основной части мероприятия, а записи остальных сессий опубликуют позже.
openai.com

✔️ Proton представила Lumo: защищенный чат-бот с фокусом на приватность.

Швейцарская компания Proton, известная своим одноименным почтовым сервисом, выпустила автономного ИИ-ассистента Lumo. Чат-бот позиционируется как безопасная альтернатива продуктам от крупных технологических корпораций.

Lumo умеет обобщать документы, писать код, составлять черновики писем и отвечать на веб-запросы. Сервис работает исключительно на открытых языковых моделях, размещенных в собственных дата-центрах Proton в Европе. Вся переписка защищена сквозным шифрованием с "нулевым доступом", что не позволяет самой компании или третьим лицам читать и хранить сообщения.

Попробовать Lumo можно без регистрации через веб-клиент или мобильные приложения, но с ограничениями. Платная подписка Lumo Plus за $12.99 в месяц снимает лимиты на общение и позволяет загружать файлы большего размера.
proton.me

✔️ Google DeepMind Aeneas: открытая ИИ-система для восстановления латинских надписей.

Google DeepMind выпустила Aeneas, опенсорсный инструмент на базе ИИ, предназначенный для помощи историкам в работе с фрагментарными древними надписями. Система анализирует неполные транскрипции и изображения, после чего определяет вероятное место и дату происхождения текста, предлагает варианты недостающих слов и находит аналоги в корпусе известных надписей.

Модель, обученная на 200 000 каталогизированных текстов, является развитием более ранней системы Ithaca для греческого языка. В исследовании, опубликованном в Nature, Aeneas улучшил генерацию научных гипотез в 90% случаев, а его оценки происхождения и датировки совпали с консенсусом ученых.

Aeneas доступна бесплатно для ученых, преподавателей и сотрудников музеев.
theguardian.com

✔️ AWS закрывает свою ИИ-лабораторию в Шанхае.

Amazon Web Services объявила о закрытии своей исследовательской ИИ-лаборатории в Шанхае. В компании это решение назвали трудным, оно завершает семилетнюю историю работы центра, который занимался передовыми разработками в области машинного обучения. По словам одного из научных сотрудников, подразделение расформировывают из-за "стратегических корректировок на фоне напряженности между США и Китаем".

Лаборатория, открытая в 2018 году, была весьма продуктивной: на ее счету более 100 научных публикаций и создание популярной open-source библиотеки Deep Graph Library. В лучшие времена в ней работало более 1000 человек.
ft.com

✔️ Компания Марка Цукерберга разработала нейромоторный браслет, работающий без персональной калибровки.

Устройство, разработанное в Reality Labs представляет собой браслет, который считывает электрическую активность мышц предплечья (sEMG), напрямую декодируя двигательные намерения пользователя.

Главное достижение - разработка универсальной модели, обученной на данных тысяч людей. В отличие от аналогов, требующих длительной настройки под каждого человека, эта система работает из коробки, без предварительной калибровки под новых пользователей.

В тестах интерфейс продемонстрировал распознавание рукописного ввода со скоростью почти 21 слово в минуту, точное определение дискретных жестов (щипки, свайпы) и плавное управление курсором. При этом короткая персональная донастройка на данных конкретного пользователя может повысить точность еще на 16%.
nature.com

@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Анализ данных (Data analysis)

🚀 Новинка: Code Sandbox MCP — простой интерпретатор кода для ИИ-агентов

Теперь ты можешь запускать код прямо из LLM (например, Gemini) в локальной изолированной среде, которую полностью контролируешь.

🛠 Как работает:
1. Запускается контейнер (Docker или Podman)
2. Код сохраняется во временный файл
3. Файл копируется внутрь контейнера
4. Выполняется (Python, JS и др.)
5. Вывод и ошибки считываются
6. Всё возвращается клиенту
7. Контейнер удаляется

🔗 Примеры и исходники — в блоге и на GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🚨 Anthropic близка к новому раунду инвестиций: от $3 до $5 миллиардов 💸
Оценка компании — $170 миллиардов 🤯

Anthropic - разработчик Claude, одного из самых продвинутых LLM на рынке.

И, похоже, ставки становятся всё выше и выше...

📈 Гонка за AGI продолжается.

Читать полностью…

Анализ данных (Data analysis)

Российские эксперты по ИИ выступили на WAIC 2025 в Шанхае

С 26 по 29 июля в Шанхае проходит World Artificial Intelligence Conference (WAIC) — одна из крупнейших мировых конференций по искусственному интеллекту.
В этом году в программе впервые прошли сессии с участием российских учёных:
🔹 AI Journey — с докладами выступили представители науки и эксперты из России и Китая: Андрей Белевцев (Сбер), Максим Ерёменко (Сбер), Иван Оселедец (AIRI), Ю Кай (профессор университета Цзяотун) и другие.
🔹 AI Horizons — международная научная форсайт-сессия, организованная AI Alliance Network с участием российских и китайских AI-экспертов.

На выставочном стенде AI Journey × AI Alliance Network были представлены новейшие российские разработки в области GenAI, включая GigaChat, Kandinsky, SymFormer.
➡️ Подробнее — по ссылке.

Читать полностью…

Анализ данных (Data analysis)

📊 Metabase Learn — лучший старт для изучения аналитики и дашбордов

🔥 Официальный обучающий портал от Metabase: от первых шагов до продвинутых сценариев с embedding и администрированием.

Что внутри:
✅ Подключение БД и создание запросов без кода
✅ Визуализация данных, фильтры, метрики, дашборды
✅ SQL-гайды, объединение данных, отладка
✅ Встраивание аналитики в свои продукты через SDK
✅ Управление пользователями и масштабирование
✅ Бонус: советы по аналитике для команд и стартапов

https://github.com/metabase/metabase

Читать полностью…

Анализ данных (Data analysis)

🏅 Gemini 2.5 Pro на уровне золотой медали IMO 2025

Исследователи из UCLA показали, что открытая модель Gemini 2.5 Pro от Google способна решить 5 из 6 задач Международной математической олимпиады 2025 — это соответствует золотой медали среди участников‑людей.

📌 Как это сделали:
— Использовали уже опубликованные задачи IMO 2025
— Дали минимальные подсказки (например: “попробуем решить через индукцию”) только для первых 2 задач
— Построили итеративный цикл: генерация → критика → исправление, имитируя то, как думают и переписывают доказательства настоящие математики

🤖 Модель сначала генерирует черновики решений, затем сама их перечитывает, указывает на слабые места и переписывает до финального варианта.

⚠️ Модель не участвовала официально в IMO. Это эксперимент, показывающий, насколько далеко уже ушёл reasoning у LLM.

📎 Статья независимая, авторы — не из Google.

https://github.com/lyang36/IMO25/blob/main/code/agent.py

Читать полностью…

Анализ данных (Data analysis)

E-CUP возвращается. Реальные данные. Масштабные проекты. Большие призы

Решайте ML-задачи в стиле Ozon Tech и узнайте, как работают ML-инженеры в e-com бигтехе. Девять победителей разделят призовой фонд — 7 200 000 рублей 🔥

🗓 Регистрация: https://cnrlink.com/ecup25da
💻 Формат участия: онлайн
👥 Команда: от 1 до 5 человек
🎯 Для кого: Data Scientists, ML-специалисты, аналитики данных, дата-инженеры, специалисты Big Data и разработчики, которые интересуются ML/DS.

Что вас ждёт:
🔹 Работа над проектом для миллионов пользователей на основе данных от ведущего e-com в России.
🔹 Обмен опытом с экспертами Ozon Tech.
🔹 Питчинг — 13 сентября на конференции E-CODE. Ozon Tech предоставит финалистам билеты и оплатит поездку.

Каждый трек E-CUP — реальная e-com задача, как в настоящей продуктовой ML-команде.
1️⃣ Рекомендации: предсказание следующей покупки пользователя
2️⃣ Логистика: автопланирование курьеров
3️⃣ Контроль качества: автоматическое выявление поддельных товаров

Регистрация на платформе Codenrock: https://cnrlink.com/ecup25da

Читать полностью…

Анализ данных (Data analysis)

Хочешь знать, что происходит внутри ИТ крупного банка?

Команда ПСБ рассказывает о работе и жизни в блоке ИТ!
 
🔹 Знакомься с командой, их проектами и хобби
🔹 Участвуй в активностях: митапы, конференции, спорт
🔹 Читай и комментируй экспертные статьи
 
Подписывайся на канал  ИТ ПСБ !

Читать полностью…

Анализ данных (Data analysis)

📚Знакомство с Pandas на примере разведочного анализа данных

В проектах данные редко бывают идеальными: пропуски, дубликаты и аномалии могут искажать результаты анализа и снижать качество ML-моделей.

👩🏻‍💻 Программа вебинара:
- Обработка пропусков
- Удаление дубликатов
- Поиск аномалий
- Причины появления аномалий и способы их обработки

🎓 Вебинар буде полезен:
-  начинающим специалистам в области DS
- тем кто работает с данными в электронных таблицах и хочет повысить объемы и скорость обработки данных

➡️ Ссылка для регистрации: https://tglink.io/33c047e23823?erid=2W5zFGdPEzt

💡 Урок проходит в рамках старта курса «Специализация Machine Learning» от Otus, где за 11 месяцев студенты проходят обучение с нуля до middle. Оставьте заявку на курс прямо сейчас, чтобы воспользоваться 10% скидкой на курс + 5% промокодом MachLearn_5 и учиться весь год по летним ценам! Условия актуальны до 31.07.2025г.

#реклама
О рекламодателе

Читать полностью…

Анализ данных (Data analysis)

🚀 GSPO: Group Sequence Policy Optimization — новый прорыв в RL-обучении больших языковых моделей!

Что делает GSPO особенным:

🔹 Последовательностная оптимизация (sequence-level RL), строго согласованная с функцией награды
🔹 Высочайшая стабильность — даже на больших MoE-моделях, без коллапса
🔹 Без костылей вроде Routing Replay — обучение стало проще и чище
🔹 Легко масштабируется: больше вычислений = лучше результат ✅

🔥 Используется в новых Qwen3 (Instruct, Coder, Thinking)
📉 Дает более чистые градиенты, быструю сходимость и меньшие требования к инфраструктуре по сравнению с GRPO

🧠 GSPO = стабильно, масштабируемо, идеально для продакшна.

📄 Статья: https://huggingface.co/papers/2507.18071

Читать полностью…

Анализ данных (Data analysis)

⚡️ Почему лучшие разработчики всегда на шаг впереди?

Потому что они знают, где брать настоящие инсайд!
Оставь “программирование в вакууме” в прошлом, выбирай свой стек — подпишись и погружайся в поток идей, лайфхаков и знаний, которые не найдёшь в открытом доступе.

ИИ: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Базы данных: t.me/sqlhub
Мл собес t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/devops_teleg
Хакинг: t.me/linuxkalii
МЛ: t.me/machinelearning_ru
Data Science: t.me/datascienceiot
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/java_library
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: /channel/gamedev
Физика: t.me/fizmat
SQL: t.me/databases_tg

Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: /channel/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: /channel/addlist/mzMMG3RPZhY2M2Iy

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🖥 Chatgpt для кода в тг: @Chatgpturbobot -

📕Ит-книги: /channel/addlist/BkskQciUW_FhNjEy
💼ИТ-вакансии t.me/addlist/_zyy_jQ_QUsyM2Vi

Подпишись, чтобы всегда знать, куда двигаться дальше!

Читать полностью…

Анализ данных (Data analysis)

✔️ Новый крутой выпуск 3Blue1Brown о диффузионных моделях!

Популярный ютубер (совместно с Welch Labs) простыми словами и красивой анимацией объяснил, как работают генераторы изображений и видео.

▪ 40 минут — от основ до тонкостей
▪ Для новичков + русские субтитры

P.S. Отличный вариант для первого знакомства с технологией и анимация на канале вышла реально на новый уровень!

🟠 Смотрим: тут
🟠 Смотрим в телеграм

@data_analysis_ml

#ИИ #ДиффузионныеМодели #МашинноеОбучение

Читать полностью…

Анализ данных (Data analysis)

Андрей Рыбинцев из Авито стал управляющим директором по ИИ

Также в компании будет сформирован новый кластер AI Experience. В этой роли вместе с командой из 900 специалистов он будет работать над развитием ассистентов на базе генеративных моделей, внедрение агентского ИИ и интеграцию ML в бизнес-процессы. Эти структурные изменения — сигнал, что компания настроена серьезно качнуть ИИ-направление.

За 10 лет в компании Рыбинцев курировал ключевые технологии: антифрод, автоматическую модерацию, IMV, A-Vibe, A-Vision. Сейчас фокус — системное масштабирование.

Читать полностью…

Анализ данных (Data analysis)

🚀 Команда Qwen только что представила новую модель: Qwen3‑235B‑A22B‑Thinking‑2507, нацеленную на глубокие рассуждения.

За последние 3 месяца модель была масштабирована и доработана специально для задач логики, математики, науки и программирования. Среди ключевых улучшений:

✅ Улучшенные способности к рассуждению, решению задач и анализу
✅ Повышенная точность в следовании инструкциям и использовании инструментов
✅ Поддержка нативного 256K контекста — для полноценной работы с длинными цепочками мыслей

🧠 Модель изначально работает в режиме reasoning — включать ничего не нужно. Она самостоятельно строит длинные логические цепочки, обеспечивая максимальную глубину и точность.

🟡Hugging Face: https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507
or https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507-FP8
🟡ModelScope: https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507
or https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507-FP8
🟡API Doc: https://alibabacloud.com/help/en/model-studio/models#16ff9753e1ctz

🧩 Новый Thinking‑режим поднимает планку для reasoning‑моделей в открытом доступе.

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🎙 Lex Fridman выпустил новое интервью с Demis Hassabis — CEO Google DeepMind.

🔍 В подкасте — всё, что волнует мир ИИ:
— будущее AI & AGI
— моделирование биологии и физики
— видеоигры, программирование, генерация видео
— world models и Gemini 3
— scaling laws, вычисления, P vs NP
— сложность, энергия, солнце и термояд
и многое другое.

💡 Техническое, глубокое и очень увлекательное интервью. Настоящий разговор о том, куда идёт ИИ.

📺 Смотреть на youtube
📺 Смотреть в X

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🚀 Новый релиз: MegaScience

Открыт крупнейший и самый качественный датасет для постобучения моделей научному мышлению — 1.25 миллиона QA-пар!

🔬 Покрывает 7+ дисциплин: от физики до биомедицины
📚 Вопросы и ответы уровня университетских учебников
📈 Обученные на нём модели обгоняют официальные Instruct-бейзлайны

📄 Статья: https://huggingface.co/papers/2507.16812
🤖 Датасет и модели: https://huggingface.co/MegaScience
💻 Код: https://github.com/GAIR-NLP/MegaScience
🎯 Система оценки: https://github.com/GAIR-NLP/lm-open-science-evaluation

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🚀 Qwen3-Coder — новая мощная open-source модель от Alibaba для кодинга

Модель с архитектурой MoE:
- 480B параметров в общей сложности
- 35B активных параметров
- Контекст 256k, но легко масштабируется до 1M токенов

📈 Производительность:
- На уровне Claude 4 Sonnet
- Лучше или на уровне GPT-4.1 на многих задачах
- Обходит Kimi K2, DeepSeek V3 на ряде бенчмарков

🧩 Модель уже доступна:
- На HuggingFace — можно скачать и запускать
- В OpenRouter — $1/M токенов вход, $5/M выход
(в 3 раза дешевле Claude Sonnet: $3 и $15)

Попробовать бесплатно можно:
🟡Через чат: ttps://chat.qwen.ai/)
🟡GitHub link: https://github.com/QwenLM/qwen-code
🟡 Blog:https://qwenlm.github.io/blog/qwen3-coder/
🟡 Model: https://hf.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder — это просто одна из лучших моделей для программирования, которые мы когда-либо видели.

#qwen #ml #ai #llm #Alibaba

@data_analysis_ml

Читать полностью…
Subscribe to a channel