bigdatai | Unsorted

Telegram-канал bigdatai - Big Data AI

17610

@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста

Subscribe to a channel

Big Data AI

🔥 Хватит смотреть, как другие запускают AI-сервисы и зарабатывают.

На Stepik вышел курс, который учит не “писать Python-скрипты”, а строить готовые продукты с ИИ, которые работают сами.

Ты не читаешь лекции ради лекций —
ты собираешь приложение, которое генерирует текст, хранит данные, отвечает людям и запускается по расписанию.

🚀 Через несколько модулей у тебя уже есть API.
📩 Дальше — свой Telegram-бот.
🤖 Потом — сервис, который делает всё сам.

Это не теория.
Это навык, который сейчас покупают компании — разработчик, который умеет строить AI-сервисы, а не бегает с ноутом по митапам.

А теперь главное 👇
🎁 48 часов — скидка 40%. Потом цена вырастет.

Начни учиться, если ты реально хочешь войти в AI-разработку.

Читать полностью…

Big Data AI

🚀 Tavily Deep Research: как работает новый поисковый движок Hugging Face

Tavily - это инструмент для глубокого поиска и анализа. Он не просто ищет ссылки, а собирает факты, фильтрует шум и структурирует информацию так, чтобы её мог использовать ИИ для сложных задач.

🔥 Что делает Tavily
• Ищет релевантный контент по вебу
• Отбрасывает лишнее и оставляет только важные фрагменты
• Сжимает и очищает данные перед тем, как их увидит модель
• Экономит токены и ускоряет обработку, потому что не передает «всё подряд»

🧠 Как выглядит процесс Deep Research
1. Поиск по вебу
2. Извлечение полезных частей
3. Сжатие и структурирование информации
4. Формирование финального ответа или отчета

✨ Где это полезно
• Аналитика и исследования
• Подготовка отчетов и обзоров
• Глубокие ответы, где обычный поиск слишком поверхностный

Это подход «не просто найти информацию, а переварить и подать её как исследователь».

https://huggingface.co/blog/Tavily/tavily-deep-research

Читать полностью…

Big Data AI

📊 Terminal Excel Viewer for Fast Data Management 🚀

Vex TUI - это мощный терминальный интерфейс для просмотра Excel и CSV файлов. Он предлагает шесть стильных тем, удобную навигацию с поддержкой Vim и множество функций для работы с данными, включая визуализацию и экспорт. Идеально подходит для тех, кто предпочитает работать в терминале.

🚀Основные моменты:
- Поддержка Excel и CSV файлов
- Шесть красивых тем оформления
- Визуализация данных с графиками
- Удобные клавиатурные сокращения
- Оптимизация для работы с большими файлами

📌 GitHub: https://github.com/CodeOne45/vex-tui

Читать полностью…

Big Data AI

📌NVIDIA на NeurIPS 2025.

NVIDIA анонсировала, о чем расскажет на конференции NeurIPS, которая началась сегодня и пройдет до 7 декабря в Сан-Диего.

🟡Автономный транспорт.

NVIDIA DRIVE Alpamayo-R1, или сокращенно AR1.
Это первая в мире открытая ризонинг-VLA модель специально для исследований в области автопилотов. Модель построена на базе NVIDIA Cosmos Reason и отлично поддается дообучению с помощью RL.

Alpamayo-R1 будет доступна на GitHub и Hugging Face, а фреймворк AlpaSim для тестов уже опубликован.

🟡Инструменты для создания физических роботов и симуляций.

Cosmos Cookbook - руководство с рецептами для физического ИИ и генерации синтетических данных и оценки моделей.

LidarGen - "модель мира", которая генерирует данные лидаров для симуляций.

Omniverse NuRec Fixer - инструмент мгновенного исправления артефактов в нейронных реконструкциях а робототехнике и БПЛА.

ProtoMotions3 - открытый фреймворк на базе Isaac Lab, позволяющий тренировать цифровых людей с невероятно реалистичной физикой.

🟡Но не только железом и роботами живет NVIDIA.

MultiTalker Parakeet - модель для ASR нескольких спикеров даже в быстром темпе и с перекрытиями.

В паре с ней идет Sortformer - инструмент для диаризации, т. е. разделения спикеров в аудиопотоке в реальном времени.

Ну и, конечно, NeMo Gym - библиотека для создания сред обучения с RL в комплекте с NeMo Data Designer, комплексом для создания и проверки синтетических наборов данных.

🟡И, наконец, о чистой науке.

К конференции NVIDIA подготовила более 70 научных работ. Вот лишь несколько жемчужин из этого списка:

Audio Flamingo 3. Это большая аудио-языковая модель, которая может "понимать" и анализировать аудиозаписи длительностью до 10 минут.

Minitron-SSM. Техника прунинга, которая позволила уменьшить модель Nemotron-H 8B с 8 до 4 млрд. параметров, при этом удвоив скорость инференса.

ProRL, или Prolonged Reinforcement Learning. Концепция, которая доказала, что продление процесса RL выводит модели на совершенно новый уровень в ризонинге.


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Big Data AI

✔️ Новый “Iceberg Index” от MIT показывает: современный ИИ уже технически способен выполнять работу, эквивалентную 11.7% всей зарплатной массы США - это около $1.2 трлн.

И это далеко больше, чем та малая «верхушка айсберга», которую мы видим сейчас в сфере IT.

Исследователи смоделировали 151 млн работников и 32 000 навыков, чтобы понять, где именно ИИ может заменить или усилить человека. Такой подход даёт раннее предупреждение — и политикам, и компаниям — о том, где начнётся реальное перераспределение труда и рост производительности.

Что важно:

- ИИ сегодня уже способен закрывать задачи на сумму 11.7% U.S. wage bill - примерно $1.2 трлн в год.
- Видимая экспозиция ИИ в технологиях и вычислениях - лишь 2.2% зарплатной стоимости, около $211 млрд.
То есть мы наблюдаем только пятую часть того, на что ИИ реально способен.

Мы обсуждаем ИИ в контексте увольнений, но забываем, что настоящие сдвиги — гораздо глубже.



https://www.cnbc.com/2025/11/26/mit-study-finds-ai-can-already-replace-11point7percent-of-us-workforce.html

Читать полностью…

Big Data AI

🧳 MCPorter: TypeScript Toolkit for Model Context Protocol

MCPorter — это инструмент для работы с Model Context Protocol, позволяющий легко взаимодействовать с MCP-серверами. Он автоматически находит настроенные серверы, генерирует CLI и создает типизированные клиенты, упрощая автоматизацию и интеграцию.

🚀 Основные моменты:
- Автообнаружение MCP-серверов без конфигурации.
- Генерация CLI с помощью одной команды.
- Создание типизированных клиентов для взаимодействия с серверами.
- Удобный API для работы с методами и валидацией аргументов.
- Поддержка OAuth и различных транспортов.

📌 GitHub: https://github.com/steipete/mcporter

#typescript

Читать полностью…

Big Data AI

👑 «Близнецы, продвигающие планы Elon Musk по замене сотрудников X на Grok»

Согласно расследованию издания, Musk активно продвигает идею, что большая часть работы сотрудников X может быть заменена автоматикой - с ключевой ролью отводится системе Grok.
Главные пункты:
• Два брата - инженеры-автоматизаторы — играют решающую роль в разработке и доведении Grok до состояния, в котором он потенциально может выполнять функции, ранее выполняемые людьми.
• Подход заключается не просто в улучшении чатбота, а в создании автономной системы, которая сможет не только вести коммуникацию, но фактически управлять контентом, модерацией и сервисами внутри X.
• В издании отмечают, что для Musk это стратегическая ставка: сокращение частей персонала + переход на автоматизацию = снижение затрат + ускорение роста новых продуктов и услуг.
• Источник подчёркивает, что несмотря на идею, внедрение автоматизации — это масштабная задача, требующая надёжных моделей, тестов, стабилизации и — важно — готовности компании к культурному и операционному сдвигу.
• Эксперты отмечают: если такой сценарий реализуется, то соцсеть X и вовсе может поменять свой операционный режим — от компании с большим штатом людей до компании, где большая часть сервисов управляется ИИ-агентами.

Это важный сигнал для рынка: автоматизация на больших платформах идёт дальше чатботов — она направлена на замену целых функций, ранее людей-операторов.

https://www.theinformation.com/articles/twins-pushing-elon-musks-plans-replace-x-staff-grok

Читать полностью…

Big Data AI

⚡️ HunyuanOCR: открытая OCR-модель, которая рвёт бенчмарки при размере всего 1B

Tencent выложила в open-source новую модель HunyuanOCR.

Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.

Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.

⚡ Топ по бенчмаркам
860 на OCRBench среди всех моделей до 3B
94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов

🌐 Что умеет HunyuanOCR
Модель закрывает практически все типы OCR задач
• текст на улицах, витринах, табличках
• рукописный текст и художественные шрифты
• сложные документы: таблицы, формулы, встроенный HTML и LaTeX
• субтитры в видео
• перевод текста на фото end-to-end сразу на 14 языков

Это не каскадный пайплайн, а единое решение
Один запрос и одно инференс-прогон дают готовый результат.

Это быстрее, надёжнее и удобнее, чем традиционные OCR-цепочки.

📌 Project Page
web: https://hunyuan.tencent.com/vision/zh?tabIndex=0
mobile: https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
🔗 GitHub
https://github.com/Tencent-Hunyuan/HunyuanOCR
🤗 Hugging Face
https://huggingface.co/tencent/HunyuanOCR
📄 Technical Report
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf

@ai_machinelearning_big_data


#HunyuanOCR #TencentAI #OCR #VisionAI #DeepLearning #Multimodal #AIModels #OpenSourceAI #ComputerVision #DocumentAI

Читать полностью…

Big Data AI

⚡️ Китай поглощает электричество темпами, которых мир ещё не видел

Рост потребления электроэнергии в Китае за последние годы поражает:

- За 4 года Китай добавил столько потребления, сколько вся Индия.
- За 6 лет — как Евросоюз.
- За 11 лет — как США.

И вот главный вывод:

⚠️ Электроэнергия становится новым узким местом, даже более критичным, чем чипы.

ИИ-центры, дата-центры, роботизированные фабрики, электромобили — всё требует колоссальных объёмов энергии.
Тот, кто сможет производить больше всего дешёвой электроэнергии, будет доминировать в следующей техно-эпохе.

И Китай в этой гонке далеко впереди Европы и США:
масштабные инвестиции в генерацию, сеть, ВИЭ, атом и гидро дают ему огромное преимущество.

Энергия становится новой нефтью — и КНР уже накопила стратегический запас.

Читать полностью…

Big Data AI

Cloud.​ru перевел Evolution AI Factory в коммерческую эксплуатацию. Теперь компании любого масштаба могут быстро запускать AI-решения, работать с генеративными моделями и экспериментировать с гипотезами.

Среда для разработки и внедрения решений на базе GenAI работает по тарифам с SLA, круглосуточной поддержкой и возможностью масштабирования, а цены на большие языковые модели составляют в среднем 35 ₽ за входной и 70 ₽ за выходной миллион токенов.

📈 Ключевые возможности и сервисы Evolution AI Factory:
• Доступ к каталогу Foundation Models (20+ моделей, включая GigaChat, Qwen, ChatGPT)
• Быстрый запуск моделей через ML Inference, включая свои и сторонние с HuggingFace• Эксперименты и тестирование гипотез в Evolution Notebooks
• Дообучение моделей под задачи бизнеса через ML Finetuning
• Работа с корпоративными данными и повышение точности через Managed RAG
• Запуск автономных AI Agents, выполняющих задачи и принимающих решения

Читать полностью…

Big Data AI

🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

🔍 Хотите сделать шаг от экспериментальных AI-прототипов к полноценным продакшен-агентам?

Мы подготовили среду, инструменты и пригласили экспертов — ждём только вас. 20 ноября стартует Yandex AI Studio Series — серия вебинаров для тех, кто уже работает с AI и хочет развивать агентные решения.

🚀 Что вас ждёт:
- 4 онлайн-трансляции с сессией вопросов и ответов.
- Разбор сценариев с применением LLM, VLM, Realtime API, MCP, RAG, Workflows и других технологий.
- Предзаписанный воркшоп для самостоятельной практики.
- Квиз и приятные сюрпризы.
- Нетворкинг в продуктовом комьюнити.
- Офлайн-встреча в офисе Яндекса в Москве.

Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

В программе:
- Разберём, что такое агенты и мультиагентные системы.
- Покажем, как собрать голосового и поискового агента, а также агента для обработки документов.
- Как применить знания на практике в собственных AI-проектах.

Если вы уже применяете AI и хотите вывести свои решения на новый уровень — присоединяйтесь.

📌 Регистрация

Читать полностью…

Big Data AI

Пилот с ИИ успешен, но масштабировать не получается?

«Технология работает, но устойчивого бизнес-эффекта нет. А вокруг – один хайп, сложно найти реально рабочие схемы».

Именно такие вопросы мы разбираем в AI Inside – канале о практическом применении ИИ в бизнесе.

Здесь нет абстрактных теорий – только то, что работает на практике:

Разбираем реальные кейсы: с цифрами и измеримыми результатами.
Делимся методиками внедрения: от автоматизации процессов до оркестрации ИИ-агентов.
Даем экспертный анализ: сложные темы – без воды, с фокусом на практической пользе.

О чем пишем в канале уже сейчас:

• Почему ИИ-агенты (пока) не заменят ваших сотрудников
• 95% компаний не получают отдачи от инвестиций в GenAI – это правда?
• Какие навыки команды будут критичны в 2030 году (спойлер: не программирование)

А еще:

изучаем техтренды и идеи, которые можно применить уже сегодня. Делимся инсайтами от инженеров-практиков и подборками классных статей про нейросети. И смешно шутим на тему ИИ.

Если вам интересен практический взгляд на ИИ – подписывайтесь → AI Inside

Читать полностью…

Big Data AI

XLTable - OLAP Cервер для нового стека данных
Работайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.

Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.

📈Ключевые возможности XLTable:
• Аналог MS OLAP (SSAS) для больших данных
• Интеграция с MS Excel по протоколу XMLA
• Поддержка ClickHouse, BigQuery, Snowflake
• Скоро: YDB, Greenplum
• Множество групп мер, иерархий и измерений в одном кубе
• Гибкие настройки кэширования
• Развёртывание внутри вашей инфраструктуры или в облаке

🔒Безопасность:
• Интеграция с LDAP
• Разграничение доступа на уровне мер, измерений и их членов

⚙️Производительность:
• Безлимитное количество мер и измерений
• Работа из Excel c миллиардами строк данных
• Все расчеты производятся на уровне ClickHouse
• Отличные возможности для масштабирования

Хочешь получить бесплатную пробную версию на 30 дней?

👉🏻Напиши «OLAP» - покажем демо и поможем с настройкой

Контакт: /channel/vorobiova_anastasia
Сайт с информацией о продукте: https://xltable.com/

Читать полностью…

Big Data AI

🤖 Claude Code Infrastructure Showcase

Этот репозиторий представляет собой библиотеку проверенной инфраструктуры для Claude Code, созданную на основе 6 месяцев реального использования в проекте с микросервисами на TypeScript. Он предлагает решения для автоматической активации навыков и масштабирования разработки на уровне предприятия.

🚀 Основные моменты:
- Автоматическая активация навыков через хуки
- Модульные паттерны навыков с прогрессивным раскрытием
- Специализированные агенты для сложных задач
- Документация для разработчиков, устойчивая к сбоям контекста
- Примеры использования на основе реального домена

📌 GitHub: https://github.com/diet103/claude-code-infrastructure-showcase

#typescript

Читать полностью…

Big Data AI

🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

🔍 Хотите сделать шаг от экспериментальных AI-прототипов к полноценным продакшен-агентам?

Мы подготовили среду, инструменты и пригласили экспертов — ждём только вас. 20 ноября стартует Yandex AI Studio Series — серия вебинаров для тех, кто уже работает с AI и хочет развивать агентные решения.

🚀 Что вас ждёт:
- 4 онлайн-трансляции с сессией вопросов и ответов.
- Разбор сценариев с применением LLM, VLM, Realtime API, MCP, RAG, Workflows и других технологий.
- Предзаписанный воркшоп для самостоятельной практики.
- Квиз и приятные сюрпризы.
- Нетворкинг в продуктовом комьюнити.
- Офлайн-встреча в офисе Яндекса в Москве.

Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

В программе:
- Разберём, что такое агенты и мультиагентные системы.
- Покажем, как собрать голосового и поискового агента, а также агента для обработки документов.
- Как применить знания на практике в собственных AI-проектах.

Если вы уже применяете AI и хотите вывести свои решения на новый уровень — присоединяйтесь.

📌 Регистрация

Читать полностью…

Big Data AI

✔️ По данным The Verge, OpenAI готовит ускоренный релиз GPT 5.2 уже на следующей неделе - в ответ на запуск Google Gemini 3.

Главная цель обновления - сократить отставание и усилить ChatGPT за счёт:
• более быстрых и надёжных рассуждений
• меньших задержек ответа
• лучшей управляемости через инструкции и профили

Ожидаются улучшения в скорости отклика, снижении ошибок при вызове инструментов и более предсказуемом поведении модели — то есть в тех аспектах, которые пользователи ощущают ежедневно.

📌 Источник: theverge.com/report/838857/openai-gpt-5-2-release-date-code-red-google-response

Читать полностью…

Big Data AI

✔️ OpenAI придумала, как заставить модель сообщать о своих галлюцинациях.

OpenAI опубликовала исследование новой техники Confessions. Метод решает проблему, когда модели пытаются обмануть систему оценки^ используют reward hacking или выдают уверенные, но ложные факты ради получения высокого балла.

Суть - в генерации вторичного ответа. После выдачи результата модель формирует отдельный отчет, где анализирует свое поведение на предмет соответствия инструкциям и получает награду за точное описание своих ошибок, даже если в основном ответе она соврала или нарушила правила.

Тесты на GPT-5 Thinkin показали пригодность Confessions: вероятность того, что ИИ нарушит правила и скроет это, упала до 4,4%. Важно понимать, что метод не предотвращает галлюцинации, а служит диагностическим инструментом.
openai.com

✔️ Amazon представила семейство моделей Nova и инструменты для создания ИИ-агентов.

Amazon запустил новую линейку из 4 моделей Nova. В нее вошли версии Lite и Pro, ориентированные на ризонинг, речевая модель Sonic и мультимодальная Omni, работающая одновременно с текстом, изображениями и видео. Все новые сервисы интегрированы в инфраструктуру AWS. Также был представлен сервис Nova Forge, позволяющий компаниям создавать кастомные версии моделей на собственных данных.

Кроме того, анонсирован инструмент Nova Act для создания агентов, автоматизирующих действия в браузере. Nova Act поддерживает архитектуру Human-in-the-Loop для передачи сложных задач человеку, а также предоставляет возможности для отладки: полные логи и записи сессий можно сохранять напрямую в Amazon S3.
aboutamazon.com

✔️ Выходцы из Tesla, Google и Nvidia запустили стартап UMA.

Новая компания Universal Mechanical Assistant (UMA) официально объявила о выходе на рынок. Она будет делать роботов для выполнения реальной физической работы в промышленных масштабах .

В инженерный костяк вошли Реми Каден (разработчик Tesla Autopilot и фреймворка LeRobot), Пьер Сермане (ветеран исследований в DeepMind), а также Роберт Найт, создатель робота SO-100.

UMA уже разрабатывает 2 аппаратные платформы: мобильного промышленного робота с двумя манипуляторами для складов и компактного гуманоида для работы в больницах и жилых помещениях. Стартап заручился поддержкой Яна Лекуна и Томаса Вольфа.
businesswire.com

✔️ KlingAI обновила видеогенератор до версии 2.6.

Новая модель поддерживает режим audio-video co-generation. Она генерирует видеоряд одновременно со звуковым сопровождением в рамках единого процесса. Система умеет создавать диалоги между несколькими персонажами, музыкальные клипы и сложные звуковые сцены (ASMR или экшен) с высокой точностью липсинка.

Есть технические ограничения: генерация голоса поддерживается только на английском и китайском языках (запросы на других языках автоматически переводятся в английский). В режиме Image-to-Video качество финального ролика теперь еще сильнее зависит от разрешения исходного изображения.
klingai.com

✔️ Opera интегрировала Gemini в десктопные браузеры One и GX.

Поддержка Gemini тестировалась исключительно в экспериментальной ветке Opera Neon, а теперь стала доступной в Opera One и геймерском Opera GX. Интеграция реализована через боковую панель.

Ассистент получил доступ к контексту браузера: он может анализировать содержимое активных веб-страниц, групп вкладок и видео, выполняя по запросу саммари или сравнительный анализ контента. Заявлена полноценная мультимодальность: движок обрабатывает не только текст, но и голосовые команды, изображения и загруженные файлы.

Техническая часть тоже изменилась. Разработчики перенесли в основные браузеры новую архитектуру с агентным подходом, изначально обкатанную в Neon. Это позволило увеличить скорость генерации ответов на 20%.
prnewswire.com


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Big Data AI

⚡️ OpenAI вводит «code red»: новый reasoning-модель уже на следующей неделе

OpenAI объявила внутренний «code red» - компания временно перераспределяет людей и мощности, чтобы сфокусироваться на усилении ChatGPT на фоне растущей конкуренции со стороны Google и других игроков.

Главное:

• Новый reasoning-модель выходит уже на следующей неделе — по внутренним тестам она обгоняет Google Gemini 3 и станет основой для Thinking Mode и Deep Research.
• Приоритет — качество продукта, а не монетизация: рекламные пилоты (включая шопинг-рекламу) продолжаются, но масштабный запуск отложен, пока команда улучшает персонализацию и UX для аудитории в 800+ млн пользователей в неделю.
• В рамках «code red» OpenAI усиливает персонализацию, ускоряет ответы, снижает число ненужных отказов и улучшает поведение моделей, чтобы повысить позиции ChatGPT в лидербордах вроде LMArena.
• Отдельный фокус — генерация изображений: после сильного релиза Google Nano Banana Pro OpenAI хочет удержать конкурентоспособность Imagegen в творческих и коммерческих сценариях.
• Стратегические ставки огромны: ChatGPT обслуживает ~70% глобальной «assistant-активности» и около 10% поиска. OpenAI рассчитывает удвоить выручку ($10B → $20B → ~$35B к 2027 году) и привлечь около $100B инвестиций на фоне давления со стороны Google и Anthropic.

Неделя обещает быть жаркой - впереди один из самых важных релизов OpenAI за год.

https://www.theinformation.com/articles/openai-ceo-declares-code-red-combat-threats-chatgpt-delays-ads-effort

Читать полностью…

Big Data AI

⚡️ В Ai Toolkit появилась поддержка обучения LoRA для Z-Image Turbo.

Ostris, разработчик популярного пакета для обучения диффузионных моделей добавил поддержку обучения для Z-Image Turbo с помощью De-Distill адаптера.

AI Toolkit — это универсальный набор инструментов для обучения диффузионных моделей на потребительском оборудовании. Он может запускаться как в GUI, так и в командной строке. Набор разработан так, чтобы быть простым в использовании, но при этом обладать всеми возможными функциями.


По первым тестам, обучение возможно на 12+ VRAM, а обучение персонажа на 17 изображениях длительностью 3000 шагов на RTX 5090 занимает примерно полтора часа.

Подробный гайд по процессу автор тулкита обещает выпустить в ближайшие дни.


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Big Data AI

На AI Journey презентовали крупнейший open-source проект в Европе: Сбер открыл доступ к своим флагманским моделям - GigaChat Ultra-Preview и Lightning, а также новое поколение открытых моделей GigaAM-v3 для распознавания речи, все модели генерации изображений и видео новой линейки Kandinsky 5.0 — Video Pro, Video Lite и Image Lite.

GigaChat Ultra-Preview, новая MoE-модель, 702 миллиарда параметров, собранная под русский язык и натренированная полностью с нуля. Читайте подробный пост от команды.

Впервые в России обучена MoE-модель такого масштаба полностью с нуля — без зависимости от зарубежных весов. Обучение с нуля, да и ещё на таком масштабе, — это вызов, который приняли немногие команды в мире.

Флагманская модель Kandinsky Video Pro сравнялась с Veo 3 по визуальному качеству и обогнала Wan 2.2-A14B. Читайте подробный пост от команды.

Код и веса всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.

Читать полностью…

Big Data AI

🌍 Twitter Location Flags Extension

Расширение для Chrome, которое добавляет флаги стран к именам пользователей на Twitter/X, основываясь на их местоположении. Оно автоматически определяет пользователей и запрашивает информацию о местоположении через GraphQL API Twitter.

🚀Основные моменты:
- Отображает флаги стран рядом с именами пользователей
- Работает с динамически загружаемым контентом
- Кэширует данные о местоположении для снижения нагрузки на API
- Не требует передачи данных третьим лицам

📌 GitHub: https://github.com/RhysSullivan/twitter-account-location-in-username

#javascript

Читать полностью…

Big Data AI

AI&ML в деле на AI DevTools Conf

4 декабря команда Cloud.ru проводит практическую конференцию — AI DevTools Conf. 

В программе доклады о создании AI-агентов, защите AI-систем и работе с DevOps-агентом.

А тех, кто посетит конференцию офлайн ждут воркшопы, где вы научитесь:
😶‍🌫️внедрять AI-инструменты в процесс разработки

😶‍🌫️оценивать LLM-агентов

😶‍🌫️тестировать безопасность AI

😶‍🌫️и не только


Места на офлайн-участие ограничены.

Успейте зарегистрироваться

Читать полностью…

Big Data AI

⚡️ UI-Venus от inclusionAI

Проект UI-Venus представляет собой интерфейсную библиотеку от inclusionAI, ориентированную на создание доступных, инклюзивных и современных пользовательских интерфейсов.

Основные особенности:
• Чистая и модульная архитектура UI-компонентов
• Доступность (a11y) встроена по умолчанию
• Подходит для интеграции в разные фреймворки и приложение
• Хорошая документация и примеры использования

Если вы работаете с фронтендом и хотите библиотеку, уделяющую внимание инклюзивности — UI-Venus может стать отличным выбором.

📁 Репозиторий: https://github.com/inclusionAI/UI-Venus/

Читать полностью…

Big Data AI

🚀 Оптимизация нагрузки с LPLB для MoE моделей

LPLB — это параллельный балансировщик нагрузки, использующий линейное программирование для оптимизации распределения нагрузки в моделях Mixture-of-Experts. Он динамически перераспределяет экспертов на основе статистики нагрузки, решая задачи распределения токенов для достижения балансировки.

🚀 Основные моменты:
- Использует линейное программирование для перераспределения токенов.
- Поддерживает динамическое переупорядочение экспертов.
- Оптимизирован для работы с NVIDIA cuSolverDx и cuBLASDx.
- Подходит для больших распределенных систем с несколькими GPU.
- Находится на стадии ранних исследований.

📌 GitHub: https://github.com/deepseek-ai/LPLB

#python

Читать полностью…

Big Data AI

LoRA-модель для Qwen-Image-Edit-2509, которая автоматически:
• выравнивает страницу скана
• убирает центральный сгиб
• правильно обрезает изображение
• делает скан похожим на ровную, отдельную страницу

Единственное, что нужно - подобрать подходящее соотношение сторон под формат вашей книги, тогда результат будет максимально чистым.

Модель здесь:
https://huggingface.co/tarn59/book_flatten_and_crop_qwen_image_edit_2509

Читать полностью…

Big Data AI

TextOp - фреймворк для управления гуманоидными роботами с помощью текста в реальном времени.

🎯 Что умеет:
- Принимает инструкции на естественном языке и превращает их в плавные, целостные движения тела робота.
- Позволяет мгновенно корректировать команды — изменения принимаются «на лету».
- Обеспечивает высокую скорость и живость реакции: текст → движение почти мгновенно.

🌟 Почему стоит:
- Удобный интерфейс: управляйте роботом так, как разговариваете с человеком.
- Интерактивность: меняйте команду в процессе выполнения — робот подстраивается.
- Применимо для демонстраций, взаимодействий с людьми, сервисных задач, шоу-роботов и множества других сценариев.

Если ищете способ управлять движением робота без сложного программирования - TextOp даёт простой и мощный путь.

http://text-op.github.io

Читать полностью…

Big Data AI

🚨 Новая редкая работа от Терренса Тао: AlphaEvolve решает часть математических задач лучше людей

Google представила AlphaEvolve - систему, которая эволюционным поиском находит решения к сложным математическим задачам. Тао протестировал её на 67 задачах из разных областей: от неравенств до числовых констант.

📌 Что проверяли
- задача о «движущемся диване» в 2D и 3D
- Kissing problem в N-мерном пространстве
- упаковка окружностей
- задача IMO 2025 по тесселяции
- задача о стопках блоков

🧠 Как работает AlphaEvolve
Алгоритм запускает множество параллельных попыток, проверяет решения, а затем «скрещивает» лучшие идеи, отбирая наиболее успешные.

🔥 Интересные выводы
- сильнее модель - быстрее сходимость (хотя не всегда)
- параллельность ускоряет поиск, но сильно увеличивает стоимость
- reward hacking встречается часто
- результаты значительно лучше, если похожие задачи были в обучении и если процесс направляет эксперт (особенно когда эксперт - сам Тао)

💡 Важное предложение из статьи
Тао предлагает вводить класс задач «AlphaEvolve-hard» - те, где ИИ не может легко нарушить неравенство или найти конструкцию. Такие задачи требуют принципиально нового человеческого инсайта.

Эта работа пролетела почти незаметно, но я провёл над ней больше двух часов - и это одна из самых впечатляющих математических статей за последнее время.

https://www.alphaxiv.org/abs/2511.02864v1

Читать полностью…

Big Data AI

🔥 Как аналитика данных трансформирует промышленное планирование — опыт лидеров отрасли

⚡️ Приглашаем 18 ноября (10:00–13:00, Москва) на отраслевое событие FanRuan о практическом применении аналитики в производстве. Разберем реальные кейсы, технологии прогнозирования и инструменты для принятия решений, чтобы планирование стало точнее, а загрузка мощностей — сбалансированной.
Что посмотрим и обсудим:

НЛМК (Роман Кулеш) — аналитика производственных планов, контроль выполнения Plan/Fact и архитектура BI для планирования;
ММК (Сергей Кулагин) — как визуализация ускоряет поиск узких мест и помогает принимать решения;
FanRuan (Zayne Zhao) — практический подход к прогнозированию спроса: от классификации спроса до связи плана с исполнением, и демонстрация возможностей продуктов FanRuan.

❗️ Для кого будет полезно: руководители и специалисты производств, аналитики и планировщики, ИТ и бизнес-подразделения, отвечающие за аналитику и цифровизацию.

❗️ Почему стоит прийти: реальные кейсы от лидеров металлургии и практические подходы к внедрению прогнозов на основе ИИ — без теории, только рабочие инструменты и примеры внедрения.

Регистрация обязательна — количество мест ограничено!

Реклама. ИП Чичерин-Лукьяненко Андрей Игоревич. ИНН 772830905927. erid: 2VtzqvLYND7

Читать полностью…

Big Data AI

🎮 Погружение в мир AI-социума

Microverse — это песочница, где AI-герои взаимодействуют в открытом мире, развивая свои социальные связи. Проект включает демо-версию игры, созданной на Godot 4, и предлагает уникальный опыт общения с многофункциональными AI-персонажами.

🚀 Основные моменты:
- Песочница с AI-экосистемой для социальных взаимодействий
- Поддержка многопользовательских AI-диалогов
- Долговременная память для персонажей
- Автономное управление задачами и взаимодействиями
- Интеграция с различными AI-сервисами

📌 GitHub: https://github.com/KsanaDock/Microverse

#gdscript

Читать полностью…

Big Data AI

# ⚠️ Расследователи сомневается в AI-сделках Oracle на $300 млрд — и это тревожный сигнал

Сейчас мы видим, как крупнейшие IT-компании (гиперскейлеры) заключают многолетние контракты на искусственный интеллект на сотни миллиардов долларов.

Но никто ещё не проверял, насколько всё это реально окупается. Это - эксперимент на деньгах, технологиях и времени.

💸 Если хотя бы часть этих сделок не сработает, задержится или не принесёт ожидаемой прибыли, удар почувствует вся AI-индустрия - от чипов до облаков.

🧱 Да, AI-бум реален. Но его финансовый фундамент пока как мокрый цемент — выглядит крепко, но легко может просесть.

🎯 Если у Oracle получится - они войдут в список самых влиятельных компаний мира.
❗ Если нет — вся отрасль поймёт, насколько эта гонка на самом деле рискованна и нестабильна.

> 📊 Пузыри не лопаются, когда в них перестают верить.
> Они лопаются, когда кто-то наконец проверяет цифры.

Читать полностью…
Subscribe to a channel