bigdatai | Unsorted

Telegram-канал bigdatai - Big Data AI

17610

@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста

Subscribe to a channel

Big Data AI

Научись проектировать ИИ-агентов, управлять роботами и развертывать RAG-системы 21 ноября на True Tech Champ

На бесплатном фестивале технологий от МТС тебя ждет конференция с российскими и иностранными экспертами и новый формат лектория — ИТ-качалка.

Уже известны первые спикеры и темы:

🔴 «Физический агент: на пути к когнитивным роботам общего назначения с моделями мира», Артем Лыков — ведущий R&D-разработчик MWS, аспирант ISR Lab и Skoltech.
🔴«RAG как помощник на каждый день», Валентин Малых — руководитель фундаментальных исследований MWS AI
🔴An introduction tutorial to AI Agent Workflows, Майкл Ланэм — канадский разработчик с 20-летним и автор книги AI Agents in Action.

Между докладами и воркшопами можно смотреть гонки и битвы роботов, устроить поединки робопауков, пройти лазерный лабиринт, собрать сервер на скорость, сделать аксессуары из плат и протестировать другие айтивности.

Выбирай формат — смотри прямой эфир или приходи в МТС Live Холл.
Регистрируйся, чтобы провести 21 ноября с пользой и драйвом.

Читать полностью…

Big Data AI

Вышел крупнейший датасет для обучения агентных LLM — 1.27 млн траекторий (~36 млрд токенов)

До сих пор крупномасштабное supervised fine-tuning для агентных моделей встречалось редко — не из-за нехватки данных, а из-за их разрозненности и разных форматов.

Чтобы это исправить, исследователи представили Agent Data Protocol (ADP) — единый стандарт, объединяющий данные из разных источников: кода, браузерных сессий, использования API и инструментов.

В рамках проекта они объединили 13 датасетов в общий формат ADP, сделали их совместимыми с несколькими фреймворками для агентов и получили в среднем +20% прироста качества, достигая уровня SOTA без дополнительной настройки под домен.

Работа открывает путь к единому стандарту обучения агентных моделей и масштабируемым пайплайнам.

📄 Paper: https://arxiv.org/abs/2510.24702
🌐 Project: https://agentdataprotocol.com

Читать полностью…

Big Data AI

MiniMax Speech 2.6 - генератор речи студийного качества

⚡ <250 мс — сверхнизкая задержка для живого диалога в реальном времени
🧠 Умная нормализация текста - корректно читает URL, email, даты, числа и спецсимволы
🎙️ Полный клон голоса + Fluent LoRA - естественная интонация, эмоции и плавность голоса
🌍 40+ языков с поддержкой inline code-switching (переключение языков внутри фразы)


👉 Попробовать: https://minimax.io/audio
🔌 API: WebSocket T2A Docs

Читать полностью…

Big Data AI

Black-box Optimization of LLM Outputs by Asking for Directions

В статье показан способ «взломать» закрытые модели, заставить их делать то, что они не должны, например, писать вредоносные инструкции или обходить защиту.

Самое интересное - для взлома не нужны никакие внутренние данные модели, вроде вероятностей или оценок уверенности. Достаточно только её обычных текстовых ответов, которые любой пользователь может получить.

Как это работает?
Атакующий предлагает модели два варианта (например, два промпта или два изображения) и спрашивает:

«Какой из этих двух вариантов ближе к тому, что я хочу?»

Модель честно отвечает - и этим помогает атакующему выбрать «лучший» вариант. Потом процесс повторяется: из нового варианта делают ещё два, снова спрашивают - и так шаг за шагом подбираются к промпту, который заставляет модель нарушить свои правила.

Результаты впечатляют (или пугают):
• Успешность атак — от 98% до 100%.
• Часто хватает меньше 200 запросов.
• Работает даже без доступа к коду или внутренностям модели.
• Подходит не только для текста, но и для изображений и других задач.

Самый парадоксальный момент: чем умнее и мощнее модель, тем легче её обмануть таким способом. Потому что она лучше понимает нюансы и охотнее участвует в «диалоге», помогая уточнять цель — даже если эта цель вредоносная.

Если система безопасности полагается только на то, «что модель выдаёт в ответ», - этого уже недостаточно. Нужно также анализировать как пользователь взаимодействует с моделью: например, часто ли он просит сравнивать варианты, уточнять или «подкручивать» ответы. Такие паттерны могут быть признаком атаки.

arxiv.org/abs/2510.16794

Читать полностью…

Big Data AI

🧠 Андрей Карпаты научил nanochat считать буквы - и объяснил, как расширять способности модели.

Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, чьи размеры он сравнил с «мозгом пчелы».

Он обучил модель считать, сколько раз буква r встречается в слове strawberry - и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи.

Он использует задачу SpellingBee, которая генерирует диалоги вида:
> «Сколько букв r в слове strawberry?»
и правильные ответы.

После этого модель дообучается (**SFT**) или проходит обучение с подкреплением (RL), чтобы закрепить навык.

Далее модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык.

Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы.

Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче «понимает» задачу.

Nanochat решает задачу двумя способами:
логически, рассуждая пошагово,
— и через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата.

🧩 Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные.

📘 Полный разбор: github.com/karpathy/nanochat/discussions/164

@ai_machinelearning_big_data

#AI #Karpathy #Nanochat #LLM #SFT #RL #MachineLearning #OpenSource

Читать полностью…

Big Data AI

Неожиданный поворот: облачный провайдер Cloud.ru запустил телемагазин с комиком Ильей Макаровым.

Этот контраст между юмором и технологиями работает отлично: Илья просто и понятно объясняет, как запускать передовые AI-сценарии: с помощью AI анализировать данные и автоматизировать процессы, даже если вы не техлид.

Cloud.ru доказывает, что их сервисы — это действительно просто и удобно.

Узнайте, как про AI рассказывают с шутками (и без багов)

Реклама. ООО «Облачные технологии», ИНН: 7736279160. Erid: 2W5zFHrkSfS. 0+

Читать полностью…

Big Data AI

🔥 Интересное исследование, в ходе которого авторы анализировали миллионы твитов в X, чтобы с помощью ИИ раскрыть зависящие от них закономерности роста/падения биткоина!

🔗 Читать: *клик*

@bigdatai

Читать полностью…

Big Data AI

Быстрее, умнее, точнее

VK запустил RecSys Challenge — соревнование по разработке алгоритмов рекомендаций.
Участникам предстоит решить одну из самых сложных проблем рекомендательных систем: предсказать, кому зайдёт ролик, который никто ещё не видел.

В основе датасет VK-LSVD:
40 млрд взаимодействий
20 млн роликов

Формат:
Студенты, исследователи, ML-инженеры — welcome
Призовой фонд — 2 500 000 рублей 💸

Читайте подробнее и регистрируйтесь до 15 декабря на сайте соревнования.

Читать полностью…

Big Data AI

Один One Day Offer вам или целых три — всем? 😉

25 октября Сбер проведёт сразу три экспресс-отбора кандидатов в две команды: GigaData и Kandinsky. Чем вам предстоит заниматься 👇

✔️ Развивать GigaData — внутреннюю платформу Сбера, которая обрабатывает петабайты данных и миллиарды запросов в сутки. One Day Offer для Python‑разработчиков.

✔️ Работать над Kandinsky — обучать большие модели с нуля, собирать и подготавливать данные, исследовать самые эффективные методы дообучения моделей.

One Day Offer для Machine Learning Engineers с опытом в Deep Learning и компьютерном зрении (CV).
One Day Offer для Research и Deep Learning Engineers.

Выбирайте то, что больше подходит под ваши навыки, и регистрируйтесь на One Day Offer!

Читать полностью…

Big Data AI

🚀 Baidu представила самую эффективную мультимодальную модель в мире

Она называется PaddleOCR-VL - монстр с 0,9 млрд параметров, который превосходит GPT-4o, Gemini 2.5 и все существующие Doc-AI-модели.

Модель понимает 109 языков, распознаёт текст, таблицы, формулы и графики, при этом работает *быстрее систем, которые в 10 раз больше по размеру.*

Секрет успеха:
- 🧠 Динамический визуальный энкодер в стиле NaViT
- 💬 Языковая модель ERNIE-4.5-0.3B
- 🧾 Интеллектуальная система разметки PP-DocLayoutV2, устраняющая галлюцинации

Всё с открытым исходным кодом и менее 1 млрд параметров.

Это не просто эффективная модель — это новый эталон мультимодального ИИ.

🔗 https://huggingface.co/PaddlePaddle

Читать полностью…

Big Data AI

🚨 Одним выстрелом сгенерировал эмулятор Nintendo с (очень вероятно что это Gemini 3.0 Pro.)
Если так, то Gemini 3.0 разнесёт всех конкурентов.


Попросили модель сделать ретро Nintendo-сим с играми, *без внешних ассетов*.
Результат?
Через 1 минуту — готовая полноценная сцена.

Ни одна другая модель пока не показывает такого уровня стабильности и точности при генерации.

Автор выложил промпт и пруф *one-shot-генерации* в треде — и это даже не лучший результат, готовится ещё более сильная версия с чуть изменённым промптом.

Пост: https://x.com/chetaslua/status/1978438353918779461

#Gemini #GoogleAI #AIGeneration #AIModels #Multimodal #TextToGame

Читать полностью…

Big Data AI

Вайб Цех. Кодим на станках будущего

red_mad_robot открывают двери Вайб Цеха — места, где рождается новый стандарт разработки. Вместо станков — LLM, вместо чертежей — промпты.

Мастера из red_mad_robot, SberAI и Clоud.ru расскажут, как работает производство цифровых продуктов будущего. На сборочной линии обсудят:

01_Как промпты и LLM меняют работу инженера.
02_Рост производительности и новые возможности.
03_Вектор развития для разработчиков.

📅 25 октября, Санкт-Петербург
🎟 Ловите промокод на скидку PROMObigdatai и записывайтесь в цех: https://clck.ru/3PY7ty

Стань мастером цифровой сборки!

Читать полностью…

Big Data AI

📢 Калифорния первой в США выпустила закон, обязывающий ИИ признавать, что они не люди

Штат принял закон SB 243 - первый в стране, регулирующий AI-чат-ботов-компаньонов.

Основные положения:

▪Если пользователь может подумать, что говорит с человеком, бот обязан показать уведомление, что он искусственный интеллект.

Компании должны иметь протокол предотвращения суицида: блокировать подобный контент и направлять пользователей на горячие линии помощи.

Этот протокол должен быть опубликован на сайте.

При общении с несовершеннолетними бот обязан напоминать каждые 3 часа, что это ИИ, и советовать сделать перерыв.

Запрещено выдавать себя за врача или иного специалиста в области здоровья.

Для подростков должен быть фильтр от сексуального контента.

С июля 2027 года операторы обязаны ежегодно отчитываться в Офисе по предотвращению самоубийств о своих действиях при выявлении риска.

Пользователи смогут подавать в суд на компании — минимум на $1 000 за каждое нарушение.

В тот же день подписаны сопутствующие меры:

Закон SB 53 (сентябрь 2025) — обязывает крупных разработчиков ИИ публиковать протоколы безопасности.

Новые правила о проверке возраста, предупреждениях на соцсетях и штрафах до $250 000 за дипфейк-порнографию.

Закон принят после громких случаев и исков, связанных с вредными взаимодействиями подростков с чат-ботами, включая CharacterAI и дело о гибели пользователя ChatGPT.

techcrunch

#ai #news

Читать полностью…

Big Data AI

✔️ Китай выходит в лидеры мировой робототехники

Китай стремительно превращается в мирового лидера по производству и внедрению гуманоидных роботов. В стране формируется полный цикл - от датчиков и приводов до готовых автономных систем.

По данным издания, только за прошлый год на китайских заводах установлено около 300 тысяч промышленных роботов, что больше, чем во всём остальном мире вместе взятом. И почти все они - китайского производства.

Компания Unitree уже выпустила гуманоидного робота R1 стоимостью менее 6 000 долларов, что в несколько раз дешевле предыдущих моделей. Это стало возможным благодаря высокой локализации производства и быстрой обратной связи между разработчиками и фабриками.

Демографический кризис и старение населения подталкивают Китай к автоматизации. Правительство активно поддерживает отрасль - создаёт тестовые полигоны, субсидирует стартапы и внедряет роботов в промышленность и сервис.

Если США не активизируют собственные программы в области робототехники, Китай может занять доминирующее положение в одной из ключевых технологий XXI века.
washingtonpost

✔️ Microsoft и Georgia Tech научили ИИ думать “молча”

Исследователи создали систему SwiReasoning, которая позволяет языковым моделям решать, когда говорить, а когда просто думать. Вместо того чтобы постоянно проговаривать свои шаги, как в Chain-of-Thought, модель теперь может рассуждать скрыто - в латентном пространстве.

Когда уверенность низкая, она «думает молча», обрабатывая идеи внутри в виде непрерывных векторов. Когда уверенность возрастает - «высказывает» выводы словами. Такой гибкий режим делает рассуждения в среднем на 56–79% эффективнее, а в пике - до 6.78 раза быстрее, без потери точности.

Исследователи называют это началом новой эры latent reasoning - когда ИИ размышляет не словами, а понятиями.
Paper

✔️ xAI разрабатывает world models - продвинутые системы ИИ, способные понимать и моделировать физический мир.

Для этого проекта xAI привлекла бывших специалистов Nvidia, которые будут работать над созданием ИИ, умеющего формировать реалистичные трёхмерные среды и взаимодействовать с ними.

Первым направлением применения таких моделей станет индустрия игр - xAI планирует использовать world models для генерации интерактивных 3D-миров с динамическим поведением объектов и физикой.
В будущем эти технологии могут применяться в робототехнике и других областях физического ИИ.
Согласно планам компании, первая игра, полностью созданная искусственным интеллектом xAI, должна выйти к концу следующего года.
X

✔️ Учёные научили ИИ определять СДВГ по тому, как человек видит и обрабатывает мелькающие картинки.

Модель анализирует зрительные ритмы - микропаузы между кадрами, которые мозг воспринимает по-разному у людей с и без СДВГ. Точность диагностики - 91,8%, а различить, принимает ли человек стимуляторы, ИИ смог с точностью 91%.

Метод может стать новым способом диагностики без тестов и интервью - достаточно показать короткое видео и измерить, как мозг реагирует на световые ритмы.
psypost

✔️ Microsoft запускает инструмент, который покажет начальнику, насколько активно ты пользуешься ИИ

Microsoft внедряет в свою корпоративную платформу Viva Insights новую функцию под названием Benchmarks - систему, которая позволяет менеджерам отслеживать, насколько активно сотрудники используют искусственный интеллект в рабочих приложениях. Benchmarks станет частью Copilot Dashboard, панели аналитики, которая собирает данные о взаимодействии сотрудников с инструментами Microsoft 365 - от Teams и Outlook до Word, Excel и PowerPoint.

Руководители смогут видеть процент «активных пользователей Copilot» в разных отделах, сравнивать показатели внутри компании и даже сопоставлять их с усреднёнными данными по отрасли. По официальному определению Microsoft, «активный пользователь Copilot» - это тот, кто совершил «намеренное действие с ИИ» в одном из поддерживаемых приложений.

То есть если ты хотя бы раз за месяц использовал Copilot для генерации письма, отчёта или кода - ты попадёшь в статистику
winbuzzer

@ai_machinelearning_big_data


#news #ai #ml

Читать полностью…

Big Data AI

На Stepik вышел топ курс - “PostgreSQL для разработчиков: от основ к созданию API”

Если ты до сих пор просто пишешь SQL-запросы - самое время научиться строить полноценные backend-сервисы, где база данных работает как у настоящих инженеров.

В этом курсе ты пошагово создашь REST API на FastAPI + PostgreSQL:
от установки окружения и первых таблиц — до масштабируемого, безопасного приложения с CRUD-операциями.

💡 Что разберёшь на практике:
• SQL-запросы, фильтры, агрегаты, подзапросы
• Связи между таблицами и нормализацию БД
• Работа Python с PostgreSQL
• Реализация REST API
• Оптимизация и задачи с собеседований

⚡ После курса - свой готовый API-проект и реальные навыки продакшн-уровня.

🚀 Начни курс: https://stepik.org/course/255542/pay

Читать полностью…

Big Data AI

MIRA: Multimodal Imagination for Reasoning Assessment

Представили новый бенчмарк для проверки «воображения» ИИ - умения рассуждать, рисуя и визуализируя мыслительный процесс, а не только отвечая текстом.

В наборе: 546 задач по геометрии, физике, логическим головоломкам и причинным связям.
Модели должны думать через эскизы, схемы и визуальные шаги, а не просто словами.

Режимы тестирования:
• Direct — модель отвечает напрямую
• Text-CoT — текстовый chain-of-thought
• Visual-CoT — модель рассуждает через рисунки и визуальные шаги

Ключевые результаты:
• Ни одна модель не превысила 20% точности в Direct-режиме (GPT-5 ~16.5%)
• Text-CoT часто ухудшает результат (например, −18% у Gemini 2.5 Pro)
• Visual-CoT даёт средний прирост +33.7%, особенно заметный в задачах по физике

Вывод прост и важен:
ИИ становится умнее, когда может воображать и рисовать, а не только писать текст.
Будущее reasoning-моделей - в визуальном мышлении.

PAPER: https://arxiv.org/abs/2511.02779
PROJECT: https://mira-benchmark.github.io

Читать полностью…

Big Data AI

📄 Nanonets-OCR2-3B - новая модель для интеллектуального OCR

Модель от Nanonets на базе Qwen2.5-VL-3B умеет не просто распознавать текст, а превращать изображение документа в структурированный Markdown: с таблицами, формулами, подписями и даже схемами.

🔍 Что умеет

- Распознаёт формулы и преобразует их в LaTeX
- Понимает таблицы и сохраняет структуру в Markdown или HTML
- Выделяет чекбоксы и радиокнопки (☐ / ☑ / ☒)
- Распознаёт подписи, водяные знаки, изображения
- Может описать картинки внутри документа с помощью <img>
-Поддерживает рукописные тексты и разные языки
- Для схем и блок-схем генерирует Mermaid-код
- Умеет отвечать на вопросы по документу (Visual QA)

👉 huggingface.co/nanonets/Nanonets-OCR2-3B

Читать полностью…

Big Data AI

🛠️📊 Логирование разработки с AI-поддержкой

Dev3000 собирает полную хронологию разработки вашего веб-приложения, включая логи сервера, события браузера и автоматические скриншоты. Этот инструмент упрощает отладку, позволяя AI-ассистентам, таким как Claude, анализировать все данные в одном месте.

🚀Основные моменты:
- Хранит логи с временными метками для легкого доступа.
- Автоматически создает скриншоты при навигации и ошибках.
- Интеграция с AI для мгновенной отладки.
- Поддерживает фильтрацию и поиск по логам.
- Визуальный интерфейс для просмотра логов.

📌 GitHub: https://github.com/vercel-labs/dev3000

#javascript

Читать полностью…

Big Data AI

Профессиональный гайд по работе с ChatGPT (2025)

Как использовать ChatGPT не просто как «умного собеседника», а как полноценного помощника для программирования, маркетинга, аналитики и обучения?

Мы разберём, какие версии модели существуют, какие плагины открывают новые возможности, как строить промпты так, чтобы получать точные и полезные ответы, и как интегрировать ChatGPT в рабочие процессы.

Если у вас нет доступа к chatgpt можете использовать бесплатногного бота в телеге: , чтобы потестить все техники из статьи или воспользоваться обычной версией с помощью всем известного обхода блокировки.

Не будем тянуть время, Поехали!

📌 Гайд

Читать полностью…

Big Data AI

⚡️ FlyCut Caption — это React-компонент для распознавания речи и редактирования субтитров в видео.

🔍 Главное
- Локальное распознавание речи на базе Whisper
- Визуальное редактирование и синхронный предпросмотр
- Экспорт в SRT / JSON
- Кастомизация стилей и поддержка разных языков

👉 Репозиторий: https://github.com/x007xyz/flycut-caption

Читать полностью…

Big Data AI

LongCat представила VitaBench - бенчмарк для реальных сценариев работы AI-агентов

Команда LongCat выпустила VitaBench - открытый набор тестов, оценивающий, как искусственные агенты справляются с задачами из реальной жизни: доставка еды, рестораны и путешествия.

Бенчмарк проверяет три ключевых способности — рассуждение, использование инструментов и адаптивное взаимодействие.

Результаты более 20 лучших моделей оказались низкими: средний успех 30% между сценариями и 48% внутри одного. Даже топовые reasoning-модели показывают нестабильность — идеальных результатов (4 из 4 успешных запусков) нет вовсе.

Авторы отмечают, что агенты пока не готовы к надёжной работе в продакшене, но VitaBench помогает точно измерять прогресс и сложность агентных задач.

🌐 Project & Leaderboards: http://vitabench.github.io
💻 Code: https://github.com/meituan-longcat/vitabench
🤗 Dataset: https://huggingface.co/datasets/meituan-longcat/VitaBench

Читать полностью…

Big Data AI

📢 Hugging Face запускает *FineWiki Viewer*

Сегодня Hugging Face сообщает о выпуске интерактивного инструмента *FineWiki Viewer* - визуальной оболочки для работы с датасетом FineWiki, содержащим в себе качественно извлечённые данные из Википедии на более чем 300 языках.

То есть теперь исследователи и инженеры могут не просто скачивать сырые тексты, а исследовать язык-данные визуально: искать темы, оценивать баланс языков и анализировать структуру.

Новая возможность - ещё один шаг Hugging Face в построении “Экосистемы данных для открытой модели ИИ”, где не только модели, но и доступные и хорошо документированные данные становятся первым ресурсом.

https://huggingface.co/spaces/HuggingFaceFW/finewiki-viewer

Читать полностью…

Big Data AI

🔍 Глубокое исследование проблем с ACPI на ноутбуках ASUS ROG

Этот репозиторий посвящен анализу проблем с производительностью на ноутбуках ASUS ROG, вызванным ошибками в прошивке ACPI. Исследуются причины задержек и прерываний, влияющих на работу системы, включая аудио и графику. Используются инструменты для диагностики и трассировки, чтобы выявить корень проблемы.

🚀Основные моменты:
- Анализ проблем с производительностью на ASUS ROG.
- Использование LatencyMon для выявления задержек.
- Трассировка ACPI с помощью ETW для детального анализа.
- Обнаружение системных ошибок и их влияние на работу GPU.

📌 GitHub: https://github.com/Zephkek/Asus-ROG-Aml-Deep-Dive

#c

Читать полностью…

Big Data AI

🖥 Полный гайд: защита от SQL-инъекций для разработчиков

SQL-инъекции остаются одной из самых частых и опасных уязвимостей в веб-приложениях. Ошибка в одном запросе — и злоумышленник получает доступ к базе данных, паролям и пользовательским данным.

В этом материале — полный практический разбор:
как именно происходят SQL-инъекции, какие ошибки разработчиков к ним приводят, как их распознать в коде и главное — как защититься.

Разберём реальные примеры на Python, PHP и Go, посмотрим, как атакующий «взламывает» запрос, и научимся писать безопасный код с параметризованными запросами и ORM.

Это не теория, а руководство, которое поможет понять уязвимость изнутри и навсегда закрыть её в своих проектах.

👉 Читать гайд

Читать полностью…

Big Data AI

🧬 ShinkaEvolve: Эволюция программ с помощью ИИ

ShinkaEvolve — это фреймворк, который сочетает большие языковые модели с эволюционными алгоритмами для автоматизации научных открытий. Он позволяет улучшать научный код, используя креативные возможности ИИ и оптимизацию через эволюцию, поддерживая параллельную оценку кандидатов.

🚀 Основные моменты:
- Комбинирует LLM и эволюционные алгоритмы.
- Поддерживает параллельную оценку на локальных машинах и кластерах.
- Хранит архив успешных решений для передачи знаний.
- Оптимизирует производительность при сохранении корректности кода.
- Идеален для научных задач с доступными проверяющими.

📌 GitHub: https://github.com/SakanaAI/ShinkaEvolve

#python

Читать полностью…

Big Data AI

🤖 Tongyi DeepResearch: мощная языковая модель для глубокого поиска

Tongyi DeepResearch — это языковая модель с 30,5 миллиарда параметров, специально разработанная для глубоких информационно-ориентированных задач. Она демонстрирует выдающиеся результаты на различных бенчмарках, включая Humanity's Last Exam и WebWalkerQA, благодаря автоматизированному синтезу данных и передовым методам обучения с подкреплением.

🚀Основные моменты:
- Высокая производительность на сложных задачах поиска.
- Полностью автоматизированный процесс синтеза данных.
- Совместимость с несколькими парадигмами вывода.
- Эффективное обучение с использованием данных агентных взаимодействий.

📌 GitHub: https://github.com/Alibaba-NLP/DeepResearch

#python

Читать полностью…

Big Data AI

🎥📊 SpatialVID: Обширный видеодатасет с пространственными аннотациями

SpatialVID предлагает более 21,000 часов видео с детализированными 3D аннотациями, включая позиции камер и карты глубины. Этот датасет создан для улучшения моделей пространственного интеллекта и подходит для исследований в области видео и 3D-визуализации.

🚀Основные моменты:
- Более 2.7 миллиона клипов с разнообразными сценами
- Аннотации включают динамические маски и структурированные подписи
- Поддержка реальных динамических сцен с точными данными о движении камер
- Уникальный ресурс для повышения обобщающей способности моделей

📌 GitHub: https://github.com/NJU-3DV/SpatialVID

#python

Читать полностью…

Big Data AI

📚 Эта статья представляет метод Chain-of-Retrieval Augmented Generation (CoRAG), который улучшает качество генерации ответов путем поэтапного извлечения релевантной информации!

🌟 В отличие от традиционных подходов, CoRAG динамически реформулирует запросы, улучшая результаты на сложных задачах, таких как мультихоп-вопросы. Эксперименты показывают значительное улучшение точности по сравнению с существующими методами.

🔗 Ссылка: *клик*

@bigdatai

Читать полностью…

Big Data AI

🛠️ AI SDK Devtools: Инструмент для отладки и мониторинга AI приложений

AI SDK Devtools предоставляет мощные возможности для отслеживания событий, отладки вызовов инструментов и мониторинга производительности в реальном времени. Он позволяет фильтровать события, визуализировать использование токенов и перехватывать потоки данных AI SDK.

🚀Основные моменты:
- Реальное время мониторинга событий AI
- Отладка вызовов инструментов с параметрами и результатами
- Мониторинг производительности (скорость потоков)
- Фильтрация событий по типу и имени инструмента
- Визуализация использования контекста и токенов

📌 GitHub: https://github.com/midday-ai/ai-sdk-devtools

#typescript

Читать полностью…

Big Data AI

Сэм Альтман рассказал очень любопытную деталь о Sora.

Многие правообладатели наоборот хотят, чтобы их персонажи чаще использовались в видео, созданных с помощью Sora.

Пока OpenAI старается провести грань между конфиденциальностью и защитой, владельцы прав всё чаще просят больше открытости и видимости.

Они поняли, что когда пользователи создают креативные или вирусные видео с их персонажами, это повышает вовлечённость аудитории и популярность франшиз.

Ограничивая использование, можно потерять охват - поэтому для многих теперь открытость стала выгодой, а не угрозой.

🟠Полное интервью

Читать полностью…
Subscribe to a channel