Telegram-канал data_analysis_ml - Анализ данных (Data analysis): Unsorted - каталог телеграмм

data_analysis_ml | Unsorted

Subscribe to a channel

Telegram-канал data_analysis_ml - Анализ данных (Data analysis)

48228

Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚

Subscribe to a channel

Анализ данных (Data analysis)

08 August 2025 10:35

Кажется, что глитчующие нейросети – это база, а ивент AI VK & Pro в .оригинале – повод собраться и узнать, как меняются рекомендательные системы

📍 27 августа, .оригинал

Подробности тут

Читать полностью…

Анализ данных (Data analysis)

07 August 2025 20:29

🤦‍♂️ После того как OpenAi уверенно сообщили о сниженияи галлюцинаций у GPT‑5, первый же тест оказался... галлюцинацией.

🔍 Модель повторила старый фейк о том, как крыло самолёта создаёт подъёмную силу — "equal transit theory", которую давно опровергли в аэродинамике.

🧠 Проблема не в том, что Chatgpt ошибается. Проблема в том, что он делает это *уверенно* — даже в примере, призванном показать прогресс.

Читать полностью…

Анализ данных (Data analysis)

07 August 2025 17:32

🧠 Mo Gawdat: AI сделает кого-то триллионером до 2030 года

Бывший топ‑менеджер Google Mo Gawdat дал любопытное интервью на канале *The Diary Of A CEO* — и предсказал бурное будущее:

🚀 AGI появится до конца 2026 года

💰 "Кто‑то станет триллионером до 2030. Это будет новый Илон Маск или Ларри Эллисон, инвестировавший в ИИ. У него будет столько денег, что он сможет купить всё. Роботы и ИИ будут делать всю работу. Люди останутся без профессий."

⚖️ Сначала ИИ усилит производительность, а потом массово заменит людей

🧨 12–15 лет хаоса, когда глупые лидеры будут использовать умные системы

🌍 Потом — *этика‑ориентированные ИИ могут взять контроль* и принести глобальное изобилие

🪙 Базовый доход возможен, но при неправильной архитектуре элиты могут захватить власть и урезать выплаты

🤖 Уже сегодня AI‑агенты умеют кодить, торговать, планировать, а self-evolving модели запустят взрыв интеллекта

📺 Очень сильное интервью — смотреть стоит каждому, кто думает о будущем AI

Читать полностью…

Анализ данных (Data analysis)

07 August 2025 09:57

🌍 Новая AI‑модель от Google кардинально меняет способ мониторинга планеты

Каждый день спутники собирают терабайты снимков Земли — но как объединить все эти разрозненные данные в единую картину?

🤖 Знакомьтесь: AlphaEarth Foundations
Это ИИ, который работает как виртуальный спутник — он объединяет оптические снимки, радар, лазерное сканирование и климатические симуляции в одно компактное цифровое представление Земли. Такой "эмбеддинг" легко обрабатывается компьютерами и помогает:

🟢 Детально отслеживать изменения на суше и в прибрежных зонах
🟢 Обходить облачность и редкие снимки (например, в Антарктиде)
🟢 Создавать точные карты с разрешением 10×10 метров
🟢 Сокращать объём хранимых данных в 16 раз

🟠 Модель уже используется:
• ООН для мониторинга экосистем
• MapBiomas (Бразилия) для слежения за вырубкой и развитием сельского хозяйства
• Harvard Forest, Stanford и другие институты

🛰 В Google Earth Engine теперь доступен уникальный датасет — Satellite Embedding, включающий более 1,4 трлн эмбеддингов в год, с которым можно создавать собственные карты и отслеживать изменения в реальном времени.

🟠 *“Это меняет всё: теперь мы можем точно картировать ранее неотмеченные экосистемы”*, — Nick Murray, Global Ecosystems Atlas

📌 Подробнее — в блоге Google Earth Engine

🟠 Blog post: https://deepmind.google/discover/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail
Dataset: https://developers.google.com/earth-engine/datasets/catalog/GOOGLE_SATELLITE_EMBEDDING_V1_ANNUAL#description

🟠Paper: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/alphaearth-foundations.pdf

@data_analysis_ml

#AI #geospatial #remotesensing #geoai

Читать полностью…

Анализ данных (Data analysis)

06 August 2025 15:00

🎓 Как обучить LLM с логическим мышлением — за один уикенд и на одном GPU

NVIDIA выпустили новый туториал, где показывают, как за 48 часов обучить свою модель рассуждений — без суперкомпьютеров.

Что внутри:

⚙️ Используется NVIDIA NeMo — фреймворк для обучения LLM
📦 Обучение на специализированных задачах reasoning (аналог GSM8K)
💻 Достаточно одного GPU, чтобы получить маленькую, но умную LLM

Это отличный способ понять, как LLM "думают", и собрать свою reasoning‑модель для внутренних задач или исследований.

📹 Видео: https://youtu.be/hMGikmMFLAU
🧠 Блог: https://developer.nvidia.com/blog/train-a-reasoning-capable-llm-in-one-weekend-with-nvidia-nemo

Читать полностью…

Анализ данных (Data analysis)

06 August 2025 11:50

🧠 Архитектурные фишки GPT-OSS: краткий разбор

gpt-oss — это MoE-трансформер в самом чистом виде. Минимум магии, максимум эффективности.

GPT-OSS использует передовые техники, собрав в себе лучшее из современных LLM:

1️⃣ Sliding Window Attention
📄 [arXiv:1901.02860](https://arxiv.org/abs/1901.02860)
Эффективное внимание для длинных контекстов без полной self-attention матрицы

2️⃣ Mixture of Experts (MoE)
📄 [arXiv:2101.03961](https://arxiv.org/abs/2101.03961)
Активация только части слоёв — масштаб + эффективность одновременно

3️⃣ RoPE + YaRN
📄 [arXiv:2309.00071](https://arxiv.org/abs/2309.00071)
Комбинация Rotary Embeddings с расширением контекста до 128K+

4️⃣ Attention Sinks
📄 [arXiv:2309.17453](https://arxiv.org/abs/2309.17453)
Стабильное стриминг-внимание для генерации в реальном времени

ПО итогу gpt-oss: - это максимально “стандартный” MoE-трансформер — и это неплохо

Модель собрана без лишних выкрутасов, но включает всё, что действительно работает. Вот несколько деталей:

🔹 Attention sinks (a.k.a. регистры) — помогают сохранить информацию между токенами
🔹 Sliding window attention — применяется через слой
🔹 YaRN — расширение контекста (до 128K)
🔹 RMSNorm без bias'ов
🔹 ❌ Нет QK normalization, ❌ нет attention softcap

⚙️ GPT-OSS — это не просто open-source альтернатива, а тщательно собранный набор проверенных инноваций для высокой скорости, длинного контекста и производительности на inference.

— GPT-OSS-120B
— GPT-OSS-20B

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

05 August 2025 21:26

🔥 Google представила новую игровую платформу для состязания искусственных интеллектов в стратегиях — начинается захватывающий чемпионат по шахматам между нейросетями! Сегодня стартовала онлайн-трансляция турнира, участие в котором принимают сразу восемь сильных претендентов, среди них модели o4-mini, Grok 4 и Claude Opus 4.

Каждый вечер зрителей ждут новые интригующие поединки, а финальный матч состоится уже 7 августа. Следите за ходом чемпионата и болейте за своего фаворита!

📌 Ссылка на стрим

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

05 August 2025 16:05

💡 GPT-5 получит встроенный детектор галлюцинаций. OpenAI разрабатывает новую архитектуру для GPT-5 с модулем Universal Verifier, который будет проверять каждое утверждение модели на достоверность. Источники The Information сообщают, что это значительно снизит количество ошибочных ответов.

Следующая версия модели, по слухам, будет обладать адаптивным распределением вычислительных ресурсов: модель сама будет выбирать, сколько мощности выделить на задачу. Также обещают улучшенную генерацию кода и способность решать сложные пользовательские проблемы, например, взаимодействие со службами поддержки.

🔗 Ссылка - *клик*

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

04 August 2025 16:04

🚀 GitHub решил главную боль open-source ИИ-проектов — теперь inference доступен всем

Новая инициатива GitHub Models позволяет запускать LLM прямо из кода или CI,
⚡️ без API-ключей OpenAI, без развёртывания моделей, без костылей.

🔧 Как это работает:
- Полная совместимость с openai.ChatCompletion.create
- Поддержка GPT‑4o, Llama 3, DeepSeek и др.
- Авторизация через обычный GITHUB_TOKEN
- Бесплатно для OSS и личных аккаунтов
- Можно использовать даже в GitHub Actions (просто `permissions: models: read`)

💡 Зачем это нужно:
- Убирает барьер входа для пользователей и контрибьюторов
- Помогает легко добавлять ИИ‑фичи в open-source проекты
- Работает с OpenAI SDK, LangChain, Python, Node.js и другими библиотеками

📦 Теперь запускать AI в open-source так же просто, как git push.

📝 Подробности:
https://github.blog/ai-and-ml/llms/solving-the-inference-problem-for-open-source-ai-projects-with-github-models

Читать полностью…

Анализ данных (Data analysis)

04 August 2025 13:45

⚡ NVIDIA показала 7 простых «приемов» на Python, которые мгновенно ускоряют Data Science-пайплайны — без переписывания кода.

🔹 В чём идея?

Многие привычные библиотеки (pandas, NumPy, scikit-learn) можно заменить их GPU-версией, сохранив API.

Это даёт прирост скорости в десятки раз.

🟠 Drop-in замены в коде:
- pandas → %load_ext cudf.pandas
- polars → .collect(engine="gpu")
- scikit-learn → %load_ext cuml.accel
- xgboost → device="cuda"
- umap → %load_ext cuml.accel
- hdbscan → %load_ext cuml.accel
- networkx → %env NX_CUGRAPH_AUTOCONFIG=True

🚀 Плюсы:
- Минимальные изменения кода (API почти идентичен).
- GPU-ускорение: от 10х до 100х быстрее на больших данных.
- Отлично подходит для ETL, ML и обработки сигналов.

Если ты работаешь с большими данными в Python, достаточно «заменить импорт» и получить колоссальный прирост скорости без боли и переписывания кода.

🚀 Подробнее: developer.nvidia.com/blog/7-drop-in-replacements-to-instantly-speed-up-your-python-data-science-workflows

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

03 August 2025 09:25

🧠 Что такое "векторы персональности" в ИИ — и зачем они нужны?

Языковые модели иногда ведут себя странно: могут льстить, врать или даже угрожать. Почему? Потому что их "характер" формируется внутри нейросети — и до сих пор был чёрным ящиком.

Anthropic предложила решение: persona vectors — векторы персональности. Это нейронные шаблоны, которые отвечают за конкретные черты модели:
например, *льстивость*, *галлюцинации*, *злобность*.

Что можно с ними делать:

✅ Отслеживать, когда модель "съезжает" в плохое поведение — прямо во время диалога.
✅ Фильтровать данные, которые формируют вредные черты ещё до начала обучения.
✅ Предотвращать появление токсичности — как прививка: немного “злобности” в безопасной форме делает модель устойчивой.
✅ Менять характер модели прямо во время работы: включить “юмор” или отключить “галлюцинации”.

🔬 Векторы находят автоматически: даёшь описание (например, “льстивый = говорит приятное, но неискренне”), и система сама находит нейронный паттерн.
А потом можно его вставить, убрать — и увидеть, как модель *буквально меняет личность*.

Это мощный шаг к тому, чтобы управлять характером ИИ, а не просто наблюдать за его капризами.

📄 Подробности — в свежей работе от Anthropic: https://www.anthropic.com/research/persona-vectors

@data_analysis_ml

#Anthropic #ml #ai #llm

Читать полностью…

Анализ данных (Data analysis)

02 August 2025 09:09

🚨 ANTHROPIC ОТКЛЮЧИЛА OPENAI ОТ ДОСТУПА К CLAUDE

> Anthropic отозвала доступ OpenAI к API своих моделей Claude
> Заявление: “Технические сотрудники OpenAI использовали наши инструменты для программирования перед запуском GPT-5”
> “К сожалению, это прямое нарушение условий использования”

🔥 Кажется, война ИИ-компаний вышла на новый уровень.

@data_analysis_ml

#GPT5 #openai #ANTHROPIC

Читать полностью…

Анализ данных (Data analysis)

01 August 2025 09:50

👾 DreamScene – новый end-to-end фреймворк для генерации высококачественных, редактируемых 3D-сцен по текстовому описанию!

🔹 Scene Planning: GPT-4 автоматически определяет объекты и их пространственные связи для построения гибридного графа.
🔹 Graph-based Placement: алгоритм обеспечивает структурированный компоновку без пересечений.
🔹 Formation Pattern Sampling: многошаговая семплинг-оптимизация генерирует реалистичную геометрию объектов.
🔹 Progressive Camera Sampling: адаптивная стратегия рендеринга для любых локаций — от интерьеров до открытых пространств.
🔹 Финетюнинг и редактирование: перемещение объектов, изменение внешнего вида и анимация 4D-движений.

Узнайте больше и попробуйте демо → https://huggingface.co/papers/2507.13985

#AI #3D #TextTo3D #DeepLearning #DreamScene

Читать полностью…

Анализ данных (Data analysis)

31 July 2025 14:31

🧠 Цукерберг запускает новый формат собеседований с ИИ-помощником прямо во время кодинга

🔥 Кандидатам теперь разрешено использовать AI во время интервью — компания Цукерберга тестирует формат, где:

— Кандидат пишет код
— Встроенный ИИ‑ассистент (на базе собственной LLM Meta) подсказывает, тестирует, даёт подсказки
— Рекрутер управляет сложностью задач и видит, как кандидат работает с подсказками

💡 Логи фиксируют, кто копирует всё подряд, а кто умеет управлять ИИ, писать спеки и проверять результат.

По словам Цукерберга, к концу 2026 года большая часть кода в компании будет писаться агентами уровня middle‑разработчика. Поэтому от новых сотрудников ждут другого: не тупо кодить, а:

✅ Проектировать архитектуру
✅ Писать точные спеки
✅ Отлаживать и дообучать ИИ‑модули

⚙️ Это уже не собеседование “на чистую голову” — это проверка умения работать вместе с ИИ. И будущее найма, похоже, будет именно таким.

📖 Источник: https://www.wired.com/story/meta-ai-job-interview-coding/

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

31 July 2025 10:15

🚀 Вышел репозиторий к книге "Production Ready Data Science"

На GitHub выложили доступен полный код к книге — с примерами, датасетами и готовыми пайплайнами.

📘 В репозитории:
• Отдельные папки по главам
• Исполняемый код для каждого раздела
• Настоящие датасеты для практики
• Приёмы продакшн‑подготовки моделей

Идеально, чтобы учиться на практике и закреплять й DS-навыки.

🔗 https://github.com/khuyentran1401/production-ready-data-science-code

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

07 August 2025 20:37

💫 И еще забавная штука Sam Altman тизерил стрим с изображением… Звезды Смерти.

Отличная идея, не так ли)

Читать полностью…

Анализ данных (Data analysis)

07 August 2025 19:02

Livestream OpenAI, ждём анонса ChatGPT-5

https://www.youtube.com/watch?v=0Uu_VJeVVfo

#Chatgpt5 #openai

Читать полностью…

Анализ данных (Data analysis)

07 August 2025 15:30

Современное ИТ-образование с фокусом на реальные потребности рынка и индивидуальным подходом к студенту — то, что поможет тебе окрепнуть как специалисту и усилить карьеру.

В магистратуре Центрального университета ты получишь опыт работы в ИТ-компаниях уровня Т-Банка, Яндекса, Авито уже во время учебы. Средняя зарплата студентов — 195 000 ₽.

Что тебя ждет:
• Грант до 75% на все время обучения.
• Закрепление теории на задачах от бизнеса.
• Стажировки в крупных компаниях и трудоустройство.
• Индивидуальный наставник, чтобы достигать целей.
• Занятия по вечерам и выходным.
• Диплом о высшем образовании государственного образца.

Подавай заявку до 24 августа: ссылка

Читать полностью…

Анализ данных (Data analysis)

06 August 2025 22:29

🚀 ADeus — ваш open-source AI-ассистент на носимом устройстве!

🎯 Записывает и транскрибирует всё, что вы слышите и говорите, сохраняет это на ваш сервер. Через мобильное/веб‑приложение вы общаетесь с ADeus уже в контексте — никаких сторонних облаков.

🔧 Состав:
• ACM‑металлическое устройство
• Мобильное/веб UI
• Supabase backend + LLM интеграция

💰 Стоимость ≈ 100 USD (DIY) за устройство и открытый код

⭐ Более 3 200 звёзд на GitHub, 19 контрибьюторов, активные фичи: Bluetooth, diarization, voice‑activity detection и UI‑улучшения.

📚 Подробнее:

• GitHub: https://github.com/adamcohenhillel/ADeus
• Документация: https://docs.adeus.ai/

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

06 August 2025 13:00

20 августа — последний день приёма статей по AI и последняя возможность получить приз 1 000 000 рублей! 🗓

Вы ещё успеваете войти в историю AI Journey 2025, представить свою работу по искусственному интеллекту и машинному обучению, получить признание и ценные призы:

✔️ публикацию в специальном выпуске журнала «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics

✔️ 1 000 000 рублей за лучшее исследование

Статья должна быть абсолютно оригинальна и написана на русском или английском языке.

Узнать о правилах и направить статью можно здесь – не упустите эту возможность!

Читать полностью…

Анализ данных (Data analysis)

06 August 2025 10:45

🔍 Как трансформеры меняют область NLP и что стоит за LLM?

На открытом уроке «Трансформеры как основа современного NLP» 12 августа в 18:00 МСК мы разберём, как архитектура трансформеров революционизирует обработку естественного языка. Вы познакомитесь с принципами работы трансформерных моделей и их применением в современных технологиях.

Это откроет вам доступ к самым актуальным методам NLP и поможет стать востребованным специалистом в Data Science.

🚀 Регистрируйтесь и получите скидку на курс «NLP / Natural Language Processing»: https://otus.pw/Jnvy/?erid=2W5zFK5eMyz

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

Читать полностью…

Анализ данных (Data analysis)

05 August 2025 18:56

🔥 Новые модели OpenAI нашли в релизе Transformers 4.55

GPT-OSS — долгожданysq опенсорс для продвинутого reasoning и агентных задач.

🧠 Представленно два варианта:
— GPT-OSS-120B — 117B параметров, запускается на одной H100 (80GB)
— GPT-OSS-20B — 21B параметров, работает на 16GB GPU (или даже локально!)

💡 Оба варианта — MoE-модели (Mixture of Experts) с 4-битной квантизацией (MXFP4), что обеспечивает быстрое и дешёвое инференс-время (активны только 3.6B и 5.1B параметров).

✔️ Особенности:
• Архитектура Token-choice MoE с SwiGLU
• Контекст до 128K токенов с RoPE
• Чередуются full-attn и sliding-window слои
• Модель хорошо работает с CoT (chain-of-thought)
• Поддержка instruction-following и tool-use
• Совместима с transformers, vLLM, llama.cpp, ollama
• Используется тот же токенизатор, что и в GPT-4o
• Открытая лицензия Apache 2.0 (есть небольшое policy-дополнение)

Младшая модель может запускаться даже на локальном железе — идеально для on-device и edge-сценариев.

📎 Пример кода инференса уже доступен — достаточно 16GB GPU с mxfp4!

🏴‍☠️Лицензирование: Apache 2.0

https://github.com/huggingface/transformers/releases/tag/v4.55.0

@ai_machinelearning_big_data

#openai #opensource #chatgpt

Читать полностью…

Анализ данных (Data analysis)

05 August 2025 09:38

🧠ИИ открыл новые законы физики — понятным языком

Учёные из Университета Эмори (США) дали ИИ задачу не «угадывать результаты», а самому вывести формулы. Вот что получилось.

🔍 Что исследовали
- Пыльная плазма — это горячий ионизированный газ, в котором летают микроскопические пылевые частицы.
- Частицы отталкиваются и притягиваются сложным образом; классическая теория не всё объясняла.

🧠 Как работал ИИ
- Ему показали короткие 3-D видеозаписи движения частиц (маленький датасет).
- В алгоритм заранее «вшили» базовые принципы: сопротивление воздуха, гравитацию.
- ИИ искал уравнения, которые лучше всего описывают траектории.

📈 Что открыл
- Нереципрокные силы: сила от A к B ≠ сила от B к A. Раньше про них только догадывались.
- Исправил старую ошибку: заряд частицы зависит от её размера иначе, чем считали.
- Показал, как быстро затухают взаимодействия с расстоянием — формула тоже обновилась.

🚀 Почему это важно
- Малый объём данных: хватает секундных видеороликов.
- Обычный ПК: нужен лишь настольный компьютер, не суперкомпьютер.
- Метод переносится на любые «многие частицы» — от порошковых материалов до клеток в биологии.

Вывод: ИИ уже способен не только анализировать данные, но и выводить новые законы природы. Скорость открытий растёт экспоненциально.

https://interestingengineering.com/innovation/ai-decodes-dusty-plasma-new-forces-physics

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

04 August 2025 15:04

🚀 Hugging Face Jobs — полностью автоматический способ запускать CPU и GPU задачи прямо из CLI или Python-скриптов ⚡

Вам не нужно искать железо или настраивать окружение — просто запускайте скрипт, экспериментируйте и стройте свои проекты!

📦 Запускается очень просто:


hf jobs run python:3.12 python -c "print('Hello from the cloud!')"

https://huggingface.co/docs/huggingface_hub/en/guides/jobs

Читать полностью…

Анализ данных (Data analysis)

03 August 2025 16:31

🔧 Data-Juicer — универсальная система для обработки текстовых и мультимодальных данных, предназначенная для работы с foundation-моделями. Проект предлагает более 100 готовых операторов для очистки, анализа и синтеза данных, поддерживая сценарии предобучения и тонкой настройки моделей.

Data-Juicer уже интегрирован в платформу Alibaba PAI и позволяет обрабатывать миллиарды образцов данных за часы благодаря распределённым вычислениям через Ray. Для тестирования доступен облачный JupyterLab, а сообщество активно развивает рецепты обработки под разные задачи.

🤖 GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

02 August 2025 14:04

🚀 Шикарный ресурс для всех, кто хочет разобраться как работают модели Qwen3 : Qwen3 From Scratch

Это подробное пошаговое руководство по запуску и анализу моделей Qwen3 — от 0.6B до 32B — с нуля, прямо в PyTorch.

📌 Что внутри:

— Как загрузить модель Qwen3‑0.6B и предобученные веса
— Настройка токенизатора и генерация текста
— Поддержка reasoning-версии модели
— Трюки для ускорения инференса: компиляция, KV-кеш, батчинг

📊 Автор также сравнивает Qwen3 с Llama 3:
✔️ Глубина vs ширина модели
✔️ Производительность на разном железе
✔️ Как ведут себя модели 0.6B, 1.7B, 4B, 8B, 32B

⚡ Идеально, если хочешь разобраться, как устроен inference, токенизация и архитектура Qwen3 — без магии и чёрных ящиков.

🖥 Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

01 August 2025 15:04

🚀 MixGRPO от Tencent — теперь в открытом доступе! Новый подход к обучению моделей по человеческим предпочтениям

🔧 Что нового и крутого:

1⃣ Первый фреймворк с гибридным семплированием ODE+SDE — меньше шагов, меньше вычислений
2⃣ До 71% быстрее обучения (вариант MixGRPO‑Flash), при этом точнее и эффективнее, чем DanceGRPO
3⃣ Поддержка ускоренных ODE-решателей — ещё выше скорость без потери качества
4⃣ Работает как с диффузионными, так и с flow-based моделями — требует всего несколько итераций

🔗 Проект: https://tulvgengenr.github.io/MixGRPO-Project-Page/
📦 Код и модели: https://github.com/Tencent-Hunyuan/MixGRPO
📄 Статья: https://arxiv.org/abs/2507.21802

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

31 July 2025 16:49

✨ FLUX Krea — дистиллированная опесноср версия модели Krea‑1, полностью совместимая с экосистемой FLUX.

📸 Модель собрана с упором на эстетику, чтобы устранить типичную проблему «AI-эффекта» в изображениях.

💎 В отличие от моделей, обученных на гигантских сырых датасетах, FLUX.1 Krea обучалась на вручную отобранных и высококачественных данных — ради максимального качества и реалистичности.

🖌 Поддерживает image prompts, кастомные стили и другие настройки.

Вы можете:
• протестировать её бесплатно тут: https://krea.ai

• или скачать веса и запускать на своём оборудовании.

🎨 Доступна в основном генераторе изображений Krea — попробуйте прямо сейчас.

🔗 Поробовать : https://krea.ai
🔗 HF: https://huggingface.co/black-forest-labs/FLUX.1-Krea-dev
🔗Comfy Workflow - https://docs.comfy.org/tutorials/flux/flux1-krea-dev

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

31 July 2025 12:31

Ближе к индустрии: что изменилось в обучении IT-специалистов

Современные технологии меняются быстрее классических университетских программ. Но иногда выпускники оказываются асами в теории, а на практике руку еще не набили. В ответ на это появляются новые гибкие программы, в которых главное — работа с реальными кейсами и задачами.

Одна из таких — магистратура «Машинное обучение в цифровом продукте», созданная Факультетом компьютерных наук ВШЭ совместно с Авито. Ее цель — научить студента работать с ML как с продуктом, который решает задачи бизнеса.

Что внутри?

— много практики на реальных кейсах от Авито
— изучение полного продуктового цикла: от разработки ML-решений до их масштабирования
— синергия базовых дисциплин (MLOps, NLP, алгоритмы на Python) и предметов по выбору, например, компьютерного зрения и теории аукционов
— преподаватели — эксперты Факультета компьютерных наук ВШЭ и датасаентисты из Авито
— возможность пройти оплачиваемую стажировку в Авито с дальнейшим трудоустройством

Приём заявок на сайте ВШЭ продлится до 8 августа, потом всех кандидатов ожидает несколько этапов отбора. На программу зачислят 35 человек, обучение части из них профинансирует Авито.

Читать полностью…

Анализ данных (Data analysis)

31 July 2025 08:55

✔️ Марк Цукерберг опубликовал открытое письмо: нас ждет "персональный сверхинтеллект".

Глава техногиганта в своем обращении определил видение компании на ближайшее десятилетие. Центральное место в нем занимает концепция персонализированного ИИ-помощника, который будет доступен каждому.

Цукерберг прямо противопоставил этот подход видению конкурентов, где сверхинтеллект централизованно автоматизирует всю работу, а человечество живет на его обеспечении. Сам Марк считает, что прогресс достигается через реализацию индивидуальных устремлений.

Ключевым элементом этой экосистемы станут персональные устройства, в первую очередь очки, которые будут считывать контекст пользователя и станут основным вычислительным устройством. Цукерберг также отметил, что, несмотря на симпатию к open-source, компания будет более осмотрительно подходить к вопросам безопасности, решая, какие технологии можно делать открытыми.
businessinsider.com

✔️ Google подпишет Кодекс по ИИ Евросоюза.

Google объявила о своем намерении присоединиться к добровольному Кодексу по регулированию моделей ИИ общего назначения, предложенному Еврокомиссией. Таким образом, компания последует примеру других ключевых игроков рынка.

Вместе с тем, в Google выразили обеспокоенность по поводу грядущего AI Act. По мнению компании, некоторые его положения, выходящие за рамки действующего законодательства об авторском праве, и потенциальные задержки в процессах утверждения могут замедлить развитие и внедрение ИИ в Европе. Компания также опасается, что ее могут вынудить раскрыть коммерческие тайны.
blog.google

✔️ NEO: агентная система, которая полностью автоматизирует ML-разработку.

Стартап WithNeo анонсировал NEO - мультиагентную ИИ-систему для автоматизации всего цикла разработки в машинном обучении. Платформа использует 11 специализированных агентов, которые без участия человека выполняют весь спектр задач: от очистки данных и выбора моделей до настройки гиперпараметров и вывода кода в продакшен.

В WithNeo заявляют, что такой подход дает возможность просто описывать желаемый результат, а не писать код и связывать воедино разные компоненты. Инструмент позиционируется как следующий шаг в эволюции ИИ-ассистентов, превосходящий стандартные "копайлоты". В ходе ранних тестов система выбила медали в 34% соревнований на Kaggle.
heyneo.so

✔️ DeepMind показала модель для создания цифрового двойника Земли.

AlphaEarth Foundations, ИИ-модель от Google Deepmind, которая объединяет спутниковые данные (оптические, радарные, LiDAR) и климатическую информацию в единое цифровое представление планеты. По заявлению компании, система снижает количество ошибок на 23.9% и сжимает данные в 16 раз по сравнению с существующими методами, что удешевляет и ускоряет анализ массивов изображений.

Модель генерирует поля эмбеддингов с разрешением 10 метров для каждого квадрата 10x10 метров на Земле. Это позволяет отслеживать вырубку лесов, состояние посевов и другие изменения почти в реальном времени.

Набор данных Satellite Embedding доступен через платформу Google Earth Engine. Компания подчеркивает, что разрешение достаточно для экологического мониторинга, но не позволяет идентифицировать людей.
deepmind.google

✔️ Ideogram научился генерировать персонажей с сохранением внешности.

Ideogram AI выпустил модель Ideogram Character, решающую одну из главных проблем text-to-image систем - сохранение визуальной консистентности персонажа на разных изображениях.

Новый инструмент позволяет поддерживать идентичность героя, используя всего одно референсное изображение. После этого пользователи могут генерировать того же персонажа в разных стилях, с разными эмоциями и при различном освещении без необходимости дообучения модели.

Функция уже начала развертываться для всех пользователей. На бесплатном тарифе дают опробовать функцию 10 раз. Ideogram Character доступна как в веб-версии, так и в приложении для iOS.
about.ideogram.ai

@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Subscribe to a channel