Telegram-канал machinee_learning - Machine learning chat: Unsorted

Machine learning chat

25 March 2026 14:49

Национальный инференс

Читать полностью…

Machine learning chat

25 March 2026 13:32

например оформить визу от альфа банка за 57круб =)

Читать полностью…

Machine learning chat

25 March 2026 13:29

зато рубли принимают , У сбера примерно тоже самое но за 1М

Читать полностью…

Machine learning chat

25 March 2026 13:07

Это норм читается хотя бы осенью, не раньше

Читать полностью…

Machine learning chat

25 March 2026 12:26

Похоже у него сверх способность, без API с LLM на прямую общаться.

Читать полностью…

Machine learning chat

25 March 2026 12:14

Ну то есть вся память забита хернёй из поиска 🤷‍♂

Читать полностью…

Machine learning chat

25 March 2026 11:21

дропнуть бд без бекапа - это насколько безопасно по его мнению?

Читать полностью…

Machine learning chat

25 March 2026 09:03

Как перейти от ИИ-экспериментов к рабочим системам

Рассказываем, где узнать реальный опыт тех, кто встроил искусственный интеллект в ключевые процессы компании и извлек из этого реальную выгоду. 22 апреля присоединяйтесь к конференции МЛечный путь от Selectel, провайдера инфраструктуры для ИИ.

Эксперты топовых ИТ-компаний расскажут:

🔺Как ускорить ML-пайплайны и снизить издержки на инференс без потери качества
🔺Как безопасно внедрить генеративные модели в ключевые процессы и управлять эффектом этого внедрения
🔺Как интегрировать модели в существующую ИТ-архитектуру

Конференция пройдет 22 апреля в Москве. Участие бесплатное, регистрируйтесь: https://slc.tl/ib77j

Реклама. АО "Селектел". erid:2W5zFHjUoay

Читать полностью…

Machine learning chat

25 March 2026 05:57

📌 Google разработала алгоритм квантования KV-кэша без потери точности.

Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом.

TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026.

KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти.

Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.

🟡TurboQuant - двухэтапный пайплайн.

Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны.

На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score.

Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных".

Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.

При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.

Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.

Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет.

🟡Статья
🟡Arxiv

@ai_machinelearning_big_data

🎯Полезные Мл-ресурсы 🚀 Max

#AI #ML #LLM #TurboQuant #Google

Читать полностью…

Machine learning chat

25 March 2026 03:56

Как будто Энграмм всю равно покруче будет, надо ждать модели уже с полной реализацией и того и другого что бы сравнить

Читать полностью…

Machine learning chat

25 March 2026 02:36

Спасибо за анонс, полезная информация.

Читать полностью…

Machine learning chat

24 March 2026 14:13

🚀 Похоже, в Claude Code появилась новая фича - Auto-dream

Пока официально не анонсирована, но её уже заметили в /memory

• Что это такое

Auto-dream - это фоновый подагент Claude, который:
- анализирует последние сессии
- извлекает ключевые знания
- обновляет MEMORY.md
- очищает и переорганизует старые данные

• Как устроена память
- MEMORY.md - это индекс
- отдельные файлы - детали по темам
- /memory - управление системой

👉 по сути, как garbage collector, но для памяти

🐍 Python полезные ресурсы 🚀Max

@data_analysis_ml

Читать полностью…

Machine learning chat

24 March 2026 09:03

is there anyone want to learn AI?

Читать полностью…

Machine learning chat

24 March 2026 09:00

is there anyone want to learn AI?

Читать полностью…

Machine learning chat

24 March 2026 08:38

а скинешь если не сложно я чето реально не нашел ниче ваще

Читать полностью…

Machine learning chat

25 March 2026 14:28

Все что выпустили Antropic за последнее время.

73 релиза за 52 дня.

Читать полностью…

Machine learning chat

25 March 2026 13:32

Есть десятки спрособов обойти проблему с оплатой, но кроме ПД. Даже можно без карты.

Читать полностью…

Machine learning chat

25 March 2026 13:23

Цены просто улет. За glm-4.6-357b 1000 токенов хотят за входящие и исходящие 2,318 р. при том, что на том же openrouter вход от 0,03 р. на выход макс 0,18 р. Смысл? Только за ПД?

Читать полностью…

Machine learning chat

25 March 2026 13:03

⚡️ MWS Cloud выпустил сервис по работе с большими языковыми моделями.

MWS GPT Model Hub — облачный сервис, который предоставляет доступ к LLM внутри MWS Cloud Platform. Развертывание занимает секунды, модели подключаются через OpenAI‑совместимый API.

Сейчас в сервисе 10 моделей, включая DeepSeek, Google, Alibaba, Zhipu AI. До конца года добавят еще десяток — с поддержкой преобразования текста в речь и аудио в текст.

Что можно делать с помощью MWS GPT Model Hub:

• запускать AI‑ассистентов без настройки инфраструктуры;
• обрабатывать большие объемы текстовых данных;
• создавать внутренние AI‑сервисы для сотрудников;
• сокращать time‑to‑market вдвое за счет быстрого прототипирования;
• внедрять интеллектуальный поиск в продукты.

К плюшкам: встроенные инструменты биллинга и учета ресурсов отслеживают расходы на AI‑функции по проектам и командам.

Читать полностью…

Machine learning chat

25 March 2026 12:15

Это ты кому сейчас написал, лэлэмке? 😂🤦‍♂

Читать полностью…

Machine learning chat

25 March 2026 11:25

хз, доверять боту самому решать что безопасно а что нет это такое себе... завтра он решит что твои конфиги в паблик вывалить это ок и всё, приехали.

Читать полностью…

Machine learning chat

25 March 2026 11:01

В Claude Code агент теперь сам решает, какие действия можно выполнять 👇

Раньше было два режима:
- либо он постоянно спрашивает разрешение
- либо skip permissions - делает всё без спроса

Первое раздражает.
Второе - рискованно.

Теперь появился auto mode.

В этом режиме Claude:
- сам принимает решения о доступах
- оценивает каждое действие
- безопасные - выполняет сразу
- рискованные - блокирует или ищет альтернативу

По сути:
• это тот же skip permissions, но с встроенной проверкой на потенциальный вред

🧠 Под капотом - классификатор, который анализирует каждый шаг агента

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

Читать полностью…

Machine learning chat

25 March 2026 08:37

Управляет компью́тером,заходит, старина, в твои файлики и дэпает все что найдет - мониторит почту и закидывает твой CVV

Читать полностью…

Machine learning chat

25 March 2026 05:12

"идеально для удалёнщиков" 😁

Читать полностью…

Machine learning chat

25 March 2026 03:51

Google представили TurboQuant - алгоритм, который сильно снижает требования к памяти при работе LLM.

KV-cache - это то, что хранит весь контекст во время генерации.
И именно он сейчас становится главным ограничением, а не сами модели.

Чем длиннее диалог или больше пользователей, тем быстрее заканчивается память на GPU.

TurboQuant решает это так:
- сжимает KV-cache минимум в 6 раз
- ускоряет инференс до 8 раз
- сохраняет качество без заметной потери

Это ключевой момент: раньше компрессия почти всегда ухудшала ответы.

Как это устроено:

- сначала данные преобразуются (rotation), чтобы их было проще сжимать
- затем применяется основной алгоритм сжатия (PolarQuant)
- после этого добавляется лёгкая коррекция (QJL), которая убирает ошибки

В итоге получается почти точное восстановление при сильно меньшем объёме.

С TurboQuant:
- модели можно запускать на меньшем количестве GPU
- один сервер может обслуживать больше запросов
- становится проще работать с длинным контекстом
- падает стоимость инференса

По сути, это не про “ускорить модель”, а про перераспределение ресурсов внутри всей системы.

Раньше оптимизировали веса моделей
теперь оптимизируют то, как они работают в проде

И KV-cache, как раз одна из самых дорогих частей.

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

Читать полностью…

Machine learning chat

24 March 2026 15:57

Чувак, у тебя хороший канал, но как же бесит то, что ты вообще не редактируешь это ллмный стиль. Прям буэ, читаю и бешусь каждый раз

Читать полностью…

Machine learning chat

24 March 2026 10:10

🚀 Cursor сделал regex-поиск мгновенным

Instant Grep ищет по миллионам файлов за миллисекунды
16.8 сек → 13 мс

И главное:
они не ускоряли regex
они убрали лишний поиск

🧠 Как это работает

- создаётся индекс: куски текста → файлы
- используются триграммы (fil, ile, le_)
- сначала ищутся кандидаты
- потом запускается regex

👉 большинство файлов вообще не открывается

🔥 Ключевая идея - sparse n-grams

- индексируются не все куски
- только самые «полезные»
- редкие символы имеют больший вес

💾 Всё локально

- индекс хранится у тебя
- привязан к Git
- быстрый доступ через memory map

Скорость даёт не regex
а умный отбор файлов до поиска.

https://x.com/cursor_ai/status/2036122609931165985

Читать полностью…

Machine learning chat

24 March 2026 09:01

Если вы работаете с выгрузками из баз, логами сервисов или отчетами за годы — вы уже имеете дело со значениями, разделенными запятыми (CSV). Но умеете ли вы загружать CSV в Spark правильно?

На открытом уроке разберем, как из плоского файла получить распределенную коллекцию данных — DataFrame. Поймем, почему DataFrame — это не просто таблица, как настраивать разбор грязных данных, объявлять схему вручную и избегать ошибок в промышленной среде.

Вы увидите, как Spark взаимодействует с файловой системой, научитесь писать код для загрузки CSV в PySpark или Scala и разберетесь, когда достаточно pandas, а когда без Spark не обойтись.

Открытый урок проходит в преддверии старта курса «Spark-разработчик».

➡️ Подробности и регистрация: https://otus.pw/XM07/

Читать полностью…

Machine learning chat

24 March 2026 08:38

зайди ко мне, скопируй, я недавно как раз делал бенчмарки

Читать полностью…

Machine learning chat

24 March 2026 08:37

ничего себе ты плохо искал

Читать полностью…