machinee_learning | Unsorted

Telegram-канал machinee_learning - Machine learning chat

6051

Please fell free to send your questions to admin - @haarrp https://t.me/pythonl - channel for Python developers https://t.me/ai_machinelearning_big_data our channel with huge amount of useful information

Subscribe to a channel

Machine learning chat

Ну может так и есть. Если в алгоритме скажем условно нет данных арбитража других активов, тогда ему сложнее прогнозировать.

Тут в общем нужно для начала вникнуть в hrl, а то добавлять какие то признаки и все остальное в общий рл без понимания работает оно через ирерарзию вообще или нет бред

Читать полностью…

Machine learning chat

GPT-2.
Но говорят она слишком мощная, умеет считать буквы "r" в "strawberry" - так что на всех пока не раскатывают.

Читать полностью…

Machine learning chat

Уже 3 дня без новых моделей ?

Читать полностью…

Machine learning chat

основная проблема была в том, что клауд код иногда объединяет вызовы инструментов и размышления в одном сообщении, типа "я тут подумал и вызвал инструмент", а дипсик это воспринимает как ошибку последовательности вызова инструментов

Читать полностью…

Machine learning chat

Тоже делаю торгового агента, но но у меня не классический бот, а торговый "организм" который "мыслит" и запоминает. Я сейчас думаю в сторону того, что наказание должно записываться не на действие целиком, а на связку:

состояние рынка → внутренний паттерн → действие → последствие

То есть плохой опыт должен временно снижать доверие именно к повторению похожей конфигурации, но не запрещать агенту покупать/продавать вообще. И наоборот, если контекст изменился, система должна иметь возможность снова проверить гипотезу, а не сидеть в жёстком cooldown.

Ещё отдельно интересен вопрос дневного PnL/drawdown. Кажется, их лучше использовать не как прямую reward-функцию на каждом шаге, а как более верхний “метаболический” слой: если день идёт плохо или растёт просадка, агент становится осторожнее; если хорошо, он не обязательно разгоняет риск бесконечно.

Как ты это решаешь через HRL, через отдельный risk-manager, через shaping reward, или как-то иначе?

Читать полностью…

Machine learning chat

Добрый день!
Как лучше стартовать в аналитике данных?
BI-аналитика, веб-аналитика, или обычная аналитика данных
С каких видеоуроков или книг лучше начать?
Как лучше последовательно изучать или комбинировать разные разделы аналитики?.

Читать полностью…

Machine learning chat

⚡️ Вы слышали про Rust. Знаете, что он быстрый, безопасный и что за ним будущее.

Осталось одно: сесть и выучить.

Этот курс со Stepik- кратчайший путь от «знаю что такое Rust» до «пишу на нём».

6 модулей, 50 уроков, 143 теста. Ownership, borrowing, traits, async, Tokio, Axum, макросы, WASM — всё разложено по полочкам и закреплено практикой.
Никакого видео на 40 минут ради одной мысли. Подробный текст, много кода, реальные задачи после каждого урока. На выходе — портфолио из 10+ проектов: от CLI-утилит до REST API с базой данных.

48 часов действует скидка 55 процентов: stepik.org/course/269250

Читать полностью…

Machine learning chat

С практической точки зрения: доходность на маленьком капитале будет отрицательной из-за высокой конкуренции, доходность на большом - небольшой. И, в целом, гораздо эффективнее расти с нуля отнюдь не в чистых финансах. Соотношение прибыли к риску, сам по себе уровень риска даже в стартапах несравнимо лучше.

Читать полностью…

Machine learning chat

Следующий этап понимания: уровни арбитража. То, что для тебя - альфа, для людей выше уровнем - арбитраж, и далее по цепочке. Если ты нашел что-то "рабочее", значит ты не учел весь объем информации и рисков верхнего уровня. Это их плата тебе за возможность вытащить свою альфу с тебя и тебе подобных, когда время придет (ты можешь называть это "черным лебедем", но фактически это характеристика уровня капитала - уровни ниже имеют плечо выше, в то время как чем выше уровень, тем меньше плечо, вплоть до отрицательного).

Читать полностью…

Machine learning chat

Ключевой вопрос тут - не в алгоритмах, а в данных, на самом деле. Если ты используешь общедоступные заезженные данные вроде голых цен, ну удачи тогда :)

Читать полностью…

Machine learning chat

Т.е вся проблема в логике награды голого rl, что добавление штрафа применяется ко всем состояниям - купить/ ждать/ продать на каждом шаге?

Т.е голый рл просто моделирует нажатие кнопок (условно) а все остальное он не понимает, опираясь просто на плавный рост награды ( усредненно типо)?

Читать полностью…

Machine learning chat

Вопрос такой - без hrl невозможно на голом rl обучить агента, что например открытие позиций на клнтр тренде плохо?

Т.е это так не работает, потому что он начинает применять штрафы ко всем ситуациям.

Если просто добавить условие - если резко выбило ждать например 10 минут не открывая сделку заново и т.д, то ее все равно откроет, т.к агент не понимает и у него просто Дель увеличить награду ?

Читать полностью…

Machine learning chat

8 апреля релизнули. И самое главное - токены будут считаться как overusage на любой подписке, примерно 5-15 баксов за вызов. Ultraplan еще есть, тоже интересная штука, и тоже платная для любой подписки

Читать полностью…

Machine learning chat

🚀 OpenAI представила GPT-5.5

Она заметно сильнее в самом главном: код, ресёрч, аналитика и работа с документами.

GPT 5.5 хороша в многоступенчатых задачах.

И почти во всём обходит конкурентов - например, на Terminal-Bench выбивает 82,7% против 69% у свежей Claude.
GPT-5.5 уже доступна пользователям Plus, Pro, Business и Enterprise - в ChatGPT и Codex.

Модель стала дороже: ~$5 / $30 за млн токенов.

Уже раскатывают на всех платных подписчиков.

Тестим! 🔥

https://openai.com/index/introducing-gpt-5-5/

Читать полностью…

Machine learning chat

говорится об угоне (т.е. что то что было у компании взяли себе).

так что проблема не на моей стороне

Читать полностью…

Machine learning chat

Меня интересуют только Цетлин Машинные модели.

Читать полностью…

Machine learning chat

Посоветуйте новую модель.

Читать полностью…

Machine learning chat

корректная последовательность сообщений (преобразованная):

Читать полностью…

Machine learning chat

если вдруг кому надо - снизу процесс преобразования сообщений под последовательность которую поддерживает дипсик (это мой завайбкоженый прокси-сервер)

Читать полностью…

Machine learning chat

📚 Переводим целые книги и большие файлы за минуту - opensource переводчик, который поможет адаптировать любое произведение, документ или другие файлы на любой язык.

• Внутри можно использовать любые модели, в том числе ChatGPT, Gemini, Mistral и DeepSeek.
• Вы можете запускать переводчик локально через Ollama и не бояться за приватность.
• Принимает любые типы файлов: EPUB, SRT, DOCX, TXT.
• Сохраняет форматирование.
• Переводит файлы на огромное количество языков и знает русский.
• После перевода также еще раз проходит по тексту для литературной шлифовки и комфортного чтения.

Github: https://github.com/hydropix/TranslateBooksWithLLMs

Читать полностью…

Machine learning chat

Это не техническая, а концептуальная проблема: волатильность с одной стороны кормит, с другой стороны является фактором риска если у тебя плечо выше чем у игроков для которых ты арбитраж

Читать полностью…

Machine learning chat

Проблема не в волатильности как таковой. Проблема понять как на нее реагировать без запаздывания.
Т.к указав жесткое условие на закрытие по стоп лосу, алгоритм будет пытаться вновь открыть сразу же как сделка закрылась. Добавление костылей - возврат обратно (выше зоны там где был вход) , временной таймер и т.д, это все костыли, которые сломаются когда рынок чуть опять поменяется

Читать полностью…

Machine learning chat

Если более простыми словами: чем больше у тебя капитал, тем меньший процент на него тебе нужно сделать для прокорма. И тем меньшее плечо требуется, соответственно ты можешь банально пересиживать волатильность, которая убивает игроков с бОльшим плечом. Это и есть, по сути, основной критерий выживания на рынке, даже не алгоритмы.

Читать полностью…

Machine learning chat

Трейдинг-конкурентная игра, и чем более популярны данные, тем меньше там сигнала. Просто задумайся над цифрой - в мире есть около миллиона квантов, и по крайней мере 100 тысяч из них занимаются этим профессионально. Какой шанс того, что именно твой алгоритм вытащит с общедоступных данных то, что эти сотня тысяч человек упустили? :)

Читать полностью…

Machine learning chat

Кароче цель сейчас какая? Уйти от плоской награды к целям - дневной доход в %, минимальная просадка, а не просто рост награды ?

Читать полностью…

Machine learning chat

Тесть нужно вводить HRL и моделировать в нем поведение - не просто рост награды без причинно следственной связи, а на каких либо условиях - рост дневного pnl на 5% например, дополнительное условие - максимальная дневная просадка 1%. Агент тогда начнет сам понимать и зоны в которых повышенная волатильность, и зоны новостные, когда цена резко и импульсивно меняется?

Читать полностью…

Machine learning chat

А, ну то есть валидации еще не было. У меня коммиты делаются только после ручной валидации, если что. И нужно не код смотреть, нужно систему в действии трогать и на реальных кейсах крутить, оптимизировать в деталях в процессе реального использования.

Читать полностью…

Machine learning chat

Ant Group выкатила Ling-2.6-1T, флагманскую модель на триллион параметров, и главная фишка тут не размер.

Разработчики сделали ставку на механизм «быстрого мышления»: модель не гоняет бесконечные цепочки рассуждений, а выдаёт ответ экономно по токенам, сохраняя при этом SOTA уровень интеллекта.

По сути, Ant Ling пытается переломить индустриальный тренд, где качество ответа принято покупать ценой огромного расхода токенов. Здесь токен возведён в ранг first-class сущности, то есть эффективность встроена в саму архитектуру, а не прикручена сверху.

https://openrouter.ai/inclusionai/ling-2.6-1t:free

Читать полностью…

Machine learning chat

Xiaomi анонсировала серию MiMo-V2.5 - новое поколение их открытых агентных моделей.

MiMo-V2.5-Pro - флагман линейки. Серьёзный скачок по сравнению с MiMo-V2-Pro в общих агентных способностях, сложной разработке ПО и долгосрочных задачах.

По заявленным бенчмаркам догоняет фронтирные модели вроде Claude Opus 4.6 и GPT-5.4: SWE-bench Pro — 57.2, Claw-Eval — 63.8, τ3-Bench — 72.9. Может автономно выполнять
профессиональные задачи с более чем 1000 вызовов инструментов — работа, на которую у людей-экспертов ушли бы дни.

Tech Blog: https://mimo.xiaomi.com/blog/mimo-v2.5-pro

MiMo-V2.5 - нативно омнимодальная модель с сильными агентными возможностями. Даёт производительность Pro-уровня примерно за половину стоимости. Улучшено восприятие изображений и видео, нативное контекстное окно на 1M токенов и значительно более эффективный инференс.

Доступны техблоги и API с тарифными планами на платформе Xiaomi.

Tech Blog: https://mimo.xiaomi.com/blog/mimo-v2.5

🔗 API & Token Plan: https://platform.xiaomimimo.com/token-plan

Читать полностью…

Machine learning chat

ну что ну вот. новость эту перечитай и мое сообщение

Читать полностью…
Subscribe to a channel