6051
Please fell free to send your questions to admin - @haarrp https://t.me/pythonl - channel for Python developers https://t.me/ai_machinelearning_big_data our channel with huge amount of useful information
ничего сложнее небольшого куска кода или sql запроса ллмки писать не особо могут. Кучу раз надеялся на лучшее и напарывался на ситуации когда всё работает но криво. А уж про то, что если в том же диалоге решать 2 разные задачи я вообще молчу.
Если не считать потоки в лангфлоу например, где можно подзаморочиться
Anthropic выпустили исследование AI Fluency Index. И главный вывод - большинство людей уже используют AI каждый день, но почти никто не умеет работать с ним правильно.
Вот самое важное и неожиданное из исследования.
Главный навык работы с AI - не запрос, а диалог
85,7% эффективных взаимодействий - это не один вопрос, а серия уточнений.
Когда человек:
- уточняет
- просит доработать
- спорит
- улучшает результат
уровень AI-грамотности в 2 раза выше.
Такие пользователи:
- в 5,6 раза чаще проверяют логику ответа
- в 4 раза чаще замечают, чего не хватает
Вывод: первый ответ AI - это черновик, а не результат.
Самая продуктивная модель - AI как напарник
Наиболее эффективные пользователи не делегируют работу полностью, а используют AI как:
- мыслительного партнёра
- соавтора
- помощника в размышлениях
AI усиливает человека, а не заменяет его.
Опасный эффект: чем красивее результат, тем меньше его проверяют
Когда AI создаёт:
- код
- документы
- приложения
- интерфейсы
люди:
- реже проверяют факты (-3,7%)
- реже замечают недостающий контекст (-5,2%)
- реже задают вопросы по логике (-3,1%)
Если результат выглядит готовым - его принимают на веру.
Это один из главных рисков эпохи AI.
Люди хорошо управляют AI, но плохо контролируют результат
В задачах с готовыми материалами пользователи чаще:
- чётко описывают цель (+14,7%)
- задают формат (+14,5%)
- дают примеры (+13,4%)
Но при этом меньше анализируют итог.
Только 30% пользователей задают правила работы с AI
Например:
- «Если мои предположения неверны - поправь»
- «Объясни логику перед ответом»
- «Скажи, в чём ты не уверен»
А это напрямую влияет на качество результата.
Главный вывод
Разрыв будущего будет не между программистами и не-программистами.
Разрыв будет между:
- теми, кто ведёт диалог с AI
- и теми, кто копирует первый ответ
AI-грамотность - это новый базовый навык.
И самый важный принцип из исследования:
Первый ответ AI - это начало работы, а не конец.
https://www.anthropic.com/research/AI-fluency-index
@data_analysis_ml
команда дипсика очень нихуёвая так то. просто они не выпускают массовый продукт пока что не знаю почему. захотели бы выпустили. может быть копят ульту
Читать полностью…
⚡ Китайские производители чипов агрессивно демпингуют на рынке DRAM.
Компания CXMT продаёт модули DDR4 почти в два раза дешевле рыночной цены, несмотря на то, что сами цены на память резко растут.
За последний месяц стоимость DRAM выросла на 23,7% - до $11,50, а в годовом выражении увеличилась более чем в 8 раз.
Пока мировой рынок дорожает из-за дефицита и спроса, китайские компании пытаются захватить долю рынка за счёт низких цен.
https://www.koreaherald.com/article/10679206
После того, как ты допишешь Цетлин Машину!
Читать полностью…
Китайский новый год в самом разгаре, а они обещали!
Читать полностью…
Flip будет полезен, потому что будет больше данных и они будут разные.
Я правильно понимаю, что в обучении только искусственный шум (который добавляется программно), а удалять мы пытаемся реальный? Может ещё быть проблема с тем что искусственный шум не похож на реальный и слишком однообразен (то есть не покрывает всё распределение реальных шумов). Может поискать готовые датасеты на эту тему с примерами очищения реальных шумов?
Шум - гаусс, хром, ISO с рандомизированными настройками. Клеточные автоматы - разные шумы в сегментированных подпространствах на одном изображении? Звучит интересно, но сложно понять, какой явный прирост в эффективности это даст. А flip будет полезен для шума? Если область и изображение всё равно те же самые.
Читать полностью…
Я 150 лет изучаю фрэймворки - а проблема Цетлина так и не решена
Читать полностью…
Годы в ожидании Цетлин Машины тянутся невыносимо...
Читать полностью…
В финтехе нужны xgboost и синтетические данные
Вот, я на прошлой неделе с помощью xgboost создавал синтетические данные)
А что там, preprocessing табличек сделал, XGBoost запустил, да и файн тьюнишь по cross validation и feature engineering )
А fraud detection каким-нибудь автоэнкодером замутил)
Вывод о том что диалог важен конечно странный, использую самые последние версии, например opus 4.6, и, по личным наблюдениям, очень быстро при разрастании контекста начинает тупить. При работе с кодом. А лучший вариант получается когда даю задание, он пишет участок кода и тз к нему, и тут же ему в новом диалоге кидаю его же код на проверку. 5-6 итераций и иногда получается что то рабочее, конечно не для прода. Если же делать все в одном диалоге, качество стремительно начинает проседать. Так же у джемини, и у чатгпт
Читать полностью…
Если накладывается искусственный шум, то в качестве базового датасета можно использовать любой большой датасет, например COCO. Но наиболее вероятно, что проблема в низком разнообразии накладываемых шумов
Читать полностью…
А на кой чёрт нужно это говно, которое даже на русском разговаривать не умеет
Читать полностью…
Смотря какие задачи хочешь решать, если классификация или NER это encoder-only модели типа BERT, если генерация то decoder-only (GPT), если перевод то в сторону encoder-decoder (seq2seq).
По сути, выучи архитектуру Transformer, дальше ты просто используешь encoder для одних задач, decoder для других или полный encoder-decoder для третьих. Закроешь 80% NLP.
Её хотя бы можно было запускать на моём слабом ноутбуке.
Читать полностью…
Привет! Подскажите, какую модель изучать в PyTorch, учусь я по пути ML Engineer NLP/LLM. Хотелось бы понять какую именно модель или модели изучать? Так как я видел много моделей NLP в PyTorch хочу изучать ту которая мне нужна на данный момент, и чтобы не кидал все силы в ненужный материал.
Читать полностью…
Люди! Ну когда уже выпустят DeepSeek V4?!
Читать полностью…
Другой нейронкой сгенерировать из датасета еще больше изображений..
Читать полностью…
Без аугментаций будет во первых мало данных (и они будут однообразные), во вторых будет очень медленно сходиться. Надо как минимум flip, random crop (для масштаба), освещённость, цветовые аугментации, fancy pca.
Также повысить разнообразие накладываемого шума. Каким образом он накладывается? Кажется, что можно накладывать с помощью рандомизированных клеточных автоматов.
С виду первые главы тоже неплохо выглядят, но может слегка конспективно. Но если изучать МЛ совсем с нуля, то лучше выбрать что-то другое
Читать полностью…
Даже не надейся - роботы истребят нас быстрее чем раскуришь
Читать полностью…
Только после того, как ты напишешь Цетлин Машину.
Читать полностью…
Господа, добрый день!
Скажите пожалуйста, на ваш взгляд, мне уже можно не надеяться на выход Gemma 4? Или она выйдет совместно с DeepSeek V4?
Да, это верно. Хотелось бы, если возможно, про область пообщаться, хотя бы вкратце
Читать полностью…