Telegram-канал j_links - Just links: Unsorted - каталог телеграмм

Just links

28 Apr 2025 21:32

https://github.com/Otter-man/ModelCollapser

Читать полностью…

Just links

27 Apr 2025 22:53

SycEval: Evaluating LLM Sycophancy https://arxiv.org/abs/2502.08177

Читать полностью…

Just links

24 Apr 2025 06:42

Science-T2I: Addressing Scientific Illusions in Image Synthesis https://arxiv.org/abs/2504.13129

Читать полностью…

Just links

21 Apr 2025 08:54

ignore-topk: новая регуляризация для борьбы с деградацией LLM во время файнтюнинга (by DeepMind)

При дообучении языковые модели частенько портятся. Рисёрчеры из DeepMind показали, что проблема связана с тем, что LLM, пытаясь запомнить новый факт, начинает использовать лёгкие shortcut-ы вместо аккуратного внедрения новых знаний в веса. Она просто «раскладывает» новую информацию по уже знакомым ей понятиям (казалось бы это хорошо, но нет). Такое явление они назвали "праймингом" (aka разложение числа на простые множители), и из-за него LLM начинает путаться в фактах, выдавая новую информацию где не просили.

Авторы этой статьи предлагают потенциальное решение — регуляризацию ignore-topk. Идея до гениальности простая:
- Делаем обычный шаг файнтюнинга и смотрим на обновления весов (Δω).
- Отбираем top-k% самых больших обновлений и… просто удаляем их (умножаем на 0).
- Используем только небольшие изменения весов, которые не содержат шорткатов для быстрой меморизации.

Зачем так странно?
Оказывается, самые большие градиенты как раз и отвечают за «грязное» быстрое запоминание через прайминг. Игнорируя их, мы заставляем модель учиться медленнее и аккуратнее. При этом прайминг уменьшается на 90-95%, а способность запоминать новые факты не страдает.

Но авторы конечно молодцы, сами придумали бенчмарк, сами свой подход измерили, а на другие "learning without forgetting" методы вообще забили. Поэтому не могу сказать, что ignore-topk лучше чем, например, Child-Tuning или EWC, но выглядит прикольно, я его точно попробую 🤷‍♂️

Статья

Читать полностью…

Just links

19 Apr 2025 20:06

A RISC-V 32-bit microprocessor based on two-dimensional semiconductors https://www.nature.com/articles/s41586-025-08759-9

Читать полностью…

Just links

16 Apr 2025 14:58

Ising 100: review of solutions https://arxiv.org/abs/2504.09661

Читать полностью…

Just links

15 Apr 2025 15:51

https://github.com/MoonshotAI/Kimina-Prover-Preview
via @black_samorez

Читать полностью…

Just links

09 Apr 2025 06:22

Flux attachment theory of fractional excitonic insulators https://arxiv.org/abs/2504.05427

Читать полностью…

Just links

05 Apr 2025 10:03

Hydrodynamics of the electronic Fermi liquid: a pedagogical overview https://arxiv.org/abs/2504.01249

Читать полностью…

Just links

04 Apr 2025 06:33

ReferDINO-Plus: 2nd Solution for 4th PVUW MeViS Challenge at CVPR 2025 https://arxiv.org/abs/2503.23509

Читать полностью…

Just links

01 Apr 2025 15:18

Entropic Order https://arxiv.org/abs/2503.22789

Читать полностью…

Just links

26 Mar 2025 11:41

On the Importance of Error Mitigation for Quantum Computation https://arxiv.org/abs/2503.17243

Читать полностью…

Just links

22 Mar 2025 00:33

M-Attack: как обмануть GPT-4.5 и Gemini

Все привыкли, что атаковать современные мультимодальные модели (типа GPT-4o, Claude, Gemini и т.п.) крайне сложно — особенно, если это black-box модели, где нет доступа к градиентам и архитектуре. Стандартные подходы атак типа "выдать одну картинку за другую" часто генерируют какие-то невнятные шумы, которые либо игнорируются моделью, либо приводят к абстрактным ответам типа "размытое изображение".

Но оказалось, что проблема была не в самих моделях, а в подходе к генерации возмущений. В свежей статье предложили очень простой, но мощный подход — M-Attack:
1. Берём исходную и целевую картинки.
2. На каждом шаге рандомно crop'аем кусок исходного изображения (50-100% площади) и затем ресайзим обратно до исходного размера.
3. Заставляем эмбеддинги этого кусочка максимально приблизиться к эмбеддингам целевого изображения оптимизируясь в white-box режиме по ансамблю открытых визуальных моделей (например, CLIP, ViT и тп).

И всё! После нескольких итераций в центральной области картинки "проявляется" целевая семантика, при этом возмущения выглядят крайне незаметно и аккуратно (в отличие от других подходов).

Авторы добились совершенно впечатляющих результатов: успех атаки (ASR) превышает 90% (!) для GPT-4.5, GPT-4o и даже для o1 и Gemini. Код и датасет из 100 атакованных картинок выложили в открытый доступ.

Статья, GitHub, dataset

Читать полностью…

Just links

21 Mar 2025 15:01

Compute Optimal Scaling of Skills: Knowledge vs Reasoning https://arxiv.org/abs/2503.10061

Читать полностью…

Just links

20 Mar 2025 17:24

Bras and Kets in Euclidean Path Integrals https://arxiv.org/abs/2503.12771

Читать полностью…

Just links

28 Apr 2025 19:09

CombiBench: Benchmarking LLM Capability for Combinatorial Mathematics https://moonshotai.github.io/CombiBench/

Читать полностью…

Just links

26 Apr 2025 11:16

Short remarks on shallow unitary circuits https://arxiv.org/abs/2504.14005

Читать полностью…

Just links

23 Apr 2025 20:20

usual test set
https://x.com/openaidevs/status/1915097067023900883
cost $5.66

Читать полностью…

Just links

21 Apr 2025 06:57

Higher-Form Anomalies Imply Intrinsic Long-Range Entanglement https://arxiv.org/abs/2504.10569

Читать полностью…

Just links

17 Apr 2025 16:56

Из реально прикольного пишут что автономный дрон из Micro Air Vehicle Lab Делфта обошел 13 других дронов, а еще обошел людей в гонках на A2RL Drone Championship в Абу Даби

Пару лет назад дрон уже обгонял людей, но там была предустановленная исследователями трасса. А в этой новости пишут, что трасса бала организаторами сделана (т.е. они или не затачивались под нее специально, или затачивались но не так сильно - тут я чот не очень понял).
RLем тренили
🥳 Оч круто

https://www.youtube.com/watch?v=yz2in2eFATE

https://www.tudelft.nl/2025/lr/wereldprimeur-tu-delft-ai-drone-wint-van-menselijke-bestuurders-op-wk-drone-racen

На ютубе на эту работу ссылаются

End-to-end Reinforcement Learning for Time-Optimal Quadcopter Flight
https://ieeexplore.ieee.org/document/10611665
https://arxiv.org/abs/2311.16948

PS Собираем кстати AI штуки и проекты делаем в /channel/researchim

Читать полностью…

Just links

16 Apr 2025 14:39

Signatures of unconventional superconductivity near reentrant and fractional quantum anomalous Hall insulators https://arxiv.org/abs/2504.06972

Читать полностью…

Just links

10 Apr 2025 06:22

The 1st Solution for 4th PVUW MeViS Challenge: Unleashing the Potential of Large Multimodal Models for Referring Video Segmentation https://arxiv.org/abs/2504.05178

Читать полностью…