Telegram-канал j_links - Just links: Unsorted - каталог телеграмм

Training superhuman coding models at Cursor

Случайно наткнулся на видео, где ребята из Cursor обсуждают всякое разное про LLM. Обычно в подобных подкастах все высказывания очень поверхносные, чтобы случайно не выдать каких-нибудь секретов. А тут на удивление упомянули довольно много технических деталей.

Краткий список затронутых тем:
- Как делать RL, когда нет одного правильного ответа?
- Что делать, если вероятность получить "правильный" ответ очень маленькая?
- Как сделать, чтобы модель могла ориентироваться в большом проекте?
- Как поддерживать long context?
- Как делать credit assignment для memory tool?
- Как cursor может обучаться на пользовательских данных.
- Почему плохо смотреть на лайки/дизлайки ответов.
- Какая инфра нужна для больших RL тренировок.

Судя по количеству просмотров, если сам этим не занимаешься, то смотреть не очень интересно. Но мне понравилось!

Читать полностью…

Just links

31 May 2025 12:52

Generalization Bias in Large Language Model Summarizati https://arxiv.org/abs/2504.00025

Читать полностью…

Just links

30 May 2025 09:07

Enumerate-Conjecture-Prove: Formally Solving Answer-Construction Problems in Math Competitions https://arxiv.org/abs/2505.18492

Читать полностью…

Just links

29 May 2025 12:53

SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents https://arxiv.org/abs/2505.20411

Читать полностью…

Just links

29 May 2025 11:02

Pauli Propagation: A Computational Framework for Simulating Quantum Systems https://arxiv.org/abs/2505.21606

Читать полностью…

Just links

28 May 2025 06:54

https://unitaryhack.dev/bounties/

Читать полностью…

Just links

24 May 2025 22:32

I used o3 to find a remote zeroday in the Linux SMB implementation (Score: 161+ in 6 hours)

Link: https://readhacker.news/s/6v2yL
Comments: https://readhacker.news/c/6v2yL

Читать полностью…

Just links

23 May 2025 20:35

CLEVER: A Curated Benchmark for Formally Verified Code Generation https://arxiv.org/abs/2505.13938

Читать полностью…

Just links

23 May 2025 09:12

Does Earth have two high-tide bulges on opposite sides? (2014) (Score: 151+ in 9 hours)

Link: https://readhacker.news/s/6uVvc
Comments: https://readhacker.news/c/6uVvc

Читать полностью…

Just links

18 Jun 2025 07:21

LLM-First Search: Self-Guided Exploration of the Solution Space https://arxiv.org/abs/2506.05213

Читать полностью…

Just links

16 Jun 2025 08:13

LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming? https://arxiv.org/abs/2506.11928

Читать полностью…

Just links

16 Jun 2025 08:08

Bulk Excitations of Invertible Phases https://arxiv.org/abs/2506.11288

Читать полностью…

Just links

06 Jun 2025 21:03

A 2D-CFT Factory: Critical Lattice Models from Competing Anyon Condensation Processes in SymTO/SymTFT https://arxiv.org/abs/2506.05324

Читать полностью…

Just links

06 Jun 2025 17:04

We made Claude, Gemini, o3 battle each other for world domination.

We taught them Diplomacy—the strategy game where winning requires alliances, negotiation, and betrayal.

Here's what happened:

DeepSeek turned warmongering tyrant. Claude couldn't lie—everyone exploited it ruthlessly. Gemini 2.5 Pro nearly conquered Europe with brilliant tactics. Then o3 orchestrated a secret coalition, backstabbed every ally, and won.

More: https://every.to/diplomacy

Читать полностью…

Just links

04 Jun 2025 18:08

https://mlcommons.org/benchmarks/training/

Читать полностью…

Just links

01 Jun 2025 07:44

A Lean companion to Analysis I (Score: 150+ in 6 hours)

Link: https://readhacker.news/s/6vp2P
Comments: https://readhacker.news/c/6vp2P

Читать полностью…

Just links

30 May 2025 14:55

Quantized Transport of Disordered Superconducting Fractional Quantum Hall Edges https://arxiv.org/abs/2505.20398

Читать полностью…

Just links

29 May 2025 13:48

https://odyssey.world/introducing-interactive-video

Читать полностью…

Just links

29 May 2025 11:06

Disturbing news about the d=2+ε expansion https://arxiv.org/abs/2505.21611

Читать полностью…

Just links

28 May 2025 14:14

Generalized Hall Conductivities in Local Commuting Projector Models: Generalized Symmetries and Protected Surface Modes https://arxiv.org/abs/2505.20384

Читать полностью…