Telegram-канал j_links - Just links: Unsorted - каталог телеграмм

j_links | Unsorted

Subscribe to a channel

Telegram-канал j_links - Just links

6481

That's just link aggregator of everything I consider interesting, especially DL and topological condensed matter physics. @EvgeniyZh

Subscribe to a channel

Just links

26 Apr 2024 15:01

Offline Actor-Critic Reinforcement Learning Scales to Large Models

В основном ресерч в сфере рл происходит на маленьких моделях пушто
- и небольшие модели способны решить задачи при грамотном обучении и грамотной архитектуре (эмпирический факт), в основном это млп с релу/лики_релу и леернормой и все
- есть много проблем в сетапе рл, которые надо решать до того, как задумываешься о модельке и ее размерах
- если увеличивать размер модели, то это доп проблемы, потому что увеличиваются риски для нестабильности, вырожденности и всего такого

Но дипмаинд решил разнести и эту парадигму и отскейлить рл модели до больших размеров
Как оказывается, актор-критик в совокупности с perceiver'ом, который здесь может обрабатывать разные стейты для разных роботов (или симулякров роботов) + постепенно отходить от бихевиор клонинга, и выбивать высокий скор как на средах, где данные собраны хорошо, так и плохо!!

И это все на 132 тасках с непрерывными действиями🥸

👀LINK

#rl #offlinerl #multitask #behaviorcloning #largemodels #scalinglaws

Читать полностью…

Just links

26 Apr 2024 09:52

https://sites.google.com/view/ph11fall2019/previous-hurdles

Читать полностью…

Just links

24 Apr 2024 19:58

Из других свежих интересностей, HF опубликовал свою открытую реимплементацию Gato (/channel/gonzo_ML/966) под названием Jack of All Trades (JAT).

Пост: https://huggingface.co/blog/jat
Статья: https://arxiv.org/abs/2402.09844
Код: https://github.com/huggingface/jat
Модель: https://huggingface.co/jat-project/jat
Датасет: https://huggingface.co/datasets/jat-project/jat-dataset

Читать полностью…

Just links

21 Apr 2024 22:59

COCONut: Modernizing COCO Segmentation arxiv.org/abs/2404.08639

Читать полностью…

Just links

20 Apr 2024 09:16

Scaling Instructable Agents Across Many Simulated Worlds https://arxiv.org/abs/2404.10179

Читать полностью…

Just links

14 Apr 2024 21:01

#prog #game #abnormalprogramming

Verilog to Factorio blueprints compiler

https://github.com/Redcrafter/verilog2factorio

(thanks @GabrielFallen)

Читать полностью…

Just links

13 Apr 2024 08:55

Certifying almost all quantum states with few single-qubit measurements https://arxiv.org/abs/2404.07281

Читать полностью…

Just links

10 Apr 2024 10:55

Higher Landau-Level Analogues and Signatures of Non-Abelian States in Twisted Bilayer MoTe2 https://arxiv.org/abs/2404.05697

Читать полностью…

Just links

09 Apr 2024 19:58

Google Axion Processors – Arm-based CPUs designed for the data center (Score: 151+ in 5 hours)

Link: https://readhacker.news/s/65Ehb
Comments: https://readhacker.news/c/65Ehb

Читать полностью…

Just links

06 Apr 2024 11:53

JRDB-PanoTrack: An Open-world Panoptic Segmentation and Tracking Robotic Dataset in Crowded Human Environments arxiv.org/abs/2404.01686

Читать полностью…

Just links

05 Apr 2024 17:09

Training LLMs over Neurally Compressed Text https://arxiv.org/abs/2404.03626

Читать полностью…

Just links

31 Mar 2024 13:22

Keypoint Action Tokens Enable In-Context Imitation Learning in Robotics arxiv.org/abs/2403.19578

Читать полностью…

Just links

27 Mar 2024 13:32

Counterexamples in Quantum Information https://docs.google.com/document/u/0/d/1ysBvFXcAPldOJ96Jz4CXJa8h93oIVZnfZTUYDiRZAF8

Читать полностью…

Just links

26 Mar 2024 17:35

RewardBench: Evaluating Reward Models for Language Modeling https://arxiv.org/abs/2403.13787

Читать полностью…

Just links

25 Mar 2024 11:02

Doped stabilizer states in many-body physics and where to find them https://arxiv.org/abs/2403.14912

Читать полностью…

Just links

26 Apr 2024 14:11

Anyonic Topological Order in Twisted Equivariant Differential (TED) K-Theory arxiv.org/abs/2206.13563

Читать полностью…

Just links

25 Apr 2024 18:09

Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data https://arxiv.org/abs/2404.14367

Читать полностью…

Just links

24 Apr 2024 14:38

Lattice Surgery for Dummies https://arxiv.org/abs/2404.13202

Читать полностью…

Just links

21 Apr 2024 09:21

Demonstration of logical qubits and repeated error correction with better-than-physical error rates https://arxiv.org/abs/2404.02280

Читать полностью…

Just links

16 Apr 2024 10:19

Probing the 3D Awareness of Visual Foundation Models arxiv.org/abs/2404.08636

Читать полностью…

Just links

13 Apr 2024 22:13

Direct transition from a fractional quantum anomalous Hall state to a smectic state with the same Hall conductance https://arxiv.org/abs/2404.06745

Читать полностью…

Just links

11 Apr 2024 10:20

Wu's Method can Boost Symbolic AI to Rival Silver Medalists and AlphaGeometry to Outperform Gold Medalists at IMO Geometry

китайцы сказали что ваши альфа геометри хуйня, у нас есть method Wu дома, прикрутили к нему cетку для выбора лучших бимов из alpha geometry и стало лучше чем было

paper

Читать полностью…

Just links

10 Apr 2024 07:22

LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders https://arxiv.org/abs/2404.05961

Читать полностью…

Just links

07 Apr 2024 07:05

Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation arxiv.org/abs/2404.03645

Читать полностью…

Just links

06 Apr 2024 11:49

Non-Abelian braiding of Fibonacci anyons with a superconducting processor arxiv.org/abs/2404.00091

Читать полностью…

Just links

04 Apr 2024 09:46

Privacy Backdoors: Stealing Data with Corrupted Pretrained Models https://arxiv.org/abs/2404.00473

Читать полностью…

Just links

30 Mar 2024 10:48

Long-form factuality in large language models https://arxiv.org/abs/2403.18802

Читать полностью…

Just links

26 Mar 2024 17:39

High-Temperature Gibbs States are Unentangled and Efficiently Preparable https://arxiv.org/abs/2403.16850

Читать полностью…

Just links

26 Mar 2024 06:21

Manipulating Chess-GPT's World Model
https://adamkarvonen.github.io/machine_learning/2024/03/20/chess-gpt-interventions.html

Читать полностью…

Just links

24 Mar 2024 11:56

T-Rex2: Towards Generic Object Detection via Text-Visual Prompt Synergy https://arxiv.org/abs/2403.14610

Читать полностью…

Subscribe to a channel