Telegram-канал j_links - Just links: Unsorted - каталог телеграмм

Translation of the Rust's core and alloc crates to Coq for formal verification (Score: 152+ in 4 hours)

Link: https://readhacker.news/s/67R7a
Comments: https://readhacker.news/c/67R7a

Читать полностью…

Just links

14 May 2024 06:16

How much entanglement is needed for emergent anyons and fermions? https://arxiv.org/abs/2405.07970

Читать полностью…

Just links

11 May 2024 19:50

The Fault in Our Stars: An Analysis of GitHub Stars
as an Importance Metric for Web Source Code https://www.ias.cs.tu-bs.de/publications/GithubTranco.pdf

Читать полностью…

Just links

10 May 2024 14:55

https://twitter.com/PhysicsHenry/status/1788518510248759495

Читать полностью…

Just links

09 May 2024 06:31

Robust agents learn causal world models https://openreview.net/forum?id=pOoKI3ouv1

Читать полностью…

Just links

08 May 2024 07:50

Identifying the topological order of quantized half-filled Landau levels through their daughter states https://arxiv.org/abs/2405.03780
https://twitter.com/evgeniyzhe/status/1788082384916689357

Читать полностью…

Just links

07 May 2024 21:57

Almost-idempotent quantum channels and approximate C∗-algebras https://arxiv.org/abs/2405.02434

Читать полностью…

Just links

04 May 2024 08:35

Topological holography for fermions https://arxiv.org/abs/2404.19004

Читать полностью…

Just links

28 Apr 2024 21:27

Training on Mistakes Improves Problem Solving Performance https://gytis.co/2024/04/25/Training-on-Mistakes-Improves-Problem-Solving-Performance.html

Читать полностью…

Just links

28 Apr 2024 10:20

В Абу-Даби прошла первая в мире гонка болидов-беспилотников.

Самое интересное происходило на квалификации, когда машины делали тестовые заезды, чтобы «познакомиться» с трассой. Машины вылетали с трасс, разворачивались, влетали в отбойники. Одним словом делали то, за что мы любим беспилотники.

Читать полностью…

Just links

26 Apr 2024 15:01

Offline Actor-Critic Reinforcement Learning Scales to Large Models

В основном ресерч в сфере рл происходит на маленьких моделях пушто
- и небольшие модели способны решить задачи при грамотном обучении и грамотной архитектуре (эмпирический факт), в основном это млп с релу/лики_релу и леернормой и все
- есть много проблем в сетапе рл, которые надо решать до того, как задумываешься о модельке и ее размерах
- если увеличивать размер модели, то это доп проблемы, потому что увеличиваются риски для нестабильности, вырожденности и всего такого

Но дипмаинд решил разнести и эту парадигму и отскейлить рл модели до больших размеров
Как оказывается, актор-критик в совокупности с perceiver'ом, который здесь может обрабатывать разные стейты для разных роботов (или симулякров роботов) + постепенно отходить от бихевиор клонинга, и выбивать высокий скор как на средах, где данные собраны хорошо, так и плохо!!

И это все на 132 тасках с непрерывными действиями🥸

👀LINK

#rl #offlinerl #multitask #behaviorcloning #largemodels #scalinglaws

Читать полностью…

Just links

26 Apr 2024 09:52

https://sites.google.com/view/ph11fall2019/previous-hurdles

Читать полностью…

Just links

24 Apr 2024 19:58

Из других свежих интересностей, HF опубликовал свою открытую реимплементацию Gato (/channel/gonzo_ML/966) под названием Jack of All Trades (JAT).

Пост: https://huggingface.co/blog/jat
Статья: https://arxiv.org/abs/2402.09844
Код: https://github.com/huggingface/jat
Модель: https://huggingface.co/jat-project/jat
Датасет: https://huggingface.co/datasets/jat-project/jat-dataset

Читать полностью…

Just links

21 Apr 2024 22:59

COCONut: Modernizing COCO Segmentation arxiv.org/abs/2404.08639

Читать полностью…

Just links

20 Apr 2024 09:16

Scaling Instructable Agents Across Many Simulated Worlds https://arxiv.org/abs/2404.10179

Читать полностью…