That's just link aggregator of everything I consider interesting, especially DL and topological condensed matter physics. @EvgeniyZh
Noninvertible Gauge Symmetry in (2+1)d Topological Orders: A String-Net Model Realization https://arxiv.org/abs/2408.02664
Читать полностью…Signature of anyonic statistics in the integer quantum Hall regime https://www.nature.com/articles/s41467-024-50820-0
Читать полностью…https://mlcommons.org/2024/08/mlc-algoperf-benchmark-competition/
Читать полностью…Visual Riddles: a Commonsense and World Knowledge Challenge for Large Vision and Language Models https://arxiv.org/abs/2407.19474
Читать полностью…LEAN-GitHub: Compiling GitHub LEAN repositories for a versatile LEAN prover https://arxiv.org/abs/2407.17227
Читать полностью…https://fixupx.com/karpathy/status/1816637781659254908
Читать полностью…https://fixupx.com/kellerjordan0/status/1816183555715915878
Читать полностью…Good Writing https://www.cs.cmu.edu/~pausch/Randy/Randy/raibert.htm
Читать полностью…SegPoint: Segment Any Point Cloud via Large Language Model https://arxiv.org/abs/2407.13761
Читать полностью…Baba Is AI: Break the Rules to Beat the Benchmark https://arxiv.org/abs/2407.13729
Читать полностью…https://www.asml.com/en/news/stories/2024/5-things-high-na-euv
Читать полностью…VISA: Reasoning Video Object Segmentation via Large Language Models https://arxiv.org/abs/2407.11325
Читать полностью…A polynomial-time classical algorithm for noisy quantum circuits https://arxiv.org/abs/2407.12768
Читать полностью…NeedleBench: Can LLMs Do Retrieval and Reasoning in 1 Million Context Window? https://arxiv.org/abs/2407.11963
Читать полностью…SGIFormer: Semantic-guided and Geometric-enhanced Interleaving Transformer for 3D Instance Segmentation https://arxiv.org/abs/2407.11564
Читать полностью…Minimal Quantum Circuits for Simulating Fibonacci Anyons https://arxiv.org/abs/2407.21761
Читать полностью…ПЕРВЫЙ МУЛЬТИМОДАЛЬНЫЙ ДАТАСЕТ ЗАДАЧ ПО ФИЗИКЕ?
Контрибьютеры в вихре варят очень сложные датасеты - рецепт простой: краулим 10 гб html-pdf_ок, прогоняем через кучу ocr, latex конверторов, парсим текстовый слой и картинки. Потом обмазываем все это регулярками для вязкости и получаем вероятно один из самых сложных для LLM датасетов - physics_big.
Почему он сложный? Потому что это мультимодальная физика с олимпиад. В отилчие от геометрии или алгебры для физики все сильно хуже с солверами, авто решаторами и индукцией ее тоже не решишь
Заливать в test в train можно здесь hf
Над релизом работали:
@suro4ekgg - вообще почти сделал
@mlunderground
@lovedeathtransformers
поддержать в X
RefMask3D: Language-Guided Transformer for 3D Referring Segmentation https://arxiv.org/abs/2407.18244
Читать полностью…No Black Holes from Light https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.133.041401
Читать полностью…Ммм, кайфологи из DeepMind рассказывают про AlphaGeometry2 + AlphaProof
https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/
AlphaProof работает на RLе
Около миллиона неформальных математических задач переводятся на формальный математический язык (LEAN) с помощью нейросетки-формализатора. Затем сеть-решатель ищет доказательства или опровержения проблем, постепенно обучаясь с помощью AlphaZero решать более сложные проблемы.
AlphaGeometry 2 на гемини:
Это нейро-символическая гибридная система, в которой языковая модель была основана на Gemini и обучена с нуля на гораздо большем количестве синтетических данных, чем ее предшественница. Это помогло модели решить гораздо более сложные задачи геометрии, включая задачи о движении объектов и уравнениях углов, отношений или расстояний.
ViLLa: Video Reasoning Segmentation with Large Language Model https://arxiv.org/abs/2407.14500
Читать полностью…Counting Bytes Faster Than You'd Think Possible
https://blog.mattstuchlik.com/2024/07/21/fastest-memory-read.html
Isospin Pomeranchuk effect and finite temperature resistivity minimum in rhombohedral graphene https://arxiv.org/abs/2407.13763
Читать полностью…Intel vs. Samsung vs. TSMC (Score: 150+ in 16 hours)
Link: https://readhacker.news/s/6bAeb
Comments: https://readhacker.news/c/6bAeb
Scaling Laws with Vocabulary: Larger Models Deserve Larger Vocabularies https://arxiv.org/abs/2407.13623
Читать полностью…https://youtube.com/watch?si=Hq4DpYuh6IRA-Mgw&v=1MjvCM1d81M
Читать полностью…PutnamBench: A Multilingual Competition-Mathematics Benchmark for Formal Theorem-Proving https://trishullab.github.io/PutnamBench/
Читать полностью…The Importance of Online Data: Understanding Preference Fine-tuning via Coverage https://arxiv.org/abs/2406.01462
Читать полностью…