That's just link aggregator of everything I consider interesting, especially DL and topological condensed matter physics. @EvgeniyZh
Reinforcement Learning within Tree Search for Fast Macro Placement https://openreview.net/forum?id=AJGwSx0RUV
Читать полностью…1st Place Winner of the 2024 Pixel-level Video Understanding in the Wild (CVPR'24 PVUW) Challenge in Video Panoptic Segmentation and Best Long Video Consistency of Video Semantic Segmentation https://arxiv.org/abs/2406.05352
Читать полностью…Neural Redshift: Random Networks are not Random Functions https://arxiv.org/abs/2403.02241
Читать полностью…A Bayesian Approach to Online Planning https://arxiv.org/abs/2406.02103
Читать полностью…Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B https://arxiv.org/abs/2406.07394
Читать полностью…Entanglement Asymmetry in non-Abelian Anyonic Systems https://arxiv.org/abs/2406.03546
Читать полностью…Если вы любите пытаться сломать защиту в разных LLM с помощью промпт инъекций – то у меня вам полезная ссылка, датасет из почти ~1500 промпт инъекций собранных с Reddit, Discord, Twitter и тп.
https://github.com/verazuo/jailbreak_llms
Внутри промпты и для старых инъекций, вроде DAN, до более новых с base64, leet code и тп.
Следующий шаг, это натренировать на этом модель, которая будет ломать другие модели автоматом ☕️
On the Effects of Data Scale on Computer Control Agents https://arxiv.org/abs/2406.03679
Читать полностью…Improving Alignment and Robustness with Short Circuiting https://arxiv.org/abs/2406.04313
Читать полностью…Fractionalization of Coset Non-Invertible Symmetry and Exotic Hall Conductance https://arxiv.org/abs/2405.20401
Читать полностью…dataset explorer for the LMSYS Kaggle
https://app.airtrain.ai/dataset/bb589c26-8f45-4f42-8ba3-07ef51b73a03/null/1/0
Evidence of Learned Look-Ahead in a Chess-Playing Neural Network https://arxiv.org/abs/2406.00877
Читать полностью…🍷 FineWeb: decanting the web for the finest text data at scale https://huggingface.co/spaces/HuggingFaceFW/blogpost-fineweb-v1
Читать полностью…Offline-Boosted Actor-Critic: Adaptively Blending Optimal Historical Behaviors in Deep Off-Policy RL https://arxiv.org/abs/2405.18520
Читать полностью…3rd Place Solution for MeViS Track in CVPR 2024 PVUW workshop: Motion Expression guided Video Segmentation https://arxiv.org/abs/2406.04842
Читать полностью…Does your data spark joy? Performance gains from domain upsampling at the end of training https://arxiv.org/abs/2406.03476
Читать полностью…How to train your ViT for OOD Detection https://arxiv.org/abs/2405.17447
Читать полностью…TORAX: A Fast and Differentiable Tokamak Transport Simulator in JAX https://arxiv.org/abs/2406.06718
Читать полностью…Improve Mathematical Reasoning in Language Models by Automated Process Supervision https://arxiv.org/abs/2406.06592
Читать полностью…Splitting of Girvin-MacDonald-Platzman density wave and the nature of chiral gravitons in fractional quantum Hall effect https://arxiv.org/abs/2406.02730
Читать полностью…GenAI Arena: An Open Evaluation Platform for Generative Models
https://arxiv.org/abs/2406.04485
https://huggingface.co/spaces/TIGER-Lab/GenAI-Arena
Density Isobar of Water and Melting Temperature of Ice: Assessing Common Density Functionals https://chemrxiv.org/engage/chemrxiv/article-details/66616c4e21291e5d1d301165
Читать полностью…https://d.erenrich.net/are-you-smarter-than-an-llm/index.html
Читать полностью…AI in software engineering at Google: Progress and the path ahead https://research.google/blog/ai-in-software-engineering-at-google-progress-and-the-path-ahead/
Читать полностью…Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models https://arxiv.org/abs/2406.02061
Читать полностью…Heuristics on the high seas: Mathematical optimization for cargo ships
https://research.google/blog/heuristics-on-the-high-seas-mathematical-optimization-for-cargo-ships/
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis https://arxiv.org/abs/2405.21075
Читать полностью…Offline Regularised Reinforcement Learning for Large Language Models Alignment https://arxiv.org/abs/2405.19107
Читать полностью…ЭЭГ арбузов и некорректное "декодирование"
Китайские исследователи записали ЭЭГ у 10 арбузов и оценили качество ее классификации сверточной сетью, назначив классы разным участкам этой ЭЭГ в соответствии с несколькими исследованиями других авторов. В этих исследованиях стимулы разных классов предъявлялись блоками. ЭЭГ рандомно относили к обучающей, валидационной и тестовой выборке. Качество классификации получилось весьма неплохим.
Авторы делают вывод, что всему виною временнАя автокорреляция в ЭЭГ, что многие результаты в статьях по "декодированию" ЭЭГ завышены, и что нужно правильно выбирать дизайн эксперимента и разбиение данных при кроссвалидации.
Xiran Xu, Bo Wang, Boda Xiao, Yadong Niu, Yiwen Wang, Xihong Wu, Jing Chen. Beware of Overestimated Decoding Performance Arising from Temporal Autocorrelations in Electroencephalogram Signals. arXiv, 27 May 2024 https://doi.org/10.48550/arXiv.2405.17024
via Михаил Лебедев