3112
Биоинформатика, дата сайнс, биология. Основное правило - вежливое и уважительное общение. @sberlogabig - основной канал @sberlogasci математика, физика, ДС @sberloga_discussion за жизнь Доклады: https://www.youtube.com/c/SciBerloga
Потому не лучше подобрали архитектуру
Читать полностью…
Ты в упор игнорируешь тот факт, что во всех случаях берется рандом.
Читать полностью…
На счет этой таблички. Они берут задачу и сравнивают две модели
- претрененную модель с одной архитектурой
- рандомную модель с другой архитектурой
Ну и оказывается, что можно подобрать архитектуру лучше, которая даже без претрены будет давать более хороший результат. Ну так естественно можно! А если ее запретренить, то и ещё лучше результат будет =)
Например - берут NTv2, у него без претрены качество на 20% падает, потом они меняют ему токенайзер, тюнят, качество опять хуже, потом они меняют ему размер эмбедингов, снова тюнят - качество вырстает. Разве из этого можно сделать вывод, что претрена не помогает? Конечно нет. Из этого вывод такой - для этой задачи лучше работает другой размер эмбединга. Ну авторы собственно такой вывод и делают.
потому что все их бенчмарки до этого мусор
Читать полностью…
действительно, проблема в бенчмарках. Я полностью согласен. Только проблема в том, что когда любую такую модель на НОРМАЛЬНЫХ задачах тестят — она не работает.
А есть абсолютно эзотерически-шизофазические бенчмарки именно днк-моделей. Созданные именно их авторами. На которых уже 6 лет продолжается random walk кучи моделей
я эту ссылку тоже кидал
Читать полностью…
"вы взяли наш бенчмарк, но выигрываете на нем ибо бенчмарк плохой"
Читать полностью…
Да, работа интересная, никто же не спорит. Но она все-таки о другом. На мой взгляд, она о том, что CNN - эффективная архитектура, которая иногда работает лучше, чем трансформеры. Моя гипотеза, что CNN у них так хорошо работает, потому что они скорят на NT bench, где все задачи короткие. И они, как я понимаю, берут NT bench v1, который вообще не очень удачный - его давно уже заменили на v2, на котором все сравниваются (бардак там конечно тот ещё, потому что есть ещё и v3 теперь, и все это не удобно сравнивать).
Так или иначе, никто не обещает, что претрененый трансформер - и вообще трансформер - это самая лучшая архитектура для любой геномной задачи. Речь была о том, помогает ли претрена - ответ из текущей статьи - помогает.
Глобально, мне нравятся варианты типа Borzoi/AlphaGenome/NTv3 где внизу конволюции, а над ними трансформеры
Добро пожаловать в (sci)Berloga Bioinformatics, Biology, etc. Club, Chaevnik
Напиши пару слов о себе 👍
Думаю эпидемии чихов получили распространение после достаточного уплотнения биомассы человеческой, а вопросы того что покушать, а что нет были актуальны всегда
Читать полностью…
Мне кажется более интересным вопрос в эволюции чувства отвращения. Как оно отличается между видами, и почему оно именно такое? Если это защита от эпидемий — почему у нас меньше отвращения к чихам и соплям, чем к калу? И как с этим дела у диких человеческих племен — наверное там разница меньше?
Читать полностью…
Это я даже видел (не в живую, в записи, разумеется)
Читать полностью…
Гориллы - веганы, и гориллы едят экскременты, во всяком случае в неволе. Я где-то читала (окей, википедия подтверждает), что неприятный запах кала обусловлен скатолом, а скатол в больших количествах образуется, когда ешь мясо, так что у веганов какашки не такие отталкивающие.
Читать полностью…
ну это ответ столь же верный, сколь и бессмысленный)
Читать полностью…
Надо инициировать исследование.
Читать полностью…
В качестве сравнения
Читать полностью…
На GENA, ктстати, так и не смогли подобрать ) ну я верю, что можно, если долго стараться. Только это ничего не говорит о полезности претрены
Читать полностью…
char — заменить токенизатор (какая разница для рандомной модели)
larger dim — это просто побольше размерность дать рандому. И почему-то опять прирост в тыкву превратился
Кстати, у NT есть и для длинных контекстов отдельный бенчмарк. Но им никто не пользуется =(
https://huggingface.co/datasets/InstaDeepAI/genomics-long-range-benchmark
Сейчас есть уже очень много разных бенчмарков. Я думаю, что этот стал особенно популярный потому, что его сделали очень удобным - все на hf, просто тренится. Ну и опубликовали одним из первых и в хорошем журнале.
Читать полностью…
https://arxiv.org/abs/2503.16351
Читать полностью…
а почему же там такие задачи:?
Читать полностью…
Всем доброго времени суток.
Читать полностью…
Добро пожаловать в (sci)Berloga Bioinformatics, Biology, etc. Club, Андрей
Напиши пару слов о себе 👍
Короче надо просто deep research спросить, там наверняка кучу результатов уже
Читать полностью…
Никто же не откажется от предложенного кофе сорта Лювак?)
Читать полностью…
Кстати пигмеи едят (ну или ели, не уверен в их текущей урбанизации) слоновий кал, в качестве источника витаминов
Читать полностью…
Я немедленно начну это обсуждать со знакомыми веганами! Спасибо!
Читать полностью…
Кролики (имеется в виду искусственное содержание) теряют до 20% веса, если слишком часто им клетку убирать и не оставлять какахи на повторную переработку :))
…на самом деле ответ будет - «эволюция и особенности питания». Кролики едят траву (бактерии вырабатывают целлюлазу, но им надо время, чтобы целлюлозу расщепить), а мы не только. Хотя, получается, для веганов второй «заход» может и сработать :))
Так ли велика разница?
Читать полностью…