sberlogabio | Unsorted

Telegram-канал sberlogabio - (sci)Berloga Bioinformatics, Biology, etc. Club

3112

Биоинформатика, дата сайнс, биология. Основное правило - вежливое и уважительное общение. @sberlogabig - основной канал @sberlogasci математика, физика, ДС @sberloga_discussion за жизнь Доклады: https://www.youtube.com/c/SciBerloga

Subscribe to a channel

(sci)Berloga Bioinformatics, Biology, etc. Club

Потому не лучше подобрали архитектуру

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Ты в упор игнорируешь тот факт, что во всех случаях берется рандом.

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

На счет этой таблички. Они берут задачу и сравнивают две модели
- претрененную модель с одной архитектурой
- рандомную модель с другой архитектурой

Ну и оказывается, что можно подобрать архитектуру лучше, которая даже без претрены будет давать более хороший результат. Ну так естественно можно! А если ее запретренить, то и ещё лучше результат будет =)

Например - берут NTv2, у него без претрены качество на 20% падает, потом они меняют ему токенайзер, тюнят, качество опять хуже, потом они меняют ему размер эмбедингов, снова тюнят - качество вырстает. Разве из этого можно сделать вывод, что претрена не помогает? Конечно нет. Из этого вывод такой - для этой задачи лучше работает другой размер эмбединга. Ну авторы собственно такой вывод и делают.

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

потому что все их бенчмарки до этого мусор

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

действительно, проблема в бенчмарках. Я полностью согласен. Только проблема в том, что когда любую такую модель на НОРМАЛЬНЫХ задачах тестят — она не работает.
А есть абсолютно эзотерически-шизофазические бенчмарки именно днк-моделей. Созданные именно их авторами. На которых уже 6 лет продолжается random walk кучи моделей

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

я эту ссылку тоже кидал

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

"вы взяли наш бенчмарк, но выигрываете на нем ибо бенчмарк плохой"

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Да, работа интересная, никто же не спорит. Но она все-таки о другом. На мой взгляд, она о том, что CNN - эффективная архитектура, которая иногда работает лучше, чем трансформеры. Моя гипотеза, что CNN у них так хорошо работает, потому что они скорят на NT bench, где все задачи короткие. И они, как я понимаю, берут NT bench v1, который вообще не очень удачный - его давно уже заменили на v2, на котором все сравниваются (бардак там конечно тот ещё, потому что есть ещё и v3 теперь, и все это не удобно сравнивать).

Так или иначе, никто не обещает, что претрененый трансформер - и вообще трансформер - это самая лучшая архитектура для любой геномной задачи. Речь была о том, помогает ли претрена - ответ из текущей статьи - помогает.

Глобально, мне нравятся варианты типа Borzoi/AlphaGenome/NTv3 где внизу конволюции, а над ними трансформеры

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Добро пожаловать в (sci)Berloga Bioinformatics, Biology, etc. Club, Chaevnik
Напиши пару слов о себе 👍

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Думаю эпидемии чихов получили распространение после достаточного уплотнения биомассы человеческой, а вопросы того что покушать, а что нет были актуальны всегда

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Мне кажется более интересным вопрос в эволюции чувства отвращения. Как оно отличается между видами, и почему оно именно такое? Если это защита от эпидемий — почему у нас меньше отвращения к чихам и соплям, чем к калу? И как с этим дела у диких человеческих племен — наверное там разница меньше?

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Это я даже видел (не в живую, в записи, разумеется)

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Гориллы - веганы, и гориллы едят экскременты, во всяком случае в неволе. Я где-то читала (окей, википедия подтверждает), что неприятный запах кала обусловлен скатолом, а скатол в больших количествах образуется, когда ешь мясо, так что у веганов какашки не такие отталкивающие.

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

ну это ответ столь же верный, сколь и бессмысленный)

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Надо инициировать исследование.

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

В качестве сравнения

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

На GENA, ктстати, так и не смогли подобрать ) ну я верю, что можно, если долго стараться. Только это ничего не говорит о полезности претрены

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

char — заменить токенизатор (какая разница для рандомной модели)
larger dim — это просто побольше размерность дать рандому. И почему-то опять прирост в тыкву превратился

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Кстати, у NT есть и для длинных контекстов отдельный бенчмарк. Но им никто не пользуется =(

https://huggingface.co/datasets/InstaDeepAI/genomics-long-range-benchmark

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Сейчас есть уже очень много разных бенчмарков. Я думаю, что этот стал особенно популярный потому, что его сделали очень удобным - все на hf, просто тренится. Ну и опубликовали одним из первых и в хорошем журнале.

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

https://arxiv.org/abs/2503.16351

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

а почему же там такие задачи:?

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Всем доброго времени суток.

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Добро пожаловать в (sci)Berloga Bioinformatics, Biology, etc. Club, Андрей
Напиши пару слов о себе 👍

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Короче надо просто deep research спросить, там наверняка кучу результатов уже

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Никто же не откажется от предложенного кофе сорта Лювак?)

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Кстати пигмеи едят (ну или ели, не уверен в их текущей урбанизации) слоновий кал, в качестве источника витаминов

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Я немедленно начну это обсуждать со знакомыми веганами! Спасибо!

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Кролики (имеется в виду искусственное содержание) теряют до 20% веса, если слишком часто им клетку убирать и не оставлять какахи на повторную переработку :))

…на самом деле ответ будет - «эволюция и особенности питания». Кролики едят траву (бактерии вырабатывают целлюлазу, но им надо время, чтобы целлюлозу расщепить), а мы не только. Хотя, получается, для веганов второй «заход» может и сработать :))

Читать полностью…

(sci)Berloga Bioinformatics, Biology, etc. Club

Так ли велика разница?

Читать полностью…
Subscribe to a channel