Новая гугловская veo2 первая модель прошедшая тест на гимнастику. Выглядит очень сильно, сильно лучше всего открытого и закрытого.
Работает с американского VPN.
Самый красивый блог чтобы разобраться с nD parallelism, a ещё внутри интерактивное демо!
И это первая доходчивая визуализация на моей памяти
main-horse.github.io/posts/visualizing-6d/
Встречаются два вонаби ресерчера в подчате Луна Парка и один другого спрашивает:
— Как найти работу llm ресечером?
— Могу рассказать...
— Рассказать-то я и сам могу, а как найти?
почему с каждым релизом wandb становится все хуже и хуже, что это блять, почему так мерзко, где EMA
Читать полностью…/channel/StarsAskBot?start=241154130
Го потестим, тут вопросы можно анонимно задавать, закидывайте. Стоит 1 звёздочку.
А вот и анонс от СЕО компании с цифрами бенчмарков!
У кого-то из чата уже заработали аудио-ввод и вывод (генерация речи), у меня пока нет(
https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/
Ссылка попробовать в AI Studio БЕСПЛАТНО: тык
В момент выхода анонса соры я говорил: этот прорыв будет в опенсурсе и очень быстро.
На момент выхода соры в виде сайта я говорю: а чо так слабо?
https://app.checkbin.dev/snapshots/1f0f3ce3-6a30-4c1a-870e-2c73adbd942e
oss apache2 hunyuan video (тупо видео генератор НЕ world model) vs sora paid world model
Читать полностью…- папа, а кем ты хотел быть в молодости?
- рэпером
- а кем стал?
еле сдерживая слезы, я попытался сменить тему:
- не важно. пошли на синк, обсудим планы по новому продукту яндекса. и захвати новогодние пряники на кофепоинте, они очень вкусные.
AI Journey 2024 оказалась очень богата на новые AI-продукты от Сбера. В частности банк выложил в открытый доступ сразу 3 своих новых генеративных модели.
GigaChat Lite рассчитана на простые обыденные задачи. Это первая по-настоящему российская open-source модель. Поэтому она максимально стабильная и не требует больших мощностей. Ее преимущество - скорость.
GigaAMv2 признали лучшим в РФ AI-инструментом для распознавания речи. Ее можно дообучать.
GigaEmbeddings создавалась для RAG и других задач, где требуется серьезная производительность. Превосходит большинство конкурентов по производительности и надежности.
Написал обзор на Phi4
Довольно любопытная инженерная статья про то как учить LLM хорошо, при token budget вдвое меньше чем у qwen2.5 14b модель выдает лучшие/такие же результаты.
А еще авторы предлагают любопытную модификацию DPO.
alexwortega/qLTfc-M_2HT">читать teletype
оригинальная статья
ПРЕТРЕН В С Ё?
Наши слоны из Нижнего Новгорода выступили на Neurips и рассказали что интернет в целом кончился, дальше надо делать time inference scaling.
С учётом того как Суцкевер повлиял на современные сетки, стоит как минимум послушать.
А время покажет, ошибается он в этот раз или нет.
Смотреть полный доклад
🎨 Играюсь с Recraft v3
Это лучшая нейросеть для генерации фотореалистичных изображений по результатам sbs сравнения. Особенно хорошо модель понимает русскую эстетику.
Сервис позволяет создать кастомный стиль изображения. Как образец можно загрузить до 5 фотографий.
Последние четыре фотографии в посте имитируют стиль лиминальных пространств.
@hikonon
Добавили новые модели от T-Tech в репозиторий на github Ru General Arena.
Напомню, что тут бейзлайн это все еще gpt-3.5-turbo-0125, а судья gpt-4-1106-preview, промпты засепмлпены по 50 разным топикам (т.е. и сложные и просптые вперемешку).
Интересно, то что по метрикам которые репортит T-Tech в своем посте на хабре, вихрь немо стоит довольно низко в лидерборде, в отличие от их моделек. Мое мнение если кратко: в текущей ситуации сранивать что-то довольно сложно, так как квены изначально довольно оверфитнутые на все многие классические бенчмарки, переведенные промпты AlpacaEval и ArenaHard это конечно хорошо, но под них уже много кто заоферфитился на английском и без изменений промптов оценки результаты на русском могут выходить как минимум неоднозначные, что и показывает большое количество сильных шейкапов между зарепорчеными авторами бенчмарками.
В целом, мне кажется, что таблица на скрине отображает мое понимание, но объективная реальность думаю всегда где-то посередине...
Большой день.
Мы выкладываем в опенсорс наши модели T-Lite и T-Pro. И эти модели просто топ 🥳
Мы увереннно выбиваем #1 среди открытых моделей по разным бенчам на русском. По MERA мы взяли #2 модель на русском ещё и включая все API, уступая только GPT-4o.
Это до-тренированный qwen-2.5 в размерах 7B и 32B. Мы провели большую работу: свой токенизатор, глубокое до-обучение на русский и специфичные корпуса. Аккуратная работа с данными. Тех репорты будут.
Этот релиз является подтверждением нашего подхода в LLM: допретрен на базе опенсорса и затем файнтюн под доменные области. Получается значительно лучше результат и мы тратим на порядок меньше денег (не преувеличение).
Пользуйтесь. Модели для инженеров, рекомендуется дальнейший файнтюн, например через наш Turbo-Alignment.
Наш новый HF: https://huggingface.co/t-tech
Лидерборд по MERA: https://mera.a-ai.ru/ru/leaderboard
Остальные бенчи тоже есть, арены будут как прокрасятся
Прошел почти год с релиза соры
- не разогнана до near realtime(как runway3, ltxv)
- 1080 как макс разрешение и только для подписки за 200 баксов(!)
- качество в ленте выглядит на уровне klingv1.5(хотя в деталях лучше)
закидывайте 200 баксов и погоняю эту фигню, свои кровные я не готов отдавать