🌟 Reader-LM: небольшие языковые модели для преобразования HTML в Markdown.
Reader-LM - это семейство мультиязычных компактных языковых моделей, разработанные специально для извлечения данных из web-контента. Обе модели имеют внушительное контекстное окно в 256 тыс. токенов и нацелены на преобразование "сырого", зашумленного HTML-кода в чистый и структурированный Markdown формат:
🟢Reader-lm-1.5b
🟢Reader-lm-0.5b
В основе Reader-LM лежит decoder-only архитектура, а обучение модели проводилось в два этапа. На первом этапе использовались короткие и простые HTML-документы (до 32 тысяч токенов). На втором этапе длина последовательностей была увеличена до 128 тысяч токенов.
Чтобы обработать такие длинные последовательности, разработчики применили механизм zigzag-ring-attention. В процессе обучения была выявлена проблема дегенерации, которая проявлялась в повторении одних и тех же токенов или зацикливании модели. Для борьбы с этим явлением были применены методы contrastive search и contrastive loss и, дополнительно, механизм ранней остановки декодирования при обнаружении повторяющихся токенов.
Корпус данных объемом 2,5 млрд. токенов для обучения Reader-LM состоял из синтетических пар "сырой HTML" - "Markdown", сгенерированные с помощью Jina Reader API и GPT-4o.
Для оценки производительности Reader-LM сравнивалась с несколькими большими языковыми моделями: GPT-4o, Gemini-1.5-Flash, Gemini-1.5-Pro, LLaMA-3.1-70B и Qwen2-7B-Instruct.
Оценка проводилась по метрикам ROUGE-L, Token Error Rate (TER) и Word Error Rate (WER). Результаты показали, что Reader-LM превосходит по качеству преобразования HTML в Markdown более крупные модели, при этом ее размер в 50 раз меньше.
Варианты запуска моделей: Goggle Collab (возможен запуск на бесплатном T4 тарифе), локально в Transformers. Неофициальные квантованные GGUF- версии для запуска в llama.cpp и LM Studio:
🟠Reader-lm-1.5b-GGUF. Версии разрядности от 3-bit (780 Mb) до 16-bit (3.1 Gb);
🟠Reader-lm-0.5b-GGUF. Версии разрядности от 3-bit (350 Mb) до 16-bit (990 Mb).
📌Лицензирование : CC-BY-NC-4.0 License.
🟡Страница проекта
🟡Модель Reader-lm-1.5b
🟡Модель Reader-lm-0.5b
🟡Google Collab
🟡Demo
🟡GGUF Reader-lm-1.5b
🟡GGUF Reader-lm-0.5b
🚗 Новый Toyota Prius проехал 1700 км (!) на одном баке 2024/09/toyota-prius-sets-guinness-world-record-averaging-93-1-mpg-in-cross-country-trip-from-la-to-nyc/— автомобиль уже называют «инженерным чудом» и внесли в Книгу рекордов Гиннеса за самый низкий расход топлива.
Toyota Prius LE преодолел расстояние от мэрии Лос-Анджелеса на западном побережье до мэрии Нью-Йорка на восточном, преодолев 5168,7 километров. В ходе поездки автомобиль показал рекордно низкий расход топлива — всего 2,5 л/100 км.
Даже сами инженеры Toyota были в шоке.
@vistehno
⚡️ Меняем лица на фотографиях за считанные секунды — инструмент чрезвычайно простой и интуитивно понятный.
Загружаем исходные фотографии и получаем крутой результат:
• Мгновенно.
• Без водяных знаков и вообще каких-либо ограничений.
• Бесплатно.
• Для скачивания в любом популярном формате.
Попробуйте здесь.
🌠🛰 Первый в истории выход космических туристов в открытый космос был успешно осуществлен.
Участники миссии Polaris Dawn
провели серию тестов на подвижность своих скафандров, находясь в открытом космосе около двух часов.
По словам миллиардера Джареда Айзекмана, одного из участников этой экспедиции -
Несмотря на то, что дома у всех полно дел, Земля с этого расстояния кажется идеальным местом.
🔥 AIList — это крутейшая библиотека бесплатных российских нейросетей. Использовать их можно без VPN и бесплтно!
Все нейросети удобно отсортированы по категориям и видам задач.
Пробуем ЗДЕСЬ ⚡
#neural #nn #soft
@vistehno
Разбираешься в AI? Покажи, на что способен – прими участие в международном соревновании AI Journey Contest. Призовой фонд – более 8 миллионов рублей!
Задачи, как всегда, масштабные и амбициозные. Участникам предстоит работать с SOTA-технологиями, выбрав одну или несколько из предложенных задач:
✔️ Emotional FusionBrain 4.0 — создать мультимодальную модель, которая умеет круто понимать видео, отвечает на сложные вопросы и «чувствует» человеческие эмоции.
✔️ Multiagent AI — разработать мультиагентную RL-систему, где агенты будут объединяться в различные схемы кооперации при решении задач. Эта задача суперполезна для научных исследований.
✔️ Embodied AI — сделать робота-помощника, который будет решать сложные задачи взаимодействия с окружающей средой и человеком, общаясь на естественном языке.
✔️ E-com AI Assistant — используя LLM GigaChat, создать AI-ассистента, который сможет рекомендовать пользователям релевантные товары для покупки на маркетплейсе Мегамаркет.
Кстати, в решении задач тебе может помочь нейросетевая модель GigaChat и другие AI-разработки Сбера!
Следующий шаг в развитии AI – за тобой! Переходи по ссылке, регистрируйся и успей решить задачи до 28 октября! Соревнование проводится при поддержке Института AIRI.
🌟 LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs.
LLaVaOLMoBitnet1B - мультимодальная модель, способная принимать в качестве входных данных изображение + текст (запрос) и отдавать согласованные текстовые ответы на выходе.
Архитектура модели состоит из 3-х частей:
🟢CLIP ViT-L/14 на 100М параметров, состоящий из 24 слоев с размером скрытого слоя 1024;
🟢MLP, состоящий из 2-х линейных слоев с размером скрытого слоя 2048 с активацией GELU;
🟢Тернарная LLM (OLMoBitNet1B) с 1.1 миллиардом параметров, состоящая из 16 слоев, в которых все линейные слои заменены на слои BitLinear158.
Модель была обучена в 2 фазы. Первая - предварительное обучение для выравнивания функций и вторая фаза - тонкой настройки инструкций.
Фаза предварительного обучения состояла из 1 эпохи на отфильтрованном наборе данных 595 тыс. концептуальных текстовых аннотаций, с обновлением весов только проекционного слоя.
Для второй фазы точной настройки инструкций использовалась 1 эпоха с набором данных LLaVa-Instruct-150K с обновлением и весов слоя проекции и весов LLM.
⚠️ Примечание: Модель в репозитории IntelLabs на Huggingface находится в режиме акцепта доступа. После отправки запроса пройдет какое-то время, прежде чем владелец репозитория одобрит запрос.
▶️Локальная установка и запуск:
# Clone repositry
git clone https://huggingface.co/IntelLabs/LlavaOLMoBitnet1B
# Move to folder & intall requirements
cd LlavaOLMoBitnet1B
pip install -r requirements.txt
# Run inference
python llava_olmo.py
text = "Be concise. Describe what is in the image"
url = "https://URL_TO_IMAGE.jpg"
⚡️ Школьник из Нью-Йорка заработал 98 млн рублей на своём ИИ-стартапе.
Он создал приложение, которое позволяет подсчитывать калории по фотографии еды, используя API ChatGPT. Приложение уже скачали более 100 тысяч человек.
Теперь у него отличное резюме для будущих карьерных возможностей!
@vistehno
🔥
Новая нейрофункция в Фотошопе
С этим обновлением можно за считанные клики "примерить" любую одежду на кого угодно — даже на медведя.
@vistehno
🚀 Крутой бесплатный сервис для удаления водяных знаков олайн.
Просто загрузите изображение, и ИИ сделает всю работу за вас.
Попробуйте здесь.
@vistehno
В новом учебном году откроется море вакансий, стажировок и образовательных школ! Хватит убивать время, бери карьеру и образование в свои руки!
И подписывайся на канал "Поступашки — ШАД, Стажировки и Магистратура", чтобы быть в курсе всех событий в мире образования и карьеры.
Канал ведут преподаватели Яндекса, ВШЭ и ШАД.
Там тебя ждут:
🔺Слив вопросов с собеса в Яндекс по МЛ, аналитике и бэкенду
🔺Инсайды для поступающих в ШАД, Ai Masters и другие бесплатные программы доп образования по DS
🔺Подборка топовых магистратур по Data Science
...и еще море полезнейшего контента, каждый пост- считай произведения искусства. Я жалею, что не нашел этот канал раньше.
Подписывайтесь, потом сами себе спасибо скажете: ⬇️
@postypashki_old
⚡️ Alibaba и Tencent представили нейросеть Minimax для создания видео из текста. Она способна быстро и качественно генерировать ролики с нуля, но с ограничением по длительности до 6 секунд.
Станет ли это конкурентом для Sora или очередным источником странных нейрогенераций? Узнать можно бесплатно после регистрации.
— Потребуется китайский;
— Работает только на ПК или в десктоп-версии на смартфоне.
• Попробовать
@vistehno
⚡️ Новостной дайджест.
✔️ NVIDIA запускает NIM Agent Blueprints для предприятий, чтобы помочь им создать свой корпоративный ИИ.
Компания NVIDIA объявила о выпуске каталога готовых ИИ-решений под названием NVIDIA NIM Agent Blueprints, который позволит разработчикам создавать и развертывать генеративные ИИ-приложения для различных отраслей.
NIM Agent Blueprints представляет собой набор предварительно обученных, настраиваемых рабочих процессов, которые могут быть использованы для создания приложений для обслуживание клиентов, автоматизации рабочих процессов и извлечение данных из PDF-файлов.
NVIDIA также объявила о сотрудничестве с Accenture, Cisco, Dell Technologies, Deloitte, Hewlett Packard Enterprise, Lenovo, SoftServe и World Wide Technology, которые будут использовать NIM Agent Blueprints для создания и развертывания генеративных ИИ-приложений для своих клиентов.
nvidianews.nvidia.com
✔️ Claude.ai сделала доступной функцию Artifacts для всех пользователей.
Компания Claude.ai объявила о доступности функции Artifacts для всех пользователей, включая владельцев бесплатных, профессиональных и командных планов. Теперь пользователи могут создавать и просматривать Artifacts в мобильных приложениях для iOS и Android.
anthropic.com
✔️ Cerebras Inference: самый быстрый инференс для языковых моделей.
Компания Cerebras Systems представила сервис для инференса LLM, который показывает рекордную производительность и скорость. Движок, работающий на базе третьего поколения процессора Wafer Scale Engine, способен обрабатывать до 1800 токенов в секунду для модели Llama3.1 8B и до 450 токенов в секунду для модели Llama3.1 70B. Это в 20 раз быстрее, чем решения на базе графических процессоров NVIDIA.
Онлайн-сервис Cerebras предлагает лучшую цену в отрасли - 10 центов за миллион токенов для модели Llama 3.1 8B и 60 центов за миллион токенов для модели Llama 3 70B. Разработчикам уже доступен API для работы с сервисом.
В планах компании - поддержка моделей Llama3 405B и Mistral Large 2 в ближайшие недели.
cerebras.ai
✔️ Закрыта студия дополненной реальности MetaSpark.
Компания объявила о закрытии платформы MetaSpark для сторонних дополнений и контента с 14 января 2025 года. Это означает, что AR решения, созданные сторонними разработчиками, включая бренды и сообщество AR-создателей, больше не будут доступны.
Однако, AR инструменты, принадлежащие Meta, продолжат быть доступны пользователям во всех приложениях компании.
Это решение является частью дорожной карты по приоритезации продуктов, которые лучше всего будут отвечать будущим потребностям потребителей и бизнес-клиентов.
spark.meta.com
@ai_machinelearning_big_data
#news #ai #ml
Чем дольше загружается сайт, тем выше вероятность того, что пользователь уйдет на другой ресурс — даже если речь идет о нескольких секундах.
Чтобы пользователи быстрее и с меньшими задержками получали доступ к данным, компании могут использовать технологию Content Delivery Network (CDN).
12 сентября в 11.00 МСК МТС Web Services проведёт вебинар «Секреты скорости: почему онлайн-кинотеатр загружается быстрее, чем одностраничный сайт». Вы узнаете, как работает CDN и чем эта технология будет полезна вашему бизнесу.
Основу CDN (сети доставки контента) составляют множество серверов, расположенных в разных точках мира. Когда пользователь впервые запрашивает контент (например, видео), он загружается с основного сервера, после чего сохраняется на ближайшем к пользователю сервере. В следующий раз, когда кто-то запросит тот же контент, он быстро загрузится с ближайшего сервера, а не с основного. Эти серверы также делятся между собой кэшированным контентом, чтобы всегда быть готовыми быстро предоставить его пользователям.
12 сентября расскажем больше — какие потребности закрывает сеть доставки контента CDN MWS.
Регистрируйтесь по ссылке.
За лучший вопрос в чате трансляции — будет подарок!
Реклама. Рекламодатель ПАО «МТС». ИНН 7740000076
🎞 YouTube Addiction Rehab — это расширение для Chrome, разработанное для помощи пользователям в контроле их привычек просмотра видео на YouTube с помощью ИИ.
Оно улучшает пользовательский опыт, фильтруя малоценные и отвлекающие видео на основе индивидуальных предпочтений и целей, помогая формировать более здоровые привычки просмотра и снижать уровень отвлечения.
Ключевые функции включают AI Focus Filter, блокирующий нерелевантные рекомендации, AI Smart Blocker, предотвращающий доступ к отвлекающим видео, и возможность скрытия коротких роликов из рекомендованной ленты.
Установка расширения немного отличается для браузеров Chrome, Firefox и Safari, и для каждого из них предоставлены детальные инструкции.
▪ Github
#TypeScript #JavaScript
@vistehno
Я думаю такого варианта монетизации нейросетей вы еще не видели 🤯
Недавно познакомился с человеком, который уже долгое время зарабатывает на создании девушек-моделей через нейросети.
Только одна модель, которую он делает в ИИ, в среднем приносит около 100.000₽ в месяц. А у него таких девушек уже 9 и 5 новых он запускает в сентябре!
У себя в блоге он раскрывает весь свой путь, суть заработка и дает бесплатно инструкцию, как начать. Переходите 👉/channel/+nbDnTowE6Rc2ZGIx
Технологии прогрессируют, количество и мощность дата-центров растет, спрос на цифровизацию появляется во всех сферах жизни. Все больше становится и кластеров виртуальной инфраструктуры с GPU-ускорителями для крупномасштабных задач машинного обучения, ИИ и высокопроизводительных вычислений .
Хранилища данных тоже меняются. Современный дата-центр теперь стоит ближе к сверхнадежному заводу Skynet, чем к серверной стойке в опасном закутке без дверей.
26 сентября на онлайн-встрече МТС Web Services обсудим перспективы развития дата-центров и технологии, которые уже сегодня меняют индустрию. Мы подготовим подробный и доступный обзор основных инструментов, которые обеспечивают надежное и бесперебойное размещение данных.
Регистрируйтесь по ссылке!
И готовьте свои вопросы: за лучший вопрос в чате трансляции будет подарок :)
Реклама. Информация о рекламодателе
🏆 Российский AutoML побеждает на международной арене
Команда “LightAutoML testers” победила в международном соревновании Kaggle AutoML Grand Prix! Наши ребята: Александр Рыжков, Дмитрий Симаков, Ринчин Дамдинов и Иван Глебов с помощью решений на основе LightAutoML обошли известных конкурентов по индустрии, включая команды из Amazon и H2O!
🚀 LightAutoML - бесплатный и открытый инструмент
Ключом к успеху стала open-source библиотека LightAutoML (LAMA), которая автоматизирует построение моделей машинного обучения. Благодаря использованию библиотеки ускоряется построение моделей и, зачастую, повышается качество. Инструмент подойдет как новичкам, так и профессионалам - решение можно получить как в несколько строк, так и с полной кастомизацией.
🌍 Kaggle AutoML Grand Prix 2024
Это - онлайн соревнование, приуроченное к ежегодной международной конференции International Conference on Automated Machine Learning, которая в этом году пройдет в Париже. Соревнование проходило на Kaggle (самой масштабной мировой платформе для соревнований по анализу данных) в 5 этапов, в каждом из которых было необходимо создать качественную модель машинного обучения всего за 24 часа.
🎓 Делимся опытом
Хотите узнать секреты победителей? Не пропустите вебинар, где команда расскажет о своих решениях и ответит на ваши вопросы! Он пройдет в 17:30 уже сегодня в канале @lightautoml!
⚡️ OpenAI релизнули новую модель OpenAI o1, которая в разы мощнее GPT-4o.
Тот самый секретны проект, над которым так долго работала компания.
Доступ обещают дать уже сегодня.
@ai_machinelearning_big_data
#openai #chatgpt
Марк Цукерберг, который недавно приобрел 387-футовую мегаяхту стоимостью 300 миллионов долларов, оснащенную четырьмя гигантскими дизельными двигателями, рассказывает о том, как важно «остановить изменение климата, пока мы не уничтожили планету». 🤡
@vistehno
Сегодня рынок переполнен большим количеством предложений, связанных с нейросетями.
Естественно у любого здравомыслящего человека возникает ряд вопросов:
❓А это точно для меня?
❓Если для меня, то что выбрать из множества вариантов?
❓С чего вообще начать изучение этих непонятных, но таких манящих своей простотой нейросетей.
Узнали себя? 🤖
Тогда эта информация для Вас
⚡️Наконец-то появился бесплатный тест на совместимость с нейросетями, который дает возможность ответить на самый главный вопрос:
НУЖНО ЛИ СВЯЗЫВАТЬСЯ С НЕЙРОСЕТЯМИ ИМЕННО ВАМ?⚡️
Переходите по ссылке, чтобы узнать свою совместимость и получить персонализированную расшифровку БЕСПЛАТНО
5 минут вашего времени, и вы решите дилемму!🙌
📉 Nvidia потеряла миллиарды долларов за один день, установив антирекорд по суточным убыткам среди всех компаний.
Министерство юстиции США начало расследование, обвиняя компанию в монополизации рынка, заработке на ИИ и ущемлении интересов геймеров. Хуанг, глава Nvidia, может столкнуться с серьезными последствиями, так как его обвиняют в замедлении роста производительности игровых видеокарт и завышении цен, при этом он продолжал продавать акции на пике их стоимости.
Теперь Минюст требует раскрыть всю внутреннюю информацию о компании.
@vistehno
🔥 Все самые полезные нейросети для учёбы — собрали для вас огромную подборку, без которой не обойтись к 1 сентября.
Storm — напишет статью или доклад, опираясь только на проверенные источники;
Undetectable AI Humanizer — обходит антиплагиат и любые ИИ-детекторы. Можно смело пропускать здесь любой сгенерированный текст;
Qwen2-Math — решает математические задачи с лёгкостью;
Prezo.AI — официально признана лучшей нейросетью для создания презентаций;
Learning Studio — генерирует курсы на любую тему;
Whisper — преобразует любое аудио или видео в текст;
Ligolette — «убийца» Duolingo, поможет выучить любой язык в увлекательной форме;
ElevenLabs — превращает текст в аудио, генерирует звуки и даже переводит видео на другой язык. Незаменим для всех;
Llamatutor— обучает любым темам в простом диалоговом формате;
BiRefNet — лучший инструмент для удаления фона с изображений;
Solo — классный генератор сайтов от создателей FireFox;
Explain Me Like I’m Five— объясняет любую тему так, будто вам 5 лет;
Ideogram — лучший генератор картинок с текстом.
WolframAlpha — лучший инструмент для решения сложных уравнений;
@vistehno
🏈 Нет, это не стадион — это спортбар Cosmo в Лос-Анджелесе, где трансляции идут на огромном иммерсивном экране, создавая эффект присутствия на настоящем матче. Атмосфера такая же, как на стадионе, но здесь можно удобно сидеть за столиком и заказывать любую еду.
Будущее спортбаров уже здесь!
@vistehno
⚡️ Айфон бросает вызов Фотошопу!
В бета-версии iOS 18.1 появилась впечатляющая функция на базе ИИ — Clean Up. Она позволяет всего за пару действий идеально удалять ненужные объекты с фотографий, будь то кактус на заднем плане или случайные прохожие.
@vistehno
🖥 Android тестирует новую функцию - автоматическую блокировку смартфона при краже.
Система реагирует на резкие движения, такие как вырывание телефона из рук, и экран мгновенно блокируется.
Эта функция уже тестируется в Бразилии.
@vistehno
🧠 Немного технопорно, Маск показал Cortex
Cortex - это перкластер обучения искусственного интеллекта, который строится в штаб-квартире Tesla в Остине для решения «реальных задач искусственного интеллекта».
@vistehno