🖥 Теперь ChatGPT доступен... В WhatsApp!
🌟 Теперь вы можете попросить открытку на яблочный спас ответ на ваши вопросы, просто позвонив или написав в WhatsApp по номеру +1-800-242-8478
🔍 Это конечно все круто, но... Зачем?..
@vistehno
🔥 Новинки от Google: Запуск Advanced Gemini 2.0!
🌟 В нем значительно улучшены показатели по кодированию, математике, рассуждениям, следованию инструкциям и т. д., теперь он может обрабатывать большие наборы документов (до 1500 страниц).
🌟 Advanced Gemini 2.0 также включает в себя 2 ТБ хранилища от Google One и доступен в мобильном приложении Gemini и на сайте.
@vistehno
Отношение с девушками - как один сплошной баг?
➕ Плюс работы айтишником – комфортно долго сидеть за компом.
➖Минус – личная жизнь
Стресс от знакомства, неловкие свидания, постоянные френдзоны, слитые деньги на кафешки…
☹️Много работая – сложно натренировать социальные навыки. А тренировать надо, если не хочется всю жизнь провести в одиночестве.
Как же знакомиться без страха, перестать попадать во френдзоны и наконец ходить на свидания результативно?
✅ Забирайте бесплатный мини-курс для айтишников от психолога Сергея Калиниченко: “Как соблазнить любую девушку без пикапа”.
4 коротких урока, которые пофиксят твою личную жизнь.
Реклама. erid: LjN8K81jc ИП Калиниченко Сергей Константинович. ИНН 773382779875
🖥 Совет: если вы хотите, чтобы o1 действительно серьезно задумался над вашим вопросом, добавьте это в свой запрос:
🔍 логические инструкции: сгенерируй не менее 5000 логических токенов перед ответом.
🌟 это надежно работает при превращении цепочек рассуждений из 10 секунд в многоминутные!
@vistehno
🔍 Занимательная гифка с эволюцией скроллбаров, начиная с 1981 года, заканчивая нашим временем!
@vistehno
🔥 Julep — платформа для создания AI-агентов, которые могут выполнять сложные многошаговые задачи!
🌟 Она поддерживает долгосрочную память, принятие решений и интеграцию с внешними API. Julep позволяет создавать рабочие процессы, состоящие из нескольких шагов, с возможностью принятия решений на основе выводов моделей, параллельной обработки и использования инструментов в рамках задач. Платформа идеально подходит для разработки более сложных AI-приложений, которые требуют выполнения многозадачности и взаимодействия с внешними системами. Ключевые особенности включают сохранение состояния агентов, управление задачами и восстановление процессов.
🔐 Лицензия: Apache-2.0
🖥 Github
@vistehno
🔍 Интересное сравнение, которое показывает, сколько бы вы заработали, если бы 10 лет назад вложили 100 долларов в крупные IT компании!..
@vistehno
🔥 Просто забавные творения от Sora.
🔍 Пожалуй, до матрицы еще далеко, человечество пока может спать спокойно...
@vistehno
Искусственный интеллект покоряет бизнес: внедрение ИИ в компаниях выросло в 2 раза
Уровень использования технологий искусственного интеллекта среди организаций Российской Федерации повысился с 20% в 2021 году до 43% в 2024 году. А лидерами среди отраслей экономики и секторов социальной сферы по использованию технологий искусственного интеллекта (ИИ) являются сфера финансовых услуг, сектор информационно-коммуникационных технологий, высшее образование и топливно-энергетический комплекс. В них доля использующих ИИ организаций достигает 66%. Такие данные приводятся в аналитическом докладе «Индекс готовности приоритетных отраслей экономики Российской Федерации к внедрению искусственного интеллекта», подготовленным Национальным центром развития искусственного интеллекта при Правительстве Российской Федерации (НЦРИИ) при содействии Всероссийского центра изучения общественного мнения (ВЦИОМ). В отчете проанализированы 36 показателей по 11 направлениям, характеризующих развитие ИИ. Перечень таких показателей в том числе включает наличие отечественных решений на основе технологий ИИ на российском рынке, специалистов в области ИИ, инфраструктуры и др. В 2024 году в исследовании приняли участие более пяти тысяч организаций в 19 отраслях экономики и секторах социальной сферы.
Среди других выводов исследования отмечается значительный рост востребованности использования технологий обработки естественного языка, распознавания и синтеза речи. Наблюдается рост качества ИИ-систем и их эффективности: в этом году 97% организаций, использующих искусственный интеллект, получили положительный эффект от его применения. Кроме того, существенный и многократный экономический эффект от применения ИИ организации стали отмечать в 2,5 раза чаще за последние три года. При этом значимыми барьерами широкомасштабного внедрения ИИ остаются недостаток кадров и финансирования.
В рамках исследования представлена динамика развития искусственного интеллекта в 19 отраслях экономики; изучен опыт организаций, внедривших искусственный интеллект; определены потребности российских организаций в возможных мерах государственной поддержки для расширения практики использования искусственного интеллекта и увеличения эффективности его использования; выработаны рекомендации по нивелированию проблем, возникающих при внедрении искусственного интеллекта.
С полной версией отчета можно ознакомиться по ссылке: База знаний Национального портала РФ по искусственному интеллекту и нейросетям
Индекс рассчитывается с 2021 года при поддержке Правительства РФ в рамках федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика Российской Федерации». Результаты исследования используются в рамках исполнения поручения Президента Российской Федерации Пр-172, п.1 г) - 2 от 29.01.2023.
@vistehno
🌟 BioNeMo: фреймворк разработки ИИ-моделей для дизайна лекарств.
NVIDIA BioNeMo2 Framework - это набор инструментов, библиотек и моделей для вычислительного поиска и разработки лекарственный препаратов.
Он ускоряет самые трудоемкие и дорогостоящие этапы создания и адаптации моделей биомолекулярного ИИ, предоставляя оптимизированные модели и инструменты, которые легко интегрируются в вычислительные ресурсы на базе GPU.
Фреймворк позволяет создавать, обучать и настраивать модели, его возможности охватывают различные рабочие нагрузки и терапевтические механизмы: генерация молекул, предсказание структуры белка, белок-лиганд и обучение представлениям.
Помимо кода пайплайнов, скриптов и утилит, BioNeMo2 Framework содержит:
▶️Предобученные модели:
🟢ESM-2 - предварительно обученный двунаправленный энкодер (BERT-подобный) для аминокислотных последовательностей. BioNeMo2 включает в себя чекпоинты с параметрами 650M и 3B;
🟢Geneformer - модель табличного подсчета, которая генерирует плотное представление sc-RNA клетки путем изучения паттернов коэкспрессии в отдельных клетках.
▶️Датасеты:
🟠CELLxGENE - совокупность общедоступных single-cell наборов данных, собранных в CZI (Chan Zuckerberg Initiative) общим объемом в 24 млн. клеток;
🟠UniProt - база данных кластеризованных наборов белковых последовательностей из UniProtKB, созданная на основе транслированных геномных данных.
📌Лицензирование: Apache 2.0 License.
🟡Страница проекта
🟡Документация
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #Framework #NVIDIA
🌟 DeepSeek-V2.5-1210: файнтюн базовой DeepSeek-V2.5.
Файнтюн модели DeepSeek-V2.5 с 236 млрд. параметров с улучшенными показателями в математических вычислениях, программировании, генерации текста и рассуждении. В модели также оптимизированы функции загрузки файлов и обобщения веб-страниц.
Точность решения задач с DeepSeek-V2.5-1210 на LiveCodebench выросла с 29,2% до 34,38% относительно родительской DeepSeek-V2.5, в математических тестах MATH-500 с 74.8% до 82.8%.
DeepSeek-V2.5-1210 поддерживает function calling и использует обновленный шаблон чата для расширения возможностей модели.
⚠️ Чтобы использовать модель в инференсе с BF16 требуется 8 GPU c 80 GB VRAM каждый.
▶️Пример инференса DeepSeek-V2.5-1210 на Transformers:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig
model_name = "deepseek-ai/DeepSeek-V2.5-1210"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
# `max_memory` should be set based on your devices
max_memory = {i: "75GB" for i in range(8)}
# `device_map` cannot be set to `auto`
model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True, device_map="sequential", torch_dtype=torch.bfloat16, max_memory=max_memory, attn_implementation="eager")
model.generation_config = GenerationConfig.from_pretrained(model_name)
model.generation_config.pad_token_id = model.generation_config.eos_token_id
messages = [
{"role": "user", "content": "Write a piece of quicksort code in C++"}
]
input_tensor = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")
outputs = model.generate(input_tensor.to(model.device), max_new_tokens=100)
result = tokenizer.decode(outputs[0][input_tensor.shape[1]:], skip_special_tokens=True)
print(result)
🔥 OpenAI предоставила доступ к Sora — новому мощному генератору видео, способному изменить множество отраслей. Это произошло!
Теперь вы можете:
- Создавать видео на основе текстов и изображений, делать ремиксы и объединять несколько роликов в единый видеоряд.
- Качество видео превосходит все ожидания — оно лучше, чем у Kling, GEN-3 и других конкурентов.
- Интерфейс включает в себя галерею, возможность создания папок и монтажа.
- Вы можете выбрать продолжительность видео до 20 секунд и разрешение до 1080p, а также продлить генерацию до пяти раз.
- Система была обучена на новостных материалах, поэтому генерация телевизионных передач получается особенно реалистичной.
- Доступ предоставляется платным подписчикам. За $20 в месяц вы получите 50 генераций, а за $200 — неограниченное количество генераций и отсутствие водяных знаков.
Попробовать можно здесь!
@vistehno
🔥 flux-fill-outpaint — полезный инструмент для генерации изображений с использованием нейросетей!
🌟 Этот инструмент позволяет пользователям создавать изображения, дополняя или редактируя части существующих картинок, с применением технологии "outpainting". Outpainting — это процесс, при котором нейросеть генерирует или "достроит" изображение за пределами его исходных рамок, расширяя сцену или добавляя новые элементы, сохраняя при этом стиль и контекст исходного изображения.
🔗 Ссылка: *клик*
@vistehno
🖥 Анонс второго дня OpenAi: теперь вы можете тренировать свою сверхумную модель на основе o1!
Для превращения модели в эксперта в определенной области достаточно предоставить ей около 20 примеров задач с их решением. Впечатляет, правда?
Уже начали выдавать доступ различным университетам, чтобы они смогли заменить своих преподавателей
AI представили reinforcement finetuning для o1 (RFT).
Этот метод отличается от обычного файнтюнинга (или файнтюнинга с учителем) тем, что он позволяет обучать модель думать определённым образом в конкретной области, важной для пользователя. Разработчики утверждают, что таким способом можно довести модель до экспертного уровня в нужной сфере, используя значительно меньший объём данных, чем требуется для стандартного файнтюнинга.
Файнтюнинг будет доступен непосредственно на платформе OpenAI: необходимо лишь выбрать режим "reinforcement" и загрузить набор данных (в ходе демонстрации использовался датасет всего из 100 образцов, что оказалось достаточным для получения хороших результатов, судя по графикам оценки качества).
К сожалению, обычным пользователям эта функция станет доступна не раньше следующего года – сейчас она проходит закрытое тестирование среди университетов и бизнес-клиентов. Вероятно, стоимость этой услуги будет довольно высокой, однако результат обещает оправдывать затраты.
https://platform.openai.com/finetune
@vistehno
🔥 Сравнение 8 ИИ-моделей для создания видео!
🔍 Промпт: POV Жуткая находка секретных подземных туннелей возле ядерного реактора в лесу, трясущаяся съемка с телефона, ненасыщенные синие, зеленые и серые тона, напряженное настроение, научно-фантастический хоррор
@vistehno
🖥 Сегодня девятый день стримов OpenAI из двенадцати, и они демонстрируют множество новых возможностей API o1:
— В API o1 теперь реализована работа с изображениями, возможность внутренних вызовов ассистентов (когда моделям необходимо выполнять вычисления), а также вывод данных в формате JSON.
— Улучшена настройка точности выполнения инструкций.
— Появилась функция Reasoning Efforts, позволяющая пользователям регулировать степень размышлений модели над задачей.
https://www.reddit.com/r/singularity/comments/1hgfttc/openai_day_9_for_developers/
@vistehno
Уже забыли, когда кодили что-то нестандартное?
Приглашаем тряхнуть стариной на бесплатном мини-курсе от Skillbox «Python для всех». Он состоит из практики чуть меньше чем полностью. За 4 дня мы создадим 4 проекта:
1️⃣ Бота для Telegram, который умеет переводить голос в текст
2️⃣ Бота для Telegram, который обрабатывает фотографии
3️⃣ Парсер, который извлекает данные с сайтов
4️⃣ Веб-сайт (с помощью фреймворка Flask)
В общем, прокачаете навыки, освежите память и наверняка узнаете что-то новое.
Регистрируйтесь: https://goo.su/kpfB?erid=2VtzqxQdkrm
🎁 А ещё подарки: персональная карьерная консультация, скидка 10 000 рублей на любой курс Skillbox и подборка полезных материалов.
Вас ждет новогодняя распродажа в Skillbox: дарим скидки до 60% и 3 курса в подарок!
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
📎 ML в медицине: дайджест за 8 - 15 декабря 2024 г.
▶️Модели, бенчмарки и датасеты
🔘Модель диагностики хронического заболевания почек.
Модель глубокого обучения, которая с высокой точностью диагностирует болезни почек по данным КТ-снимков.
🔘RNAgrail: графовая нейронная сеть и диффузионная модель для предсказания 3D-структуры РНК.
Опенсорсный инструмент моделирования и прогнозирования структуры РНК.
🔘LLaSA: Анализ активности пациента по инерционным датчикам с помощью MLLM.
Mодель, которая может анализировать данные с датчиков движения и отвечать на вопросы о действиях и активности человека.
▶️Фреймворки и методологии
🔘TOP-Training: целенаправленный метод обучения LLM для извлечения ответов на вопросы в медицинской области.
Метод обучения на синтетических данных, адаптированных под конкретную медицинскую задачу.
🔘Hybrid RAG: гибридная архитектура RAG для управления данными.
Концепт системы, которая использует MLLM и взаимодействие между клиниками для обмена медицинскими данными, улучшении диагностики и теорию контрактов, которые мотивируют клиники делиться актуальной информацией.
🔘MMedPO: метод повышения точности медицинских VLM.
Метод, который учитывает важность медицинской информации при обучении VLM и улучшает точность моделей в медицинских задачах.
🔘GMNA: анализ геномных данных с использованием сети ошибочной классификации.
Метод, который сравнивает геномы вирусов SARS-CoV-2 на основе ошибок в их классификации нейронными сетями. Чем чаще модель путает геномы из разных регионов, тем больше у них общего. Этот подход помог увязать генетические различия вирусов с географией и потоками авиаперелетов.
🔘Цифровые отпечатки для обучения ИИ в медицинской визуализации.
Способ хранить и передавать знания о том, как обучать ИИ анализировать медицинские изображения, не раскрывая данные.
🔘Прогнозирование посещений отделения неотложной помощи пациентами с диабетом 2 типа с помощью машинного обучения.
Применение разных ML-алгоритмов, чтобы спрогнозировать, когда пациенты будут ходить в отделение неотложной помощи. Лучше всего справлялись случайный лес, XGBoost и ансамблевая модель.
▶️Медицинские LLM-приложения
🔘BRAD: цифровой помощник для биоинформатики на основе LLM.
Цифровой помощник, который умеет искать и подтягивать информацию из разных источников - статей, баз данных, программных инструментов.
🔘BioResearcher: система автоматизации медицинских исследований.
Система с LLM, которая помогает ученым быстро находить нужные статьи, обрабатывать их, планировать эксперименты и даже писать отчеты.
▶️Исследования и обзоры
*️⃣T5-модели: преимущества и ограничения в обработке медицинских текстов.
Исследование, в котором сравнили разные модели Т5, обученные на медицинских данных, и выяснили, что специализированные клинические модели показывают лучшие результаты на некоторых задачах, но им не хватает гибкости. А модели общего назначения, адаптированные под медицинские задачи, оказываются эффективнее, особенно когда данных мало.
*️⃣Автоматизация классификации препаратов для клинических назначений с помощью LLMs.
Концепт системы, которая использует LLM для автоматической классификации лекарств по Анатомо-терапевтическо-химической системе. Это упрощает работу медиков и повышает точность распределения препаратов.
*️⃣Обзор медицинских наборов данных.
Обзор мед. датасетов - текстов, картинок, разговоров врачей и пациентов, которые используются для обучения ИИ-моделей решать медицинские задачи. Есть много интересных и полезных баз данных, но в основном на английском и китайском языках.
🔜 Читать полный дайджест
@ai_machinelearning_big_data
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:
МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
АНАЛИЗ Данных: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: /channel/gamedev
Haskell: t.me/haskell_tg
💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: /channel/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: /channel/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: /channel/addlist/BkskQciUW_FhNjEy
⚡️ DeepSeek-VL2: релиз набор VL-MoE моделей нового поколения.
DeepSeek-VL2 - усовершенствованная серия VLM c Mixture-of-Experts (MoE), которая значительно превосходит DeepSeek-VL.
Модели семейства ориентированы на задачи визуальных ответов на вопросы, оптического распознавания символов, понимания документов/таблиц/схем и визуального обоснования.
DeepSeek-VL2 включает три основных модуля:
🟠Визуальный энкодер SigLIP-SO400M-384, который использует динамическую стратегию разбиения изображения на фрагменты. Эта стратегия позволяет эффективно обрабатывать изображения высокого разрешения с различными соотношениями сторон.
🟠VL-адаптер, преобразующий визуальные элементы в формат, понятный языковой модели. Адаптер также добавляет специальные маркеры, чтобы обозначить границы строк, фрагментов и миниатюр.
🟠Языковая модель DeepSeek-MoE с механизмом MLA. MLA повышает эффективность обработки информации, сжимая kv-данные в компактный вектор. Это ускоряет обработку информации и увеличивает пропускную способность.
DeepSeek-VL2 обучается в три этапа: на первом этапе обучается MLP-соединитель, который связывает визуальный энкодер с языковой моделью, затем модель обучается на датасете из текста, изображений, аннотаций, QA и данных OCR и, в конце процесса, дообучается с учителем для улучшения ее способности понимать инструкции и вести диалог.
Модельная серия состоит из 3 вариантов c контекстом 4096:
🟢DeepSeek-VL2-Tiny (1B активных параметром и 3.4В общих);
🟢DeepSeek-VL2-Small (2.8B активных параметром и 16.1B общих);
🟢DeepSeek-VL2 (4.5B активных параметром и 27.5B общих).
DeepSeek-VL2 была протестирована на задачах DocVQA, ChartQA, InfoVQA, TextVQA, MMBench и показала лучшие результаты по сравнению с другими моделями MoE.
DeepSeek-VL2 эффективно использует архитектуру MoE и превосходит другие модели с аналогичным количеством активных параметров.
📌Лицензирование: DeepSeek License.
🟡Набор моделей
🟡Техотчет
🟡Сообщество в Discord
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #VLM #DeepSeek
🔥 MagicPatterns — это онлайн-инструмент, способный генерировать классный дизайн по одному текстовому запросу!
🌟 Платформа помогает дизайнерам и разработчикам быстро создавать визуально привлекательные элементы для веб-сайтов, приложений и других цифровых проектов.
🔗 Ссылка: *клик*
@vistehno
🔥 Это видео, воссоздающее Tekken 8, полностью сгенерировано ИИ!
🔗 Оригинал: *клик*
@vistehno
🔥 MagicPatterns — это онлайн-инструмент, способный генерировать классный дизайн по одному текстовому запросу!
🌟 Платформа помогает дизайнерам и разработчикам быстро создавать визуально привлекательные элементы для веб-сайтов, приложений и других цифровых проектов.
🔗 Ссылка: *клик*
@vistehno
🔥 Julius.ai — полезный и бесплатный ИИ-сервис для визуализации данных!
🌟 Он отлично справляется даже с большими объемами информации. Так, на видео выше он без проблем составил интерактивную карту счастья населения по странам.
🔗 Ссылка: *клик*
@vistehno
🔥 Meshy.ai — классный сервис, который позволяет вам создавать высококачественные и анимированные 3D-модели из одной фотографии!
🔗 Ссылка: *клик*
@vistehno
🔥 Полезный сайт, который убирает водяные знаки с фотографий при помощи ИИ!
🔗 Ссылка: *клик*
@vistehno
🔥 Команда Яндекс Переводчика рассказала, как получает данные для обучения моделей машинного перевода!
Прежде чем выдать пользователю перевод текстов, документов или видео, для машины нужно найти миллиарды параллельных предложений, на которых ее можно обучить. Все тонкости этого процесса подробно разобрали в статье на Хабре.
🔗 Ссылка: *клик*
@vistehno
🖥 OpenAI приоткрыла доступ к новой версии ChatGPT — компания анонсирует запуск САМОЙ МОЩНОЙ модели.
На данный момент, при использовании ChatGPT, ответы будут генерироваться с помощью новой модели под названием o1 pro mode. В течение ограниченного времени ее можно попробовать бесплатно, а стоимость подписки станет известна после официального анонса сегодня в 21:00.
Согласно утечкам информации, месячная подписка на o1 pro может обойтись в ОГРОМНУЮ сумму — около 200 долларов. Так что стоит поторопиться и воспользоваться возможностью бесплатного тестирования.
@vistehno