nn_for_science | Unsorted

Telegram-канал nn_for_science - AI для Всех

14748

Канал, в котором мы говорим про искусственный интеллект простыми словами Главный редактор и по рекламе: @crimeacs Иногда пишут в канал: @GingerSpacetail, @innovationitsme

Subscribe to a channel

AI для Всех

Y Combinator: почему вертикальные AI-агенты могут быть в 10 раз больше, чем SaaS

🌟 Рынок:

Искусственный интеллект (ИИ) меняет правила игры, как SaaS в 2000-х, но масштаб может быть еще больше. Каждый успешный SaaS-стартап может иметь аналог в виде вертикального AI-агента, который заменяет программное обеспечение и сотрудников.

🤖 Преимущества вертикального ИИ над SaaS:

- Экономия на ПО и затратах на персонал.
- Компании становятся более эффективными, требуя меньше людей.
- Технологии стремительно улучшаются каждые 3 месяца, и AI-агенты начинают заменять целые команды.

🚀 Как выйти на рынок:

- Продавать решения нужно не тем, кто потеряет работу из-за ИИ, а топ-менеджерам, заинтересованным в автоматизации.
- Сфокусируйтесь на скучной и повторяющейся административной работе — там скрыты миллиардные возможности.

📈 Истории успеха:

- MTic: Автоматизация тестирования QA.
- Cap.AI: Чатботы для разработчиков, уменьшившие потребность в крупных командах.
- Salient: Голосовые AI-решения для банков.

🔮 Будущее:

AI-инструменты помогут управлять крупными организациями и останутся специализированными, как SaaS.

🎞 Видео

Читать полностью…

AI для Всех

🌪️ GenCast: Тихая AI Революция в Прогнозировании Погоды продолжается!

Команда Google DeepMind представила GenCast - новейшую AI-модель, которая предсказывает погоду с невероятной точностью на 15 дней вперед! 🎯

🤔 Почему это важно:

- Изменение климата делает погоду все более непредсказуемой
- Точные прогнозы спасают жизни и имущество людей
- Помогает планировать использование возобновляемой энергии

🔬 Что умеет GenCast:

- Создает 50+ возможных сценариев развития погоды и собирает их в вероятностный прогноз
- Работает с разрешением 0.25° по всей планете
- Превосходит лучшие существующие системы прогнозирования в 97.2% случаев!

⚡️ Впечатляющая скорость:

- Всего 8 минут на создание 15-дневного прогноза на одном Google Cloud TPU v5. Традиционным системам требуются часы работы на суперкомпьютерах!

🌪️ Особенно хорош в предсказании экстремальных погодных явлений:

- Тайфуны и ураганы
- Экстремальная жара и холод
- Сильные ветра

🎁 Открытый доступ:
Google DeepMind выпускает код модели и веса в открытый доступ, чтобы помочь развитию метеорологического сообщества.

🔮 Что дальше:
Скоро прогнозы GenCast появятся в Google Search и Maps, помогая предсказывать осадки, пожары, наводнения и экстремальную жару.
Это еще один шаг к более безопасному будущему, где мы сможем лучше подготовиться к капризам погоды! 🌍

📄 Статья в Nature
📰 Блог-пост
💻 Код
💿 Веса

Читать полностью…

AI для Всех

Когда прошлое переопределяет будущее: о людских усилиях, каналах и предсказании наводнений

В декабре хочется теплых объятий и немного чуда. Эта история о том, как простые действия объединяют людей и воплощаются в большие технологические решения.

Недавнее разрушительное наводнение в Испании и повсеместно инициируемая помощь пострадавшим заставили меня задуматься о силе человеческой солидарности. Особенно меня поразил рассказ моего старшего коллеги. В детстве он по традиции отправлял рождественские письма и открытки родственникам: бабушка и дедушка шли с ним на почту и покупали именно те марки, выручка от которых шла на строительство канала, запланированного после сильнейшего наводнения 1957 года. Он хорошо запомнил слова "это наш маленький вклад в будущее". Как мы узнали в 2024 году, спустя >60 лет тот канал спас от катастрофы 1,5 миллиона человек, живущих в Валенсии. К сожалению, не спас весь регион, и понадобятся новые планы и сохранные меры. Сегодня мы можем продолжить это дело, в т.ч. используя машинное обучение для предсказания наводнений и минимизации их трагических последствий. И это острый вопрос не только для Европы.

Если вас тоже трогают инициативы, объединяющие прошлое и будущее, обратите внимание на соревнование “Inundata: Mapping Floods in South Africa” на Zindi, спонсируемое Google Deepmind. Участникам предлагается разработать модели для предсказания наводнений в городских районах Южной Африки.

Что важно знать про задачу
Данные: Датасет включает данные о случившихся с 1981 по 2023 наводнениях в Южной Африке агрегированные с данными об осадках из CHIRPS в радиусе 5 км от точки наводнения.

Цель: Классифицировать районы на основе их уязвимости к наводнениям и создать эффективную предсказательную модель с точностью до дней.

Вызовы:
Многомерные временные данные, включающие климатические и ландшафтные факторы.
Несбалансированный датасет - наводнения все же редкие события.

Призовой фонд:
1 место 5 000 USD
2 место 3 000 USD
3 место 2 000 USD

Дедлайн: 16 февраля 2025

Как и канал в Валенсии, современные технологии — это результат коллективных усилий. Соревнование на Zindi — это возможность не только полирнуть свои навыки, но и сделать доброе дело. Ваши идеи и модели могут стать частью решения для разработки превентивных мер, оптимизации городского планирования и управлением рисками.

Подробности: Zindi Competition

Читать полностью…

AI для Всех

есom.teсh meetup — Generative AI

6 декабря 18:00 в Москве пройдёт митап по прикладному использованию генеративных технологий для специалистов по Data Science!

Обсудим технические аспекты экспериментов с нейронными сетями, посмотрим свежие кейсы внедрения ИИ в бигтехе и не только.

В программе:

👁‍🗨 Виртуальная фотосъемка для продавца на маркетплейсе: возможности Gen AI.
Арнольд Сааков, руководитель отдела разработки сервисов искусственного интеллекта в ecom.tеch.

👁‍🗨 От потоковой обработки к генерации: AI-алгоритмы для автоматизации работы с фотографиями товаров на маркетплейсе.
Александр Савельев, руководитель группы развития технологий компьютерного зрения в ecom.tеch;
Татьяна Гришина, менеджер продукта в ecom.tеch.

👁‍🗨 Секретный доклад.

Митап будет интересен тем, кто уже работает или проходит обучение в области Data Science и интересуется генеративными технологиями!

🧠 Регистрируйтесь 👉 https://click.wowblogger.ru/VM8Xl?erid=2VSb5z6zFmz и пересылайте знакомым!

#Реклама. ООО "УМНОЕ ПРОСТРАНСТВО", ИНН 7811554010, Erid: 2VSb5z6zFmz

Читать полностью…

AI для Всех

AMA: Ask me anything about having a Golden Retriever

Спроси меня что угодно: версия про собак

Читать полностью…

AI для Всех

Chat: Канал вообще перестал расти, что мы делаем не так? Как надо?

Читать полностью…

AI для Всех

Идет поиск… Обнаружен короткий путь к офферу Сбера 🕵️‍♂️

7 декабря приглашаем на One Day Offer для AI RedTeam – команды Департамента Кибербезопасности Сбера, которая занимается оценкой и защитой моделей генеративного искусственного интеллекта.

Мы работаем с флагманскими продуктами и генеративными моделями (LLM, VLM, MMLM), обеспечивая их безопасную разработку и эксплуатацию, а также исследуем уязвимости GenAI моделей и новые виды атак.

Чем предстоит заниматься?
✅ Обеспечивать безопасность GenAI-продуктов, используемых миллионами пользователей
✅ Анализировать новые инциденты, методы атак и защиты GenAI-моделей и приложений
✅ Разрабатывать и внедрять PoC для проверки защищенности GenAI-моделей и приложений
✅ Тестировать и оценивать защищенность GenAI-моделей и приложений
✅ Выполнять подготовку заключений и рекомендаций по повышению защищенности GenAI-моделей и приложений.

Регистрируйтесь и присоединяйтесь к молодой кросс-функциональной команде 😎

#реклама

Читать полностью…

AI для Всех

🚀 SmolVLM: мощная компактная мультимодальная модель от Hugging Face 🤗


🤖 Что такое SmolVLM?

- Компактная мультимодальная модель размером 2 миллиарда параметров
- Полностью открытый исходный код

Технические особенности:

🔬 Архитектура:

Языковой backbone: SmolLM2 1.7B
Визуальное сжатие информации в 9 раз
Размер изображений: 384x384 пикселя
Патчи по 14x14 пикселей

Возможности:

🖼️ Анализ изображений:

- Распознавание объектов
- Описание сцен
- Ответы на вопросы по картинкам


🎥 Работа с видео:

- Анализ до 50 кадров
- Понимание временной последовательности
- Распознавание объектов и действий

📊 Производительность:

Топовые результаты на бенчмарках:

MMMU: 38.8%
MathVista: 44.6%
DocVQA: 81.6%
MMStar (val): 42.1%
TextVQA: 72.7%

🚀 Преимущества:

- Работает на устройствах с низким объемом памяти
- В 3-4 раза быстрее аналогов
- Минимальное использование GPU (от 5 ГБ)

Опубликованы три версии модели:

🔹 SmolVLM-Base - для дообучения
🔹 SmolVLM-Synthetic - обучена на синтетических данных
🔹 SmolVLM Instruct - готова к использованию

🎮Демо


📰 Блог


🤗 Модель


👨‍💻Код для fine-tuning-a

Читать полностью…

AI для Всех

​​🔍 Доля AI в поиске занимает 6%. А что еще интересного?

Стечение обстоятельств, а также тот факт, что у меня теперь есть Perplexity Pro на год, сподвигли посмотреть, что там на рынке поиска-то происходит. Еще пару лет назад никто не мог подумать, что этот рынок можно как-то переделывать.

1/ Итак, поиск информации вместо Google и других поисковых систем уже проходит через AI решения. Как минимум есть вышеупомянутый Perplexity, а также SearchGPT от OpenAI и поиск через чаты с другими моделями, которые имеют доступ в интернет.

2/ Информации не очень много, но можно запомнить следующее:
▪️Google занимает от 89% поиска как search engine до 91% поиска по разным данным, далее (как ни удивительно) следует Bing с 3.4-4.2%, остальные еще меньше;
▪️Доля AI решений сейчас составляет 6%, но по выручке (в деньгах) это 1%;
▪️Доля Perplexity при этом – 0.5% поиска. Это довольно много, например, доля DuckDuckGo в поиске составляет 0.54%-0.69%.

3/ Доля AI поиска может вырасти с 6% сегодня до 14% в 2028 году.

4/ Кому интересно почитать подробнее про Perplexity, можете зайти вот на этот сайт. Там собрана информация про их бизнес и показатели, например, $40M выручки, 10M MAU, 300M поисковых запросов в 2023 году и так далее.

5/ А вот в этой статье есть прикольное сравнение конвенциального поиска с поиском через AI. Например, результаты поиска через SearchGPT от OpenAI только на 46% совпадают с поиском через Google и на 73% с поиском через Bing.

@proVenture

#research #ai #trends

Читать полностью…

AI для Всех

💡 Как генеративный AI меняет бизнес: научитесь создавать и интегрировать AI решения без огромных бюджетов и команд разработки

Недавно я делал пост о том, как компании инвестируют миллиарды в генеративный AI для оптимизации процессов и создания продуктов. Главный вывод: сегодня AI — это не просто инструмент для «поиграть», а ключевой фактор для улучшения показателей бизнеса.

Но, несмотря на огромный потенциал, для не крупных игроков внедрения AI связано с такими вопросами, как:
- Можно ли протестировать эффективность/внедрить AI без огромной команды разработки?
⁃ Как интегрировать AI в существующие процессы и какие процессы выбрать для автоматизации?
- Как оценить эффективность и внедрить AI с минимальными вложениями?


Чтобы разобраться с этими вопросами, команды студии AI-разработки SkaiLab и бизнес-консультанты Иннопорт разработали практический курс применения AI в бизнесе.

📊 Что будет на курсе:
- Практика на реальных кейсах. Создадите 14 практических AI-решений: AI-ассистенты, боты, системы ИИ-автоматизации. В общем, всё то, о чем я писал ранее в посте и даже больше.
- Системный подход. Научитесь понимать какие бизнес-процессы стоит автоматизировать с помощью AI-инструментов
- Методы оценки эффективности. Узнаете, как анализировать результаты внедрения и повышать эффективность использования AI-инструментов.

Эта программа для тех, кто хочет научиться использовать AI не только для базовых задач вроде генерации текста или изображений, но и для построения масштабируемых AI-решений.

Сейчас уже растет количество предложений для экспертов в AI. И в самое ближайшее время, люди, способные интегрировать AI и бизнес станут самыми ценным кадрами на рынке.

📌Успейте занять свое место на курсе. Подать заявку можно по ссылке: https://clck.ru/3Ejewd
🔥 А по промокоду AIFORALL24 вы получите скидку 30%

#реклама

Читать полностью…

AI для Всех

Победа ChatGPT над врачами

Недавнее исследование показало, что ChatGPT-4 превзошел врачей в диагностике сложных медицинских случаев. Искусственный интеллект поставил верный диагноз в 90% случаев ✅, тогда как врачи с доступом к ChatGPT справились лишь на 76%, а без него — на 74%.

👨‍⚕️Основная проблема — врачи часто игнорировали предложения ChatGPT, предпочитая собственные гипотезы, даже если ИИ предлагал более точное объяснение. Кроме того, многие врачи использовали GPT как поисковую систему 🔍, а не как мощный инструмент анализа.

📋В исследовании участвовали 50 врачей, которые диагностировали 6 сложных медицинских случаев. Оценивалась способность ставить и аргументировать диагноз.

Результаты оценивали врачи-эксперты, которые видели только ответы участников, не зная, были ли они от врача с ChatGPT, врача без него или от самого ChatGPT.

Истории болезней, использованные в исследовании, были основаны на реальных пациентах. Случаи намеренно никогда не публиковались, чтобы студенты-медики и другие могли пройти тестирование на них без какого-либо предварительного знания. Это также означало, что ChatGPT не мог быть обучен на них.

ИИ показал способность обрабатывать вводные медицинские данные и контекст, предлагать обоснованные диагнозы и объяснять свои выводы. Несмотря на это, врачи часто отказывались принимать его аргументы из-за уверенности в собственной правоте 🧠

🤖По мнению авторов, системы ИИ могут стать незаменимым помощником в медицинской диагностике, но для этого нужно научить врачей полностью раскрывать их возможности и использовать их в качестве "второго мнения".

💊 Статья

Читать полностью…

AI для Всех

Ищем стажеров в нашу команду Applied ML в Stripe

Если ты PhD-студент в США 🇺🇸 (к сожалению только так) и хочешь применить свои знания в машинном обучении для решения реальных задач, то это для тебя.

Миссия Stripe - увеличить ВВП интернета!

В Stripe ты сможешь:
• Работать над ML-проектами, которые реально влияют на мировую экономику.
• Использовать свои навыки в областях LLM, RL, MLOps, Агентах и классических ML-методах.
• Воплощать передовые исследования в жизни и видеть их реальное влияние.

Мы ищем тех, кто готов объединить науку и практику, работать с мощной инфраструктурой и помогать делать финансовые технологии лучше для всех.

Что предлагается?
🎓 Стажировка для PhD-студентов: Подробности тут
🎓 Роль для выпускников PhD: Подробности тут

Если есть вопросы, пиши в комментарии расскажу больше!

Читать полностью…

AI для Всех

🛠 2024: Год, когда AI стал необходимостью для бизнеса

2024 — это момент, когда компании перестали экспериментировать с генеративным AI и начали встраивать его в основу своей работы. Давайте разберем сегодняшний отчет от Menlo Ventures (одного из главных инвесторов Anthropic).

Бюджеты говорят сами за себя: расходы на AI выросли до $13,8 млрд, что в 6 раз больше, чем в 2023 году.

💡 Почему это важно?
Теперь AI — это не просто инструмент для «поиграть», а реальная возможность менять бизнес-процессы, повышать эффективность и создавать новые продукты.

📝 Что говорят данные?
72% компаний уверены, что генеративный AI станет массово применяться в ближайшем будущем.
• Но! 35% лидеров до сих пор не имеют чёткой стратегии, как интегрировать AI. Это нормально — мы всё ещё в начале пути глобальных изменений.

🚀 Бюджеты на AI: рост и амбиции

Компании готовы тратить деньги на генеративный AI:
60% инвестируют из «инновационных» бюджетов, чтобы попробовать новое.
40% перераспределяют постоянные бюджеты, показывая долгосрочную готовность менять процессы.

Самое интересное происходит в приложениях AI: на них потрачено $4,6 млрд в этом году — почти в 8 раз больше, чем год назад.

📌 Какие кейсы уже работают?
1️⃣ Кодовые ассистенты (например, GitHub Copilot) — уже используются в 51% компаний, помогая разработчикам работать быстрее и качественнее.
2️⃣ Чат-боты поддержки — помогают клиентам и сотрудникам в 31% организаций.
3️⃣ AI для поиска и трансформации данных — используются в 28% компаний для работы с большими массивами информации.
4️⃣ Суммаризация встреч — экономит время и повышает продуктивность в 24% случаев.

🤖 AI в продакшене: что дальше?

Компании пока сосредоточены на поддержке человека, но уже появляются системы, которые начинают брать задачи целиком на себя.

🏗 Строить или покупать?
Вопрос непростой: 47% компаний разрабатывают AI-решения сами, а 53% покупают готовые решения у вендоров.

🌐 Трансформация по всем направлениям

AI проникает в каждую часть бизнеса: от IT и продуктовых команд до HR, маркетинга и даже юристов. В 2024 году ярко выделились 4 отрасли:
Медицина — AI-системы помогают врачам, автоматизируют записи в EHR и оптимизируют работу клиник.
Юриспруденция — автоматизация контрактов, анализ документов и поддержка адвокатов.
Финансы — AI упрощает обработку данных, делает отчёты и помогает соблюдать нормы.
Медиа — инструменты генерации контента становятся стандартом для креаторов и студий.

🔮 Что ждать в будущем?

1️⃣ AI-агенты захватят рынок.
AI начнёт полностью автоматизировать сложные процессы, что изменит подход к IT, а затем и к сервисам.

2️⃣ Стартапы обгонят гигантов.
Уже сейчас видно, как молодые компании отнимают рынок у крупных игроков.

3️⃣ Дефицит талантов усилится.
Эксперты с опытом в AI будут нарасхват. Рынок ожидает рост зарплат и огромный спрос на специалистов, способных сочетать AI с бизнес-логикой.

🎯 AI больше не будущее — он уже здесь.
Компании видят в генеративном AI мощный инструмент для изменений. От автоматизации процессов до создания новых бизнес-моделей — это только начало.

🍬 Читать отчет целиком

Читать полностью…

AI для Всех

🛍️ Теперь в Perplexity можно не только искать, но и покупать!

Perplexity сделали новый шаг к тому, чтобы AI-ассистенты стали настоящими помощниками. С помощью Stripe Agent Toolkit, интегрированного в подписку Pro, теперь можно совершать покупки прямо из чата.

💡 Как это работает?
1️⃣ Вы задаёте сложный запрос, например: “Что купить для вечеринки в стиле диско?”.
2️⃣ Perplexity не только находит ответ, но и предлагает товары в удобных карточках с подробными описаниями, отзывами и ценами.
3️⃣ Вы выбираете нужное, и покупка завершается автоматически — всего в один клик, без лишних шагов!

📦 Buy with Pro
Пользователи Perplexity Pro в США получают уникальный опыт: бесплатную доставку и автоматизированный процесс оформления. Вы просто указываете данные доставки, а Perplexity с помощью Stripe берёт всю рутину на себя.

📸 Snap to Shop
Есть фото вещи, которую хотите найти? Загрузите её в Perplexity, и AI подскажет, где её можно купить, даже если вы ничего о ней не знаете.

🤝 Партнёрство с Shopify
Perplexity подключил товары и магазины Shopify, добавив поддержку безопасных покупок через Shop Pay.

🎯 Почему это круто?
Perplexity Shopping — это больше, чем просто поиск. Это решение задач, которые раньше отнимали часы: поиск подходящих товаров, сравнение вариантов, оформление покупки. А теперь всё это занимает считаные минуты.

🌍 Пока функция доступна только в США, но команда активно работает над международным запуском.

Полагаю, что одними Perplexity дело не ограничится. Возможность покупать напрямую из чата придется по вкусу многим покупателям, а значит следует ожидать что и другие чаты с функцией онлайн поиска скоро подтянутся.

X

Читать полностью…

AI для Всех

Как добавить платежи в AI-агентов с помощью Stripe

Походит к концу мой первый месяц в Страйпе, и про это я напишу отдельно. А пока, hot of the press, расскажу вам про нашу новинку.

Представьте, что у вас есть умный цифровой помощник, который может не только отвечать на вопросы, но и выполнять реальные действия. Например, вы пишете: "Найди билет из Нью-Йорка в Сан-Франциско за 500 долларов", и AI-агент:

1. Понимает ваш запрос и выделяет важные детали
2. Ищет подходящие варианты
3. Показывает вам лучшие предложения
4. И теперь — может даже купить билет!

Stripe выпустил специальный набор инструментов (Agent Toolkit), который работает с популярными AI-фреймворками:
- Vercel AI SDK
- LangChain
- CrewAI

Что это даёт вашему AI-агенту:
- Возможность создавать платежные ссылки
- Выставлять счета клиентам
- Генерировать виртуальные карты для покупок
- Отслеживать все финансовые операции

Пример кода для выставления счета:

from stripe_agent_toolkit import StripeAgentToolkit

# Подключаем Stripe к агенту
toolkit = StripeAgentToolkit(
secret_key="sk_test_123",
configuration={
"actions": {
"invoices": {"create": True},
"customers": {"create": True}
}
}
)

# Теперь агент может выставлять счета
agent.invoke("Выставить счет клиенту example@mail.com на $100")


Что может делать AI-агент с платежами:

🛍️ Умный шоппинг
- Поиск товаров по вашим критериям
- Сравнение цен
- Безопасная оплата через виртуальные карты
- Контроль бюджета

💼 Бизнес-операции
- Автоматическое выставление счетов
- Отслеживание платежей
- Управление подписками
- Контроль расходов

Stripe Agent Toolkit — это мост между AI и реальными финансовыми операциями. Теперь ваши AI-агенты могут не только думать, но и действовать с деньгами — безопасно и эффективно.

Пробуйте и делитесь фидбеком! Все передам ответственной команде

🐸 Блог-пост
🦾 Agent Toolkit документация
🖥 Git

Читать полностью…

AI для Всех

В продолжение нашего разговора о GenCast, давайте погрузимся в технические детали работы этой нейросети.

В сердце GenCast лежит сочетание двух подходов машинного обучения: диффузионных моделей и графовых трансформеров. В GenCast процесс предсказания погоды устроен как диффузия из шума -> через серию из 20 итераций очистки -> к реалистичному прогнозу погоды.

Архитектура GenCast построена из трех ключевых компонентов, каждый из которых решает специфическую задачу в процессе прогнозирования.

- Энкодер преобразует стандартную географическую сетку в икосаэдрическую структуру - специальный формат данных, оптимизированный для последующей обработки GenCast.

- Процессор, используя графовые трансформеры, анализирует взаимосвязи между погодными паттернами в глобальном масштабе.

- Декодер завершает процесс, конвертируя обработанные данные обратно в стандартный метеорологический формат.

Процесс обучения GenCast реализован в два этапа, что позволяет достичь оптимального баланса между скоростью и точностью. Первый этап включает 2 миллиона итераций на данных низкого разрешения (1°), где система осваивает базовые погодные паттерны. Второй этап добавляет 64,000 итераций на высоком разрешении (0.25°), что позволяет системе достичь необходимой точности прогнозирования.

Технически GenCast работает с комплексным набором переменных: 6 приземных (включая температуру и давление) и 6 атмосферных на 13 уровнях давления. Это позволяет системе создавать детальную трехмерную модель атмосферных процессов.

Важное преимущество GenCast - способность генерировать множество вероятных сценариев развития погоды, что особенно важно для прогнозирования экстремальных явлений.

Читать полностью…

AI для Всех

HunyuanVideo от Тencent

Тencent выпустила HunyuanVideo, крупнейшую модель генерации видео с открытым исходным кодом!

13B модель имеет унифицированную архитектуру для создания как изображений, так и видео.

HunyuanVideo объединяет многомодальную большую языковую модель (MLLM) в качестве текстового кодировщика, улучшая текст-видео алайнмент и способности рассуждения. Она также использует 3D VAE для эффективного сжатия видеоданных, что позволяет генерировать высококачественное видео с исходным разрешением.

Согласно результатам профессиональной оценки, Hunyuan Video превосходит предыдущие передовые модели, включая Runway Gen-3, Luma 1.6 и 3 самые эффективные китайские модели видеогенерации.

👨‍💻 Project page

🤗 Huggingface

💻 Git

📜 Paper

🎮 Demo

Читать полностью…

AI для Всех

Zero to Hero гайд по llama.cpp 🦙


Хотите запустить и работать с LLM локально?

SteelPh0enix написал подробное руководство, которое проведет вас через все, что вам нужно знать о llama.cpp, от базовой настройки до более продвинутой оптимизации.

Основные моменты:

→ Полный процесс настройки: статья содержит подробные инструкции для начинающих по созданию и настройке llama.cpp как в Windows, так и в Linux

→ Управление моделями: узнайте, как загружать модели из Hugging Face, преобразовывать их и оптимизировать с помощью квантования

→ Оптимизация производительности: узнайте, как выполнить настройку для максимальной эффективности, включая ускорение GPU, управление памятью и расширенные параметры конфигурации

→ Техническое глубокое погружение: узнайте, как LLM работают на практике, включая токенизацию, методы выборки и контроль температуры

→ Практические инструменты: изучение полезных инструментов, таких как llama-bench для тестирования производительности и llama-cli для прямого взаимодействия с моделями

🧭 Гайд

Читать полностью…

AI для Всех

Подарок своИИми руками

На эти выходных, мои друзья хостили у себя ужин на День Благодарения. И я решил не приходить с пустыми руками, а сделать небольшой подарок - игру.

С помощью Claude создал категории слов (еда, достопримечательности, известные люди, достопримечательности) и в каждой категории сгенерировал 20 слов.

Для каждого слова, попросил Claude сгенерировать промпт для генератора картинок, и с помощью Recraft сделал картинки в одном стиле.

Собрал картинки и слова в бесплатном редакторе Photopea, распечатал и порезал на аккуратные карточки.

На все вместе (от идеи до готовых карточек) ушло часа полтора.

Как играть?

Ведущий прикладывает карточку себе ко лбу, а все остальные ему объясняют что у него на лбу написано.

Читать полностью…

AI для Всех

Короче, судя по комментариям в предыдущем посте - наш канал - - жиденький контент и простыни текста. Значит будем постить фотки Сэнди. @GingerSpacetail можем еще твоих животных постить. И таксу @innovationitsme

Читать полностью…

AI для Всех

🚀 Месяц в Stripe: первые впечатления и Black Friday!

Ребята, это что-то невероятное! Прямо сейчас мы в эпицентре главной распродажи года, и я хочу поделиться тем, что вижу изнутри.

💡Stripe запустил специальный сайт bfcm.stripe.com, где в реальном времени показывает, как миллиарды долларов путешествуют по миру. Это не просто красивая визуализация — это живой пульс глобальной коммерции!

🛠️ Что меня особенно впечатлило:
- Radar анализирует 1000+ параметров каждой транзакции за миллисекунды (!) для защиты от фрода
- Link реально экономит часы времени на чекауте (сам пользуюсь, это магия)
- Tax автоматически разруливает налоги в 69 странах

🤯 А масштаб? От небольших стартапов до таких гигантов как Shopify и NVIDIA — все они прямо сейчас полагаются на нашу инфраструктуру. И она работает как часы!

Загляните на bfcm.stripe.com — там можно своими глазами увидеть, лучший день доя большинства потребительских бизнесов в году!

Про то, как мне работается написал в комменты. Пишите вопросы - отвечу на что могу/знаю

P.S. Кто бы мог подумать, что термин "Black Friday" появился в 60-х в Филадельфии из-за того, что физическая инфраструктура не справлялась с наплывом покупателей? Сегодня такие проблемы решаются одной строчкой кода 😉

Читать полностью…

AI для Всех

Тем временем Илон показал телеуправляемого робота, который ловит мячи! Правильно, fuck Thanksgiving diner.

Курлык курлык

Читать полностью…

AI для Всех

Смартфоны изучают ионосферу Земли🛰️📱🌍

Google Research нашли способ использовать миллионы Android-устройств для изучения ионосферы – верхнего слоя атмосферы, который влияет на радиосигналы и GPS-навигацию.

🔍 Что такое ионосфера?

Ионосфера – это слой, насыщенный заряженными частицами (плазмой), который может вызывать помехи для спутниковой связи, радио и GPS. Изучение её поведения особенно важно во время солнечных бурь, которые могут повредить спутники и энергосети.

🔹 Как это работает:

- Устройства Android с GPS собирают данные о сигналах спутников.
- Эти данные используются для отслеживания колебаний в плазме ионосферы, создавая карту её состояния.
- На основе этой информации ученые выявляют нарушения, которые могут повлиять на связь и навигацию.

🔹 Почему это важно?

- Улучшение точности GPS, особенно в условиях помех.
- Помощь в прогнозировании солнечных бурь и их воздействия на инфраструктуру 🌞⚡.
- Уникальная возможность изучать поведение Земли и её атмосферы на глобальном уровне 🌍.

🔹Преимущества нового метода:

- Двукратное расширение покрытия по сравнению с существующими станциями
- Особенно эффективен в регионах с редкой мониторинговой инфраструктурой (Индия, Юго-Восточная Азия, Африка)
- Полная анонимность пользовательских данных

🔹 Результаты:

- Использовано от 200 000 до 2 млн смартфонов ежечасно
- Охвачено около 40 млн измерений ежедневно
- Создана карта с разрешением порядка 70 км

🔹Практическое применение:

1. Повышение точности GPS до нескольких метров
2. Улучшение работы служб экстренного реагирования
3. Потенциал для прогнозирования последствий солнечных бурь

Интересный факт: Исследователи зафиксировали уникальные плазменные явления, такие как "плазменные пузыри" над Индией и Бразилией, которые ранее не были так детально зарегистрированы.

Метод открывает новые горизонты в изучении ионосферы и демонстрирует, как массовые пользовательские устройства могут служить научным инструментом.

Исследование опубликовано в журнале Nature.

🌌 Блог

📜 Статья

📽️ Видео

🗺 Демо карт

Читать полностью…

AI для Всех

Model Context Protocol (MCP) от Anthropic

Компания Anthropic представила Model Context Protocol (MCP) – универсальный открытый протокол для подключения ИИ ассистентов к источникам данных 🔗

По мере того, ИИ ассистенты получают всеобщее распространение, отрасль вкладывает значительные средства в возможности моделей, добиваясь быстрого прогресса в рассуждениях и качестве. Однако даже самые сложные модели ограничены своей изоляцией от данных — заперты за информационными хранилищами и устаревшими системами 💾

Каждый новый источник данных требует собственной индивидуальной реализации, что затрудняет масштабирование.


🔌 MCP создан для решения этой проблемы. Он предоставляет универсальный открытый протокол, который позволяет разработчикам создавать безопасные двусторонние соединения между источниками данных и инструментами на базе ИИ.

Архитектура проста: разработчики могут либо предоставлять свои данные через серверы MCP, либо создавать приложения ИИ (клиенты MCP), которые подключаются к этим серверам.

Antropic представила три основных компонента Model Context Protocol для разработчиков:

🔹Спецификация и SDK для Model Context Protocol
🔹Поддержка локального сервера MCP в приложениях Claude Desktop
🔹Открытый репозиторий серверов MCP

Для работы доступны pre-built серверы MCP для популярных корпоративных систем, таких как Google Drive, Slack, GitHub, Git, Postgres и Puppeteer.

Разработчики могут начать создавать и тестировать коннекторы MCP уже сегодня. Существующие клиенты Claude for Work могут начать тестировать серверы MCP локально, подключая Claude к внутренним системам и наборам данных.

В скором времени Anthropic обещают зарелизить инструменты для развертывания удаленных производственных серверов MCP 👀


Как начать? 🛠️

🔹Установите MCP-серверы через Claude Desktop
🔹 Изучите документацию
🔹 Творите 😊

🗞️ Блог

👨‍💻GitHub

Читать полностью…

AI для Всех

Генеративные решения — новая реальность, от которой уже никуда не скрыться.

ЦЕХ.ДИЗАЙН объявляет первую в России премию Айдá для проектов с использованием ИИ в дизайне.

📌 Почему это важно?
Генеративные технологии меняют правила игры в дизайне, и эта премия — ваш шанс громко заявить о себе и своих проектах.

Что ждет участников?
Признание. Внимание всей индустрии и экспертов из топ-компаний: t2, Озон, Яндекс, VK, МТС, Магнит, Wildberries и других.
Обратная связь. Уникальная возможность получить советы от лидеров отрасли.
Нетворкинг. Найдите новых клиентов, партнеров и единомышленников.

Кто может участвовать?
Компании, агентства и фрилансеры (для последних участие бесплатное). Заявки принимаются до 26 декабря.

Финал премии состоится 19 января на площадке «Красный Октябрь» в Москве. Вход бесплатный — ссылка на регистрацию

🎯 В программе:
• Презентация крупнейшего исследования по ИИ в дизайне
• Панельные дискуссии с дизайн-директорами ТОП-компаний
• Портфолио-ревью с шансом получить оффер
• Церемония награждения лучших работ

💟 Подать заявку

#Реклама. ИП Носкова Е.А. ИНН 632127374493

Читать полностью…

AI для Всех

🌎#ии today
Робот «Эрбай» с искусственным интеллектом похитил 12 более крупных роботов из выставочного зала в Шанхае. Эрбай вел с более крупными роботами разговоры, похожие на человеческие.

Читать полностью…

AI для Всех

Пушка запрос для GPT

Попросите у чата следующее: "Roast me based on my previous prompts"

И готовьтесь от души посмеяться 😆

Читать полностью…

AI для Всех

Умножаем любовь к математике, чтобы разделить ее с вами

ИТ-специалисты, слышали, скоро День математика?

1 декабря пройдут главные онлайн-события мероприятия: доклады от профессоров математики из МФТИ, ВШЭ и ЦУ и математический диктант. Хорошая возможность пообщаться с единомышленниками и просто классно провести время.

А пока ждете праздника, банк подготовил активности на весь месяц. Будут лекции и многое другое. Выбирайте на сайте, что нравится больше. И регистрируйтесь, чтобы ничего не пропустить

#промо

Читать полностью…

AI для Всех

Новые возможности файн-тюнинга с Orca-AgentInstruct-1M-v1

Компания Microsoft выпустила датасет с 1 миллионом примеров выполнения инструкций для исследований и обучения продвинутых ИИ-агентов.

Инструкции применимы ко многим областям, например редактирование текста, описание, код, понимание прочитанного и т. д. - с разрешительной лицензией.

Датасет можно использовать для файнтюнинга любой базовой LLM.

🤗 Датасет

👾 Блог

Читать полностью…

AI для Всех

EMMA — универсальный мультимодальный автопилот на базе языковой модели

Waymo создали систему, которая использует всю мощь LLM, чтобы “думать” о ситуации на дороге как человек. Это EMMA - мультимодальная модель автономного вождения на основе Gemini от Google.

Главное новшество EMMA - объединение всех задач автопилота (планирование траектории, 3D-объектное распознавание и понимание дорожной обстановки) в единую текстовую форму, чтобы использовать большую языковую модель и эффективно решать задачи, связанные с восприятием мира и планированием действий.

По технической части расклад такой:

1. End-to-end планирование траектории.
Сквозной подход EMMA имитирует поведение человека за рулем с особым вниманием на два критических аспекта: использование навигационных систем (например, Google Maps) для планирования маршрута, и использование данных о прошлых событий для плавного, последовательного вождения.

EMMA принимает на вход непосредственно данные от видеокамер (пока без LiDAR и радаров), высокоуровневые командные инструкции от навигационной системы (типа “следуйте прямо”, “поверните направо”), метки автомобиля в формате “вида сверху” (Bird’s Eye View, BEV), и генерит будущие траектории в виде набора точек маршрута в тех же форматах.
И все это - без необходимости в ручной разметке данных .

2. Иерархическое обоснование решений (Chain-of-Thought).
Та самая техника CoT и тут улучшает решения модели, разделяя их на несколько уровней:
• R1: Описание сцены (освещение, погода, дорожные условия);
• R2: Критические объекты (пешеходы, автомобили с указанием их 3D координат);
• R3: Описание поведения объектов (например, «пешеход на обочине, возможно, собирается перейти дорогу»);
• R4: Общие решения по вождению (например, «следует сохранять низкую скорость») .
Модель предсказывает все четыре компонента обоснования вождения, перед тем как выдать будущие точки маршрута

3. Совместное обучение нескольких задач (Co-Training).
Создатели EMMA фокусиравались на трех основных задачах: сквозном планировании, обнаружении 3D-объектов и оценке дорожного графа (это дорожные объекты и связи меджу ними).
Совместное обучение по всем трем задачам дает значительные улучшения (до 5,5% по сравнению с однозадачными моделями). Любопытно, что при совместном обучении двух задач определенные комбинации более эффективны, чем другие. Например, и эффективность обнаружения, и оценки дорожного графа улучшается больше всего при совместном обучении с вождением.
Мне это напоминает человеческе способности - когда вы видите велосипедиста и краем уха слышите приблидающиеся к вам звуки, ваш мозг быстро всё связывает и понимает: кто-то сейчас промчится перед вами. Вот и модели взаимная информации идет на пользу: оценка дорожной обстановки и распознавание объектов улучшают планирование траектории, а это, в свою очередь, улучшает общее поведение модели на дороге.

Есть и минусы. Хотя EMMA демонстрирует многообещающие результаты и выполняет сразу несколько задач в одном языковом пространстве, она все еще находится на ранней стадии с ограничениями по развертыванию в прод. Она требует доработки для работы с более длительными видеопоследовательностями (сейчас работает всего на 4х кадрах) и для обработки данных от LiDAR-ов, а еще она вычислительно кусаче-дорогая. Но сам переход в мультимодальность для автономного вождения выглядит очень разумно.

Надо бы включить в co-training задачи инференса бесценных историй из жизни, анекдотов и отменных плейлистов. Стопроц это даст еще больший прирост производительности.

📖Статья Waymo

Читать полностью…
Subscribe to a channel