Геймерам посвещается: Dungeons & Dragons (D&D), знаменитая ролевая игра, вступает в новую эру с помощью искусственного интеллекта. Ученые из Университета Пенсильвании и Университета Мэриленда разработали систему под названием CALYPSO, которая использует крупные языковые модели (LLM) для улучшения игрового опыта.
CALYPSO предлагает три интерфейса на основе ChatGPT, интегрированных с популярным чат-сервисом Discord, для поддержки мастера подземелий (Dungeon Master - человек, который управляет игрой) в различных аспектах игры. Это включает в себя генерацию текста для описания встреч, мозговые штурмы для уточнения сценариев и открытый чат, где игроки могут взаимодействовать с ИИ, действующим как фэнтезийное существо.
Проект показал, что ИИ может быть полезным инструментом для DM, генерируя текст высокой и низкой достоверности, который может быть дальше развит человеком. Однако были и некоторые проблемы, такие как "галлюцинации" модели, когда она выдумывала факты, которых нет в исходных книгах.
В целом, CALYPSO представляет собой пример ИИ инструментов, которые могут обогатить опыт настольного гейминга, сохраняя при этом творческий контроль в руках человека. Это открывает новые горизонты для D&D и других ролевых игр, где ИИ может стать вдохновляющим партнером, а не заменой человеческого взаимодействия.
Не знаю как вы, а я заметил выход игры Baldur's Gate 3 по вселенной Dungeons & Dragons, а тут ещё такая новость на эту тему 🧙♂️✨
https://www.theregister.com/2023/08/19/chatgpt_dnd_dm/
препринт https://arxiv.org/abs/2308.07540
Компания Google представила новую функцию для Chrome. Она называется Smart Google Extractor (SGE) и позволяет пользователям получать краткие и точные извлечения из любого текста на веб-странице.
SGE использует искусственный интеллект для анализа текста. Он определяет ключевые идеи, факты и аргументы, а затем генерирует сжатое изложение основного содержания. Пользователи могут выбрать любой фрагмент текста или весь текст на странице и нажать кнопку SGE в панели инструментов Chrome.
SGE помогает пользователям экономить время и повышать продуктивность. Он упрощает поиск и понимание информации в Интернете, особенно для длинных и сложных текстов. Он также может помочь студентам, ученым и журналистам в написании рефератов, обзоров и статей.
Пока что доступно для пользователей США
https://blog.google/products/search/google-search-generative-ai-learning-features/
Это Snapchat-линза (AR-фильтр) от Sander Veenhow.
Как говорит автор — он создал риалтайм генератор образов Бэнкси, что действительно похоже на работы художника, но мы видим в первую очередь здесь invisible-костюм.
Для создания эффекта использовалась Lens Studio с фильтрами машинного обучения SnapML.
Протестировать эффект можно по ссылке.
Llama2.rs
Вы хотели запустить LLaMa2 70B на своем стареньком лэптопе? Ну, вот теперь можете.
Чел переписал Карпатовскую llama2.c на Rust, оптимизировал загрузку весов в память (memmap), реализовал Grouped Query Attention и добавил квантизацию.
70B LLaMa2, которая в обычной жизни влазит только в A100, теперь бегает на лаптопе! Кхм, ну как, бегает... скорее ходит. 5 токенов в минуту.
GitHub
@ai_newz
Исследователи из MIT разработали "жидкие нейронные сети" (LNN), которые предлагают компактное и эффективное решение для проблем искусственного интеллекта, особенно в областях робототехники и автономных автомобилей. LNN отличаются от традиционных моделей глубокого обучения, используя математическую формулировку, которая стабилизирует нейроны во время обучения и позволяет им адаптироваться к новым ситуациям после обучения. Они значительно компактнее: для выполнения задачи, например, удержания автомобиля в своей полосе, LNN требуется всего 19 нейронов, в отличие от 100 000 у традиционной нейронной сети. LNN особенно подходят для работы с непрерывными потоками данных, что делает их идеальными для робототехники и автономных автомобилей.
https://venturebeat.com/ai/how-mits-liquid-neural-networks-can-solve-ai-problems-from-robotics-to-self-driving-cars/
YouTube тестирует генеративные резюме видео ✨
YouTube тестирует использование искусственного интеллекта для автоматического создания резюме видео. Эти резюме предназначены для краткого обзора содержания видео и будут доступны для ограниченного числа пользователей. Эксперимент является частью более широких исследований Google в области генеративного AI. Если AI-резюме получат более широкое распространение, это может повлиять на то, как создатели контента структурируют свои видео на YouTube.
https://www.theverge.com/2023/8/1/23815321/youtube-ai-video-summaries
На реддите опять делают огромный пиксельный рисунок, сейчас там 222к человек, можете тоже поучаствовать тут👌👨🎨
Читать полностью…Создавайте будущее, чтобы не офигеть от него 🦄
Генеративный AI сейчас самая хайповая сфера во всем мире. Те, кто уже использовал ChatGPT, Midjourney, Stable Diffusion - вы точно понимаете, как эти технологии меняют вашу жизнь и ведение бизнеса 🔥
Если вы хотите идти в ногу с этим новым миром, не отставать и начать применять генеративные нейросети в бизнесе или делать свой проект - вам обязательно нужно прийти на конференцию по AI от сообщества Hegai 27-го июля
В чем для вас польза?
• Вы сможете познакомиться с наиболее крутыми и практическими способами применения нейросетей
• Познакомитесь со стартапами, которые уже делают проекты в этой области и венчурными фондами
⚡️ Станьте частью этого тренда — присоединяйтесь к конференции 27 июля! И не забудьте промокод FUTURIS ⚡️
🤖Гуманоидный робот NASA, Валькирия, начинает новую миссию в Австралии на объектах энергетической компании Woodside Energy. Робот будет использоваться для удаленного ухода за беспилотными и морскими объектами, что повысит безопасность персонала и окружающей среды. Валькирия, ростом 1,8 метра и весом 125 кг, способна выполнять важные задачи в опасных условиях. Полученные в ходе этой миссии знания помогут ускорить развитие робототехники и могут быть применены в будущих миссиях NASA.
https://www.euronews.com/next/2023/07/13/nasas-first-humanoid-robot-valkyrie-is-being-tested-at-offshore-energy-facilities-in-austr
🥩🧫Ученые из Тафтсского университета разработали бессмертные стволовые клетки мышц крупного рогатого скота, которые обладают быстрым темпом роста и способностью делиться сотни раз, возможно, даже бесконечно. Это открытие увеличивает потенциал для крупномасштабного производства мяса.
Эти клетки могут быть использованы для создания новых продуктов без необходимости повторного получения клеток из биопсии фермерских животных. Бессмертные клетки также снижают порог входа для других исследователей, чтобы изучить клеточное сельское хозяйство и найти способы снижения затрат и преодоления проблем масштабирования производства.
Ключевыми шагами в создании этих клеток были модификация клеток для постоянного восстановления их теломер (концов хромосом), что помогает сохранить их "молодыми", и стимулирование клеток к постоянному производству белка, который ускоряет деление клеток.
Новые стволовые клетки способны дифференцироваться в зрелые мышечные клетки, хотя и не полностью идентичные животным мышечным клеткам. Это открывает возможность для производства мяса, которое может воспроизвести вкус и текстуру натурального мяса.
https://scitechdaily.com/potentially-unlimited-supply-scientists-grow-meat-from-immortal-stem-cells/
Anthropic анонсировали Claude 2, новую модель в авангарде интеллектуальных ассистентов. Прямых сравнений с GPT-4 нет, но относительно старой модели улучшили всё, особенно математику, программирование и способность рассуждать.
Сама компания предлагает думать о Claude 2 как "о дружелюбном, полном энтузиазма коллеге или личном помощнике, которого можно проинструктировать на естественном языке, чтобы помочь вам со многими задачами".
Потыкать бету можно тут: https://claude.ai/
Почитать карточку модели (больше про метрики и сравнение Alignment, нежели технические детали обучения): нетяжелый pdf
Интересная фича: Claude 2 has been trained to generate coherent documents of up to 4000 tokens, corresponding to roughly 3000 words.
В прикрепленном видео - демонстрация юзкейсов (но "вау"-эффекта уже не производит...)
Source
⚡️OpenAI внедрила плагин Code Interpreter для всех подписчиков ChatGPT Plus. Этот инструмент позволяет AI выполнять код, анализировать данные, создавать диаграммы и редактировать файлы. Пользователи могут генерировать визуализации данных, анализировать плейлисты, создавать интерактивные HTML-файлы и многое другое. Ранние отзывы положительные, и многие считают, что теперь каждый может стать аналитиком данных. Безопасность остается приоритетом, и OpenAI продолжает совершенствовать протоколы безопасности.
https://venturebeat.com/ai/code-interpreter-comes-to-all-chatgpt-plus-users-anyone-can-be-a-data-analyst-now/
Inflection.AI, компания, разработавшая своего эмпатичного ИИ-ассистента pi.ai, подняла раунд инвестиций в $1.3B (на прикрепленной картинке — моя реакция. Но тут хотя бы у компании уже есть какой то MVP, а не только вебсайт).
В комментариях к прошлым постам читатели канала уже обсуждали pi.ai, и хвалили живость диалога. Поэтому если надоело общаться с ChatGPT — попробуйте (есть бот в whatsapp, приложение для iOS, сайт в конце концов). Я пока этого не сделал, позже поделюсь ощущениями. Если верить блогу разработчиков — это их персональная проприетарная модель, а не API к уже существующим LLM с промптом. В комментариях делитесь своим опытом — кажется ли этот бот более "человечным" и "понимающим"? 💬
Интересно, что в раунде инвестиций участвовали Microsoft (решили яйца разложить по нескольким корзинам — не all in'ить же на OpenAI!), Reid Hoffman, Bill Gates, Eric Schmidt (бывший СЕО Google, 2001-2011) и... NVIDIA. Да, компания-разработчик железа, спонсирующая AI-революцию, теперь вкладывается и из своего кармана.
Но что примечательно — так это обещание Inflection.AI построить новый кластер для обучения моделей, в котором будет 22'000 новейших видеокарточек H100. Они эффективнее предыдущего поколения A100 в 3-4 раза (по разным бенчмаркам обучения LLM). По слухам, ChatGPT обучалась на 20-25 тысячах A100. Так что это достаточно весомо. На данный момент такой суперкомпьютер был бы топ-2 в мировом рейтинге, причём, вплотную приближаясь к первому месту. Однако конкуренты не спят — ходит много слухов, что OpenAI, Oracle, Microsoft тоже закупают GPU гигантскими партиями.
А знаете, у кого эти карточки будут покупаться по цене $25'000 за штуку? У NVIDIA... $25'000 x 22'000 = $550M, половина раунда инвестиций, просто вернется в карман кожаной куртки Jensen Huang. Умно, умно, и долю в компании прикупил, и товар реализовал, и бонус квартальный будет начислен.
Google DeepMind, под руководством CEO Демиса Хассабиса, работает над созданием новой AI системы под названием Gemini. Эта система будет использовать техники, примененные в AlphaGo, искусственном интеллекте, который в 2016 году победил чемпиона в настольной игре Go. Целью Gemini является превзойти возможности текущего AI, стоящего за ChatGPT от OpenAI.
Gemini, который все еще находится в стадии разработки, будет большой языковой моделью, работающей с текстом, подобной GPT-4, которая питает ChatGPT. Однако команда Хассабиса планирует объединить эту технологию с техниками, использованными в AlphaGo, чтобы предоставить системе новые возможности, такие как планирование и решение проблем. Gemini представят через несколько месяцев.
https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/
Судя по слухам Meta готовятся выпустить открытую языковую модель, которая пишет код. Модель называется Code Llama и ее ждут уже на следующей неделе. Весь этот комплекс конечно не будет конкурировать с готовыми решениями, вроде Github CoPilot - по сути это просто один из кирпичиков для конструктора “сделай свою систему написания кода”.
Очень интересно, что политику выпуска именно открытых языковых моделей ведет именно Meta - как-то это слабо укладывается в ёё публичный образ компании. С другой стороны, есть компания OpenAI, которая выпускает крайне закрытое решение. А есть Meta, которая выпускает опенсорс решение. Что-то в этом парадоксе есть https://www.theinformation.com/articles/metas-next-ai-attack-on-openai-free-code-generating-software
✨Стартап Stability AI, известный своей моделью Stable Diffusion, запустил новую LLM под названием StableCode. Эта модель предназначена для генерации кода и будет доступна на трех уровнях: базовая модель, модель инструкций и модель с длинным окном контекста, поддерживающая до 16 000 токенов. StableCode использует данные из открытого проекта BigCode и будет поддерживать разработку на Python, Go, Java, JavaScript, C, markdown и C++
https://venturebeat.com/programming-development/stability-ai-launches-stablecode-an-llm-for-code-generation/
Попробовать можно на hugging face
О, OpenAI запустила своего собственного. робота: краулера для обхода сайтов с целью сбора данных, которые смогут в дальнейшем использоваться для обучения моделей. Но теперь, раз имя и параметры бота известны, доступ можно запретить в robots.txt или другими методами, известными вебмастерам. Очень правильное решение: тем, кто очень опасается, что контент их сайта будет использован для обучения ИИ, предоставлен стандартный инструмент для закрытия доступа. С другой стороны, если человеку дан инструмент для блокировки доступа, а он им не воспользовался, то сам себе злобный буратино и нечего потом жаловаться и в суд ходить:)
https://www.seroundtable.com/openais-chatgpt-web-crawler-gptbot-35835.html
GitHub Copilot представил новую функцию, позволяющую разработчикам видеть, когда их код совпадает с кодом в общедоступном репозитории. Это помогает избегать дублирования кода и дает разработчикам возможность использовать существующие библиотеки кода. Функция находится в приватной бета-версии и в будущем появится в Copilot Chat.
https://techcrunch.com/2023/08/03/github-copilot-now-shows-developers-when-its-code-suggestions-match-code-in-a-public-repository/
OpenAI подала заявку на торговую марку "GPT-5"🌚, возможно предвещая приход преемника своей текущей LLM GPT-4. Однако, это не гарантирует скорый запуск GPT-5. Сейчас компания, скорее всего, сосредоточится на улучшении GPT-4, несмотря на ее недостатки, такие как "галлюцинации" фактов и высокие затраты на поддержание работы.
https://futurism.com/the-byte/openai-trademark-gpt-5
В GPT-4 добавили фичу, слухи про которую ходили давно — предзаписанные инструкции/роли, которые модель должна выполнять и отыгрывать. И можно задать желаемый формат ответов (например, всегда отвечать стихами на французском, почему нет?)
Нужно включить в настройках
Settings → Beta features → opt into Custom instructions
Затем перезагрузить страницу, в и меню слева (где настройки) у вас появится отдельная кнопка.
Источник
Стало известно, что Google разрабатывает AI-инструмент "Genesis" для автоматического создания новостных статей. Инструмент был продемонстрирован руководителям крупных СМИ. Google утверждает, что целью является помощь журналистам, а не их замена. Однако, эффективность и ответственность инструмента пока остаются под вопросом.
А ещё у ChatGPT повысили лимит использования GPT-4 до 100 сообщений в 3 часа вместо 25. Мелочь, но приятно👌
⚡️Apple создаёт свой AppleGPT
Apple активно занимается разработкой новых инструментов искусственного интеллекта, которые могут конкурировать с такими продуктами как ChatGPT от OpenAI и Bard от Google. Используя собственный фреймворк под названием "Ajax", Apple разработала сервис чат-бота, известный как "Apple GPT".
В последние месяцы Apple значительно усилила усилия в области AI, привлекая к работе несколько команд. Компания понимает возможные проблемы с конфиденциальностью и работает над их решением.
На фоне этой новости акции Apple выросли на 2,3%, достигнув рекордного уровня. Однако компания все еще определяет, как лучше представить эти технологии потребителям.
Apple также планирует интегрировать технологию больших языковых моделей (LLM) в Siri, что позволит голосовому помощнику выполнять больше задач от имени пользователей. Тем не менее, точные планы и сроки еще не установлены.
https://www.bloomberg.com/news/articles/2023-07-19/apple-preps-ajax-generative-ai-apple-gpt-to-rival-openai-and-google
🦙 Llama-2
Это очень важно: вышла Llama-v2 у которой открытый исходный код и лицензия, разрешающая коммерческое использование!
Это изменит ландшафт рынка LLM.
Llama-v2 доступна на Microsoft Azure и будет доступна на AWS, Hugging Face и других провайдерах.
Доступны предварительно обученные и зафайнтюненые модели с параметрами 7B, 13B и 70B.
Сайт Llama-2
Документ Llama-2
Стартап Stability AI запустил сервис Stable Doodle, который превращает эскизы в художественные изображения. Используя AI, сервис анализирует контуры эскиза и создает визуально приятное изображение. Stable Doodle доступен через платформу ClipDrop и ориентирован на любого пользователя, от новичка до профессионала. Компания видит в этом инструменте помощь для дизайнеров и иллюстраторов, позволяющую экономить время и повышать эффективность работы.
https://techcrunch.com/2023/07/13/stability-ai-releases-stable-doodle-a-sketch-to-image-tool/?guccounter=1
Попробовать тут👨🎨
✨Google обновил своего чат-бота Bard AI, добавив функции голосового ответа и реакции на запросы с изображениями. Теперь Bard доступен во многих странах, включая Европейский Союз, и поддерживает более 40 языков, включая русский. Пользователи могут слушать ответы Bard, а также использовать изображения в своих запросах. Кроме того, Google добавил возможность закреплять и переименовывать беседы, делиться ответами и изменять тон ответов Bard.
https://www.theverge.com/2023/7/13/23793014/google-bard-ai-chatbot-talk-spoken-responses-respond-visual-prompts-eu
Ещё недавно писал про то, что Meta представили новый подход, позволяющий моделькам генерировать более 1 миллиона токенов, но тут исследователи из Microsoft Research представили LONGNET - вариант трансформера, способный масштабировать длину последовательности до более чем 1 миллиарда токенов 🤯 без потери в более коротких последовательностях. Это достигается за счет использования нового элемента, называемого расширенным вниманием, который позволяет уменьшить сложность обработки до линейной. Это преодолевает ограничения процессора и памяти, позволяя эффективно масштабировать длину последовательности с практически постоянным временем выполнения.
Похоже в ближайшие пару лет, ограничения длины токенов могут просто исчезнуть🤓
https://www.marktechpost.com/2023/07/08/microsoft-research-introduces-longnet-a-transformer-variant-that-can-scale-sequence-length-to-more-than-1-billion-tokens-with-no-loss-in-shorter-sequences/
Microsoft разрабатывает новый тип компьютера, основанного на свете, под названием Analog Iterative Machine (AIM). Этот компьютер использует фотоны и электроны для обработки данных, в отличие от традиционных цифровых компьютеров, которые используют транзисторы для обработки двоичных данных. AIM способен обрабатывать данные быстрее и эффективнее, благодаря использованию всего спектра света, что позволяет ему решать сложные задачи оптимизации. Это нововведение может перевернуть так называемый закон Мура, связанный с ростом вычислительной мощности.
На данный момент AIM все еще является исследовательским проектом, но команда недавно собрала первое в мире опто-электронное оборудование для смешанных - непрерывных и двоичных - задач оптимизации. Хотя в настоящее время он работает в ограниченном масштабе, первые результаты обнадеживают и команда начала масштабировать свои усилия. Это включает в себя исследовательское сотрудничество с многонациональным банком Barclays, базирующимся в Великобритании, для решения задачи оптимизации, критической для финансовых рынков, на компьютере AIM. В июне 2023 года команда запустила онлайн-сервис, который предоставляет симулятор AIM, чтобы партнеры могли изучить возможности, создаваемые этим новым типом компьютера.
В итоге сервис отжима воды из публикаций много куда будет интегрирован, но пользоваться им можно уже сейчас (хотя наружу его открыли только что, так что это публичная бета, а не готовый отлаженный продукт). Интерфейс и функционал предельно просты: даешь ссылку на статью, получаешь выжимку (в идеале потом ее качество оцениваешь, чтобы дообучить алгоритм).
Если сервис подвис (на то и бета, с ним бывает) — просто перегрузить страницу:)
На мой взгляд, сильно полезнее многих генеративных штучек, когда приходится много текстов проглядывать.
https://300.ya.ru/
NASA разрабатывает систему на естественном языке, похожую на ChatGPT, для астронавтов. Эта система позволит астронавтам выполнять маневры и проводить эксперименты без необходимости изучения сложных руководств. Планируется, что система будет использоваться на Лунной станции "Gateway", поддерживающей миссию "Artemis", которая запланирована на ноябрь 2024 года💫
https://www.engadget.com/nasa-is-creating-a-chatgpt-like-assistant-for-astronauts-081903604.html
Кстати, ещё на днях NASA достигла важного этапа в восстановлении воды на Международной космической станции. Система контроля окружающей среды и жизнеобеспечения (ECLSS) смогла восстановить 98% воды, использованной экипажем. Это достигается за счет сбора сточных вод, мочи и захвата влаги, выделяемой в воздух из дыхания и пота экипажа и их переработки в питьевую воду.