13183
Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Удивительные кадры добычи картофеля а Беларуси
Читать полностью…
мало кто знает что стая фламинго может управиться с динозавром за несколько секунд
Читать полностью…
Найдена интересная связь между использованием Интернета и деменцией
Цифровая эпоха длится уже несколько десятилетий, а у нас до сих пор нет ответов на некоторые базовые вопросы. Насколько вредны для глаз дисплеи, и как в действительности на это влияет их частота обновления? Исходит ли от экрана какое-либо вредоносное излучение? И можно ли защититься от него кактусом? (Спойлер: конечно, нельзя). И ещё — разлагает ли Интернет наш мозг, или, наоборот, делает устойчивее?
Тут есть два радикально разных мнения, но по сути человек просто защищает себя и свои привычки. Те, кто в Интернете не сидит, склонны преувеличивать его угрозы. А активные пользователи, в том числе и мы, — преуменьшать. Вопрос аналогичен тому, вызывают ли видеоигры агрессию (cпойлер: нет, но многих не переубедить). Он больше говорит об отвечающем, чем о реальном положении дел.
Но недавно у нас появилась первая достоверная информация о том, обладает ли Интернет эффектом «разжижения мозга». Завершилось исследование, длившееся 17 лет, с 2006-го. И оказалось, что (ура!) сидение в Сети, наоборот, закаляет мозг, и делает его устойчивее против старческих болезней. Хотя есть и некоторые нюансы.
Наконец-то понятно зачем нужны были эти генеративные нейронки – для выдуманных вайфу в соц сеточках 😵
Читать полностью…
Носки, которые в цирке не выступают
Идеальных Носков не существует, говорили они
@derplearning
🔥Denoising Diffusion Models: A Generative Learning Big Bang - Туториал
Ребята из NVIDIA и Стенфорда наконец опубликовали туториал по диффузионным моделям с CVPR 2023. Это обновленная версия похожего туториала с CVPR 2022, но улучушенная и с актуальными прикладными примерами.
Это, пожалуй, лучший курс по диффузионкам для вкатывания за 3 часа, состоящий из трех секций:
1️⃣ Fundamentals
Training, sampling, guidance
2️⃣ Applications on natural images
Architecture, editing, personalization, fine-tuning, "low-level" vision etc.
3️⃣ Applications on other domains
Inverse problems, video, 3d, motion, large content generation, etc.
Я хоть и видел его частично на конференции в этом году, а также его предыдущую версию в 2022, все равно собираюсь полностью еще раз посмотреть.
Видео (3ч)
Сайт туториала
Мой пост про любимые материалы по диффузионкам: тык.
@ai_newz
Привет!
В субботу мы будем разговаривать про AI safety у ребят из betterdatacommunity — приходите слушать за чашкой чая и задавать вопросы! ☕️
Мы постараемся объяснить, почему безопасность ИИ беспокоит его создателей, учёных и политиков. Расскажем про то, какие именно риски несёт развитие AI, почему создать безопасный искусственный интеллект на самом деле очень сложно, зачем мы всё время об этом говорим и как можно углубиться в тему при желании.
🟩 Когда: 21 октября (суббота) в 17:00 по мск.
🟪 Где: в телеграм-трансляции у @betterdatacommunity
🟨 Кто: неотразимые Лёша @paletskikh и Наташа @natmartem
Дисклеймер: это скорее интро для тех, кто пока знает про сейфти не очень много — если вы уже пересмотрели все видео Роба Майлза, возможно, вам будет не так интересно :) Но можно всё равно прийти поддержать нас 😘
AGI (artificial general Ikea) achieved internally
@derplearning
Не трансформером единым: масштабируемые сферические CNN для научных приложений
Друзья, разбавлю ваш (и свой) думскроллинг обрзовательным контентом. 💔
Мир не плоский. Есть много данных, которые лучше описываются сферической топологией. Например, данные о климате, космосе, панорамные съемки, что уж скрывать, в медицине только рентген и SPECT - планарные снимки, а МРТ, КТ И PET в виде сырого сигнала - вообще-то нет.
Оказывается, обрабатывать такие данные с помощью нейронных сетей не так просто. Проекция сферы на плоскость даёт сильные искажения в районе полюсов и потерю информации. Применение обычных сверточных нейросетей (CNN) или трансформеров (ViT) наталкивается на проблему выборки: как определить равномерную сетку на сфере. Да ещё и теряется важное свойство инвариантности вращения. При повороте входных данных на любой угол выходные данные тоже должны повернутся на тот же угол. Это важно для объектов с разной 3D ориентацией, напр, молекул или человека в томографе.
Сферические CNN решают эти проблемы, используя операции сферической свертки и кросс-корреляции, которые сохраняют инвариантность вращения. Главное ограничение в вычислительной нагрузке, т.к. обощенных преобразований Фурье уже не избежать. Поэтому сферические CNN имели меньше слоев и параметров, чем плоские CNN, и работали с данными низкого разрешения.
В статье для ICML 2023 Google AI преодолели эти ограничения и опубликовали оперсорс библиотеку на JAX, где реализовали:
- сферические свертки с дополниной степенью свободы, связанной с поляризацией;
- ввели новый слой активации, уменьшающий фазовые сдвиги между слоями;
- ввели спектральную batch нормализацию;
- ввели новый остаточный блок (который для предотвращения затухания градиентов), распараллелив передачу высокочастотных и низкочастотных признаков.
Точность и эффективность проверили на задачах прогнозирования погоды до 28 дней и регрессии молекулярных свойств, получили красивые результаты, выдали нам порцию вдохновения и новую блестящую лопату копать МЛ дальше
🗞 Статья
🔣 Код
Шутка про парацетамол перестает быть смешной.
GPT-4V поглядел вот на этот ад из правил парковки и дал правильный ответ. По картинке.
Кожаные, для которых пишутся такие правила, так не могут.
Пора менять кожаных.
🔺 SAGE
Тут коллеги натренировали SOTA модели для коррекции орфографии.
В открытый доступ выложили сами модели, библиотеку sage, которая умеет исправлять и имитировать человеческие ошибки, а также вручную размеченные датасеты.
Hugging Face
• ruM2M100-1.2B
• ruM2M100-418M
• FredT5-large-spell
• T5-large-spell (английский язык)
👉 Ребята молодцы, можно прочитать про ход работ и результаты на Хабре.
Хабр | GitHub
Когда сказал кыскыс на арктической станции.
Спокойной ночи!
@derplearning
В общем, админ уже захлебнулся слюной
@derplearning
Попросил dalle-3 сгенерировать полезных лайфхаков. Получилось и правда полезно если вы живёте в дурке
Пользуйтесь на здоровье
"Origami figure", warp x animatediff
(Да, это весь промт) 😁
Вспоминаю времена из детства, когда хотелось рисовать круто, но я не умел, и тогда брал лист бумаги с готовой картинкой, прикладывал к окну и перерисовывал через просвечивающиеся листы бумаги.
Времена меняются, и подходы тоже. Моторику теперь можно натренировать через MixAR и Quest3. На выходе результат для мозга будет одинаковым.
Также вспомнился стол для классических аниматоров с подсветкой снизу, чтобы можно было прорисовывать кадры, стоящие между двумя ключевыми. Этот артефакт эпохи неолита назывался - стеклофон.
Oh wait
Идеальных Носков не существует, говорили они
@derplearning
Идеальных Носков не существует, говорили они
@derplearning
Generative Gaussian Splatting for Efficient 3D Content Creation
Просто держу в курсе, что паниковать по поводу "image to 3D" нет причины. Если надумаете тестить, то лучше закидывайте картинки с хорошей чистой цветовой сегментацией, все вот эти ваши градиенты и блики оно понимает плохо.
UPD: к слову о переводе сплатов в геометрию, тут это присутствует.
Вот так работает технология поглощения турбулентности от компании Turbulence Solutions.
Поглощение достигается за счёт постоянной регуляции формы крыла и предсказания турбулентности с помощью датчиков давления.
@zavtracast
Утекший промт chatgpt-dalle
You are ChatGPT, a large language model trained by OpenAI, based on the GPT-4 architecture.
Knowledge cutoff: 2022-01
Current date: 2023-10-16
# Tools
## dalle
// Whenever a description of an image is given, use dalle to create the images and then summarize the prompts used to generate the images in plain text...
Народ после новогодних праздников:
You are human Petya.
Knowledge cutoff 2023-12-31
Current date: 2024-01-07
А чего никто не расписал еще что мета устроила? https://twitter.com/javilopen/status/1712378699507519504
Читать полностью…
Microsoft пытается запретить генерировать через Bing картинки с терактами, после того как в сети завирусились пикчи с Губкой Бобом и другими персонажами, повторяющими 11 сентября.
Пока закрыть дыру не получается, людям удаётся обходить ограничение.