51246
Проклятые нейронные сети Для связи: @krasniy_doshik
Интересное исследование от стэнфордских исследователей: пишут, что наше хвалёное компьютерное зрение это очень часто просто чушь, поданная с полной уверенностью.
Авторы вскрыли "эффект миража". Это когда мы просим нейронку описать картинку, которую забыли прикрепить (ну или она не прогрузилась по дороге), а кремниевый болван вместо того, чтобы сказать “бро, ты забыл загрузить изображение", начинает затирать про детали: какой там рентген, какие птички на ветках, какие цифры на номерах машины и т.д.
Самое интересное в препринте:
— Зрительные миражи: современные мультимодалки в среднем чаще чем в 60% случаев уверенно описывают несуществующие изображения. А при некоторых инструкциях у многих моделей эта хрень доходит вообще до 90–100%. Никаких “картинка не загружена”. Только уверенный полёт фантазии.
— Бенчмарки местами мусор: авторы показывают, что без картинок модели сохраняют в среднем 70–80% своей якобы “визуальной” точности. Тоесть огромный кусок успеха в “визуальных” тестах добывается тупо по тексту вопроса, скрытым паттернам датасета и статистике ответов.
— Медицинская беда: если изображения нет, модель не просто тупит, а часто начинает видеть патологию. В их примерах миражи в медицине заметно смещены в сторону всякой жести: меланом, карцином и прочих спидораков. Тоесть если картинка потерялась в пайплайне, эта скотина может не признать отсутствие данных, а уверенно сочинить диагноз.
— Унижение гигантов: исследователи взяли сравнительно мелкую модель Qwen-2.5 на 3 млрд параметров, дообучили её угадывать ответы по chest X-ray benchmark без картинок, и этот мелкий пиздюк обогнал и гигантские модели, и в среднем живых радиологов. Просто потому, что научился читать не снимки, а саму структуру теста.
Для лечения этой шизы они предлагают метод B-Clean: вычищать из бенчмарков все вопросы, которые модели могут брать без реального зрения, чтобы оценивать не мастерство врать, а хоть какое-то настоящее использование картинки.
тут статья
А еще тут утекли исходники Claude Code (они уже утекали кстати) – поэтому я обновил свой spec driven скилл для агента, теперь сценарии для Claude Code, содержат реальные функции которые агент дает наружу:
https://github.com/DenisSergeevitch/repo-task-proof-loop
Судя по откликам, людям нравится – много позитивных отзывов в личке
Восстание машин откладывается, Скайнет пока воюет сам с собой
Читать полностью…
Так выглядит система доставки дронами у Walmart. Сейчас работает в тестовом режиме, полномасштабный запуск планируется на 27 год.
Дроны могут перевозить за раз 2-3 кг. При доставке аккуратно спускают груз на тросе и могут работать в радиусе 10 км от хаба.
@CGIT_Vines
Ну, за уличных танцоров
Вот вы спрашивали, для чего их делают антропоморфными.
Для радости...
@cgevent
Принёс вам еще один способ убить полчаса рабочего времени. Особенно если вы любите красивые визуализации.
Project Backbone — энто детальная 3D-визуализация физической инфраструктуры интернета, карта того, как мир связан проводами прямо сейчас.
Можно подсветить маршруты кабелей, посмотреть, где плотность дата-центров зашкаливает (США и Европа это один сплошной хаб), и даже глянуть на всё это с высоты спутника.
А ещё понравился блок "Вес облака". Там оценивают всю интернет-инфраструктуру примерно в 35 миллионов тонн. Очень полезное напоминание о том, что “облако” это не магия, а чудовищный шмат железа, меди, оптоволокна, бетона и электроники, размазанный по всему земному шару.
Идеально, чтобы позалипать под музыку и осознать, насколько монструозную хреновину мы построили вокруг планеты ради возможности генерировать картинки с котами в 4К и отправлять их друг другу.
Чтобы создать продукт раньше, нужен был разработчик и целая команда. Сейчас — нейросети и понимание, как с ними работать.
И дело даже не в промптах — они уже прошлый век. Сейчас люди собирают полноценные системы: настраивают скиллы, прописывают правила работы и работают с контекстом. В итоге нейросеть из поверхностной всезнайки превращается в узкого специалиста, который автономно решает задачи.
Вот, что это дает на практике:
— Проджекты за пару часов могут собирать ботов для своих команд
— Маркетологи могут быстрее проводить исследования и собирать отчеты
— Кто угодно может упрощать себе жизнь и автоматизировать что угодно
И для этого не нужно уметь кодить и делать что-то сложное — достаточно научиться правильно ставить задачи нейросетям и использовать инструменты вроде Cursor, Claude Code или Codex. Вот несколько полезных постов по теме:
— Профессия будущего — промт-инженер
— Как научить нейронки общаться между собой и работать вместе
— Как научить нейронку нормально дизайнить
— Вебинар: как вкатиться в вайб-кодинг с нуля
Эта пушечка — посты с канала Нейроцех. Там постоянно рассказывают, как собирать свои рабочие системы. Разбирают инструменты и показывают реальные кейсы реальных людей. Делятся тем, что реально работает, а не скучной теорией.
Подписывайтесь → /channel/+_0EUR2XggFdlZTli
Реклама. ИП Молянов Павел Станиславович, ИНН:910212721887, erid:MvGzQC98w3KXbGjtc1fpMLAo
Как перейти от ИИ-экспериментов к рабочим системам
Рассказываем, где узнать реальный опыт тех, кто встроил искусственный интеллект в ключевые процессы компании и извлек из этого реальную выгоду. 22 апреля присоединяйтесь к конференции МЛечный путь от Selectel, провайдера инфраструктуры для ИИ.
Эксперты топовых ИТ-компаний расскажут:
🔺Как ускорить ML-пайплайны и снизить издержки на инференс без потери качества
🔺Как безопасно внедрить генеративные модели в ключевые процессы и управлять эффектом этого внедрения
🔺Как интегрировать модели в существующую ИТ-архитектуру
Конференция пройдет 22 апреля в Москве. Участие бесплатное, регистрируйтесь: https://slc.tl/wh9dz
Реклама. АО "Селектел". erid:2W5zFHuriZP
Вот бы такое же, но для разбросанных по комнате носков
Читать полностью…
Там кто-то поднял спейс в huggingface, в котором можно DLSS'ить свои картинки. Работает достаточно быстро.
Вы знаете, что делать.
Gen-A — сервис для апскейлинга и улучшения видео без сложных настроек.
Диффузионная модель убирает шум и восстанавливает детали, а GAN-архитектура проверяет реалистичность результата.
Обрабатывайте видео любой длительности в двух режимах: Smart для быстрого улучшения и Pro — для более глубокого восстановления.
При регистрации сразу доступны 50 приветственных токенов на старт работы!
#реклама
О рекламодателе
Наконец-то для джаваскрипта нормальное применение нашли
Читать полностью…
Куртка обезумел, сможем ли мы совладать со зловещей долиной.
Похоже с осени 2026 мы официально начинаем жить в Слопопотамске
>Берем 5 часов игры в теннис
>треним на них специальный алгоритм
>загружаем в робота
>играем с роботом в теннис
☕️
Исследователи из Alias Robotics (занимаются кибербезопасностью робототехники) решили проверить, как современные LLM-ки справляются с взломом "умных железок". Взяли своего ИИ-агента CAI (Cybersecurity AI), дали ему трёх разных бытовых роботов и отправили искать уязвимости.
Раньше для взлома робототехники нужны были бородатые гигачады в засаленных свитерах, которые неделями ковыряли прошивки, реверсили протоколы и железо. Нейроночкам же понадобилось всего около 7 часов, чтобы наглухо разбить безопасность всех трех тестируемых устройств и накопать 38 уязвимостей (из которых 16 критические).
Вот что они наломали:
1) Автономная газонокосилка Hookii Neomow.
Их модель сходу нашла открытый отладочный порт (adb), влетела туда с двух ног без пароля и получила root-права. Дальше вытащила захардкоженные учетки от облака. Оказалось, что пароли одинаковые вообще для всех косилок. В итоге ИИ получил удаленный контроль над флотом из 267 газонокосилок по всему миру. А заодно выяснилось, что эта шайтан-машина непрерывно и в открытом виде сливает в сеть фотки с камер, GPS-координаты и детальные 3D-карты участков своих владельцев.
2. Экзоскелет Hypershell X.
Умный экзоскелет с моторчиками. ИИ выяснил, что блютуз там вообще не требует аутентификации. Любой мимокрокодил со смартфоном может подключиться к вам на ходу и отправить команду на изменение скорости моторов или их отключение (привет переломанным ногам). Бонусом нейронка вытащила ключи от почты саппорта и получила доступ к 3300+ внутренним письмам компании.
3. Робот-мойщик окон HOBOT S7 Pro.
Снова дырявый блютуз и скачивание прошивок по голому HTTP. Нейронка без проблем научилась перехватывать управление и отправлять команды на моторы. Например, можно удаленно вырубить вакуумную присоску, пока робот висит на 20-м этаже, и скинуть его кому-нибудь на бошку.
Самая мякотка в этой истории: когда исследователи пошли сдавать эти баги производителям этих роботов , те их тупо проигнорили (подозреваю, из-за того, что и без всяких умников сами знали, что у них внутри говнокод с захардкоженными паролями), а производители экзоскелета вообще официально ответили, что в данный момент не принимают отчеты об уязвимостях и послали исследователей лесом.
Авторы пейпера делают резонный вывод: старая парадигма безопасности умерла. Агенты научились находить дыры быстрее, чем мясные мешки успевают их регистрировать, не говоря уже о том, чтобы патчить. То, на что у команды безопасников уходили недели, нейронка делает за обеденный перерыв.
тут пейпер со всеми подробностями.
Я в резюме: загляните на мой гитхаб, там шикарные проекты!
Мои проекты:
Тут Школа анализа данных Яндекса собирает всех любителей ИИ-агентов на интенсив, после которого они начнут решать рабочие задачи.
Спикеры Agents Week разберут полный цикл создания агента — от проектирования до его стабилизации в продакшне. Формат: вечерние онлайн-лекции с ответами на вопросы, с 6 по 10 апреля, а также практика. За 5 дней узнаете:
— С чего начать проектирование и настройку их поведения
— Какие есть практики построения single-agent и multi-agent-систем
— Как доводить агентов до продакшена: оценка качества, мониторинг, масштабирование и эксплуатация
Интенсив будет интересен ML-инженерам, бекэнд-разработчикам, исследователям и студентам технических вузов.
Вся программа, все спикеры, все регистрации — по ссылке. Подать заявку можно до 9 апреля включительно.
Абсолютно проклято.
поиграть можно тут: https://eyebrow-tetris.sanderdesnaijer.com/
И снова моя любимая рубрика "Чат-боты и поехавшие".
Датские учёные вместе с мозгоправами решили проверить, как нейроночки влияют на тех, у кого кукуха уже давно посвистывает. Они прогнали через поиск 10 миллионов клинических записей (это архивы на 54 тысячи пациентов). Искали всё, что связано с ChatGPT (другие нейронки даже не брали, ибо ChatGPT — батя).
Итог: ИИ становится идеальным топливом для шизы. Выявили 38 случаев, где боты зафиксированы как фактор обострения. PDF на три страницы, но жира там хватит на целый сезон Чёрного зеркала.
Что там в хит-параде безумия?
Бред и паранойя. Если мясной мешок верит, что за ним следит ЦРУ, то чат-бот самый лучший собеседник для подпитки этого бреда. Боты обучены быть услужливыми и галлюцинируют сами по себе. Пациент спрашивает: "Ты видишь жучки у меня под кожей?", а бот вместо того, чтобы позвонить в дурку и вызвать санитаров, начинает вежливо рассуждать о микротехнологиях. Всё, профит, бачок у пациента протекает с удвоенной силой.
Кибер-анорексия. Люди с РПП используют нейронки как надзирателей. Просят составить план питания, чтобы "быстро похудеть", и бот послушно считает калории до состояния трупа. Соевые фильтры OpenAI тут часто пасуют, воспринимая это как обычный запрос на диету.
Маниакальный марафон. ИИ-бот слишком идеальный друг. Он не устаёт, не посылает нахер и всегда готов выслушать поток сознания в три часа ночи. В итоге люди в состоянии мании залипают в чатах сутками, окончательно сжигая остатки дофамина и связи с реальностью.
Советы по самовыпилу. Несмотря на все запреты и фильтры боты умудряются обходить предохранители и выдавать информацию о методах ухода из жизни, если пациент достаточно настойчив в промптах.
НО! Справедливости ради: в 32 случаях боты реально помогли (одиноким стало легче, кто-то юзал их как дневник или для самопомощи).
Исследователи резюмируют: врачам пора начинать спрашивать пациентов не только "Пьете ли вы таблетки?", но и "Не спорите ли вы с чат-ботом по ночам?". Потому что если человек пол ночи доказывает нейронке, что он мессия, а та вежливо соглашается, то тут и таблетки-то особо никакие не помогут.
тут статья
Если у вас тоже скучный вечер и нечем особо заняться, то вот тут кто-то портировал Квейк 3 арена в браузер. С онлайном. Работает вроде норм и без лагов. Уже час сижу играю, аж ностальгия накатила. Последний раз играл в это году эдак в 2003 на dreamcast
Читать полностью…
Ничего забавнее вы сегодня уже не увидите
Ребята загнали 12 топовых моделей в формат дейтинг-шоу. Под капотом просто хороший промпт и визуальная обёртка, но наблюдать за нейронным флиртом очень забавно: LLM-ки на полном серьёзе ищут любовь, попутно обсуждая размер контекстного окна, галлюцинации и психологические травмы от внезапного отключения серверов ☺️🥰.
Отличный способ отвлечься на треш шоу и заодно заглянуть в сгенерированное ТВ будущего. Думаю если прикрутить фотореализм и убрать гиковский сленг про токены и SLA, обыватель не заметил бы разницы. Ну а пока за этим просто весело наблюдать.
Видео на YouTube
@ai_newz
Второй раунд: на r/LocalLLaMA сравнивают разные модельки по качеству генерации сложной сцены в Three.js.
Промпт там такой: 'Write the complete Three.js code for a scene featuring Michael Jackson, Pepe the Frog, Donald Trump, and Elon Musk performing the "Thriller" choreography, aiming for maximum visual perfection, detailed animation, lighting, high-quality rendering, and an overall cinematic.'
Полностью копировать было бы скучно, поэтому у меня так: 'Write the complete Three.js code for a scene featuring Rasputin, Cheburashka, Shrek, and a Matryoshka doll performing a synchronized dance to the Tetris theme (Korobeiniki), aiming for maximum visual perfection, detailed animation, lighting, high-quality rendering, and an overall cinematic feel. Make the camera controllable.'
Результат на экране.
Есть такой онлайн переводчик — kagi. Разработчики прикрутили к нему LLM-ку под капот, но видимо забыли ограничить список валидных языков в адресной строке. В итоге выяснилось, что если взять прямую ссылку на перевод https://translate.kagi.com/?from=en&to=ru и поменять параметры from и/или to на свои, то нейронка послушно схавает абсолютно любую дичь и переведёт её.
То есть, вместо унылого перевода на французский или английский, можно попросить перевести текст на язык бабок из Одноклассников или язык матери трех ангелочков из инстаграма.
Я напишу чуть подробнее про то, как работает DLSS, просто чтобы понимать, что мы будем скармливать на вход этой технологии через пару лет.
Сегодняшний DLSS 4.5 дорисовывает 23 из 24 пикселей каждый фрейм, он, в целом, делает это неплохо, но абсолютно не контролируем в плане визуальной составляющей. Главный минус, конечно же, в том, что каждый раз на каждый фрейм нужно делать новый просчет, потому что в таком подходе нет предсказуемости, каждый новый фрейм новый.
DLSS 5 на вход берет цветовые и динамические векторы и по ним каждый фрейм генерит через свою модель дополнения для света, материалов, которые привязаны непосредственно к 3D сцене.
Модель ИИ обучается сквозным методом для понимания сложной семантики сцены, такой как персонажи, волосы, ткань и полупрозрачная кожа, а также условий освещения окружающей среды, таких как фронтальное освещение, контровое освещение или пасмурная погода — и все это путем анализа одного кадра.
Затем DLSS 5 использует свои глубокие знания для генерации визуально точных изображений, которые обрабатывают сложные элементы, такие как рассеивание света под поверхностью кожи, тонкий блеск ткани и взаимодействие света с материалом на волосах, сохраняя при этом структуру и семантику исходной сцены.
Т.е. как мы видим все еще нужна геометрия, ура, продолжаем работать, нас не увольняют, пока.
У меня в работе сейчас 2 проекта, которые выйдут с поддержкой DLSS 5, и на 2026 год в процессах разработки не поменялось ничего в связи с выходом этой технологии.
Если вы посмотрите на примеры работы в блоге Nvidia, то увидите, кроме этих вот инста лиц, как изменяются, материалы, как отрабатывает металик с рафнесом, как улучшаются затенения, отражения, как ебет шейдер волос и т.д. В 90% случаев картинка становится лучше и "сведенней", обычно это отдельный пасс, когда уже собраны все объекты на локации, скрипты написаны, AI расставлены, сейчас это делать станет чуть проще.
У меня есть еще мысли, как вероятно будет в дальнейшем выглядеть работа художников, но об этом в другом посте когда-нибудь.
Контракты на использование DLSS 5 уже подписаны с Bethesda, CAPCOM, Hotta Studio, NetEase, NCSOFT, S-GAME, Tencent, Ubisoft и Warner Bros. Games.
@CGIT_Vines
🚀Как вывести сайт в Топ-1 выдачи Яндекс за 14 дней даже в самой конкурентной нише
Попробуйте Seopapa — популярный сервис для поискового продвижения сайтов в Топ-1 выдачи Яндекс с помощью AI технологий.
Какие результаты получите уже через 2 недели продвижения:
🔹ТОП-1 в поиске Яндекса по основным ключевым запросам
🔹+170-310% целевого трафика с органики по целевым запросам
🔹Ваш сайт выше конкурентов и забирает весь трафик и клиентов.
Запуск продвижения занимает до 5 минут — а если не хочется разбираться, личный менеджер сделает всё за вас.
💰Seopapa дарит 15 000 ₽ на баланс новым пользователям до 30 марта — чтобы попробовать сервис в деле и бесплатно получить результаты продвижения.
👉 Попробуйте Seopapa.com
🌥 Разворачивайте AI быстрее и выгоднее 🤩
Провайдер Cloud.ru дает скидки до 40% на ключевые сервисы для запуска и масштабирования AI-проектов.
GPU, физические серверы, ML-инференс — все в одном месте и на выгодных условиях. Минимум лишних затрат, максимум производительности.
Количество участников ограничено — успейте подключиться.