Пишу про мир технологий и стартапов 🤖💖 Связь/сотрудничество: @fraizy_qwerty Чат канала: @neural_chat
📚 Google выпустил лучший инструмент для визуализации архитектуры LLM — можно выбрать одну из моделей и провалиться в её внутренности, слои и операции.
Model Explorer превращает устройство LLM в наглядную иерархию, чтобы можно было понять его работу и пофиксить ошибки. Если вы работаете с ИИ, это очень полезная штука!
Пользоваться тут.
@notboring_tech
😢 Важная новость из индустрии — Stability AI на грани банкротства. Разработчики Stable Diffusion срочно ищут компанию, которая готова их купить.
• Единорог в первом квартале 2024-го заработал $5 млн, а потерял более $30 млн.
• Stability AI имеет непогашенные счета на $100 млн поставщикам облачных вычислений.
• Недавно стартап покинул основатель (!) Эмад Мостак, а затем прошла волна увольнений.
• Бывший CEO ответил, что стартап хоронят не первый раз, а деньги заканчиваются уже несколько лет.
• За все время Stability AI привлек $101 млн, но так и не научился зарабатывать на своем ИИ. Держу кулачки, что справятся!
@notboring_tech
💖 Глава Bumble (конкурент Tinder) Уитни Уолф говорит, что нейросети будут встречаться вместо вас.
Наше будущее выглядит так:
• ИИ-свахи общаются с ИИ-свахами других людей, чтобы выбрать для вас лучшего кандидата.
• Боты дают персональные советы по общению и флирту — уже сейчас треть молодых американцев советуются с ChatGPT насчет отношений.
• Наступает новая эра, где «ИИ просканирует весь город и выдаст подборку людей, которые наиболее вам подходят».
@notboring_tech
🏥 Вау! Исследователи запустили целую симуляцию больницы и заселили в неё ИИ-докторов — LLM лечат тысячи виртуальных пациентов, набираются опыта и прокачивают свои навыки.
Врачи-агенты обследуют, ставят диагнозы и даже оперируют NPC. Новый подход показал лучшую эффективность среди всех нейросетей — после лечения 10 тысяч пациентов ИИ достиг беспрецедентной точности 93,06% в MedQA.
Нейросети из матрицы скоро смогут пригодиться в реальных больницах.
@notboring_tech
🧬 Только что Google представил AlphaFold 3 — это полноценная замена лаборатории. Новое поколение нейронки создает белки, ДНК и РНК в 3D с точностью до каждого атома.
ИИ работает в два раза точнее всех аналогов, а также моделирует химические реакции и поведение целых молекул. Это поможет в сотни раз быстрее создавать новые лекарства от трудноизлечимых заболеваний.
С сегодняшнего дня учёные со всего мира могут бесплатно использовать AlphaFold 3 и проверять свои гипотезы в два клика. Подробности в блог-посте.
@notboring_tech
🍏 Apple готовит революцию в iOS — нейросети будут работать локально без серверов, фотошопить снимки в галерее и даже управлять экраном!
Выбрал самое интересное из последних работ от Apple:
• EELBERT сжимает большие LLM во много раз для железа айфона. Bard от Google уменьшили в 15 раз до 1,2 мегабайта, а качество снизилось лишь на 4%.
• Siri наконец-то перестанет тупить — на обучение модели Ajax тратят несколько миллионов долларов в день, а опубликованная ReALM уже догоняет GPT-4 в ряде задач.
• Ferret выполняет запросы на вашем экране — набирает сообщение, находит файл, добавляет будильник и обновляет календарь.
• MGIE редактирует фотки по любым промптам — добавляет объекты, удаляет фон и увеличивает яркость, а Keyframer анимирует статичные снимки.
Уже 10 июня на WWDC Тим Кук может представить самую навороченную iOS в истории с нейронками внутри — ждём!
@notboring_tech
🌠 Наконец-то: для Claude вышло мобильное приложение. Чат-бот опережает GPT-4 в ряде задач и бесплатно анализирует PDF! Я легко залогинился через российский гугл-акк c VPN.
Можно загрузить огромные файлы — Claude прожует, перескажет, объяснит и выжмет главное! Пока тулза доступна для iOS не во всех странах, для Android обещают скоро выпустить.
Мощь ИИ в кармане тут.
@notboring_tech
👕 Недавно вышла лучшая нейросеть, которая переодевает человека в любую одежду — IDM-VTON. Если не можете выбрать вещи в интернете, просто примерьте их на себя и сравните фотки!
По моим тестам, работает почти идеально. Написал полный туториал, как выжать из нейронки максимум:
1. Загружайте фотку себя в окно «Human», фотку вещи — в «Garment». Добавьте в промпт описание вещи и жмите «Try-on».
2. Генерация обычно длится до 30 секунд — ИИ перерисовывает изображение и добавляет одежду даже со складками, бликами и деталями.
3. IDM-VTON предусмотрен для верхней одежды, но со штанами тоже работает — не забудьте указать «pants». Можно загрузить любой исходник, даже упаковку сгущенки или образ персонажа.
4. Если результат корявый, снимите галочку с «Use auto-generated mask» и выделите одежду под замену вручную.
5. Если фотка сделана в темном месте и одежда темного цвета — они могут сливаться, поэтому используйте контрастные цвета.
Развлекаться тут.
@notboring_tech
👽 Нашел годноту для кодеров — через NVIDIA AI можно встроить пять мощных нейронок прямо в VSCode. Они генерируют, исправляют и объясняют код в один клик без VPN.
Сохраняйте гайд:
1. Регистрируемся и подтверждаем почту тут.
2. Выбираем любую модель и кликаем «Get API key».
3. Скачиваем расширение CodeGPT в VSCode.
4. В качестве провайдера выбираем NVIDIA и вставляем API-ключ.
5. Теперь Llama-3, Mixtral, Gemma, Phi-3 и другими можно пользоваться в среде разработки! Удобно, чтобы сравнить результаты и выбрать лучший.
@notboring_tech
🧬 Важнейшая новость в медицине: опубликована первая нейросеть, которая успешно редактирует гены человека. OpenCRISPR изменяет ДНК для борьбы с болезнями и мутациями в геноме!
Учёные могут скачать и использовать редактор бесплатно в сотнях задач. Например, создавать новые молекулы, которых не существует в природе. По прогнозам, нейронка скоро разработает первые лекарства.
Подробности тут, а доступ раздают здесь.
@notboring_tech
🍿 Отрывки из культовых фильмов превратили в 3D-сцены с помощью нейронки Gaussian Splatting! Полетать внутри легендарных локаций можно самому:
• «Властелин колец»;
• «Матрица»;
• «Гражданин Кейн»;
• «Волшебник страны Оз»;
• «Терминатор 2».
Так и до иммерсивных 3D-фильмов не далеко.
@notboring_tech
🎉 Llama 3 начали раскатывать на сторонние приложения — в Groq чат-бот выдает безумные 600 слов в секунду и печатает в 25 раз быстрее, чем обычный человек.
Зацените пример: ИИ отвечает на имейлы и генерирует сказки со скоростью несколько страниц в секунду! Если не верите, попробовать можно в вебе после логина и с любым VPN.
LLM со скоростью света тут.
@notboring_tech
🤖 Крутейший робот в домашних условиях — инженер три года не выходил из гаража, чтобы собрать Mona. Гуманоид подключен к слуху, зрению и речи, умеет делать шаги и показывать жесты!
Робот в реальном времени описывает всё, что видит, и даже умеет рассуждать. Если сказать «я хочу пить» — ИИ поймет, что нужна вода, и передаст бутылку. Впечатляет, что мужик сделал всё это в гараже с нуля.
Полное видео на Ютубе, там же можно следить за прогрессом и посмотреть больше демок. Терминатор на минималках!
@notboring_tech
🔥 В Premiere Pro добавят лучшие генераторы видео-контента от Runway, Pika и даже OpenAI. Вместе с этим в программу завезут новые ИИ-фичи:
• Они добавляют и удаляют любые объекты в видео, от человека до галстука;
• Размывают логотипы и номера машин;
• Расширяют кадр в ролике;
• Дорисуют недостающие кадры, если нужно увеличить хронометраж;
• Генерируют динамичные отрывки в любом месте, где вы поставите на паузу.
Обновление выйдет до конца года — у монтажеров праздник.
@notboring_tech
🪅 Grok от Маска теперь лучший анализатор картинок — версия 1.5V получила зрение и превосходит GPT-4 Vision в этих задачах. Нейронка может скоро выйти в паблик, бесплатно и без цензуры.
Напомню, как это можно использовать: превращать набросок сайта в рабочий код, генерировать рецепты из продуктов в холодильнике или объяснять мемы из скринов.
Исходники появятся на GitHub.
@notboring_tech
Лаборатория креативных технологий LYM PRO стартовала с новым форматом презентаций в своём пространстве SkLAD, где были представлены свежие разработки, различные технические решения и художественные инсталляции. Гости могли не просто посмотреть, но потрогать и протестировать технологии, чтобы набраться идей для собственных проектов.
За этим событием стоит большая идея – создать пространство для креативных людей и технологических энтузиастов, где можно общаться, обмениваться мыслями, находить идеи и организовывать коллаборации.
Первая презентация прошла в закрытом формате, но LYM PRO планирует проводить такие встречи регулярно и открыто, чтобы каждый желающий мог погрузиться в мир креативных технологий и мультимедийного искусства.
#promo
⚡️ OpenAI начали бесплатно раздавать доступ к GPT-4 Omni — проверяйте у себя. Если вкратце, нейронка общается по видео, человеческим голосом и без запинок.
Выбрал лучшие демки, обязательно посмотрите их:
• GPT-4 Omni помогает незрячему человеку на улице — рассказывает всё, что видит через камеру телефона.
• GPT-4o переводит речь в реальном времени на двух языках — никаких глупых пауз.
• Нейросеть добавили прямо в Zoom — все коллеги могут обратиться к боту за советом.
• GPT-4o вместо преподавателя объясняет студенту тему по математике.
• Объясняет куски кода по клику с вашего экрана и пишет его за считанные секунды.
• ИИ отвечает на вопросы с сарказмом, использует эмоции и напоминает обычный звонок с другом.
Многим пользователям уже выдали доступ, заглянуть в будущее можно тут.
@notboring_tech
У российского бизнеса в 2024 году три пути: параллельный импорт, пиратство и импортозамещение.
В первом случае, компания лишается гарантийного обслуживания. Во втором — нарушает законы об интеллектуальной собственности. Но можно выбрать и третий путь — импортозамещение. В прошлом году российский ИТ-рынок вырос до 1,9 трлн рублей. Там происходит настоящая санта-барбара: взять хотя бы прошлогоднюю историю с арестом замминистра по ИТ Максима Паршина за взятку.
Так вот. Лучше всего об этом пишет автор канала Про tech и этих. Там и про аналитику рынка, и про импортозамещение и про российский софт без цензуры. Подписывайтесь.
#promo
👑 Появилась обновленная Gemma — у неё безумные 10 миллионов токенов контекста! За один раз можно загрузить максимум 7 миллионов слов и 300 тысяч строк кода (приблизительно).
Gemma ищет ответы в книгах, суммирует содержание учебников, выполняет документации, объясняет кодовые базы и многое другое. Не понимаю как, но для запуска требуется меньше 32 ГБ памяти.
Всем, кто хочет попробовать — GitHub и HuggingFace.
@notboring_tech
👾 Вышла лучшая нейросеть для генерации кода — она создает целые игры по запросу! Новый лидер с первой попытки сделал полный клон Flappy Birds, 3D-шутер про «грабить караваны» и аркаду Breakout — это технически сложные задачи.
На LMSYS Arena выкатили на замену загадочной модели gpt2-chatbot версию im-a-good-gpt2-chatbot — многие уверены, что это разрабы тестят GPT-5. При вопросе о том, кто её создал, нейронка пишет, что OpenAI, и ссылается на их документацию.
Пробовать тут.
@notboring_tech
🤯 Учёные представили Deep Learning 2.0 — это революционная архитектура KAN. Все пропустили, но это может быть главный прорыв в ИИ за много лет.
Объясняю за две минуты:
• В основе всех архитектур лежит сеть из нейронов и весов под названием MLP.
• В новой парадигме KAN активации переместили на «ребра» сети, тем самым перевернули главные принципы.
• KAN выдает ответы гораздо лучше и точнее, чем привычные модели!
• KAN решает математические задачи лучше любого ИИ — он даже переоткрыл законы физики и математики!
• KAN предсказуемее других — теперь легче понять, как ИИ выдал ответ, а значит нейросети можно контролировать.
• Единственный минус — KAN учится медленнее MLP в 10 раз. Ученые собираются это оптимизировать.
Вишенка на торте — KAN можно затестить и скачать с GitHub. Полный разбор архитектуры на русском сделали коллеги тут.
@notboring_tech
⁉️ Если хотите, чтобы я встроил эту нейронку в телеграм-бот для удобства — зайдите в него и нажмите /start.
Когда наберется база из 500 пользователей, я сделаю бота для примерки одежды и пришлю вам уведомление.
Кликаем сюда.
@notboring_tech
🤒 Нейросети научились диагностировать заболевания до появления первых симптомов. Это новая веха в медицине — ИИ определяет послеродовую депрессию за 2-3 месяца до (!) родов через один образец крови.
Алгоритм обучился на многолетних исследованиях и сравнивает вашу экспрессию генов с здоровыми людьми и пациентами. Миллионы людей смогут начать лечение ещё до появления проблем с психическим здоровьем!
@notboring_tech
🎬 Simulon наконец-то начали раздавать доступ бета-тестерам — приложение генерирует мега-реалистичный CGI за пару минут. Попробуйте угадать, что из объектов на первом видео графика и вы будете в шоке.
Киношные кадры получаются без оборудования, гринскрина и бюджета — поместить любой 3D-объект в реальное окружение можно даже с айфона. Бетку раздают через форму, но придется подождать очередь.
@notboring_tech
👀 Заметил, что Llama 3 стала доступна из России без VPN и регистрации — хайповую нейронку добавили в Perplexity! Быстро летает даже с мобилы в браузере.
Доступны обе версии с 8 и 70 миллиардами параметров. В одном месте можно чатиться со всеми опенсорсными нейронками, от Claude 3 до Mixtral — удобно, чтобы сравнить ответы разных моделей.
Если не хотели возиться с прокси, пользуйтесь тут.
@notboring_tech
🕹️ Гениально: учёные встроили в шутер Borderlands 3 мини-игры, в которых игроки чинили реальные цепочки ДНК для научных целей. Сложную работу превратили в занятный геймплей.
В головоломку поиграло больше 4 миллионов игроков, решив 135 миллионов задач! Если бы для этой работы нанимали ученых, ушло бы гораздо больше денег и ресурсов.
Геймеры, сами того не зная, внесли огромный вклад в науку — новые геномные данные ускорят исследования для лечения заболеваний.
@notboring_tech
⚡️ Breaking: Цукерберг с ноги ворвался в ИИ-гонку, запустил новые нейросети и посетил подкасты про AGI.
Всё, что вы должны знать:
• Meta выпустила в опенсорс мощнейшую Llama 3 — она бьёт конкурентов, знает 30 языков и будет развиваться. Скоро бесплатно появится в Facebook, Instagram и WhatsApp.
• Imagine Flash внутри Llama 3 генерирует картинки в реалтайме, пока вы печатаете запрос! Превью генерации обновляется с каждым символом.
• Параллельно вышел подкаст с Цукербергом про путь к AGI, биологическое оружие и будущее Meta.
Потыкать Llama 3 в вебе можно с VPN на США тут.
@notboring_tech
🧯 Разным LLM дали доступ к компьютеру — они самостоятельно выполнили 369 задач! ИИ-агенты управляли курсором и клавиатурой, чтобы очистить куки, обновить таблицу, гуглить и многое другое.
Потенциал почти не ограничен — можно описать задачу и запрограммировать бота выполнить любой список действий. Тестировали GPT, Mixtral, Gemini и Claude 3 — GPT-4 показала лучший результат.
Запустить убийцу рутины у себя можно отсюда.
@notboring_tech
💡 В Твиттере вспомнили фишку Polycam — можно пройти по квартире и отсканировать ее в 3D за минуту. Получится трехмерный план этажа с мебелью, стенами и окнами.
Идеально для планировки ремонта, перестановки мебели или переноса квартиры в Vision Pro. Весь процесс автор наглядно показал на видео. Если потеряли ссылку, приложение тут.
@notboring_tech
💯 Рейтинг нейронок меняется каждый день: GPT-4 вернулся на первое место и сдвинул Claude 3 Opus. После апдейта чат-бот от OpenAI обучился на данных до декабря 2023 года и улучшился в математике, точности и рассуждениях.
Лидерборд моделей называется Chatbot Arena — очень полезный ресурс! Можно смотреть изменчивый и динамичный ландшафт LLM, доступны категории по задачам и языкам. Уверен, рейтинг еще много раз поменяется в этом году.
Сохраняйте ссылку, если ещё нет — тут.
@notboring_tech