Пишу про мир технологий и стартапов 🤖💖 Связь/сотрудничество: @fraizy_qwerty Чат канала: @neural_chat
🤯 Gemini 1.5 Pro втихую превзошла ChatGPT и взорвала Твиттер — нейронка от Google анализирует многочасовые подкасты, книги и гайды лучше конкурентов. Только почитайте эти примеры:
• Энтузиаст скормил целый учебник по биологии и получил ответы на три вопроса именно по его содержанию.
• Gemini 1.5 Pro создала персонажа для сложной ролевой игры благодаря пошаговой инструкции из 352 страниц.
• Чел показал полный код самоорганизующегося компьютера и пример вызова API — Gemini 1.5 Pro объяснила, как работает код, и интегрировала себя в репозиторий.
В Gemini 1.5 Pro можно одним кликом загрузить до 1 часа видео, 11 часов аудио, 700 тысяч слов или 30 тысяч строк кода. Впечатляет!
@notboring_tech
💖 Небольшой интерактив: какое видео реальное, а какое сгенерировала нейросеть Sora?
@notboring_tech
🎵 Показали новый генератор MusicMagus — редактировать полученные треки теперь можно текстовыми указаниями! «ControlNet для музыки» позволяет точечно настраивать и дополнять биты.
Можно менять инструменты, жанр и настроение, при этом сохраняя общую мелодию. Кто умеет грамотно составлять запросы, скоро станет ещё и битмейкером. Правда, попробовать пока не получится — ждём исходный код.
@notboring_tech
🧠 Только что OpenAI официально запустили память в ChatGPT — главное обновление за последнее время, которое научило нейронку запоминать диалоги. Приятно, что фичу начали раскатывать даже бесплатным аккаунтам.
Из интересного:
• если вы когда-то говорили об аллергиях, в следующий раз ИИ составит рацион с его учетом;
• память доступна в публичных ботах GPTs;
• появился новый чат «инкогнито»;
• можно попросить запомнить что-то конкретное;
• все воспоминания сохранены в настройках;
• их можно выбрать и удалить по клику.
@notboring_tech
🔉 В открытый доступ вышел самый мощный синтезатор речи, который клонирует любой голос за пару секунд! MetaVoice 1B обучен на 100 тысячах часов аудио — нейронка скопирует исходный голос и озвучит им ваш текст.
Звучит правдоподобно и работает бесплатно, но русского языка не нашел. Справится с генерациями нескольких минут беспрерывного аудио — подойдет для подкастов, дипфейков и других озвучек. Код тут, демка в браузере здесь.
@notboring_tech
🪄 Журналисты напряглись: шесть ИИ-агентов автономно пишут новостные газеты. Выбираете интересующие темы и несколько нейронок с разными ролями готовят персонализированную выжимку новостей, как команда реальных людей.
Первый ИИ ищет инфу в интернете, куратор фильтрует источники, копирайтер пишет материал, критик дает обратную связь, дизайнер готовит макет, редактор всё проверяет и издатель выпускает статью. Всё происходит за секунды специально под ваши интересы.
Самое крутое, что фреймворк уже доступен на GitHub.
@notboring_tech
👾 Если вы любите почитать про технологии, менеджмент и управление проектами — загляните в канал «Прод не упал». Редакция ежедневно публикует экспертные посты с легкой ноткой иронии и юмора, а еще краткие инфоповоды и мемы.
Что почитать:
→ Про токсичную продуктивность
→ Почему руководитель не должен быть постоянно занят
→ Почему полезно ходить на собесы, даже если не хотите менять работу
→ Как определить плохого руководителя
→ Почему не стоит искать причину каждой ошибки
Авторских, качественных и полезных каналов немного, подписывайтесь: @prodneupal
⚡️ Ночное включение: чип Neuralink успешно вживили в мозг первому человеку. Испытуемый чувствует себя хорошо и восстанавливается, написал час назад Илон Маск. Свершилось!
Клинические испытания Neuralink на людях обещали начать ещё в 2020, 2022 и 2023 году. Потенциалы у технологии большие — например, возвращение подвижности конечностей. Ждём подробности и первые тесты.
@notboring_tech
💤 Стартап Prophetic анонсировал первую нейросеть Morpheus-1, которая помогает вызвать осознанные сновидения. Она коннектится с обручем на голове, анализирует мозговые волны и точно определяет, когда человек находится в фазе быстрого сна.
В правильный момент ультразвуковые лучи стимулируют определенные зоны мозга, чтобы «разбудить» человека внутри сна и начать стабильные осознанные сновидения. Первые бета-тесты начнутся уже весной — записаться можно на сайте, а подробности рассказали в видосе.
Контроль за снами уже близко!
@notboring_tech
🎨 Ого, Google представил мультизадачную нейросеть для видео — Lumiere. Она генерирует ролики по текстовым запросам, повторяет стили, анимирует статичные картинки, заменяет объекты и оживляет области.
Runway пора подвинуться! Lumiere умеет выполнять все основные задачи, а главное — в невероятном качестве. Пока это не готовый продукт и исходного кода нет. Смотрим больше примеров в видео и на сайте.
@notboring_tech
🏥 В медицине произошел важный прорыв: FDA одобрило первое ИИ-устройство для обнаружения рака кожи. Теперь им могут пользоваться 300 тысяч врачей в США, чтобы проводить тесты для пациентов старше 40 лет.
DermaSensor анализирует кожу и выявляет три типа рака с точностью 96%. Это ещё не окончательный диагноз, а помощь врачам обнаружить первые признаки. Девайс стоит всего $399 в месяц — совсем недорого для клиник.
2024 год только начался, а доступный ИИ уже помогает выявить рак на ранних стадиях.
@notboring_tech
🍏 Apple выпустила 10-минутный гайд для Vision Pro — это наглядная демонстрация главного девайса года! Показали управление, 3D-воспоминания, иммерсивные фильмы, рабочее пространство, FaceTime, окружения и все основные фичи.
Все предзаказы раскупили за один час, теперь дата доставки сдвигается на март. Пока всё выглядит очень красиво, хайпово и зрелищно, хотя есть вопросы к весу гарнитуры и мемным глазам. Полный видос — на Ютубе. Первый обзор от журналистов, кстати, можно почитать здесь.
@notboring_tech
🧲 Meta только что выпустила MAGNeT — генератор музыки, битов и звуков по текстовым запросам. Достаточно ввести подсказку, а алгоритм сгенерирует уникальную комбинацию звуков нужной длительности.
На видосе синтезировали треки 80-х, рок, игру на пианино, крики чаек и шум волн — все примеры звучат качественно. Такое ощущение, что аудиостоки вымрут уже в этом году. Исходники лежат здесь, а демо доступно в браузере.
@notboring_tech
ИТ-каток возвращается
Тинькофф снова пригласил всех причастных к ИТ на каток в Парке Горького. На этот раз вечером 22 января. Tinkoff on Ice 2.0 — для всех, кто из ИТ, а также для друзей и членов их семей. Помимо веселой движухи, там будет много пользы: лекции от ведущих ИТ-экспертов (Сбера, Авито и других), speed dating для поиска новых знакомств в ИТ-среде, фудкорт с бесплатной едой и напитками, керлинг и много других активностей при поддержке КХЛ.
Подробности по ссылке.
erid:2VtzqwFoEXo
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673
🤔 Кейс: как в несколько раз увеличить эффективность и качество работы компании с помощью нейросетей
Участник «Сколково» «Тексел» уже применяет ИИ в восьми ключевых аспектах — найм сотрудников, менеджмент, продажи, техподдержка, исследования, разработка, маркетинг, юридическая работа.
Эффективность использования нейросетей в компании заключается не просто в автоматизации процессов, а в полном переосмыслении и перестроении подхода к работе, рассказывает Максим Федюков, гендиректор «Тексел».
💬 «Нейросети не заменяют людей, а дополняют и усиливают наши возможности. Это новый тип собеседника, который помогает нам видеть вещи по-новому и решать задачи более эффективно. Нейросети помогают нам в достижении целей, приумножая ценность человеческого вклада».
Например, в области продаж нейросети помогают обрабатывать сложные запросы и вести переговоры. Время ожидания ответа клиентами сократилось в 18 раз, при этом сами ответы идут не по шаблонам, а на основе собранной базы знаний, и всегда четко соответствуют вопросам.
👉 Подробнее о том, как еще наш резидент применяет ИИ, рассказываем по ссылке.
👋 Skolkovo LIVE — инновации тут
📻 ElevenLabs добавили к видео от Sora звук — теперь это полноценные ролики. В новом анонсе компания показала фичу, которая по описанию генерирует любой звук!
Записаться в лист ожидания можно здесь.
@notboring_tech
⭐️ Не мог пройти мимо нового анонса OpenAI — показали генератор видео Sora по текстовым запросам в прорывном качестве! Собрал любимые примеры в один пост, посмотрите сами.
• Такого уровня деталей и реализма не добивался никто, при беглом просмотре не отличить от жизни.
• Длительность до 60 секунд и разрешение 1080p.
• Процедурная генерация любых игр по вашим запросам стала еще ближе.
• Пока что доступ только для избранных — думаю, открытая бета появится через пару месяцев.
• Прямо сейчас Сэм Альтман на заказ генерирует видосы в Sora в треде.
Затаили дыхание и ждём релиза тут.
@notboring_tech
💣 Бомба недели: глава OpenAI Сэм Альтман хочет привлечь 7 триллионов долларов, чтобы возглавить разработку AGI. Здесь нет ошибки — нужны не миллиарды, а триллионы. Это больше общей капитализации Apple и Microsoft вместе взятых!
Нехватка дорогих процессоров сдерживает рост OpenAI, поэтому Альтман намерен построить десятки заводов и обсуждает сотрудничество с Arm, TSMC и шейхами из ОАЭ. Правда, чтобы собрать такие деньги, нужно продать 10% мирового ВВП.
Просчитался, но где?
@notboring_tech
🎉 Вау, нейросети подготовят вас к любому созвону — команда из разных ИИ-агентов сделает выжимку инфы, которую вам нужно знать перед звонком. Подойдет для собесов, интервью и экзаменов.
Просто указываем участников, контекст и цель встречи, а на выходе получаем биографию людей, вопросы для обсуждения и обзор главных тем. Поможет быть увереннее и не отходить от курса встречи!
Все файлы для установки на GitHub.
@notboring_tech
🎨 Google выпустил убийцу Midjourney — генератор ImageFX нацелен на удобный интерфейс, подсказки по запросам и интуитивные настройки.
По результатам справляется почти так же, но иногда появляются артефакты, проседает качество и бывают ошибки из-за цензуры промтов. Пользоваться ImageFX на сайте удобнее, чем Midjourney в Discord.
У художников и дизайнеров новый ИИ-инструмент (с VPN) — тут.
@notboring_tech
💨 Релизнулась нейронка, которая восстанавливает любые фотки — достаточно описать проблему. «Убери туман», «стабилизируй снимок», «сделай светлее», «прокачай разрешение» и так далее.
Как понятно по примерам — InstructIR работает очень интуитивно и умеет почти всё, от ретуши до размытия. Попробовать уже можно сейчас, демка доступна на HuggingFace.
@notboring_tech
🥽 Подоспели первые обзоры и распаковки Apple Vision Pro — я уже посмотрел их и выбрал главное. Журналисты сошлись во мнении, что это лучшая MR-гарнитура с безупречным экраном (23 миллиона пикселей) и огромным потенциалом, но с очевидными минусами:
• Шлем весит целых 600-650 грамм;
• батареи хватит на 2,5 часа;
• есть проблемы с клавиатурой, трекингом взгляда и рук;
• режим прозрачности бывает мыльным;
• внутри ощущается изоляция и одиночество;
• цена $3500 неподъемная даже для США;
• 3D-аватары — отдельный мем, смотрите в видосе.
Но для меня это самый интересный продукт Apple за последние годы. Посмотреть обзоры можно тут, здесь и тут.
@notboring_tech
💣 Все пропустили бомбу — Bytedance запустила бесплатную замену GPT Store. В платформе Coze есть сотни ИИ-плагинов для разных задач, а создать своего бота и выложить его в Telegram можно за пару минут без кода.
Доступны плагины с подключением к интернету, календарю, CapCut, Excel и другие. Под капотом у всех ботов — тот же GPT-4, но пользоваться можно без ChatGPT Plus за $20 в месяц.
Бесплатно создаем и пробуем разные боты тут.
@notboring_tech
📊 Нашел полезную нейронку для проведения любых исследований. В AfforAI можно закинуть документы, файлы, таблицы, сайты и другие ссылки — ИИ суммирует их в понятную выжимку по запросу.
«Второй мозг» прочешет тонны информации, переведет текст с других языков и проверит на достоверность. Ещё нейронка умеет составлять полные отчеты по финансовым докам и многое другое.
Для сбора инфы, работы и ресёрча — самое оно.
@notboring_tech
✏️ В феврале Google добавит в Chrome три новые ИИ-фичи. Появится умная организация вкладок для разбивки их по группам, авто-оформление браузера и самое полезное — генератор текста буквально везде.
В любом поле можно нагенерить черновик — из простого запроса, правой кнопкой мыши и без плагинов. ИИ напишет письма, сообщения на форумах, контент и многое другое. Получается, только что Chrome убил тысячи расширений с ChatGPT!
@notboring_tech
💣 NVIDIA внезапно представила конкурента ChatGPT — семейство моделей ChatQA превосходит GPT-4 в широком спектре задач.
Например, ChatQA лучше справляется с таблицами, арифметикой и случаями, на которые нет ответа. Судя по закрытым тестам, в 10 наборах данных система достигает уровня точности GPT-4!
Приближается новый участник ИИ-гонки. Кода нет, пока можно почитать подробности.
@notboring_tech
📐 Ночью DeepMind показал прорыв — AlphaGeometry решает задачи по геометрии на уровне олимпиад и золотых медалистов-людей! ИИ решил 25 из 30 задач олимпиады, когда предыдущий алгоритм справлялся лишь с 10.
Для обучения было сгенерировано более 100 миллионов задач, автономно и без участия человека. Под капотом языковая модель придумывает креативные идеи, а символический двигатель принимает рациональные решения.
Теперь ИИ решает задачи на уровне топовых математиков и ещё лучше использует логическое мышление (это пригодится для новых открытий). По классике, исходный код на Github.
@notboring_tech
✨ Вау, новая нейронка превращает любого человека в кого угодно. Достаточно отправить фотку лица и вбить свой запрос. Выглядит весело!
PhotoMaker сделает из вас Железного человека, богатыря или героя комиксов. При желании можно закинуть не свою фотку, а знаменитости или друга.
Демо можно попробовать прямо в браузере — тут.
@notboring_tech
💖 Понравилось: подборка визуальных гайдов для понимания основ больших языковых моделей (LLM). Вы разберетесь, как устроена архитектура нейросетей, даже если не особо понимаете в кодинге.
Сложные концепции и фундаментальные принципы представили в виде иллюстраций, схем и графиков! Оригинал подборки по платной подписке, поэтому выгрузил вам список визуализаций. Сохраняйте:
• Трансформеры по иллюстрациям;
• GPT-2 по иллюстрациям;
• Подробная визуализация LLM;
• Интерактивная статья про генеративный ИИ от Financial Times;
• Инструмент от OpenAI, чтобы разобраться в токенах;
• Объяснение работы токенайзеров;
• Визуализация разделения текста;
• Модели машинного обучения — они запоминают или обобщают (продвинутый уровень).
@notboring_tech