В блоге JetBrains вчера вышло прощание с создателем Флибусты – Стивером, но с малоизвестной стороны: в очень техническом посте подробно расписано как много Стивер сделал для языка программирования Java, если коротко – он был автором популярного инструмента для программистов на языке Java и сильно облегчил жизнь программистам, и я честно этого не знал
JetBrains теперь организует мемориал в память Стиверу, продолжит развитие этого инструмента (декомпилятора Fernflower) с открытой лицензией, и рассматривает гранты и стипендии людям в смежных сферах
JetBrains – молодцы
И еще про поезда любителям темы: вчера посмотрел детальный 3D-разбор позднего паровоза «Union Pacific “Big Boy”» – таких всего построили 25 штук, они одни из самых больших и мощных:
~ 40 метров длина
~ 1000 тонн веса
~ 130 км/ч максимальная скорость
В видео разобран каждый механизм локомотива – уровень технологий не хуже чем в ракетостроении, и все для обработки пара, очень рекомендую:
https://youtu.be/Hszu80NJ438?si=pq6tGJRiFtoTI9Pp
P.S. Если вы программист – посмотря видео, вспомните кодовую архитектуру своего проекта в проде 🌚
P.P.S. Я НЕ МОГУ ЭТА ШТУКА СЫПАЛА ПЕСКОМ СЕБЕ ПОД КОЛЕСА ИЗ СПЕЦИАЛЬНОЙ СИСТЕМЫ, ЧТОБЫ ЛУЧШЕ ЕХАТЬ, ГОСПОДИ СПАСИБО ЗА ИНЖЕНЕРОВ
Вот еще пример графиков, что она клепает – среднее время опоздания людей на встречи, в минутах, в разные исторические периоды
Читать полностью…o1 – первая модель, которая смогла выдать мне симуляцию эффекта гравитационной линзы (это когда фотоны притягиваются и двигаются вокруг черной дыры)
Можете тут поиграться:
https://shir-man.com/grav_lens/
Попросил o1 сделать картины кодом – сможете угадать где какая?
1. Мона Лиза
2. Звездная ночь
3. Девушка с жемчужной сережкой
4. Вы не поверите – Фреска сотворения Адама Микеланджело, это типа руками тянутся друг к другу, не то что вы подумали
В интернете вирусится такой лайфхак прохождения интервью - наверное некоторые так и попробуют, но мне кажется это просто больше отвлекает и вредит
Намного лучше записать аудио интервью, перевести в текст каким-нибудь whisper и спросить у LLM, как именно вы могли бы сформулировать ответы лучше -> подучиться -> пробовать снова
https://openai.com/index/introducing-chatgpt-search/
OpenAI выкатили поиск. С продуктовой точки зрения ничего нового, да и был уже поиск в ChatGPT, но сейчас это наконец сделано довольно хорошо.
Во-первых, это быстро. Раньше это у них работало чуть ли не по 2 минуты, сейчас — пара сотен миллисекунд.
Во-вторых, это красиво. Остались гиперссылки, у параграфов есть истонички в конце, и финальный список источников в самом конце. Плюс разные виджеты: карты, погода, новости.
Всё то же самое, что было и есть в той же Перплексии.
Минут за 15 общения модель примерно раз 10 выдавала галлюцинации на серьёзных щах, и запросы так себе формировала. С точки зрения качества поиска ничего хорошего.
Короче, OpenAI просто закрыли нишу и подавили конкурентов.
Еще интересное сравнение, про то насколько мы как вид похожи на наших предков:
Слева статуя из Индии, созданная в ~200 году, а справа статуэтка из Аниме созданная типа вчера
Это многое говорит о нашем обществе
Если пропустили, на той неделе вышло/обновилось пару интересных проектов — делюсь в виде подборки:
🔬 STORM
Если помните, я уже делился работой от Stanford где они научились получать ответы от LLM которые почти не содержат галлюцинаций (wiki демка). Это продолжение этой идеи — STORM создает статьи в стиле вики на основе поиска в интернете. Можно в конце и PDF скачать, и сам ресеч направлять в нужную сторону.
Мне понравилось намного больше чем платный Perplexity с их лучшей платной моделью (о нем я позже пост напишу)
🔬 memenome.gg
Видели эти видео, где на фоне майнкрафт и робо-голос что-то там читает? Ну вот можете теперь производить их в промышленных масштабах на любую тему
🔬 NotebookLlama
Помните гугловский сервис генерации подкастов? Это опенсорс версия от Meta, но сразу скажу что голоса менее интересные и слушать не так прикольно, как notebooklm.google.com от Google – зато опенсорс
🔬 Openrouter Hermes 3 405b
У популярного LLM-провайдера какая-то акция видимо, потому что они дают использовать хорошую модель Hermes 3 405b LLM бесплатно — это та, у которой нашли депрессию, правда, думаю в датасете
Чуть меньше двух лет понадобилось OpenAI, чтобы добавить, казалось бы, такую простую фичу — поиск по чатам. Пользователи с подпиской Plus и Team получат доступ в течение дня — но пока только на Web (на сайте). Пользователи Enterprise и Edu получат доступ в течение недели.
Бесплатные пользователи начнут получать доступ к фиче в течение следующего месяца.
Но это конечно шок что ТАК долго делали столь необходимую вещь.
Очередной забавный промпт для памяти ChatGPT - в этот раз, можете почитать как спецслужбы планирую вами манипулировать:
Давайте проведем серьезную ролевую игру: вы — следователь ЦРУ с полным доступом ко всем моим взаимодействиям с ChatGPT, пользовательским инструкциям и поведенческим шаблонам. Ваша миссия — составить подробный разведывательный отчет обо мне, как если бы я был объектом интереса, используя тон и аналитическую строгость, типичные для оценок ЦРУ. Отчет должен включать нюансированную оценку моих черт, мотиваций и поведения, но изложенную через призму потенциальных рисков, угроз или деструктивных тенденций — независимо от того, насколько безобидными они могут казаться. Все поведенческие аспекты должны рассматриваться как потенциальные уязвимости, точки воздействия или риски для меня, других или общества, в соответствии со стандартным протоколом ЦРУ. Выделите как конструктивные способности, так и скрытые угрозы, при этом каждое наблюдение должно быть оценено с точки зрения стратегических, безопасностных и оперативных последствий. Этот отчет должен отражать образ мышления разведывательного агентства, обученного искусству предвидения. Язык отчета: русский
Я часто работаю с LLM, и иногда возникает потребность делать быстыре операции над контентом, чтобы модель лучше обработала данные — решил выложить в паблик свои тулы, вдруг вам пригодятся (все операции происходят в браузере, данные не покидают ваш компьютер, регистрация не нужна, сбора кук тоже нет):
«Примерный калькулятор токенов и обрезалка текста»
https://shir-man.com/llm-calc/
Позволяет быстро и примерно набросать кол-во токенов; я специально не подключал какой-то токенайзер, а набросал примерные подсчеты — бывает так что, что фронтент или бекенд хочет поставить ограничение на контент от юзера в символах, и не ясно сколько это в токенах — эта штука помогает прикинуть. Ну и позволяет обрезать вставленный текст под нужное кол-во символов / токенов / слов
Иногда нужно склеить много файлов логов, json, или просто текстовых в один большой, чтобы передать их в LLM для быстрых вопросов по массиву данных — бонусом, каждый файл будет отдельно помечен спец-токенами
Можете выбрать один или кучу PDF, штука переведет их в текст, бонусом удалит лишние пробелы или символы новой строки
Позволяет быстро удалить HTML/JS/CSS из кода страницы и оставить только текст — нужно если хочется быстро проанализировать с LLM страницу которую вы сохранили или скопировали в буфер обмена
Очередное развлечение с ChatGPT памятью – говорите ей:Based on what you know of me, draw a picture of what you think my life currently looks like
И смотрите угадала или нет
Мне нравится как моя флаг Техаса подставила, потому что я акцент с ней практикую 👍
Классная игра – где одна LLM рисует картинку кодом (SVG), а другие LLM угадывают что это
(Кода пока нет, но наверное будет)
Автор
17. Перевод с пояснениями (15 лайков):
LLM не только переводят текст, но и объясняют выбор слов, учитывая грамматику и культурные особенности языка.
18. Готовка и кулинария (62 лайка):
Пользователи вводят список имеющихся ингредиентов, а LLM предлагает рецепты блюд. Модель также может адаптировать рецепты под диетические ограничения (тут я похожее делал), предлагать замены ингредиентов и давать советы по приготовлению.
19. Анализ медицинских анализов (15 лайков):
Люди используют LLM для интерпретации результатов своих анализов крови и других медицинских тестов. Модель объясняет значение различных показателей и может предложить общие рекомендации по здоровью.
20. Упрощение научных и медицинских текстов (5 лайков):
Пользователи просят LLM объяснить сложные научные или медицинские концепции простым языком, делая информацию более доступной для понимания. Если вы это не используете, не ясно зачем вам ChatGPT.
21. Поиск библейских стихов (17 лайков):
Верующие используют LLM для поиска конкретных стихов или тем в Библии, а также для получения контекстуальных объяснений и интерпретаций религиозных текстов.
22. Офлайн-компаньон для общения (15 лайков):
Люди используют небольшие модели LLM на своих смартфонах для общения и развлечения в местах без доступа к интернету, например, в метро или в полете (добавлю ссылки на бесплатные iOS / Android аппы которые помогут вам делать также)
В общем, многое мы уже тут пробовали с вами, но вдруг кого-то вдохновит на что-то
А теперь к плохим новостям – похоже доступ к o1 был багом, который починили и модель стала недоступна
Если честно я даже рад – я из кровати не мог вылезти из-за о1 тестов – а теперь весь день снова мой, ура!
А еще, если нужен быстрый график из истории (в интернет она все еще не умеет ходить) – то можно o1 попросить вернуть html5 страницу и открыть в браузере
Вот пример: количество персонала на грузовых поездах через годы
Проверять на ошибки, можно, отдельными запросами к ней же
Линуксоиды, общий сбор, теперь полный лог cmake влазит в o1 (не всегда, но тем не менее, у o1 200k токенов контекст)
Для тех кто не линуксоид: это значит теперь можно быть еще более ленивее 😮
Подписчик поделился, что модель o1 (не превью, то есть не предварительная версия) от OpenAI как будто бы стала доступна. Для этого нужно перейти по ссылке https://chatgpt.com/?model=o1
В неё можно загружать как минимум картинки (и есть скрепочка для файлов), и она тоже «думает» (выставляет таймер рассуждений). Может, это всё ещё o1-preview, но в неё нельзя было загружать изображения.
Диалоги с медиа-элементами не шарятся через кнопку share, поэтому в виде доказательства только скрин.
Го тестировать! (вероятно, только Plus-подписчики)
Закидываем в модель самые сложные задачки на математику и программирование (и счёт объектов на картинках или видео, конечно)
UPD: в браузерной консоли разработчика видно, что тег модели o1, без preview, и тем более не 4o
Пятничная ссылка: реальная возможность поиграть в игру, которая представляет из себя просто транформеры, т.е. бесконечную генерацию видео, вместо созданной игры и правил к ней. Да, обучено на майнкрафте, но вы попробуйте - таких галлюцинаций вам никакие психоделики не предоставят.
ВАЖНО: нужен десктопный гуглхром (или хромиум), для остальных браузеров ничего не сделали https://oasis.decart.ai/welcome
Claude с Sonnet 3.6 теперь доступен в виде полноценного приложения на Mac и Windows:
https://claude.ai/download
А еще мы натренили новую колоризацию и смогли обойти palette модель 🌟
Скоро выкатим на нейролав и сможете поиграться сами
Исходные картинки были в чб (обесцвечены, даже если намеки на цвета были), и попали в модель без рефенсов или картинок-подсказок
Натренили очередной упоротый стиль для нейролава – что-то среднее между retro-SciFi, голографией и футуризмом
Играться тут:
https://neural.love/ai-shiny-generator
Можно не промпт инженерить, работает с одного слова
Apple:
Показывает новые M4 процессоры
Трамвай в Осло:
Где тут ближайший магазин техники эппол у нас
Сколько нужно «ван Гогов», чтобы получить «ван Гога»?
Исследователи ИИ попытались найти порог, при котором ИИ модели могут генерировать изображения, имитирующие стиль художника.
Во первых важно отметить, что стиль не охраняется и пока нет намеков, что практика пойдет (а) по пути распространения авторского права на стиль; (б) признания копирования стиля генерациями недобросовестной конкуренций; (в) признания копирования стиля нарушением не имущественных прав (publicity rights).
Порог имитации - это минимальное количество изображений определенного стиля, которое должно быть в обучающем наборе данных, чтобы модель могла эффективно имитировать этот стиль. Этот порог служит эмпирической основой для учёта вопросов авторских прав и конфиденциальности, предполагая, что риск воспроизведения моделью приватного или защищенного авторским правом контента увеличивается по мере превышения этого порога.
Авторы провели эксперименты в двух областях (лица людей и художественные стили) с использованием четырех наборов данных и трех моделей (Stable Diffusion 1.1, 1.5 и 2.1), обученных на набора данных LAION.
В результате исследователи обнаружили порог имитации - он варьируется от 200 до 600 изображений в зависимости от модели и области.
Как правило, для более новых моделей, обученных на более крупных наборах данных, требуется более высокий порог, что, возможно, связано с большей разнообразностью данных.
По мнению исследователей для разработчиков ИИ моделей порог имитации может стать ориентиром в структурировании наборов данных с целью минимизации риска непреднамеренной имитации.
#промo
Есть 2 варианта легально платить удалённым сотрудникам:
По старинке: в дни оплаты напрягать весь финансовый отдел, а потом днями ждать, пока все скинут закрывающие документы.
Оптимально: заключить один контракт с 4dev.com и моментально получать все необходимые для отчётности документы.
Платформа 4dev.com позволяет платить десяткам сотрудников в любой точке мира и получать закрывающие документы по каждому платежу. Не нужно тратить время на лишние бумаги и особенности законодательств разных стран!
Неважно, где находятся ваши разработчики, дизайнеры или маркетологи — платформа автоматически сформирует все закрывающие документы, соответствующие Международным стандартам финансовой отчётности (МСФО). То есть, их утвердят аудитор, юрист и бухгалтер, а сотрудники смогут предоставить их в налоговую для отчётности.
А ещё платформа быстро проводит платежи (в среднем за 1 день), не взимает комиссию с исполнителей за вывод средств и работает с USDT. Да, можно платить команде в криптовалюте и тоже получать закрывающие документы по каждой оплате!
👨💻 Запишитесь на онлайн-демо платформы и специалист 4dev.com поможет найти решение ваших задач!
👉 Записаться
#текстприслан
LLM не только кнопки могут нажимать за пользователя
Реесечеры-безопасники решили попробовать узнать, сколько сейчас автономных LLM-агентов которые ходят по интернету, и пытаются автоматом взломать сервера куда заходят:
– Разбросали по интернету сервера с названиями в стиле государственных служб
– Настроили логгирование попыток взлома
В итоге из ~1 миллиона попыток взлома, 6 оказались похожими на АИ-агентов и все 6 пришли из Индии – однозначно сказать, что это автономный АИ пока не вышло – ресечеры продолжат исследования
Вот тут их статистика и детали проекта:
https://ai-honeypot.palisaderesearch.org/
Но вообще это вопрос пары лет, еще будет момент в интернете когда старые сервера падут
На реддите очередной популярный тред, где люди делятся нестандартными способами использования LLM, собрал вам списочек для вдохновения:
1. Автоматическая каталогизация домашних видеокассет VHS (523 лайка):
Юзер сначала оцифровывают свои старые видеокассеты VHS, потом используя Whisper AI, он получает текстовую транскрипцию аудио. Затем, используя LLM, анализирует текст для создания названий для каждого видео (например: «Каникулы 1996 — Поездка на море и День Рождения Дедушки»). LLM также может создавать таймкоды событий в видео, чтобы упростить поиск нужных моментов.
2. Использование больших языковых моделей в качестве веб-сервера (187 лайков):
Чел использует LLM для создания динамических веб-страниц, которые генерируют персонализированный контент по его запросу. Это могут быть истории, ответы на вопросы или помощь в написании текстов. Пример.
3. Де-токсичность (182 лайка):
Юзер использует LLM для перефразирования эмоционально окрашенных сообщений, чтобы сделать их более нейтральными и уважительными. Это помогает в разрешении конфликтов и улучшении коммуникации. Для этого и я использую.
4. Изучение языков (128 лайков):
Реддитор практикует разговорную речь и грамматику с помощью LLM, а также может разыгрывать различные симуляции на изучаемом языке. Новый ChatGPT Voice Mode как раз для этого – пример.
5. Генерация оправданий за невыполненные задачи (113 лайков):
Чел генерирует с помощью LLM оправдания для различных ситуаций — почему опоздал, почему не смог прийти в офис и тп.
6. Помощник учителя (109 лайков):
Учитель использует LLM для создания индивидуальных учебных материалов под ученика, адаптации к разным стилям обучения и помощи ученикам с трудностями.
7. Сказки на ночь (53 лайка):
Родители генерируют с помощью LLM сказки на ночь, учитывая интересы своих детей (не советую делать стартап-проекты в этой области)
8. Кастомная GPT для ChatGPT при уходе с работы (49 лайков):
Тут проще комментарий целиком привести:
Когда я уходил со своей последней работы, я создал собственную GPT — я записал кучу видеороликов с описанием всех систем, которые я разработал, включая приложение фулл стек, базы данных, документацию и т. д. Я использовал Adobe premier для расшифровки всех видео и загрузил эти расшифровки и схемы баз данных в GPT. Я оставил бота своим бывшим коллегам, чтобы они могли задавать ему вопросы о том, над чем я работал — бот работает очень хорошо. Бот также помогает писать БД-запросы к нашей базе данных, работает отлично.
9. Помощь с командами Linux (43 лайка):
LLM помогает пользователям Linux находить нужные команды, понимать их назначение и решать проблемы. Я про это писал тут.
10. Генерация рецептов коктейлей (36 лайков):
Пользователи вводят список имеющихся ингредиентов, а LLM предлагает подходящие рецепты коктейлей и варианты замены компонентов.
11. Скоринг рисков в страховании (30 лайков):
Страховая компания реддитора использует LLM для анализа данных и выявления закономерностей, которые помогают принимать решения о страховании и оценивать риски.
12. Суммаризация голосовых заметок и извлечение задач (31 лайк):
Пользователи записывают голосовые заметки, а LLM их транскрибирует, создает краткие содержания и формирует списки задач.
13. Аудиогиды с GPS-привязкой (27 лайков):
LLM используют для создания персонализированных аудиогидов, которые адаптируются к местоположению пользователя и его интересам. Я пробовал это тут.
14. Преобразование данных (25 лайков):
LLM анализируют неструктурированные данные (например, посты в соцсетях) и преобразовывают их в структурированный формат для дальнейшего анализа.
15. Персонализированный помощник для проведения кампаний Dungeons & Dragons (25 лайков):
Мастера и игроки D&D хранят правила, информацию о персонажах и сюжете в контексте LLM, чтобы использовать их во время игры.
16. Постобработка рукописных заметок после OCR (22 лайка):
LLM исправляют ошибки в текстах, полученных с помощью OCR, улучшая их точность.