Видишь капчу на сайтах?
Берешь, например, https://huggingface.co/spaces/docparser/Text_Captcha_breaker
Радуешься
Код и модель тут
C сегодняшней ночи на ChatArena новые отличные модели (лучше gpt4) im-also-a-good-gpt2-chatbot
иim-a-good-gpt2-chatbot
можно выбирать самостоятельно.
Раньше они попадались случайно в разделе "Arena (battle)"
1) Зайти на сайт ChatArena chat.lmsys.org
2) Выбрать сверху в меню "Direct Chat"
3) В "Choose any model to chat" выбрать любую из 2 моделек (im-also-a-good-gpt2-chatbot или
im-a-good-gpt2-chatbot)
4) Бесплатно чатиться
Lux — это мощное расширение для pandas DataFrame, которое автоматически предлагает графики под ваши наборы данных
Статья на медиуме с описанием работы библиотеки
Статья на Arxiv
im-a-good-gpt2-chatbot
появился в сравнительной части chat.lmsys.org
chat.lmsys.org — сейчас арена для теста лучших LLM, и арт вроде должен быть далеко от этого. Но я недавно узнал у Сиолошной про im-a-good-gpt2-chatbot
, говорят это проделки OpenAI.
В общем я решил использовать старые промпты для P5JS (Помните был такой Генарт? Когда с помощью кода создают красоту)
И im-a-good-gpt2-chatbot
показал невероятное понимание как создать, анимировать и даже визуализировать объекты. В моем случае я попросил создать симуляцию столкновения двух нейтронных звезд и примерно рассчитать масштаб черной дыры и визуально показать ее. Очень хорошо видеть в сравнение со второй рандомной(Qwen
и gemini-1.5-pro-api-0409-preview
) моделью, как im-a-good-gpt2-chatbot
превосходит другие модели и выдает рабочий, сложный код.
Пока я прошу перевести код в Blender API(что он тоже прекрасно делает
) поглядите на симуляцию столкновения двух нейтронных звезд одинакового размера.
А Денис успел раньше игру запилить.
P.S. Модель хорошо сгенерировала svg вариант текстового сторис для инсты и даже запилила полноценный код с использования controlnet и кастомных моделей в diffusers. Это очень мощно.
Недавно показали Streamlit – питоновская библиотека для разработки веб-приложений. В том числе для интерактивных визуализаций и мини-дэшей.
Хороший дизайн и даже их дизайн система в открытом доступе!
Примеры приложений:
- prettymap
- генератор твитов
- showflake health
Очень напоминает shiny 💫
Украл отсюда
Статистика цен на недвижимость на основе всех объявлений недвижимости + в разрезе регионов
Потыкать можно тут
Будут лайки, доделаю до текущей даты
В России впервые оштрафовали за воровство идеи для рилса. Блогер по теме недвижимости пожаловался в суд на риелтора, который нагло украл его идею для видео.
Суд принял решение оштрафовать плагиатора на 300 тысяч рублей.
Теперь нужно будет придумывать свои идеи самостоятельно
Юристы: о, это что? Новый заработок?
Наушники с возможностью съема данных электрической активности мозга (ЭЭГ)
https://neiry.ru/
Берем, отслеживаем во время решения задачек с leetcode и замеряем стату
Стартап из Индии Swaayatt Robots делает беспилотник для местных дорог.
Им приходится работать с коровами на дорогах, машинами на встречке, мотороллерами и тук-туками, которые пытаются попасть под колёса, полным отсутствием разметки и знаков (да и дорог тоже).
Это вам не по идеальным улицам Калифорнии тестировать беспилотник.
Запустил Ламу в фоне на компьютере и забыл. Теперь делаю alt-tab, когда нужно проверить или сократить любой текст, задать вопрос, помочь в формулировке, сделать выжимку.
По качеству выше чем бесплатные версии Claude, Gemini, GPT.
Бесплатно, работает локально на любой пароварке, требует 4.5GB памяти, не нужен интернет и никуда не отправляет ваши данные.
Установка занимает 2 минуты, не нужно даже консоль открывать: https://lmstudio.ai
1) Берем такой датасет https://github.com/AceLewis/my_first_calculator.py/blob/master/my_first_calculator.py#L20822
2) Обучаем
3) Получаем готовый калькулятор
Набор дата сайнтиста в стартапе по-британски
1. Firestore - NoSQL бд, чтобы хранить целиком жсоны и строить дата пайплайны поверх onCreate/onUpdate
2. Typescript - какая разница, на каком языке прогать? А тут зато js команда поймет, что ты делаешь
3. Firebase Cloud Functions - ETL весьма может быть и на серверлесс
4. ChatGPT, Gemini, Claude - вместо тысячи NLP, NER и парсеров
5. Crunchbase, Pitchbook, Apollo - базы с ~Series A стартапами
6. Cursor.sh + claude - самый мощный копайлот тудэй
Другие наборы из серии:
- дамская сумочка стартаперши
- мобильный сайд-хаслер
У Dalle3 картинки в тренировочном датасете очень подробно описаны gpt-шкой с виженом
Читать полностью…В приложении Сбера появились проверки сайтов и номеров телефона
Раздел «Безопасность»
Челы из Авито рассказывают о том, что сделали кучу иконок при помощи генерации
https://dsgners.ru/product-design/4744-kak-myi-sdelali-1000-kartinok-pochti-v-dva-raza-deshevle-obyichnogo-blagodarya-neyroseti
👀 Aeonium-v1-BaseWeb-1B
Завершено обучение первой языковой модели для русского языка с 1.6 млрд. параметров.
- 32B токенов в датасете
- 4096 контекстное окно
- Llama в качестве основной архитектуры
- 128k vocab
HuggingFace
@hikonon
Практически 6 тысяч публичных обращений опубликовано
/channel/cheb_problems
Статистика обращений с января по март тут начиная с этого сообщения
Увидел какой-то монстр-смартфон Unihertz Tank 3 pro
Нравятся подобные
В телефоне:
- 23 800 миллиАмпер
- 18 Гб ОЗУ
- 512 Гб памяти
- Мега-яркий фонарик
- Проектор, 100 люмен, 120 Гц
- экран 120 Гц
- ещё куча всего, лень писать
обзорчик тык
Microsoft впервые с 2018 года пополнила исходники MS-DOS: в открытый доступ выложены полные исходники MS-DOS 4.0
Читать полностью…Moderna, крупная фарма компания, утверждает что 100% их лигал команды плотно сидит на GPT, они разработали 400+ внутренних GPTs для автоматизации работы, используют для обработки данных для дозирования лекарств. Понятно, что этот ролик скорее рекламный ролик OpenAI.
Читать полностью…Возникла идея запарсить сообщения телеграм чатов у районов/домов/микрорайонов, насколько оно полезно?
Читать полностью…Берём
https://store.steampowered.com/app/1363080/Manor_Lords
Обзорчики тык, тык и тык
Опубликован новый пример дизайна ML системы по шаблону Reliable ML
Пополняем базу примеров хороших дизайн-документов
Сегодня добавили новый пример дизайн-документа - проект от Симулятора ML. Даниил Картушов и команда представляют pet project по разработке чат-бота для поиска ответов на разные запросы в телеграм-каналах.
Опубликованный дизайн-док - пример хорошо проработанного и не перегруженного лишней информацией документа. Для более глубокого погружения в потребности пользователей в части про бизнес-требования команда проекта добавила User Story Map и Customer Journey Map. Это, кстати, может стать отличным дополнением к шаблону дизайн-документов.
Огромное спасибо авторам документа за вклад в развитие ML-дизайна.
Шаблон дизайн-документа ML-систем от Reliable ML
Материалы по работе с дизайн-доком
Как написать док вместе с Reliable ML
Stay tuned!
Ваш @Reliable ML
#business #tech #ml_system_design