daniilak | Unsorted

Telegram-канал daniilak - Daniilak — Канал

264

Пишу о технологиях и датасетах, немного ML Рекламирую Чебоксары

Subscribe to a channel

Daniilak — Канал

Практически полностью выкачена статистика по делам на сайтах от СудРФ

Количество судов - 2317 штук ( из них 14 не имеют сайтов)
У многих судов есть несколько серверов. В сумме 2592 сервера.
А у каждых серверов есть категории и подкатегории дел. Всего не меньше 23048 подкатегорий (из них ~500 страниц сделаю позже)

Общее количество дел в разрезе категорий:

Уголовное судопроизводство:
Первая инстанция: 6629997
Апелляционная инстанция: 3337412
Кассационная инстанция (до 2013 года): 3607642
Кассационная инстанция (с 2013 года): 1168220
Надзорная инстанция (до 2013 года): 1167036
Кассационная инстанция: 489464

Гражданское судопроизводство:
Первая инстанция: 44612348
Апелляционная инстанция: 6544455
Кассационная инстанция (до 2012 года): 5304125
Кассационная инстанция (с 2012 года): 1179530
Надзорная инстанция (до 2012 года): 1177721
Кассационная инстанция: 973482

Административное судопроизводство:
Первая инстанция: 6759341
Апелляционная инстанция: 822519
Кассационная инстанция: 192837

Дела об административных правонарушениях:
Первая инстанция: 11286094
Производство по жалобам на постановления по делам об АП: 5209788
Производство по жалобам на решения по жалобам на постановления по делам об АП: 584787
Производство по жалобам на вступившие в законную силу решения, постановления по делам об АП: 731658

Производство по материалам:
Производство по материалам: 15348057

Некоторые суды/серверы/категории дел не дают возможности производить поиск всегда или в какой-то определенный период. Другие, коих мало, имеют немного другую структуру
Данная статистика будет полезна тем, кто проводит аналитические расчеты

Читать полностью…

Daniilak — Канал

Олимпиадники в Телеграм не умеют считать.
В чатах с таймером, если ты отправляешь >5 фотографий/вложений, то отправляется только случайная часть вложений, остальное бесконечно висит

Читать полностью…

Daniilak — Канал

Для тех, кто сегодня делает презентации, вам послание: если OpenAI делает простые ч/б презенташки, то что вы так паритесь

Читать полностью…

Daniilak — Канал

https://spectrum.ieee.org/prompt-engineering-is-dead

Читать полностью…

Daniilak — Канал

Если бы мне поручили защитить сайт от парсинга, то, как минимум, я бы собрал диапазоны IP-адресов всех серверов, например, отсюда, и добавил их в черный список

Читать полностью…

Daniilak — Канал

На сайте Emupedia можно посидеть в старой Windows, послушать музыку в Winamp и поиграть в игры того времени бесплатно.

Внутри собрано все самое лучшее — Dune 2, Command & Conquer: Red Alert 2, серия Doom, первый Half-Life и так далее. Есть локальный режим для игры с друзьями. А также множество родных программ и тот самый Paint

Читать полностью…

Daniilak — Канал

GPT-4o – новая нейросеть от OpenAI

– Доступна бесплатно для простых пользователей (даже без оплаты), а выходит уже сегодня.
– GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее.
– Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок).
– Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран.
– Для русского заявлено в 1.7 раз меньше токенов.

Читать полностью…

Daniilak — Канал

https://vc.ru/design/112303-veb-dizayner-prevrashchaet-starinnye-knigi-i-broshyury-19-veka-v-interaktivnye-sayty

Читать полностью…

Daniilak — Канал

У Dalle3 картинки в тренировочном датасете очень подробно описаны gpt-шкой с виженом

Читать полностью…

Daniilak — Канал

В приложении Сбера появились проверки сайтов и номеров телефона
Раздел «Безопасность»

Читать полностью…

Daniilak — Канал

Челы из Авито рассказывают о том, что сделали кучу иконок при помощи генерации
https://dsgners.ru/product-design/4744-kak-myi-sdelali-1000-kartinok-pochti-v-dva-raza-deshevle-obyichnogo-blagodarya-neyroseti

Читать полностью…

Daniilak — Канал

👀 Aeonium-v1-BaseWeb-1B

Завершено обучение первой языковой модели для русского языка с 1.6 млрд. параметров.
- 32B токенов в датасете
- 4096 контекстное окно
- Llama в качестве основной архитектуры
- 128k vocab

HuggingFace
@hikonon

Читать полностью…

Daniilak — Канал

Фиксирую еще одну идею по реализации библиотеки легковесного мониторинга сервера

Читать полностью…

Daniilak — Канал

Практически 6 тысяч публичных обращений опубликовано
/channel/cheb_problems
Статистика обращений с января по март тут начиная с этого сообщения

Читать полностью…

Daniilak — Канал

Начал писать аналог этой библиотеки, под капотом которой будет FastAPI

Читать полностью…

Daniilak — Канал

Собираю публичные обращения граждан с ноября по всей России, пока что всего около 100 тысяч обращений.
Также публикую обращения по Чувашии в этом канале @cheb_problems, где уже опубликовано чуть больше 4 тысяч обращений вместе с результатами. Некоторые обращения оттуда попали в СМИ

Читать полностью…

Daniilak — Канал

Новое хобби у людей ходить на собеседования в крупные компании «по приколу». Удивительно, но многих счастливчиков берут, причём сразу на руководящие должности. Объяснение этому — нехватка кадров практически во всех областях

Читать полностью…

Daniilak — Канал

Любой зум созвон для разраба это же просто фоновый подкаст

Читать полностью…

Daniilak — Канал

Конституционный суд разрешил наказывать за экстремистскую символику, размещённую до её запрета

Читать полностью…

Daniilak — Канал

Пользователи macOS, OpenAI выкатили приложение для ChatGPT, качайте (только под VPN)
https://persistent.oaistatic.com/sidekick/public/ChatGPT_Desktop_public_latest.dmg

WIn-юзеры, пока страдаем

Читать полностью…

Daniilak — Канал

Небольшая некоммерческая организация опенаи заявляет "мы - бизнес"

Читать полностью…

Daniilak — Канал

Видишь капчу на сайтах?
Берешь, например, https://huggingface.co/spaces/docparser/Text_Captcha_breaker
Радуешься

Код и модель тут

Читать полностью…

Daniilak — Канал

C сегодняшней ночи на ChatArena новые отличные модели (лучше gpt4) im-also-a-good-gpt2-chatbot и
im-a-good-gpt2-chatbot можно выбирать самостоятельно.

Раньше они попадались случайно в разделе "Arena (battle)"

1) Зайти на сайт ChatArena chat.lmsys.org
2) Выбрать сверху в меню "Direct Chat"
3) В "Choose any model to chat" выбрать любую из 2 моделек (im-also-a-good-gpt2-chatbot или
im-a-good-gpt2-chatbot)
4) Бесплатно чатиться

Читать полностью…

Daniilak — Канал

Вечером смотрим презентацию OpenAI (20:00 MSK)

Читать полностью…

Daniilak — Канал

Lux — это мощное расширение для pandas DataFrame, которое автоматически предлагает графики под ваши наборы данных

Статья на медиуме с описанием работы библиотеки

Статья на Arxiv

Читать полностью…

Daniilak — Канал

im-a-good-gpt2-chatbot появился в сравнительной части chat.lmsys.org

chat.lmsys.org — сейчас арена для теста лучших LLM, и арт вроде должен быть далеко от этого. Но я недавно узнал у Сиолошной про im-a-good-gpt2-chatbot, говорят это проделки OpenAI.

В общем я решил использовать старые промпты для P5JS (Помните был такой Генарт? Когда с помощью кода создают красоту)
И im-a-good-gpt2-chatbot показал невероятное понимание как создать, анимировать и даже визуализировать объекты. В моем случае я попросил создать симуляцию столкновения двух нейтронных звезд и примерно рассчитать масштаб черной дыры и визуально показать ее. Очень хорошо видеть в сравнение со второй рандомной(Qwen и gemini-1.5-pro-api-0409-preview) моделью, как im-a-good-gpt2-chatbot превосходит другие модели и выдает рабочий, сложный код.

Пока я прошу перевести код в Blender API(что он тоже прекрасно делает) поглядите на симуляцию столкновения двух нейтронных звезд одинакового размера.

А Денис успел раньше игру запилить.

P.S. Модель хорошо сгенерировала svg вариант текстового сторис для инсты и даже запилила полноценный код с использования controlnet и кастомных моделей в diffusers. Это очень мощно.

Читать полностью…

Daniilak — Канал

Недавно показали Streamlit – питоновская библиотека для разработки веб-приложений. В том числе для интерактивных визуализаций и мини-дэшей.

Хороший дизайн и даже их дизайн система в открытом доступе!

Примеры приложений:
- prettymap
- генератор твитов
- showflake health

Очень напоминает shiny 💫

Украл отсюда

Читать полностью…

Daniilak — Канал

Статистика цен на недвижимость на основе всех объявлений недвижимости + в разрезе регионов

Потыкать можно тут


Будут лайки, доделаю до текущей даты

Читать полностью…

Daniilak — Канал

В России впервые оштрафовали за воровство идеи для рилса. Блогер по теме недвижимости пожаловался в суд на риелтора, который нагло украл его идею для видео.

Суд принял решение оштрафовать плагиатора на 300 тысяч рублей.
Теперь нужно будет придумывать свои идеи самостоятельно

Юристы: о, это что? Новый заработок?

Читать полностью…

Daniilak — Канал

Когда работаешь на удаленке

Читать полностью…
Subscribe to a channel