Пишу о технологиях и датасетах, немного ML Рекламирую Чебоксары
6 инструментов для преобразования кода в диаграммы
• Diagrams — универсальный инструмент для создания различных диаграмм с использованием текстового кода, поддерживающий Python и JavaScript
• Mermaid — использует синтаксис, похожий на Markdown, для генерации блок-схем, последовательностных диаграмм и диаграмм Ганта
• Markmap — использует Markdown-синтаксис для визуализации структуры и связей идей или кода
• ASCIIFlow — инструменты для создания диаграмм в формате ASCII-арта с использованием обычного текста, такие как asciiflow и Monodraw
• PlantUML — популярный инструмент с открытым исходным кодом для создания диаграмм классов, активности и развертывания, поддерживающий множество языков программирования
• GoDiagram — аналог Diagrams, но на языке Go
#сервисы@daniilak
Давно надо было об этом написать — ещё девять месяцев назад. Я часто смотрю видео одного стримера и ютубера, философия его роликов мне близка — это PWGood. Его фанаты собрали целый плейлист, где он поёт нейроголосом, а многие думают, что это действительно его голос.
Мысль 1.
Учитывая, как легко блогеры выставляют свою жизнь напоказ, а современные технологии позволяют проводить элементарный OSINT, мошенникам не составит труда использовать истории из инстаграма для вымогательства.
Мысль 2.
Я (или не я) ж могу сделать видео с нейроголосом многих чувашских блогеров
Работать с вектором в разы приятнее
Картины по номерам готовы?
Только сейчас заметил, что на сайте калькулятора для расчета будущей пенсии вбиты ограничения в качестве заработной платы (до вычета НДФЛ) в размере 229 916 рублей
https://es.pfrf.ru/pensCalc/
А что, дальше цифр нет?
В России начали «устаревать» серверы Cloudflare.
Для разработчиков: из аналогов в России есть DDoS Guard, от 8000 рублей в месяц, и Curator, от 23 тысяч рублей в месяц
Для пользователей: вы не сможете играть во многие онлайн-игры, заходить на зарубежные сайты без установки запрещенного ПО из трех букв
Прошло пару дней как я обновил свой iPhone 12 Mini до iPhone 16 Pro. Долгое время не хотел переходить на лопаты, но в этот раз решился. Приобрел смартфон в местном магазине и, к своему удивлению, получил японскую версию. К счастью, проблему с обязательным звуком затвора камеры удалось решить — помогла установка российской eSIM-карты.
Я никогда не использую защитное стекло на телефоне. Легкие царапины меня не пугают, а продавать устройство как «идеально новое» я не планирую. В этом плане моя философия схожа с подходом сестер Олсен к своим сумкам — главное функциональность, а не безупречный внешний вид. Чехол, пожалуй, возьму, но только с маркетплейсов или AliExpress — переплачивать перекупщикам не вижу смысла.
С камерой нового iPhone всё довольно интересно. Для меня фотографии делятся на две категории: информативные и эстетичные. Зачастую красивые снимки не несут полезной информации, а мне, как человеку, который фиксирует изменения в городской застройке, важна именно содержательная часть. Впрочем, теперь у меня есть возможность завести рубрику с обоями — качество позволяет. Само качество съемки действительно улучшилось, но ночью иногда ловишь странные артефакты, особенно с балансом белого. Впрочем, это не критично, а скорее привычно.
Одна и та же iOS на разных устройствах работает по-разному. На старых моделях многие функции урезаны, поэтому приходится буквально заново осваивать систему. В целом всё стало быстрее и плавнее, хотя один классический баг уже успел проявиться — в поиске приложений пропала клавиатура.
Зато теперь у меня есть LiDAR, и я наконец-то могу сканировать микрорайоны и выгружать дороги в 3D
В Национальной Библиотеке Чувашской Республики теперь можете бесплатно взять вот такие наклейки!
Хочется двигаться дальше в этом направлении и выпускать в виде коллекций. В этот раз не указал копирайты, надо будет это сделать.
Пока работаем над конкретной большой коллекцией. Перерисовка изображений используется через нейросетевые модели. Есть некоторые изображения, что сделаны на основе карт Open Street Maps.
Глубже изучая эту тему, я немного поражаюсь агрессией со стороны художников и воровством контента для продажи со стороны обычных генераций. Хотя… если прикопаться, то воруют даже «настоящие» художники
Кстати, ранее я делал мерч для Иннополиса и других организаций в Corel Draw… если бы раньше был бы доступен Pro Create или нейросетевая генерация, было бы гораздо легче работать
А еще я забыл сделать норм фото:)
Забирайте 4 набора эмодзи с чувашскими символами
❤😍💅
/channel/addemoji/ducknet21
❤😍🔥
/channel/addemoji/emoji_Duck_by_TgEmodziBot
❤🙏🫶
/channel/addemoji/MolodezhChuvashii
❤❗🌳
/channel/addemoji/LoveChuvash
GitLab добился значительного сокращения времени создания резервных копий крупных репозиториев — с 48 часов до 41 минуты. Подробности оптимизации описаны в официальном блоге компании
Как выяснилось, проблема заключалась в функции Git, созданной ещё в 2009 году. Из-за высокой алгоритмической сложности при обработке большого количества ссылок эта функция:
— замедляла процесс создания бэкапов
— потребляла до 80% времени на удаление дубликатов
Решение пришло с заменой устаревшего механизма на современный подход с использованием map (ассоциативного массива). Новый метод автоматически предотвращает дублирование ссылок и требует минимальных временных затрат
В результате оптимизации время создания резервной копии самого большого репозитория GitLab сократилось с двух суток до 41 минуты.
Потратил весь вечер на генерацию карты на основе данных OpenStreetMap, используя спрайты, созданные через ChatGPT
https://mapcheb.ru/medieval_map/
Играясь с категориями объектов и спрайтами надо попробовать сделать в стиле линогравюры
Давно искал удобный инструмент для рисования полигонов на карте и экспорта в GeoJSON — https://geojson.io/
Основные возможности:
Рисование полигонов, линий и маркеров.
Работа с картами OpenStreetMap.
Экспорт данных в GeoJSON (стандартный формат для GIS и веб-карт).
Простое редактирование и сохранение результатов.
#сервисы@daniilak
Добавлен небольшой новый функционал на странице https://mapcheb.ru/bus (вкладка "По дням")— теперь отображается список транспорта, который появлялся на карте хотя бы один раз за день. Таблицу можно экспортировать в CSV-формат и открыть в Excel.
Пока есть две проблемы:
1. Данные загружаются в недостаточно производительную базу данных, из-за чего страница долго открывается. Этим нужно будет заняться.
2. В текущей реализации сутки считаются с полуночи, но транспорт примерно работает до часу ночи. Например, транспорт, работающий сегодня после полуночи, в статистике будет отображаться как "завтрашний". Надо это тоже учесть
Продолжая изучать архивные книги и PDF-документы, я пришёл к выводу, что стоит создать коллекцию чувашских орнаментов, которую творческие мастера смогут использовать в своих работах.
Суть в том, что многие произведения по закону перешли в общественное достояние
MarkItDown — открытый инструмент на Python для преобразования файлов и офисных документов в Markdown
Например, там можно сконвертировать файлы из Office в язык разметки с синтаксисом форматирования простого текста Markdown
Решение написано на Python и опубликовано на GitHub под лицензией MIT
#сервисы@daniilak
Ко Дню Чувашской Республики хочу предложить местным мастерам и предпринимателям набор векторных файлов в разных форматах.
Я давно заметил, что спрос на дизайн с чувашской тематикой растёт, но выбор узнаваемых и свободных для использования символов часто ограничен. В основном это чувашские рунические знаки, такие как популярный символ «Сердце Чувашии» (переработанный Павлом Поповым). Однако из-за их широкого применения возникают сложности с уникальностью и авторскими правами, что может ограничивать творчество и приводить к однотипным решениям.
В качестве альтернативы я создал набор векторных изображений Монумента Матери-Покровительнице в Чебоксарах (скульптор В. Нагорнов, архитекторы В. Филатов, Ю. Новосёлов, А. Орешников). Этот узнаваемый символ часто используется в сувенирной продукции
Предлагаю этот векторный файл бесплатно. Он частично нарисован вручную, частично доработан с помощью нейросетевых моделей, масштабируется без потерь и может стать основой для уникальных дизайнов — добавляйте орнаменты, надписи, цветовые решения.
Файлы (в комментариях) распространяется по лицензии Creative Commons CC BY 4.0. Это означает, что вы можете свободно использовать его в коммерческих и некоммерческих целях, а также изменять и дорабатывать изображение. Однако важно помнить, что лицензия применяется только к моей векторной интерпретации монумента, а не к оригинальному монументу.
Надеюсь, эти материалы будут полезны в вашей работе и вдохновят на новые идеи!
С Днём Чувашской Республики! 🎉
в целом, florence-2 лучше распознает и описывает изображения сканов
Однако на всякий случай необходимо будет самостоятельно разметить несколько книг
После обращения в Роскомнадзор поменялись пункты политики конфиденциальности.
Исчез пункт о снятиии ответственности с компании за утечки.
Появились новые пункты касаемо передачи персональным данным в том числе и третьим лицам с прямым указанием офиса в государстве Республика Молдова и сервера, что находится в Selectel (Ленинградская область).
Дорогой дневник... про OpenAI выпустили дневник с их косяками. Вот бы подобное и по ру-компаниям
openaifiles.org
#сервисы@daniilak
Выводят ли боты с искусственным интеллектом культурное наследие из строя? [1] свежий доклад Макла Вайнберга из GLASB e-Lab посвящённый тому что ИИ боты нарушают работу открытых культурных ресурсов.
И это куда серьёзнее чем ранее существовавшие проблемы открытого доступа, теперь ИИ боты напрямую злоупотребляют открытостью и от них отбиваются с помощью многочисленных CDN и иных сервисов блокирующих любое индексирование сайтов и проверяющих доступ к материалам на "человечность" запрашивающего.
Почитать стоит о том что теперь поддержание открытых коллекций стоит существенно дороже и о разных мерах применяемых к ботам, самые радикальные из этих мер - это блокировка по географии, когда блокируются некоторые страны. Например, я знаю довольно много онлайн ресурсов которые более не открываются с IP адресов относимых к России и к Китаю именно по этой причине.
При всех полезных сторонах ИИ, есть реальная угроза того что многие общедоступные культурные ресурсы будут уходить в режим доступа только после авторизации и их доступность будет существенно снижаться.
#opendata #culturalheritage #readings
Мир до ИИ-генераций наглядно
Часто для какого-нибудь мероприятия дизайн делал так:
🔹 Плакаты и раздатка — использовались векторы с Freepik Качал, переделывал в Corel Draw, а также — собирал в MS PowerPoint 2010.
🔹 Photoshop избегал как огня — растрясёт пиксели, сломает шрифты, испортит печать, а найти качественного человека, который не пропадёт после получения аванса (возрадуйтесь, если будут деньги) — редкость.
🔹 Большинство мероприятий нужно было готовить быстро, поэтому в работу шло всё, что попало в память. Кусочки инфографики с сайтов, цветовые композиции с сериалов и улиц и т.д.. В голове сразу складывался образ будущего макета – набор прямоугольников
Сейчас нейросети генерируют варианты за минуту: поправить, переделать, посмотреть – легко. А тогда каждый макет был ручной сборкой с кучей костылей. Хотя, если честно, текущее "ИИ" — очередной костыль.
С архитектурой сайтов история похожая, но об этом – в следующий раз
P.S. Шрифты не установлены, но вы можете представить у себя сами в голове какой-нибудь Bebas или Proxima Nova
Касаемо фотошопа есть классическая фраза: "ой, а мы не знали, что вы хотите печатать в формате А3, мы нарисовали в формате А6"
Начал использовать YOLOv8 для вытаскивания изображений из сканов, но пока что-то идет не так 😐😐😐
Код проекта здесь
Понадобился зоопарк нейросетевых моделей, чтобы получить это 🤪
Читать полностью…Вечернее обновление по https://mapcheb.ru/library/
Продолжаю работу с выгруженными PDF-файлами. Хорошие новости: теперь доступен каталог и удобный постраничный просмотр документов
Как это работает?
Выбираете нужный PDF и открываете его.
Пролистываете вниз — там автоматически подгрузятся метаданные публикации (год, автор, описание и т. д.).
Пока основной парсер мета-данных в процессе, но базовый функционал уже удобен для использования. Если есть замечания или предложения — пишите
Почему вместо ремонта — демонтаж?
В последнее время обращаю внимание на странную тенденцию по мониторингу обращений в регионе: сломанные детские и иные площадки не ремонтируют, а просто демонтируют
И вот что удивляет больше всего: спустя пару лет после демонтажа в ответ на обращения граждан вдруг выясняется, что новую площадку можно установить... но только при условии софинансирования со стороны жителей.
Ситуация выглядит так:
Сначала убирают старое → потом предлагают жителям скинуться на новое
Изучая старые сканы pdf, увидел четкое изображение чувашского сердца в книге 1949 года (Редактор С. Эльгер)
Вы можете почитать историю появления современного сердца Чувашии на сайте — https://visitvolga.ru/blog/heart-history/
В комментариях — генерация чувашского шрифта в виде вышивки от chatgpt.com
UPD. Ранее где-то я делился сервисом от гугла, который генерирует конкретные PNG изображения каждой буквы алфавита — вот ссылка — https://labs.google/gentype
Удалось протестировать модельку Reve, которая из коробки хорошо понимает советскую эстетику и длинные промпты
Можно генерировать бесплатно (лимит сбрасывается ежедневно) и быстро по 4-8 фото, вход через Google
В телеграм-каналах мастера промптов уже поделились своими шедеврами, но как обычно, не поделились промптами) Подробнее здесь
Команда YandexART выложила результаты своей работы — датасет Alchemist. Он состоит из 3 350 пар «картинка-текст» и имеет лицензию Apache 2.0
Есть фотографии взятые из ВК, например:
https://huggingface.co/datasets/yandex/alchemist/viewer/default/train?q=userapi