Пишу о технологиях и датасетах, немного ML Рекламирую Чебоксары
Готовимся к длительному отключению интернета
Если в ближайшее время интернет может пропасть на несколько недель или даже месяцев, лучше подготовиться заранее. Вот что стоит скачать на телефон:
🗺 Офлайн-карты
• С открытыми данными (OpenStreetMap): CoMaps, Organic Maps, OsmAnd
• Коммерческие решения: 2ГИС, Яндекс.Карты
📚 Офлайн-энциклопедии
• Kiwix – вся Википедия без подключения к сети
📡 Мессенджеры для работы через Bluetooth/Wi-Fi Direct
• Bridgefy
• Briar (для Android)
🤖 Офлайн-нейросети
• Enclave – локальный ИИ-ассистент
Рекомендую загрузить модели: Gemma 3n E2B (2B) или Gemma 3n E4B (4B)
⚠️ Важно! Все приложения нужно заранее открыть, скачать необходимые данные и настроить – без этого они не будут работать без интернета.
Для Android-устройств выбор больше из-за бóльшого количества зоопарка приложений
У меня на Kaggle уже несколько месяцев есть достижение Dataset Expert.
Если датасеты получат достаточно апвоутов, я получу следующий уровень — Dataset Master
В Чебоксарах отключают мобильный интернет «ради безопасности», хотя в регионе достаточно одного лишь открытого списка из 1651 Wi-Fi-точек с уникальными MAC-адресами. Про них тактично «забыли»? Или опять не спросили технарей? Ах да, технари же такие, что HTTP от HTTPS отличить не могут...
Читать полностью…Опубликовал датасет движения общественного транспорта Чебоксар
31.5 миллион строк
Датасет содержит ежедневные записи и метаданные движения общественного транспорта в Чебоксарах за период с 22.04.2025 по 03.07.2025. Каждый файл соответствует одному «транспортному дню» (граница дня определяется по фактическому завершению движения транспорта, а не по полуночи).
Датасет подходит для:
— Аналитики общественного транспорта
— Пространственно-временного моделирования
— Исследований городской мобильности
— Машинного обучения на реальных траекториях транспорта
HuggingFace
Kaggle
Let's Encrypt выпустил первый сертификат для IP-адреса.
Это отличное решение, если у вас есть сервер для личного использования и вы хотите настроить HTTPS, но не желаете тратиться на домен — такие сертификаты решают эту проблему
Anthropic выкупила, отсканировала и потом уничтожила миллионы физических книг для обучения своего ИИ Claude
Согласно действующему законодательству, компаниям, работающим в сфере ИИ, не нужно получать разрешение владельцев авторских прав для обучения своих больших языковых моделей, если книги были приобретены законно. Поэтому Anthropic извлекала страницы из переплётов печатных книг для сканирования и создания цифровых копий. А оригиналы позже уничтожила для «экономии места»
И бинго! — они использовали в том числе и миллионы пиратских книг. Ведь это тоже формально не нарушает закон
Собственно, Anthropic стала не первой, кто применяет подобные практики. Аналогично действовал и Цукерберг
Новый амбассадор Букета Чувашии с березовым соком?
Читать полностью…А теперь о важном 🌷
В игре Шарарам в Стране Смешариков
с начала мая 2025 года пропала игра "Урок волшебного карандаша" (аналог Крокодила)
На вершине рейтинга багхантинг платформы HackerOne оказался ИИ-бот, сообщив рекордное число уязвимостей. За разработкой бота стоит выходец из GitHub
Бот находил в них ошибки просто потому, что он бот и ему всё равно на сумму вознаграждения
Суды в 202Х году:
Слушаем показания первого свидетеля:
— В своём Telegram-канале я написал, что...
Слушаем показания второго свидетеля:
— А я в своём Telegram-канале написал, что...
В конце судья заявляет:
— Решение суда опубликовано в моём платном Telegram-канале
Вроде бы мой первый сайт на юкозе... 2011 года
сейчас не работает
https://chuvnumizmat.ucoz.ru/
6 инструментов для преобразования кода в диаграммы
• Diagrams — универсальный инструмент для создания различных диаграмм с использованием текстового кода, поддерживающий Python и JavaScript
• Mermaid — использует синтаксис, похожий на Markdown, для генерации блок-схем, последовательностных диаграмм и диаграмм Ганта
• Markmap — использует Markdown-синтаксис для визуализации структуры и связей идей или кода
• ASCIIFlow — инструменты для создания диаграмм в формате ASCII-арта с использованием обычного текста, такие как asciiflow и Monodraw
• PlantUML — популярный инструмент с открытым исходным кодом для создания диаграмм классов, активности и развертывания, поддерживающий множество языков программирования
• GoDiagram — аналог Diagrams, но на языке Go
#сервисы@daniilak
Давно надо было об этом написать — ещё девять месяцев назад. Я часто смотрю видео одного стримера и ютубера, философия его роликов мне близка — это PWGood. Его фанаты собрали целый плейлист, где он поёт нейроголосом, а многие думают, что это действительно его голос.
Мысль 1.
Учитывая, как легко блогеры выставляют свою жизнь напоказ, а современные технологии позволяют проводить элементарный OSINT, мошенникам не составит труда использовать истории из инстаграма для вымогательства.
Мысль 2.
Я (или не я) ж могу сделать видео с нейроголосом многих чувашских блогеров
Работать с вектором в разы приятнее
Картины по номерам готовы?
Только сейчас заметил, что на сайте калькулятора для расчета будущей пенсии вбиты ограничения в качестве заработной платы (до вычета НДФЛ) в размере 229 916 рублей
https://es.pfrf.ru/pensCalc/
А что, дальше цифр нет?
Теперь в Veo3 можно загружать свои фото и генерировать видео
Количество более качественного сгенерированного видеоконтента: 📈📈📈
Заметил очередной фейк в Telegram-каналах
«Мессенджер Max перманентно получает доступ к камере, местоположению, галерее, root-правам и паролям от других сервисов, работает в фоне без возможности завершения через диспетчер задач и использует jar-файлы для скрытого внедрения».
Росстат окончательно засекретил данные о количестве людей в России. Последнее обновление заканчивается мартом
Читать полностью…Пока в городе перестал работать мобильный интернет, готовлю к публикации датасеты передвижений общественного транспорта Чебоксар за май и июнь
Читать полностью…Последние две недели кропотливо создаю векторные изображения: чувашские орнаменты, символы и узнаваемые здания. Планирую собрать из них бесплатный эмодзи-пак для Telegram. Идея open source мне близка, и я хочу просто выложить работу со словами "Пользуйтесь!", но, видя примеры вокруг, задумываюсь и о какой-то отдаче.
Варианты есть: добавить ссылку на канал в название эмодзи-пака, выложить некоторые векторы с открытой лицензией или...?
Хм... Сложно найти ту самую золотую середину
Как развить насмотренность в Чебоксарах? Публикую секретный метод
Обязательно подпишитесь на ВСЕ местные паблики и новостные порталы, там вы будете первыми узнавать о культурных событиях города... с задержкой всего лишь в несколько месяцев
Узнаете о старте набора на мастер-класс? Поторопитесь — возможно, он уже заканчивается
Информация в телеграм-каналах о Чебоксарах – это как винтаж. Вы узнаете о событиях, которые уже стали частью истории культурной жизни Чебоксар. Изучайте их ретроспективно
Так можно сказать не о всех чатах или организациях, но тенденция порой прослеживается
А еще небольшой секрет: первое время новые заведения созывают всех блогеров, дабы прорекламировать свой бренд, а после нескольких дней рекламы можно забыть про качество
Анализ ответов на публичные обращения ("Решаем вместе") показывает печальную закономерность: вместо конкретных решений граждане получают однотипные отписки. Независимо от проблемы — будь то ямы во дворе или сломанные детские площадки — в ответах звучит одно: "инициативное бюджетирование".
Выделяется три типа стандартных ответов:
— Отказ с предложением софинансирования
— Отчёт о прошлых ремонтах
— Предложение собрать деньги без пояснений.
Выпускаю второй клип, чтобы наглядно продемонстрировать этот конвейер
Первый здесь
Сервис ShadeMap позволяет смоделировать расположение теней от зданий, деревьев и гор для выбранного места, даты и времени 😍
А также показывает, как долго солнце будет освещать разные территории – часы инсоляции ☀️
Украл отсюда
#сервисы@daniilak
В МФЦ Чувашии появится голосовой помощник на основе искусственного интеллекта на чувашском языке. ИИ-ассистент для терминалов и сайта МФЦ будет разработан и внедрён в сотрудничестве с компанией «Яндекс» в течение двух лет
https://minec.cap.ru/press_center/news/2025/06/27/v-mfc-chuvashii-vnedryat-golosovogo-ii-pomoschnika-govoryaschego-na-chuvashskom-yazike
Интересно, на каких датасетах и движке это реализовывается
Ох, эти бесценные админы чатов при поддержке государства...
Прошу их скрыть список участников — там, внезапно, конфиденциальная информация. А они, вместо логичных действий, с невозмутимым спокойствием жмут «заблокировать».
Ну конечно, какой ещё ответ? Разбираться — это ж лишние телодвижения, а бан — он как мантра: «нет человека — нет проблемы»
Пока гуглил, наткнулся на сервис: оказывается, кто-то спарсил все ЖК из разных городов и автоматически создаёт телеграм-чаты под каждый новострой. Вот, например, ссылка по Чебоксарам: https://cheboksary.chatnovosela.ru/novostroyki, а ещё они продвигают это как «Первый национальный мессенджер»: https://sosedi.chat/. Опять какой-то ноунейм стал "первым"
Но самое забавное — это то, как устроены их чаты. Туда накидали кучу админов-ботов, которые следят за общением и автоматически публикуют рекламу. Вот такой вот «социальный» подход к соседским чатам...
MarkItDown — открытый инструмент на Python для преобразования файлов и офисных документов в Markdown
Например, там можно сконвертировать файлы из Office в язык разметки с синтаксисом форматирования простого текста Markdown
Решение написано на Python и опубликовано на GitHub под лицензией MIT
#сервисы@daniilak
Ко Дню Чувашской Республики хочу предложить местным мастерам и предпринимателям набор векторных файлов в разных форматах.
Я давно заметил, что спрос на дизайн с чувашской тематикой растёт, но выбор узнаваемых и свободных для использования символов часто ограничен. В основном это чувашские рунические знаки, такие как популярный символ «Сердце Чувашии» (переработанный Павлом Поповым). Однако из-за их широкого применения возникают сложности с уникальностью и авторскими правами, что может ограничивать творчество и приводить к однотипным решениям.
В качестве альтернативы я создал набор векторных изображений Монумента Матери-Покровительнице в Чебоксарах (скульптор В. Нагорнов, архитекторы В. Филатов, Ю. Новосёлов, А. Орешников). Этот узнаваемый символ часто используется в сувенирной продукции
Предлагаю этот векторный файл бесплатно. Он частично нарисован вручную, частично доработан с помощью нейросетевых моделей, масштабируется без потерь и может стать основой для уникальных дизайнов — добавляйте орнаменты, надписи, цветовые решения.
Файлы (в комментариях) распространяется по лицензии Creative Commons CC BY 4.0. Это означает, что вы можете свободно использовать его в коммерческих и некоммерческих целях, а также изменять и дорабатывать изображение. Однако важно помнить, что лицензия применяется только к моей векторной интерпретации монумента, а не к оригинальному монументу.
Надеюсь, эти материалы будут полезны в вашей работе и вдохновят на новые идеи!
С Днём Чувашской Республики! 🎉
в целом, florence-2 лучше распознает и описывает изображения сканов
Однако на всякий случай необходимо будет самостоятельно разметить несколько книг
После обращения в Роскомнадзор поменялись пункты политики конфиденциальности.
Исчез пункт о снятиии ответственности с компании за утечки.
Появились новые пункты касаемо передачи персональным данным в том числе и третьим лицам с прямым указанием офиса в государстве Республика Молдова и сервера, что находится в Selectel (Ленинградская область).