SiteSputnik v.11.3.9.3 от 13.12.2024
■ О поиске утечек.
● Первый способ - специальный поиск при помощи Google.
♢ Утечки ищутся по 49 сайтам утечек, список которых на ссылке "Утечки".
♢ Импортируйте этот поиск в SiteSputnik (файл импорта - на ссылке) или обновите полностью "Настройку поиска".
● Ещё один способ поиска утечек из программы SiteSputnik.
♢ Открываете "Нишевый поиск". Он в подменю "Золотого ключика".
♢ Вставляете слева сайты, можно их просто скопипастить отсюда.
♢ Справа задаете запрос или несколько запросов.
♢ Выбираете поисковики, они внизу.
● У второго способа есть минусы и плюсы.
° Минусы: работает медленнее, больше мусора, если используется не только Google.
° Плюсы: сами можете добавлять или удалять сайты утечек или другие произвольные сайты, сами указываете какие поисковики использовать, сразу можете задать несколько запросов.
SiteSputnik v.11.3.8 от 01.11.2024
● Открываю программу SiteSputnik.
● Формирую Пакет запросов, например, про космонавтику, в котором обращаюсь к "Нейро от Яндекса", другими словами, YandexGPT (см. по красной стрелочке).
● Получаю выдачу, размещенную на ссылке: Космонавтика (взято живьём из программы, посмотрите - будет интересно).
● Формально говоря, в очередную версию СайтСпутника добавлена работа с Нейро от Яндекса, которая "дружит" с любыми другими функциями программы, а не является её обособленной функцией. Это просто ещё один очень хороший Источник информации.
● К слову будет сказано, часто наблюдаю в Телеграме информацию о дорках (списки различных дорков). Их можно тоже прописывать в Пакете запросов, но отправлять на другой Источник, как правило, на Google.
SiteSputnik v.11.3.7 от 22.10.2024
● Улучшения для англоязычной версии.
● Улучшения в компоненте +Server.
● Yahoo: адаптация к изменениям исходного кода поисковых страниц сайта.
● Поиск по ТикТок добавлен в сценарий "Соцсети" и включен в дистрибутив программы. Файл его импорта в СайтСпутник по адресу: поиск по TikTok.
● Напомню. Если Вы сами ничего не создавали на вкладке "Сценарии", то есть сценарии и отдельные поиски у Вас стандартные, то можете просто обновить стандартный сценарий следующим образом:
? - Обновления и установки - Установить последние Сценарии
SiteSputnik v.11.3.6 от 14.10.2024
● Источник NewsBrief.eu - очень хороший поток Европейских новостей и не только, но на примерно 100 разных языках (не только европейских). Новости выдаются друг за другом вперемежку - читать очень затруднительно.
● Если выполнить такой Проект:
http://newsbrief.eu/
то получим выдачу, в которой сниппеты разноязычные.
Если применить компоненту Полиглот из СайтСпутника, составив такой проект:
http://newsbrief.eu/ ^^Язык Распознать!
то получим выдачу полностью на одном русском языке
Смотрите по ссылке Европейские новости - слева многоязычная выдача, справа всё на русском языке. Скопировано живьём из программы из одновременно запущенных двух проектов.
Если добавить в Проект одну или несколько Рубрик на русском языке, например:
Рубрика://Страны/Россия/Люди/Путин
(Владимир | Президент) /1 Путин*
то получим полнотекстовую выдачу на русском языке.
Смотрите по ссылке Владимир Путин
Добавлять в Рубрику правила: (Vladimir | President) /1 Putin и ещё множество подобных на других Языках не нужно, потому что правило из Рубрики будет применяться к уже переведенным на русский язык текстам новостей.
Файл импорта Сценария в СайтСпутник по адресу: Евросоюз - новости и поиск. В сценарии есть ещё поиск по newsbrief.eu.
В последний дистрибутив этот Сценарий уже включен.
SiteSputnik v.11.3.5.3 от 19.09.2024
● Для проекта из предыдущего поста пример выдачи Телеграм, на которой для телеграм-канала "Государственная Дума – Telegram", кроме новых сообщений, можно увидеть обнаруженное программой удаленную информацию, а именно, сообщение под номером 10052 (-/channel/dumainfo/10052).
SiteSputnik v.11.3.4.4 от 13.08.2024
● government.ru - улучшения и исправления (сделано срочно)
SiteSputnik v.11.3.4 от 26.06.2024
● Экспорт содержания и адресов ссылок для Рубрик - https://sitesputnik.ru/Help/SSRubriki.htm#url .
SiteSputnik v.11.3.3.6 от 05.06.2024
Улучшения, исправления, адаптация:
● Темная тема программы и сайта https://sitesputnik.ru/.
● Повторное открытие неоткрывшихся источников - параметр.
● Объединение одноименных рубрик из разных проектов - функция.
SiteSputnik v.11.3.3.3 от 13.05.2024
● Адаптация к изменения на ЦИАН и ДЗЕН.
● hh.ru и Авито: мониторинг вакансий для соискателей.
SiteSputnik v.11.3.3.1 от 07.04.2024
● "Механизм подбрасывания": вставка в новостные и другие сообщения "чужих" текстов
● Менеджер подключения новостных источников: повышена устойчивость к внешним форс-мажорным событиям.
SiteSputnik v.11.3.2.34 от 24.03.2024
● Spider: сканирование сети роботом по запросу - развитие
SiteSputnik v.11.3.2.31 от 14.03.2024
● government.ru/all/rss: рубрикация PDF-файлов,
размещенных на ссылках из RSS-потока
● Улучшены заголовки PDF-файлов в выдаче.
SiteSputnik v.11.3.2.29 от 12.03.2024
● Для тех, кто больше "любит" Google, чем Яндекс,
в Настройках на вкладке Pro добавлен параметр:
"Применять Google раньше Яндекса".
Если оба поисковика задействованы в Сценарии,
то сначала отработает Google.
SiteSputnik v.11.3.2.26 от 04.03.2024
● regulation.gov.ru: доступ и анализ контента очень глубоко "запрятанных под скриптами" офисных файлов.
● Улучшены заголовки офисных файлов в выдаче.
● Режим администратора - открытие доступа к "Настройка сайтов" и некоторым другим функциям.
SiteSputnik v.11.3.2.23 от 26.02.2024
Исправления для поиска по Bing и Google.Новости.
https://sitesputnik.com/files/pic/recognizing.png
SiteSputnik v.11.3.9 от 07.12.2024
● Об анализе текстов, размещенных в содержании ссылок на "картинках" (в графических файлах).
● Два небольших примера выдачи, скопированной из СайтСпутника:
♢ Для Телеграм
♢ Для Авито - поиск квартир по сценарию. Номера телефонов в Авито размещены на картинках, до которых ещё нужно "докликаться".
▫️ На блёкло-жёлтом фоне сразу за картинками следуют распознанные на них тексты. Их можно анализировать "на равных" с обычными текстами, размещенными на самих ссылках.
● По моему не очень большому опыту:
♢ в "среднем" распознаётся около 75% текстовой информации, но многое сильно зависит от Источников.
♢ замедление вычислительного процесса заметное - в среднем около 1-3 сек. на картинку, количество которых на ссылках бывает большим.
● Исходя из этого и того, что реально анализ "картинок" востребован далеко не всегда, рекомендую использовать данный инструмент только при необходимости.
● Для этого нужно сделать следующее.
♢ В Настройках на вкладке "Общие" установить галочку у нового параметра "Распознавать тексты на графических мультимедиа"
♢ Это действие приведёт к появлению подсказки, которая содержит два пункта:
1) откуда скачать и куда поместить дополнительное программное обеспечение, написанное в рамках платформы SiteSputnik;
2) ссылка на GitHub на бесплатное стороннее программное обеспечение, которое, собственно, и осуществляет основные действия по распознаванию текстов.
● Состояние разработки данной функции - Бета-версия.
SiteSputnik v.11.3.7.3 от 28.10.2024
● О поисковике DuckDuckGo.com:
1) Отдаёт в выдачу до 2000 ссылок за один поиск,
это больше чем Яндекс и Гугль, они - до 250.
2) Среди этих ссылок не мало "старых".
3) DuckDuckGo добавлен в дистрибутив программы:
и в Метапоиск, и в главный Сценарий поиска.
При желании Пользователь может отказаться от этого.
В Сценарии "Ещё поисковики" DuckDuckGo оставлен.
Например, по запросу "Россия" DuckDuckGo, Яндекс и Гугль
отдали, соответственно: 1934, 223 и 246 уникальных ссылок.
Все ссылки релевантные задаваемым запросам.
Тем кто ищет и собирает информацию рекомендую однозначно.
Файл импорта в Метапоиск и главный Сценарий - на ссылке.
SiteSputnik v.11.3.5.4 от 30.09.2024
● Поиски по форумам BoardReader по РФ и миру подключены, добавлены в сценарий "Blog - поиск в блогах" и включены в дистрибутив программы. Файл импорта в СайтСпутник по адресу: поиски по форумам. Подсмотрел здесь - mycroftintel.
SiteSputnik v.11.3.5 от 10.09.2024
● WebSpider: отслеживание удаленного контента ссылок по сложному критерию (по запросу).
● Пример проекта для мониторинга Телеграм.
SiteSputnik v.11.3.4.1 от 27.07.2024
● Параметр "Интернет недоступен: остановиться и ожидать его доступности (от 0 сек. до 10 суток)", - увы, это стало жизненно необходимо.
● Исправления в компоненте +WebSpider: устранена иногда появлявшаяся "лишняя" информация при мониторинге Телеграмм-каналов
SiteSputnik v.11.3.3.7 от 18.06.2024
● Оператор "^^Проект новый": улучшения
● Планировщик задач: удаление выполненных Подзадач (Проектов) из расписания
● Параметр "Не учитывать параметры ссылки": можно перед занесением в список уникальных ссылок удалять не только параметры, но и любые лексемы ссылки
SiteSputnik v.11.3.3.4 от 21.05.2024
● Рубрикация HTML-кода документов как обычных текстов.
SiteSputnik v.11.3.3.2 от 07.05.2024
● Суды Верховный и Арбитражный: файл импорта сценария поиска по базе данных этих судов
SiteSputnik v.11.3.3 от 01.04.2024
● Server: в Планировщик добавлена опция "Другие FileForFiles",
позволяющая ему работать с несколькими СайтСпутниками.
Подробнее на ссылке: SiteSputnik+Server
SiteSputnik v.11.3.2.32 от 20.03.2024
● Улучшена функция обновления версии программы.
● Встроенный браузер на движке Chromium - улучшения.
● Исправления в процедуре авторизации на сайтах.
SiteSputnik v.11.3.2.30 от 13.03.2024
● Редактирование англоязычного интерфейса программы.
SiteSputnik v.11.3.2.27 от 07.03.2024
● zakupki.kontur.ru: адаптация к изменениям исходного кода некоторых страниц сайта в Проектах СайтСпутника.
SiteSputnik v.11.3.2.25 от 29.02.2024
● Улучшение внешнего вида сниппетов для Яндекса и Yahoo.
● AVITO.ru: отредактирована работа с профилями пользователей для Проектов.
● URL: исправление для очень редко встречаемой формы записи адресов ссылок.