Первый шаг - обучение ворд2век. Делали обучение на корпусе русского языка и википедии. Не очень.
Переобучили на тематических поисковых запросов.
Использовали методы дистрибутивной семантики. А именно word2vec
Для определения сем. близости
Специалист все равно понимает, что речь о "пневмонии".
Поисковая система также с помощью нейросетей понимает, о чем речь
Короче, говорит о проблемах кластеризаторов. Дублирование кластеров (сделать сайт и заказать сайт - они делают разные кластеры); Плохая разбивка с учётом региональностей и пр
Читать полностью…Начинаем среднюю секцию. Первый - Саша Ожгибесов, "Исследование сервисов кластеризации"
Читать полностью…Начал раскрывать. Гугл ни разу не забанил за пф. А Яндекс да. "Тем самым разрушает малый бизнес и экономику России"
Читать полностью…То есть на сколько близки те или иные слова в семантическом массиве. Чтобы потом использовать эти слова в тексте
Читать полностью…Скорее всего текст с этими словами текст про "как приготовить драники", ПС это понимает
Читать полностью…То что, кстати, Сливинский недавно говорил - дверка и дверца для кошек - о критике кластеризаторов
Читать полностью…