Важной проблемой современного интернет-сообщества является распространение огромного количества информации, что вызывает трудности для быстрого поиска достоверных знаний. В данной работе предложен новый метод технологии анализа и обработки данных, который, основываясь на семантических связях, ускоряет вывод необходимой информации, а также оценивает надежность ее источников. Особое внимание в статье уделено рассмотрению применяемых на сегодняшний день методов анализа web-контента. В статье предлагается использовать новый метод, который основывается на выделении метаинформации с web-сайта и рассмотрении ее семантических связей. Для этого в редакторе Protеgе 5.0 разработана семантическая модель, содержащая большое количество классов и свойств, характерных для элементов данной предметной области. В работе рассмотрены все основные этапы построения онтологической модели предметной области, выделены методы анализа и классификации web-ресурсов, приведены примеры описания классов и содержащихся в них экземпляров, отношений между ними. Для автоматической классификации разработаны логические правила, которые проверяют семантические связи между метаданными ресурса и наборами ключевых слов классов. Надежность источника определяется исходя из набора и объема его метаданных, что позволяет оценить достоверность и качество представленного контента. Предложенный онтологический подход является перспективным с точки зрения высокого уровня интероперабельности информационных систем за счет открытых интерфейсов доступа, а также путем использования единого формата записи и обмена данными. В рамках онтологического подхода семантическая способность к взаимодействию реализована на основе единого представления информации в предметной области. Для повышения скорости и точности вывода поисковых запросов предлагается использовать запросы из семантической базы данных на языке SPARSQL, примеры которых также приводятся в статье.
Воробьев В.И., Солдаткина А.А. Метод онтологического анализа web-ресурса на основе метаданных // Научный вестник НГТУ. – 2018. – № 3 (72). – С. 43–58. – doi: 10.17212/1814-1196-2018-3-43-58.
Vorobyev V.I., Soldatkina A.A. Metod ontologicheskogo analiza web-resursa na osnove metadannykh [Method of ontological analysis of a web-resource based on metadata]. Nauchnyi vestnik Novosibirskogo gosudarstvennogo tekhnicheskogo universiteta – Science bulletin of the Novosibirsk state technical university, 2018, no. 3 (72), pp. 43–58. doi: 10.17212/1814-1196-2018-3-43-58.