Системы анализа и обработки данных

СИСТЕМЫ АНАЛИЗА И ОБРАБОТКИ ДАННЫХ

ISSN (печатн.): 2782-2001          ISSN (онлайн): 2782-215X
English | Русский

Последний выпуск
№2(94) Апрель - Июнь 2024

Метод онтологического анализа web-ресурса на основе метаданных

Выпуск № 3 (72) Июль - Сентябрь 2018
Авторы:

Воробьев Владимир Иванович,
Солдаткина Алина Андреевна
DOI: http://dx.doi.org/10.17212/1814-1196-2018-3-43-58
Аннотация

Важной проблемой современного интернет-сообщества является распространение огромного количества информации, что вызывает трудности для быстрого поиска достоверных знаний. В данной работе предложен новый метод технологии анализа и обработки данных, который, основываясь на семантических связях, ускоряет вывод необходимой информации, а также оценивает надежность ее источников. Особое внимание в статье уделено рассмотрению применяемых на сегодняшний день методов анализа web-контента. В статье предлагается использовать новый метод, который основывается на выделении метаинформации с web-сайта и рассмотрении ее семантических связей. Для этого в редакторе Protеgе 5.0 разработана семантическая модель, содержащая большое количество классов и свойств, характерных для элементов данной предметной области. В работе рассмотрены все основные этапы построения онтологической модели предметной области, выделены методы анализа и классификации web-ресурсов, приведены примеры описания классов и содержащихся в них экземпляров, отношений между ними. Для автоматической классификации разработаны логические правила, которые проверяют семантические связи между метаданными ресурса и наборами ключевых слов классов. Надежность источника определяется исходя из набора и объема его метаданных, что позволяет оценить достоверность и качество представленного контента. Предложенный онтологический подход является перспективным с точки зрения высокого уровня интероперабельности информационных систем за счет открытых интерфейсов доступа, а также путем использования единого формата записи и обмена данными. В рамках онтологического подхода семантическая способность к взаимодействию реализована на основе единого представления информации в предметной области. Для повышения скорости и точности вывода поисковых запросов предлагается использовать запросы из семантической базы данных на языке SPARSQL, примеры которых также приводятся в статье.


Ключевые слова: семантические технологии, онтология, rdf, owl, метаданные, уровень доверия, SPARSQL, анализ web-ресурсов, квалиметрическая шкала

Список литературы

1. Осипов В.Ю., Воробьев В.И., Левоневский Д.К. Проблемы защиты от ложной информации в компьютерных сетях // Труды СПИИРАН. – 2017. –Вып. 4 (53). – С. 97–117.



2. Бергель Х., Брюс Шнаер о цифровых угрозах будущего // Открытые системы. СУБД. – 2018. – № 1. – С. 34.



3. Brandtzaeg P., Følstad A.Trust and distrust in online fact-checking services //Communications of the ACM. – 2017. –Vol. 60,N 9. – P. 65–71.



4. Тузовский А.Ф. Архитектура семантического Webпортала // Известия Томского политехнического университета. – 2006. –Т. 309, № 7. – C. 142–145.



5. Gruber T. Collective knowledge systems: where the Social Web meets the Semantic Web // Journal of Web Semantics. – 2008. – Vol. 6, N 1. –P. 4–13.



6. Ландэ Д.В. Поиск знаний в Internet. – М.: Диалектика, 2005. – 272 c. – (Профессиональная работа).– ISBN 5-8459-0764-0.



7. Рогушина Ю.В., Гришанова A.Ю. Средства интеллектуализации поиска информационных ресурсов в сети Интернет // Сборник трудовVII Международной конференции "Интеллектуальный анализ информации ИАИ-2007". – Киев, 2007. – С. 322–331.



8. Yi L.,Liu B.Webpagecleaningforwebminingthroughfeatureweighting // Proceedings of Eighteenth International Joint Conference on Artificial Intelligence (IJCAI-03). – Acapulco, Mexico, 2003. – P. 43–48.



9. Gladun A., Rogushina J., Shtonda V. Ontological approach to domain knowledge representation for information retrieval in multiagent systems //Information Theories and Applications. – 2006. – Vol. 13, N 4. – P. 354–362.



10. Gruber T. Toward principles for the design of ontologies used for knowledge sharing?// International Journal Human-Computer Studies. – 1995. – Vol. 43. – P. 907–928.



11. Гото К. Веб-редизайн: книга Келли Гото и Эмили Котлер. – СПб.:Символ-Плюс, 2003. – 376 с.



12. Семантика, метаданные и онтологии в приложениях для умного города – новые стандарты BSI/ В.П. Куприяновский, Д.И. Ярцев, А.А. Харитонов, Н.А. Уткин, Д.Е. Николаев, В.И. Дрожжинов, Д.Е. Намиот, Ю.И. Волокитин //InternationalJournalofOpenInformationTechnologies. –2017. – Т. 5, № 6. – С. 94–108.



13. Горшков С.С. Введение в онтологическое моделирование. – [Б. м.]: ООО ТриниДата, 2016. – 165 с.



14. Хованов Н.В. Анализ и синтез показателей при информационном дефиците. –СПб.: Изд-во С.-Петерб.ун-та, 1996. –196 с.



15. Hovanov N., Yudaeva M., Hovanov K.Multicriteria estimation of probabilities on basis of expert non-numeric, non-exact and non-complete knowledge // European Journal of Operational Research. –2009. – Vol. 195, iss. 3. – P. 857–863.

Для цитирования:

Воробьев В.И., Солдаткина А.А. Метод онтологического анализа web-ресурса на основе метаданных // Научный вестник НГТУ. – 2018. – № 3 (72). – С. 43–58. – doi: 10.17212/1814-1196-2018-3-43-58.
 

For citation:

Vorobyev V.I., Soldatkina A.A. Metod ontologicheskogo analiza web-resursa na osnove metadannykh [Method of ontological analysis of a web-resource based on metadata]. Nauchnyi vestnik Novosibirskogo gosudarstvennogo tekhnicheskogo universiteta – Science bulletin of the Novosibirsk state technical university, 2018, no. 3 (72), pp. 43–58. doi: 10.17212/1814-1196-2018-3-43-58.

Просмотров: 2276