W3C предлагает новую модель организации информации в «семантической паутине»

World Wide Web Consortium (W3C) опубликовал для публичного обсуждения проект модели взаимодействия систем организации знаний в «семантической паутине» – Simple Knowledge Organization System (SKOS).

Член Экспертного совета МОО ВПП ЮНЕСКО «Информация для всех» – декан факультета программирования Московской финансово-промышленной академии, заместитель главного редактора журнала «Прикладная информатика» Валерий Артюхин прокомментировал содержание этого документа.

Simple Knowledge Organization System (SKOS) в переводе с английского означает Простую систему организации знаний. В комментировании документов подобного толка для широкой общественности всегда возникает определенная проблема, поскольку аудитория естественным образом делится на две части: IT-специалистов и специалистов во всех остальных областях.

SKOS непосредственно связана с таким популярным ныне понятием, как «семантическая паутина». Основной целью создания такой паутины является получение возможности машинной обработки информации, находящейся в Интернет. Безусловно, что эта информация в виде HTML-файлов, баз данных или чего-либо иного и без того находится на компьютерных серверах, однако это ее физическое и логическое представление. Когда дело касается семантической паутины, то речь идет о семантике.

Пользователям было бы весьма полезно не просто знать, что в определенном месте планеты находится некий компьютер, на жестком диске которого имеется файл, содержащий определенное слово или фразу (это именно тот ответ, который всем нам дают поисковики), но и получить представление о документах, соответствующих запросу по смыслу, а не просто по результатам побайтового сравнения «символ к символу».

Помимо поиска, машинная обработка семантики может дать и другие преимущества, например, консолидацию различных, семантически связанных документов, для извлечения из них всей информации, которой в явном виде нет в каждом отдельном.

Однако машины вычисляют, а не думают, поэтому для реализации подобной функциональности необходимо подменить процесс мышления процессом вычисления. Для этого применяются метаданные, описывающие в формализованном виде характер и смысл информации, изначально находящейся в виде, пригодном только для восприятия человеком.

За последние годы было разработано несколько языков и моделей, с помощью которых можно записать подобные метаданные (например, RDF, OWL и CWL). Подробное их описание выходит за рамки данного комментария (краткое рассмотрение языка CWL приводилось в комментарии к документу W3C Common Web Language).

В технические детали не хочется углубляться тем более, что SKOS имеет непосредственные связи с языком OWL - Web Ontology Language (язык онтологии для Интернета) и моделью RDF – Resource Description Framework (инфраструктура описания ресурсов).

Популярный на сегодняшний день формат RSS - Really Simple Syndication (очень простое синдицирование информации) в свое время расшифровывался как RDF Site Summary (сводка сайта с применением инфраструктуры описания ресурсов), то есть также основан на модели RDF. RDF в свою очередь использует URI – Uniform Resource Identifier (единообразный идентификатор ресурса), одним из вариантов которого является старый добрый URL - Uniform Resource Locator (единообразный определитель местонахождения ресурса).

От рассмотрения потаенного места SKOS в иерархии разнообразных моделей и языков перейдем к более простому и ценному с общечеловеческой точки зрения аспекту – положению SKOS в реализации «семантической паутины» как совокупности новых возможностей.

В мире существует достаточное количество систем организации знаний, например таксономии и тезаурусы. Несмотря на ряд сложностей, SKOS позволяет преобразовать эти системы к единому виду, что позволит в будущем (когда появятся программные продукты соответствующего назначения) включить в общую систему описания знаний документы из Библиотеки Конгресса США, например. Все ровно настолько просто… в теории.

Завершая комментарий, хотелось бы поделиться наблюдением о том, что в последние несколько месяцев W3C явно активизировал работы по разработке стандартов (или рекомендаций) для «семантической паутины». Это, безусловно, позитивный сигнал, поскольку любое явление или инфраструктура глобального масштаба, каковой является Интернет, должна непрерывно эволюционировать.

Разработка и публикация рекомендации W3C обеспечивает предсказуемость этой эволюции. Огорчение вызывает лишь тот факт, что, несмотря на существование целой пирамиды документов по языкам и моделям для «семантической паутины» (несколько напоминающей «дом, который построил Джек»), они далеко не повсеместно известны широким массам.

В этом отношении модель SKOS несколько выделяется, поскольку хоть и добавляет новую нетривиальную аббревиатуру в общую копилку, но целью своей имеет интеграцию существующей информации в общую систему. Другими словами, эта модель не просто нова – она обеспечивает преемственность того, что годами разрабатывалось до ее появления.

Пока без оценки
Stilgar аватар

Очень интерестно, но статья невразумительная. Буду ещё что-нибудь читать по этому поводу, я очень интересуюсь системой организации знаний в Интернете, и даже мог бы применять такую систему, если она уже разработана достаточно для практического применения, на нескольких ресурсах, существующих и планируемых.

Может, кто-нибудь уже что-то знает про эту и подобные системы?

Ваша оценка: Нет

Здравствуйте! Уважаемый коллега.
Статья невразумительна, потому что в самом начале заложена серьёзнейшая подмена, а именно термин "информация" подменён термином "знания".
Такая подмена повсеместна и вызвана с одной стороны маркетинговыми причинами, а с другой изменениями происходящими с наукой называемой нами Информатика...
Если взять и поменять термин знания на термин информация в статье, то станет, не только понятнее, но и достовернее...
Кстати, Эксперт о подменах сам упоминает в своём интервью.
Подробнее о новом, а на самом деле для нашей науки старом подходе к пониманию предметной области Информатики можно почитать в работах К.К. Колина.
Например в этой:

Ваша оценка: Нет

Отправить комментарий

  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Доступны HTML теги: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <blockquote> <strike>
  • Строки и параграфы переносятся автоматически.
  • Поисковые системы будут индексировать и переходить по ссылкам на разрешённые домены.

Подробнее о форматировании

Яндекс.Метрика