Семантическая интероперабельность

Материал из wikixw
Перейти к навигации Перейти к поиску

Семантическая интероперабельность - это способность компьютерных систем обмениваться данными с однозначным общим значением. Семантическая интероперабельность - это требование для обеспечения возможности машинного вычисления логики, вывода, обнаружения знаний и объединения данных между информационными системами.

Таким образом, семантическая интероперабельность связана не только с упаковкой данных (синтаксис), но и с одновременной передачей значения вместе с данными (семантика). Это достигается путем добавления данных о данных (метаданных), связывающих каждый элемент данных с контролируемым общим словарем. Значение данных передается вместе с самими данными в одном самоописывающемся "информационном пакете", который не зависит от какой-либо информационной системы. Именно этот общий словарь и связанные с ним ссылки на онтологию, которая обеспечивает основу и возможности машинной интерпретации, вывода и логики.

Синтаксическая интероперабельность (см. Ниже) является необходимым условием семантической интероперабельности. Синтаксическая интероперабельность относится к механизмам упаковки и передачи данных. В здравоохранении HL7 используется более тридцати лет (что предшествовало Интернету и веб-технологиям) и использует символ канала (|) в качестве разделителя данных. Текущим интернет-стандартом для разметки документа является XML, который использует "< >" в качестве разделителя данных. :Разделители данных не придают данным никакого значения, кроме структурирования данных. Без словаря данных для перевода содержимого разделителей данные остаются бессмысленными. Хотя существует множество попыток создания словарей данных и информационных моделей для связи с этими механизмами упаковки данных, ни одна из них не была практичной в реализации. Это лишь увековечило продолжающуюся "вавилонизацию" данных и невозможность осмысленного обмена данными.

С момента введения концепции Semantic Web Тимом Бернерсом-Ли в 1999 году, растет интерес и применение стандартов W3C (Консорциума всемирной паутины) для обеспечения семантического обмена данными в веб-масштабе, объединения и возможностей логического вывода.

Семантика как функция синтаксической совместимости[править]

Синтаксическая интероперабельность, обеспечиваемая, например, стандартами XML или SQL, является предварительным условием для semantic. Она включает в себя общий формат данных и общий протокол для структурирования любых данных таким образом, чтобы способ обработки информации можно было интерпретировать на основе структуры. :Он также позволяет обнаруживать синтаксические ошибки, тем самым позволяя принимающим системам запрашивать повторную отправку любого сообщения, которое кажется искаженным или неполным. Семантическая связь невозможна, если синтаксис искажен или не способен представлять данные. Однако информация, представленная одним синтаксисом, в некоторых случаях может быть точно переведена в другой синтаксис. Там, где возможен точный перевод синтаксисов, системы, использующие разные синтаксисы, также могут точно взаимодействовать. В некоторых случаях способность точно переводить информацию между системами, использующими разные синтаксисы, может быть ограничена одним направлением, когда используемые формализмы имеют разные уровни выразительности (способности выражать информацию).

Единая онтология, содержащая представления каждого термина, используемого в каждом приложении, обычно считается невозможной из-за быстрого создания новых терминов или присвоения новых значений старым терминам. Однако, хотя невозможно предвидеть каждую концепцию, которую пользователь может пожелать представить в компьютере, существует возможность найти некоторый конечный набор "примитивных" представлений концепций, которые могут быть объединены для создания любой из более конкретных концепций, которые могут понадобиться пользователям для любого данного набора приложений или онтологий. Наличие базовой онтологии (также называемой верхней онтологией), которая содержит все эти примитивные элементы, обеспечит надежную основу для общей семантической интероперабельности и позволит пользователям определять любые новые термины, которые им нужны, используя базовый перечень элементов онтологии, и при этом эти вновь определенные термины будут должным образом интерпретироваться любой другой компьютерной системой, которая может интерпретировать базовую онтологию foundation. Вопрос о том, является ли количество таких примитивных концептуальных представлений на самом деле конечным или будет расширяться бесконечно, находится в стадии активного изучения. Если она конечна, то стабильная базовая онтология, подходящая для поддержки точной и общей семантической интероперабельности, может развиться после того, как некоторая начальная базовая онтология будет протестирована и использована широким кругом пользователей. В настоящее время ни одна онтология foundation не была принята широким сообществом, поэтому такая стабильная онтология foundation все еще находится в будущем.

Слова и значения[править]

Одно из постоянных недоразумений, повторяющихся при обсуждении семантики, - это "путаница слов и значений". Значения слов меняются, иногда быстро. Но формальный язык, такой как используемый в онтологии, может кодировать значения (семантику) понятий в форме, которая не меняется. Чтобы определить, каково значение конкретного слова (или термина, например, в базе данных), необходимо пометить каждое представление фиксированного понятия в онтологии словом (ами) или термином (ами), которые могут относиться к этому понятию. Когда несколько слов относятся к одному и тому же (фиксированному) понятию в языке, это называется синонимией; когда одно слово используется для обозначения более чем одного понятия, это называется двусмысленностью.

Двусмысленность и синонимия относятся к числу факторов, которые очень затрудняют компьютерное понимание языка. Использование слов для обозначения понятий (значений используемых слов) очень чувствительно к контексту и цели любого использования многих понятных человеку терминов. Использование онтологий для поддержки семантической интероперабельности заключается в предоставлении фиксированного набора понятий, значения и отношения которых стабильны и могут быть согласованы пользователями. Задача определения того, какие термины в каких контекстах (каждая база данных представляет собой отдельный контекст), затем отделяется от задачи создания онтологии и должна быть взята на себя разработчиком базы данных, или разработчиком формы для ввода данных, или разработчиком программы для понимания языка. Когда значение слова, используемого в каком-либо интероперабельном контексте, изменяется, то для сохранения интероперабельности необходимо изменить указатель на элемент (ы) онтологии, который определяет значение этого слова.

Требования к представлению знаний и языки[править]

Язык представления знаний может быть достаточно выразительным для описания нюансов значения в хорошо понятных областях. Существует по крайней мере пять уровней сложности [указать].

Для общих полуструктурированных данных можно использовать язык общего назначения, такой как XML.

Для многих задач могут потребоваться языки, обладающие всей мощью логики предикатов первого порядка.

Человеческие языки обладают высокой выразительностью, но считаются слишком двусмысленными, чтобы обеспечить желаемую точную интерпретацию, учитывая современный уровень технологий человеческого языка. Семантическая интероперабельность системы здравоохранения используют данные стандартизированным способом при их разделении и обмене информацией. Например, теперь две системы могут распознавать терминологию и символы лекарств. Семантическая интероперабельность системы здравоохранения используют данные стандартизированным способом по мере их разделения и обмена информацией. Например, две системы теперь могут распознавать терминологию, символы лекарств и другие нюансы при автоматическом обмене данными без вмешательства человека.

Предварительной договоренности не требуется[править]

Семантическую интероперабельность можно отличить от других форм интероперабельности, рассматривая, имеет ли передаваемая информация в ее передаваемой форме все значения, необходимые принимающей системе для ее правильной интерпретации, даже если алгоритмы, используемые принимающей системой, неизвестны отправляющей системе. Рассмотрите возможность отправки одного номера:

Если предполагается, что это число представляет собой сумму денег, причитающуюся одной компанией другой, это подразумевает какое-то действие или бездействие как со стороны тех, кто его отправляет, так и со стороны тех, кто его получает.

Оно может быть правильно интерпретировано, если отправлено в ответ на конкретный запрос и получено в ожидаемое время и в ожидаемой форме. Эта правильная интерпретация зависит не только от самого числа, которое может представлять практически любой из миллионов типов количественных измерений, скорее, это строго зависит от обстоятельств передачи. То есть интерпретация зависит от обеих систем, ожидающих, что алгоритмы в другой системе используют число в точно таком же смысле, и это, кроме того, зависит от всей огибающей передач, которая предшествовала фактической передаче простого числа.

Напротив, если передающая система не знает, как информация будет использоваться другими системами, необходимо иметь общее соглашение о том, как информация с некоторым конкретным значением (из множества возможных значений) будет отображаться в сообщении. Для конкретной задачи одним из решений является стандартизация формы, такой как запрос на платеж; этот запрос должен был бы кодировать стандартизированным образом всю информацию, необходимую для его оценки, такую как: агент, задолжавший деньги, агент, задолжавший деньги, характер действия, приводящего к возникновению долга, агенты, товары, услуги и другие участники этого действия; время действия; сумма задолженности и валюта, в которой рассчитывается долг; время, отведенное для платежа; требуемая форма платежа; и другая информация. Когда две или более систем договорились о том, как интерпретировать информацию в таком запросе, они могут достичь семантической интероперабельности для этого конкретного типа транзакции. Для семантической интероперабельности в целом необходимо предоставить стандартизированные способы описания значений гораздо большего количества вещей, чем просто коммерческие транзакции, а количество концепций, представление которых необходимо согласовать, составляет как минимум несколько тысяч.

Исследование онтологии[править]

Как добиться семантической интероперабельности для более чем нескольких ограниченных сценариев, в настоящее время является предметом исследований и обсуждений. Для решения проблемы общей семантической интероперабельности требуется некоторая форма базовой онтологии ("верхняя онтология"), которая была бы достаточно всеобъемлющей, чтобы обеспечить определение понятий для более специализированных онтологий в нескольких доменах. За последнее десятилетие было разработано более десяти базовых онтологий, но ни одна из них пока не была принята широкой базой пользователей.

Необходимости в единой всеобъемлющей онтологии для поддержки семантической интероперабельности можно избежать, разработав общую базовую онтологию как набор базовых ("примитивных") понятий, которые можно комбинировать для создания логических описаний значений терминов, используемых в онтологиях локального домена или локальных базах данных. Эта тактика основана на принципе, что:

Если:

(1) значения и использование элементов примитивной онтологии в базовой онтологии согласованы, и 
(2) элементы онтологии в онтологиях предметной области строятся как логические комбинации элементов базовой онтологии,

Тогда:

Предполагаемые значения элементов онтологии предметной области могут быть вычислены автоматически с использованием средства рассуждения FOL (логики первого порядка) любой системой, которая принимает значения элементов в базовой онтологии и имеет как базовую онтологию, так и логические спецификации элементов в онтологии предметной области.

Следовательно:

Любая система, желающая точно взаимодействовать с другой системой, должна передавать только данные, подлежащие передаче, плюс любые логические описания терминов, используемых в этих данных, которые были созданы локально и которых еще нет в онтологии common foundation.
Затем эта тактика ограничивает необходимость предварительного согласования значений только теми элементами онтологии, которые входят в общую базовую онтологию (FO). Исходя из ряда соображений, для этого может потребоваться менее 10 000 элементов (типов и связей). Однако для простоты понимания и использования дополнительные элементы онтологии с дополнительной детализацией и спецификой могут помочь найти точное местоположение в FO, где можно найти или добавить конкретные концепции предметной области.

На практике, вместе с FO, ориентированным на представления примитивных концепций, вероятно, также будет использоваться набор онтологий расширения предметной области до FO с элементами, заданными с использованием элементов FO. Такие уже существующие расширения снизят стоимость создания онтологий предметной области за счет придания существующим элементам предполагаемого значения и снизят вероятность ошибки за счет использования элементов, которые уже были протестированы. Онтологии расширений домена могут быть логически несовместимы друг с другом, и это необходимо определить, если в какой-либо коммуникации используются разные расширения домена.

Также выясняется, можно ли избежать использования такой единой фундаментальной онтологии с помощью сложных методов сопоставления между независимо разработанными онтологиями.

Важность[править]

Практическое значение семантической интероперабельности было измерено несколькими исследованиями, в которых оценивались затраты (в виде потери эффективности) из-за отсутствия семантической интероперабельности. Одно исследование, [4] посвященное снижению эффективности передачи медицинской информации, подсчитало, что за счет внедрения эффективного стандарта интероперабельности в этой области можно сэкономить 77,8 миллиарда долларов США в год. Другие исследования строительной отрасли и цепочки поставок автомобильного производства, оценивают затраты более чем в 10 миллиардов долларов США в год из-за отсутствия семантической совместимости в этих отраслях. В общей сложности эти цифры можно экстраполировать, чтобы показать, что из-за отсутствия широко используемого стандарта семантической интероперабельности только в США теряется более 100 миллиардов долларов США в год.

Еще не было проведено исследования по каждой области политики, которое могло бы обеспечить значительную экономию средств при применении стандартов семантической интероперабельности. Но чтобы увидеть, какие сферы политики способны получать прибыль от семантической интероперабельности, видетьвзаимодействияв целом. Такими областями политики являются электронное правительство, здравоохранение, безопасность и многие другие. В июне 2007 года ЕС также учредил Европейский центр семантической интероперабельности.

Семантическая совместимость для Интернета вещей[править]

Цифровая трансформация имеет огромные преимущества, позволяя организациям быть более эффективными, гибкими и более оперативно реагировать на изменения в бизнесе и условиях эксплуатации. Это связано с необходимостью интеграции разнородных данных и сервисов во всех организациях. Семантическая интероперабельность удовлетворяет потребность в общем понимании значения и контекста.

Чтобы поддержать это, межорганизационная группа экспертов, включающая ISO / IEC JTC1, ETSI, oneM2M и W3C, сотрудничает с AIOTI в ускорении внедрения семантических технологий в IoT. Группа совсем недавно опубликовала два совместных официальных документа по семантической совместимости, соответственно названных “Решения Semantic IoT – взгляд разработчика” и “К стандартам семантической совместимости на основе онтологий“. Это следует за успехом более ранней белой книги “Семантическая интероперабельность для сети вещей”.

Источник:

“Решения Semantic IoT - перспектива разработчика”

“На пути к стандартам семантической интероперабельности, основанным на онтологиях“.

Это следует из успеха более ранней белой книги “Семантическая интероперабельность для сети вещей”.

https://www.w3.org/blog/2019/10/aioti-iso-iec-jtc1-etsi-onem2m-and-w3c-collaborate-on-two-joint-white-papers-on-semantic-interoperability-targeting-developers-and-standardization-engineers/

Смотрите также[править]

Пруф[править]

/web.archive.org///colab.cim3.net/cgi-bin/wiki.pl?O