Семантическая совместимость

Материал из wikixw
Перейти к навигации Перейти к поиску

Семантическая совместимость - это способность компьютерных систем обмениваться данными с однозначным, общим значением. Семантическая совместимость-это требование, позволяющее включить машинную вычислимую логику, вывод, обнаружение знаний и объединение данных между информационными системами .

Таким образом, семантическая совместимость связана не только с упаковкой данных ( синтаксис), но и с одновременной передачей смысла вместе с данными ( семантика ). Это достигается путем добавления данных о данных (метаданных), связывая каждый элемент данных с контролируемым, общим словарем. Смысл данных передается вместе с самими данными, в одном самоописывающемся "информационном пакете", не зависящем от какой-либо информационной системы. Именно этот общий словарь и связанные с ним ссылки на онтологии, который обеспечивает основу и возможность машинной интерпретации, вывода и логики.

Синтаксическая совместимость (см. ниже) является необходимым условием для семантической совместимости. Синтаксическая совместимость относится к механизмам упаковки и передачи данных. В здравоохранении НХЛ используется уже более тридцати лет (что предшествует появлению интернета и веб-технологий) и использует символ трубы ( | ) в качестве разделителя данных. Текущий стандарт интернета для разметки документов-XML, который использует "< > " в качестве разделителя данных. Разделители данных не передают никакого значения данным, кроме как для структурирования данных. Без словаря данных для перевода содержимого разделителей данные остаются бессмысленными. Хотя существует много попыток создать словари данных и информационные модели для связи с этими механизмами упаковки данных, ни одна из них не была практически реализована. Это лишь увековечило продолжающуюся "вавилонизацию" данных и неспособность обмениваться данными со смыслом.

С момента введения концепции семантического веба Тимом Бернерсом-Ли в 1999 году наблюдается растущий интерес и применение стандартов W3C (World Wide Web Consortium, W3C ) для обеспечения возможностей обмена семантическими данными, Федерации и вывода данных в веб-масштабе.

Семантика как функция синтаксической интероперабельности[править]

Синтаксическая совместимость, обеспечиваемая, например, XML или SQL стандарты, является обязательным условием для семантического. Он включает в себя общий формат данных и общий протокол для структурирования любых данных таким образом, что способ обработки информации будет интерпретироваться из структуры. Он также позволяет обнаруживать синтаксические ошибки, что позволяет принимающим системам запрашивать повторную отправку любого сообщения, которое кажется искаженным или неполным. Семантическая связь невозможна, если синтаксис искажен или не может представлять данные. Однако информация, представленная в одном синтаксисе, в некоторых случаях может быть точно переведена в другой синтаксис. Там, где возможен точный перевод синтаксисов, системы, использующие различные синтаксисы, также могут точно взаимодействовать. В некоторых случаях способность точно переводить информацию между системами, использующими разные синтаксисы, может быть ограничена одним направлением, когда используемые формализмы имеют разные уровни экспрессивности (способность выражать информацию).

Единая онтология, содержащая представления каждого термина, используемого в каждом приложении, обычно считается невозможной из-за быстрого создания новых терминов или присвоения новых значений старым терминам. Однако, хотя невозможно предвидеть каждую концепцию, которую пользователь может пожелать представить в компьютере, существует возможность нахождения некоторого конечного набора "примитивных" представлений концепции, которые могут быть объединены для создания любого из более конкретных концепций, которые могут потребоваться пользователям для любого заданного набора приложений или онтологий. Имея фундаментальную онтологию (также называемую верхней онтологией) который содержит все эти примитивные элементы, обеспечит прочную основу для общей семантической совместимости и позволит пользователям определять любые новые термины, в которых они нуждаются, используя базовый перечень элементов онтологии, и все еще иметь эти новые термины, правильно интерпретируемые любой другой компьютерной системой, которая может интерпретировать базовую базовую онтологию. Является ли число таких примитивных концептуальных представлений на самом деле конечным или будет расширяться бесконечно, является вопросом активного исследования. Если он конечен, то стабильная фундаментальная онтология, подходящая для поддержки точной и общей семантической совместимости, может развиваться после того, как некоторая исходная фундаментальная онтология была протестирована и использована широким кругом пользователей. В настоящее время ни одна фундаментальная онтология не была принята широким сообществом, поэтому такая стабильная фундаментальная онтология все еще находится в будущем.

Слова и значения[править]

При обсуждении семантики вновь возникает одно постоянное недоразумение-путаница слов и значений. Значения слов меняются, иногда очень быстро. Но формальный язык, например используемый в онтологии, может кодировать значения (семантику) понятий в форме, которая не изменяется. Чтобы определить, что означает конкретное слово(или термин в базе данных , например), необходимо обозначить каждое фиксированное представление концепта в онтологии словом(ами) или термином (ами), которые могут относиться к этому понятию. Когда несколько слов относятся к одному и тому же (фиксированному) понятию в языке, это называется синонимия; когда одно слово используется для обозначения более чем одного понятия, это называется двусмысленностью . Неоднозначность и синонимия относятся к числу факторов, которые делают компьютерное понимание языка очень трудным. Использование слов для обозначения понятий (значения используемых слов)очень чувствительно к контексту и цели любого использования для многих удобочитаемых человеком терминов. Использование онтологий для поддержки семантической совместимости заключается в обеспечении фиксированного набора понятий, значения и отношения которых являются стабильными и могут быть согласованы пользователями. Задача определения того, какие термины в каких контекстах (каждая база данных является другим контекстом) затем отделяется от задачи создания онтологии и должна быть взята на себя проектировщиком базы данных, или проектировщиком формы для ввода данных, или разработчиком программы для понимания языка. Когда слово, используемое в некотором контексте взаимодействия, изменяет свое значение, то для сохранения взаимодействия необходимо изменить указатель на элемент(ы) онтологии, который указывает значение этого слова.

Требования к представлению знаний и языки[править]

Язык представления знаний может быть достаточно выразительным для описания нюансов смысла в хорошо изученных областях. Существует по меньшей мере пять уровней сложности этих [ указать ] .

Для получения общих полуструктурированных данных можно использовать язык общего назначения, например XML.

Языки с полной мощностью логики предикатов первого порядка могут потребоваться для многих задач.

Человеческие языки очень выразительны, но считаются слишком неоднозначными, чтобы позволить точную интерпретацию желаемого, учитывая современный уровень развития технологий человеческого языка.

Предварительное соглашение не требуется[править]

Семантическую интероперабельность можно отличить от других форм интероперабельности, рассматривая вопрос о том, имеет ли передаваемая информация в своей сообщаемой форме все значения, необходимые для правильной интерпретации ее принимающей системой, даже если алгоритмы, используемые принимающей системой, неизвестны отправляющей системе. Рассмотрите возможность отправки одного номера:

Если эта цифра должна быть суммой денег, причитающихся одной компании другой, то она подразумевает некоторое действие или бездействие как со стороны тех, кто ее отправляет, так и со стороны тех, кто ее получает.

Он может быть правильно истолкован, если отправлен в ответ на конкретный запрос, а также получен в то время и в ожидаемой форме. Эта правильная интерпретация зависит не только от самого числа, которое могло бы представлять собой почти любой из миллионов видов количественного измерения, но и строго зависит от обстоятельств передачи. То есть интерпретация зависит от обеих систем, ожидающих, что алгоритмы в другой системе используют число в точно таком же смысле, и она зависит далее от всей огибающей передач, которая предшествовала фактической передаче голого числа. Напротив, если передающая система не знает, как эта информация будет использоваться другими системами, необходимо иметь общее согласие о том, как информация с некоторым конкретным значением (из многих возможных значений) будет появляться в сообщении. Для конкретной задачи одним из решений является стандартизация формы, такой как запрос на оплату; этот запрос должен будет кодировать в стандартизированной форме всю информацию, необходимую для его оценки, такую как: агент, задолжавший деньги, агент, задолжавший деньги, характер действия, порождающего задолженность, агенты, товары, услуги и другие участники этого действия; время действия; сумма задолженности и валюта, в которой рассчитывается задолженность; время, отведенное для платежа; требуемая форма платежа и другая информация. Когда две или более систем договорились о том, как интерпретировать информацию в таком запросе, они могут достичь семантической совместимости для этого конкретного типа транзакции . Для обеспечения семантической совместимости в целом необходимо обеспечить стандартизированные способы описания значений гораздо большего числа вещей, чем просто коммерческие операции, и число концептов, представление которых должно быть согласовано, составляет как минимум несколько тысяч.

Исследование онтологии[править]

Как достичь семантической совместимости для более чем нескольких ограниченных сценариев в настоящее время является предметом исследования и обсуждения. Для решения проблемы общей семантической совместимости требуется некоторая форма фундаментальной онтологии ("верхняя онтология"), которая является достаточно всеобъемлющей, чтобы обеспечить определяющие понятия для более специализированных онтологий во многих областях. За последнее десятилетие было разработано более десяти базовых онтологий, но ни одна из них еще не была принята широкой пользовательской базой.

Необходимость в единой всеобъемлющей всеохватывающей онтологии для поддержки семантической совместимости может быть устранена путем разработки общей фундаментальной онтологии как набора базовых ("примитивных") понятий, которые могут быть объединены для создания логических описаний значений терминов, используемых в локальных доменных онтологиях или локальных базах данных. Эта тактика основана на принципе, что:

Если:

(1) согласованы значения и использование элементов примитивной онтологии в базовой онтологии, и

(2) элементы онтологии в доменных онтологиях строятся как логические комбинации элементов в базовой онтологии,

Затем:

Предполагаемые значения элементов онтологии предметной области могут быть вычислены автоматически с помощью аргумента FOL (логика первого порядка) любой системой, которая принимает значения элементов в базовой онтологии и имеет как базовую онтологию, так и логические спецификации элементов в онтологии предметной области.

Следовательно:

Любая система, желающая точно взаимодействовать с другой системой, должна передавать только передаваемые данные, а также любые логические описания терминов, используемых в этих данных, которые были созданы локально и еще не входят в общую базовую онтологию.

Эта тактика затем ограничивает необходимость предварительного согласования значений только теми элементами онтологии в общей фундаментальной онтологии (FO). Исходя из нескольких соображений, это, вероятно, будет менее 10 000 элементов (типов и отношений).

На практике вместе с FO, ориентированным на представления примитивных понятий, вероятно, также будет использоваться набор онтологий расширения домена для FO с элементами, указанными с помощью элементов FO. Такие ранее существовавшие расширения позволят снизить затраты на создание онтологий доменов, предоставляя существующие элементы с предполагаемым значением, и уменьшат вероятность ошибки при использовании элементов, которые уже были протестированы. Онтологии расширения домена могут быть логически несовместимы друг с другом, и это необходимо определить, если в какой-либо связи используются различные доменные расширения.

Также изучается вопрос о том, можно ли избежать использования такой единой фундаментальной онтологии с помощью сложных методов сопоставления среди независимо разработанных онтологий.

Важность[править]

Практическая значимость семантической интероперабельности была измерена рядом исследований, которые оценивают стоимость (в потерянной эффективности) из-за отсутствия семантической интероперабельности. В одном исследовании , посвященном утраченной эффективности передачи медицинской информации, было подсчитано, что за счет внедрения эффективного стандарта интероперабельности в этой области можно сэкономить 77,8 млрд. долл.США в год. Другие исследования, касающиеся строительной отрасли и цепочки поставок автомобильного производства, [6] оценочные затраты составляют более 10 млрд. долл.США в год из-за отсутствия семантической совместимости в этих отраслях. В общей сложности эти цифры могут быть экстраполированы, чтобы указать, что более 100 миллиардов долларов США в год теряется из-за отсутствия широко используемого стандарта семантической совместимости только в США.

Еще не было проведено исследование по каждой области политики, которое могло бы обеспечить большую экономию средств при применении стандартов семантической совместимости. Но чтобы увидеть, какие поля политики способны извлекать выгоду из семантической совместимости, смотрите раздел "Совместимость" в целом. Такими областями политики являются электронное правительство, здравоохранение, безопасность и многое другое. В июне 2007 года ЕС также создал Европейский центр семантической совместимости.

Смотрите также[править]

Пруф[править]

.researchgate.net/publication/336677616_Towards_Semantic_Interoperability_Standards_based_on_Ontologies?channel=doi&linkId=5dac45da4585155e27f7614f&showFulltext=true

[[Категория:Телекоммуникационная теория