Семантический веб

Материал из wikixw
Перейти к навигации Перейти к поиску

Семантическая сеть является расширением Всемирной паутины через стандарты Консорциума Всемирной паутины (W3C). стандарты продвигают общие форматы данных и протоколы обмена в Интернете, в основном структуру описания ресурсов (RDF). Согласно W3C, "семантическая сеть обеспечивает общую структуру, которая позволяет совместно использовать и повторно использовать данные через границы приложений, предприятий и сообществ".[2] Таким образом, семантическая сеть рассматривается как интегратор по различным контентам, информационным приложениям и системам.

Термин был придуман Тимом Бернерсом-Ли для сети данных (или сети данных ) [3], которые могут быть обработаны машинами —то есть, тот, в котором большая часть значения является машиночитаемой . В то время как его критики подвергли сомнению его осуществимость, сторонники утверждают, что применения в библиотеке и информатике, промышленности, биологии и исследованиях гуманитарных наук уже доказали законность оригинальной концепции.[5]

Бернерс-Ли первоначально выразил свое видение семантической сети следующим образом:

   У меня есть мечта для Интернета [в которой компьютеры] становятся способными анализировать все данные в интернете – контент, ссылки и транзакции между людьми и компьютерами. "Семантическая сеть", которая делает это возможным, еще не появилась, но когда это произойдет, повседневные механизмы торговли, бюрократии и нашей повседневной жизни будут обрабатываться машинами, разговаривающими с машинами. "Умные агенты", которых люди рекламировали целую вечность, наконец материализуются. 

Научная американская статья Бернерса-Ли, хендлера и Лассилы 2001 года описала ожидаемую эволюцию существующей сети в семантическую сеть. в 2006 году Бернерс-Ли и его коллеги заявили, что: "эта простая идея...остается в значительной степени нереализованной". В 2013 году более четырех миллионов веб-доменов содержали семантическую веб-разметку.

Пример[править]

В следующем примере текст "Пол Шустер родился в Дрездене" на веб-сайте будет аннотирован, связывая человека с местом рождения. Следующий HTML-фрагмент показывает, как описывается небольшой граф в RDFa-синтаксисе с помощью schema.org словарь и идентификатор Wikidata:

График, полученный из примера RDFa
< div  vocab = "http://schema.org/"  typeof = "Person" >>
 < span  property = "name" > > Пол Шустер < / span>> родился в
< span  property = "birthPlace"  typeof = "Place"  href = "http://www.wikidata.org/entity/Q1731 ">>
   < span  property = "name" >> Дрезден</ span>> .
< / span> > 

< / div>

В Примере определяются следующие пять троек (показаны в синтаксисе Turtle). Каждая тройка представляет один край в получившийся график: первый элемент тройка ( тема)- имя узла, где лезвие начинается, второй элемент ( предикат) тип ребра, и последний, третий элемент ( объект) либо имя узла, где кромка торцов или буквенное значение (например, текст, число и т. д.).

_: a < http://www.w3.org/1999/02/22-rdf-syntax-ns#type> > > < http://schema.org/Person> .

_: a < http://schema.org/name > "Пол Шустер". _: a < http://schema.org/birthPlace> > > < http://www.wikidata.org/entity/Q1731> . < http://www.wikidata.org/entity/Q1731> > > < http://schema.org/itemtype> > > < http://schema.org/Place> . < http://www.wikidata.org/entity/Q1731> > > < http://schema.org/name > "Дрезден".

Тройки приводят к графику, показанному на данном рисунке .

График, полученный в результате примера RDFa, обогащенный дополнительными данными из интернета

Одним из преимуществ использования унифицированных идентификаторов ресурсов (URI) является то, что они могут быть разыменованы с помощью протокола HTTP. Согласно так называемым связанным принципам открытых данных, такой разыменованный URI должен приводить к документу, который предлагает дополнительные данные о данном URI. В этом примере все URI, как для ребер, так и для узлов (например http://schema.org/Person - http://schema.org/birthPlace - http://www.wikidata.org/entity/Q1731) может быть разыменован и приведет к дальнейшим графам RDF, описывающим URI, например, что Дрезден является городом в Германии, или что человек, в смысле этого URI, может быть вымышленным.

Второй график показывает предыдущий пример, но теперь обогащен несколькими тройками из документов, которые являются результатом разыменования http://schema.org/Person (зеленый край) и http://www.wikidata.org/entity/Q1731 (синие края).

В дополнение к ребрам, явно указанным в участвующих документах, ребра могут быть автоматически выведены: тройной .

_: a < http://www.w3.org/1999/02/22-rdf-syntax-ns#type> > > < http://schema.org/Person> .

из оригинального фрагмента RDFa и тройного

< http://schema.org/Person> > > < http://www.w3.org/2002/07/owl#equivalentClass> > > < http://xmlns.com/foaf/0.1/Person> .

из документа по адресу http://schema.org/Person (зеленый край на рисунке) позволяют сделать следующий тройной вывод, учитывая семантику совы (Красная пунктирная линия на втором рисунке):

_: a < http://www.w3.org/1999/02/22-rdf-syntax-ns#type> > > < http://xmlns.com/foaf/0.1/Person> .

Фон[править]

Дополнительная информация: семантическая сеть § История

Концепция семантической сетевой модели была сформирована в начале 1960-х годов такими исследователями , как когнитивист Аллан М. Коллинз, лингвист М. Росс Квиллиан и психолог Элизабет Ф. Лофтус как форма представления семантически структурированного знания. Применяясь в контексте современного интернета, он расширяет сеть гиперссылочных удобочитаемых веб-страниц путем вставки машиночитаемых метаданных о страницах и как они связаны друг с другом. Это позволяет автоматизированным агентам получать более интеллектуальный доступ к сети и выполнять больше задач от имени пользователей. Термин "семантическая паутина" был придуман Тимом Бернерсом-Ли, изобретателем Всемирной паутины и директором Консорциума Всемирной паутины ("W3C"), который наблюдает за развитием предлагаемых семантических веб-стандартов. Он определяет семантическую сеть как"сеть данных, которые могут быть обработаны прямо и косвенно машинами".

Многие из технологий, предложенных W3C, уже существовали до того, как они были размещены под зонтиком W3C. Они используются в различных контекстах, особенно в тех, которые касаются информации, охватывающей ограниченную и определенную область, и где обмен данными является общей необходимостью, такой как научные исследования или обмен данными между предприятиями. Кроме того, появились другие технологии с аналогичными целями, такие как микроформаты .

Ограничения HTML[править]

Многие файлы на типичном компьютере также можно свободно разделить на читаемые человеком документы и машиночитаемые данные . Такие документы, как почтовые сообщения, отчеты и брошюры, читаются людьми. Данные, такие как календари, адресные книги, списки воспроизведения и электронные таблицы, представляются с помощью прикладной программы, которая позволяет просматривать, искать и комбинировать их.

В настоящее время Всемирная паутина основана главным образом на документах, написанных на языке гипертекстовой разметки ( HTML), соглашение разметки, которое используется для кодирования тела текста, вкрапленного мультимедийными объектами, такими как изображения и интерактивные формы. Теги метаданных предоставляют метод, с помощью которого компьютеры могут классифицировать содержимое веб-страниц. В приведенных ниже примерах именам полей "keywords", "description" и "author" присваиваются такие значения, как "computing", "cheap widgets for sale"и" John Doe".

< meta  name = "keywords"  content = "вычислительная техника, компьютерные исследования, компьютер"  / > > 

< meta name = "description" content = "дешевые виджеты для продажи" / > > < meta name = "author" content = "John Doe" / >

Из-за этого пометки метаданных и категоризации, другие компьютерные системы, которые хотят получить доступ и совместно использовать эти данные можно легко определить соответствующие значения.

С помощью HTML и инструмента для его отображения (возможно, программного обеспечения веб-браузера, возможно, другого агента пользователя) можно создать и представить страницу, в которой перечислены элементы для продажи. HTML этой страницы каталога может сделать простые утверждения на уровне документа, такие как "заголовок этого документа" виджет Superstore "", но в самом HTML нет возможности однозначно утверждать, что, например, номер товара X586172 является вещицей Acme с розничной ценой €199 или что это потребительский продукт. Скорее, HTML может только сказать, что диапазон текста "X586172" - это то, что должно быть расположено рядом с "Acme Gizmo" и "€199" и т. д. Невозможно сказать "это каталог "или даже установить, что" Acme Gizmo "- это своего рода название или что" €199 " - это цена. Также невозможно выразить, что эти фрагменты информации связаны вместе при описании отдельного элемента, отличного от других элементов, возможно, перечисленных на странице.

Семантический HTML ссылается на традиционную HTML-практику разметки, следуя намерению, а не непосредственно указывая детали макета. Например,

использование обозначения "акцент", а не, который указывает курсив. Детали макета остаются в браузере в сочетании с каскадными таблицами стилей . Но эта практика не позволяет определить семантику объектов, таких как объекты для продажи или цены.

Микроформаты расширяют синтаксис HTML для создания машиночитаемой семантической разметки объектов, включая людей, организации, события и продукты.[10] аналогичные инициативы включают Рдфа, микроданные и Schema.org ...

Семантические веб-решения[править]

Семантическая сеть принимает решение дальше. Она включает в себя публикацию на языках, специально предназначенных для данных: Resource Description Framework (RDF), Web Ontology Language (OWL) и Extensible Markup Language ( XML ). HTML описывает документы и связи между ними. RDF, OWL и XML, напротив, могут описывать произвольные вещи, такие как люди, встречи или части самолета.

Эти технологии объединены, чтобы обеспечить описания, которые дополняют или заменяют содержание веб-документов. Таким образом, контент может проявляться как описательные данные, хранящиеся в базах данных, доступных в Интернете, [11] или как разметка в документах (в частности, в расширяемом HTML (XHTML) с вкраплениями XML,или, чаще всего, чисто в XML, с макетом или отображением, хранящимися отдельно). Машиночитаемые описания позволяют контент-менеджерам добавлять смысл к контенту, т. е. описывать структуру знаний, которые мы имеем об этом контенте. Таким образом, машина может обрабатывать само знание, а не текст , используя процессы, подобные человеческим дедуктивным рассуждениям и выводам, тем самым получая более значимые результаты и помогая компьютерам выполнять автоматизированный сбор информации и исследования.

Пример тега, который будет использоваться на несемантической веб-странице:

<item> < item> блог< / item>

Кодирование подобной информации на семантической веб-странице может выглядеть следующим образом:

<item  rdf: about= "http://example.org/semantic-web /" >> > семантическая сеть< / item>

Тим Бернерс-Ли называет результирующую сеть связанных данных гигантским глобальным графиком, в отличие от всемирной паутины на основе HTML . Бернерс-Ли утверждает, что если прошлое было обменом документами, то будущее-это обмен данными. Его ответ на вопрос "как" дает три пункта инструкции. Во-первых, URL должен указывать на данные. Во-вторых, любой, кто обращается к URL-адресу, должен получить данные обратно. В-третьих, связи в данных должны указывать на дополнительные URL-адреса с данными.

Web 3.0[править]

Тим Бернерс-Ли описал семантическую сеть как компонент "Web 3.0".[12]]

   Люди продолжают спрашивать, Что такое Web 3.0. Я думаю, что, возможно, когда у вас есть наложение масштабируемой векторной графики - все рябь и складывание и выглядит туманно-на Web 2.0 и доступ к семантической сети, интегрированной в огромном пространстве данных, у вас будет доступ к невероятному ресурсу данных …
   - Тим Бернерс-Ли, 2006

"Semantic Web" иногда используется в качестве синонима "Web 3.0", хотя определение каждого термина различно. Web 3.0 начал появляться как движение в сторону от централизации услуг, таких как поиск, социальные медиа и чат-приложения, которые зависят от одной организации, чтобы функционировать.

Журналист Guardian Джон Харрис положительно оценил концепцию Web 3.0 в начале 2019 года и, в частности, работу Berners‑Lee над проектом под названием "Solid", основанным на хранилищах персональных данных или "стручках", над которыми лица сохраняют контроль. Berners‑Lee сформировал стартап, Inrupt, чтобы продвигать идею и привлекать добровольных разработчиков.

Проблемы[править]

Некоторые из проблем для семантической сети включают обширность, неопределенность, неопределенность, непоследовательность и обман. Автоматизированные системы рассуждения должны будут иметь дело со всеми этими проблемами, чтобы выполнить обещание семантической сети.

  • Необъятность: Всемирная паутина содержит много миллиардов страниц. Только онтология медицинской терминологии SNOMED CT содержит 370 000 имен классов, и существующая технология пока не смогла устранить все семантически дублированные термины. Любая автоматизированная система рассуждений будет иметь дело с действительно огромными затратами.
  • Неопределенность: это неточные понятия типа "молодой"или " высокий". Это связано с неопределенностью запросов пользователей, концепций, представленных контент-провайдерами, сопоставления терминов запросов с терминами провайдеров и попыток объединить различные базы знаний с перекрывающимися, но тонко разными концепциями. Нечеткая логика является наиболее распространенным методом для борьбы с неопределенностью.
  • Неопределенность: это точные понятия с неопределенными значениями. Например, пациент может представить набор симптомов, которые соответствуют ряду различных различных диагнозов, каждый с различной вероятностью. Вероятностные методы рассуждения обычно используются для решения проблемы неопределенности.
  • Несогласованность: это логические противоречия, которые неизбежно возникнут как при разработке больших онтологий, так и при объединении онтологий из отдельных источников. Дедуктивное рассуждение катастрофически терпит неудачу, сталкиваясь с непоследовательностью, потому что "все вытекает из противоречия" . Побеждаемое рассуждение и параконсистентное рассуждение-два метода, которые могут использоваться, чтобы иметь дело с несоответствием.
  • Обман: это когда производитель информации намеренно вводит в заблуждение потребителя информации. В настоящее время для устранения этой угрозы используются методы криптографии. Предоставляя средства для определения целостности информации, в том числе относящейся к личности субъекта, который произвел или опубликовал информацию, однако вопросы достоверности все еще должны решаться в случаях потенциального обмана.

Этот перечень проблем является скорее иллюстративным, чем исчерпывающим, и он фокусируется на проблемах "объединяющей логики" и "доказательных" слоев семантической сети. Группа инкубаторов Консорциума Всемирной паутины (W3C) для обоснования неопределенности в заключительном докладе Всемирной паутины (URW3-XG) объединяет эти проблемы под единым заголовком "неопределенность". Многие из методов, упомянутых здесь, потребуют расширений к языку онтологии сети (OWL), например, чтобы аннотировать условные вероятности. Это область активных исследований.

Стандарты[править]

Стандартизация Semantic Web в контексте Web 3.0 находится на попечении W3C

Компоненты[править]

Термин "семантическая сеть" часто используется более конкретно для обозначения форматов и технологий, которые позволяют это.[2] сбор, структурирование и восстановление связанных данных осуществляются с помощью технологий, обеспечивающих формальное описание понятий, терминов и отношений в рамках данной области знаний . Эти технологии определены как стандарты W3C и включают:

  • Структура описания ресурсов (RDF), общий метод описания информации
  • Схема RDF (RDFS)
  • Простая система организации знаний (SKOS)
  • SPARQL, язык запросов RDF
  • Notation3 (N3), разработанный с учетом читаемости человеком
  • N-тройки , формат для хранения и передачи данных
  • Черепаха (Краткий тройной язык RDF)
  • Web Ontology Language (OWL), семейство языков представления знаний
  • Формат обмена правилами (RIF), структура диалектов языка веб-правил, поддерживающих обмен правилами в Интернете.

Семантический веб-стек иллюстрирует архитектуру семантической сети. Функции и отношения компонентов могут быть резюмированы следующим образом:]

  • XML предоставляет элементарный синтаксис для структуры содержимого в документах, но не связывает семантику со значением содержимого, содержащегося внутри. XML в настоящее время не является необходимым компонентом семантических веб-технологий в большинстве случаев, поскольку существуют альтернативные синтаксисы, такие как Turtle . Turtle является стандартом де-факто, но не прошел формальный процесс стандартизации.
  • XML-схема-это язык для предоставления и ограничения структуры и содержимого элементов, содержащихся в XML-документах.
  • RDF-это простой язык для выражения моделей данных, которые относятся к объектам ("веб-ресурсам") и их отношениям. Модель на основе RDF может быть представлена в различных синтаксисах, например, RDF/XML, N3, Turtle и RDFa. RDF является фундаментальным стандартом семантической сети.
  • Схема RDF расширяет RDF и является словарем для описания свойств и классов ресурсов на основе RDF с семантикой для обобщенных иерархий таких свойств и классов.
  • OWL добавляет больше словаря для описания свойств и классов: среди прочего, отношения между классами (например, несвязанность), мощность (например, "ровно один"), равенство, более богатая типизация свойств, характеристики свойств (например, симметрия) и перечисленные классы.
  • SPARQL-это язык протоколов и запросов для семантических веб-источников данных.
  • RIF-это формат обмена правилами W3C. Это язык XML для выражения веб-правил, которые могут выполнять компьютеры. RIF предоставляет несколько версий, называемых диалектами. Он включает в себя основной логический диалект RIF (RIF-BLD) и диалект правил производства RIF (RIF PRD).

Текущее состояние стандартизации[править]

Устоявшиеся стандарты:

  • РДФ
  • RDFS
  • Формат обмена правилами (RIF)
  • SPARQL
  • Юникод
  • Единый Идентификатор Ресурса
  • Язык онтологии Web (OWL)
  • XML

Еще не полностью реализован:

  • Объединяющие логические и доказательные слои
  • Язык семантических веб-правил (SWRL)

Приложения[править]

Целью является повышение удобства использования и полезности интернета и его взаимосвязанных ресурсов путем создания семантических веб-сервисов, таких как:

  • Серверы, предоставляющие доступ к существующим системам данных с использованием стандартов RDF и SPARQL. Многие конвертеры в RDF существуют из разных приложений. Реляционные базы данных являются важным источником. Семантический веб-сервер подключается к существующей системе, не влияя на ее работу.
  • Документы "помечены" семантической информацией (расширение тегов HTML <meta><meta> , используемых на современных веб-страницах для предоставления информации для веб-поисковых систем с использованием искателей ). Это может быть машинно-понятная информация о понятном человеку содержании документа (например, создатель, название, описание и т. д.).) или это могут быть чисто метаданные, представляющие набор фактов (например, ресурсы и услуги в других местах сайта). Обратите внимание, что все, что можно идентифицировать с помощью единого идентификатора ресурса (URI) может быть описан, поэтому семантическая сеть может рассуждать о животных, людях, местах, идеях и т. д. Существует четыре формата семантических аннотаций , которые можно использовать в HTML-документах: Microformat , RDFa, Microdata и JSON-LD .[25] семантическая разметка часто создается автоматически, а не вручную.
  • Общие словари метаданных (онтологии) и карты между словарями, которые позволяют создателям документов знать, как разметить свои документы, чтобы агенты могли использовать информацию в предоставленных метаданных (так что автор в смысле "автор страницы" не будет путать с автором в смысле книги, которая является предметом обзора книги).
  • Автоматизированные агенты для выполнения задач для пользователей семантической сети с использованием этих данных.
  • Веб-службы (часто с собственными агентами) для предоставления информации специально агентам, например, Служба доверия, которую агент может спросить, имеет ли какой-либо интернет-магазин историю плохого обслуживания или спама .

Такие услуги могут быть полезны для публичных поисковых систем или могут использоваться для управления знаниями в рамках организации. Бизнес-приложения включают в себя:

  • Содействие интеграции информации из смешанных источников
  • Устранение двусмысленностей в корпоративной терминологии
  • Улучшение поиска информации, тем самым уменьшая информационную перегрузку и увеличивая уточнение и точность полученных данных
  • Определение соответствующей информации в отношении данного домена
  • Оказание поддержки в принятии решений

В корпорации есть закрытая группа пользователей, и управление в состоянии провести в жизнь руководящие принципы компании как принятие определенных онтологий и использование семантической аннотации . По сравнению с общедоступной семантической сетью требования к масштабируемости ниже, и информация, циркулирующая внутри компании, может быть более надежной в целом; конфиденциальность-это меньшая проблема за пределами обработки данных клиентов.

Скептические реакции[править]

Практическая осуществимость[править]

Критики подвергают сомнению основную осуществимость полного или даже частичного выполнения семантической сети, указывая и на трудности в ее создании и на отсутствие универсальной полезности, которая препятствует требуемому усилию быть вложенным. В статье 2003 года Маршалл и Шипман указывают на когнитивные накладные расходы, присущие формализации знаний, по сравнению с созданием традиционного веб-гипертекста:]

   В то время как изучение основ HTML относительно просто, изучение языка представления знаний или инструмента требует от автора изучения методов абстракции представления и их влияния на рассуждения. Например, понимание отношений класса-экземпляра или суперкласса-подкласса-это больше, чем понимание того, что одна концепция является “типом” другой концепции. [ ... ] Эти абстракции преподаются компьютерным ученым в целом и инженерам по знаниям в частности, но не соответствуют аналогичному значению естественного языка как "типа" чего-то. Эффективное использование такого формального представления требует, чтобы автор стал квалифицированным инженером знаний в дополнение к любым другим навыкам, требуемым областью. [ ... ] Как только человек выучил язык формального представления, он все еще часто прилагает гораздо больше усилий для выражения идей в этом представлении, чем в менее формальном представлении [...]. Действительно, это форма программирования, основанная на объявлении семантических данных и требующая понимания того, как логические алгоритмы будут интерпретировать созданные структуры. 

По словам Маршалла и Шипмана, молчаливый и меняющийся характер многих знаний добавляет к проблеме инженерии знаний и ограничивает применимость семантической сети к конкретным доменам. Еще одна проблема, на которую они указывают, - это специфические для домена или организации способы выражения знаний, которые должны быть решены с помощью соглашения сообщества, а не только технических средств.Как оказалось, специализированные сообщества и организации для внутрифирменных проектов, как правило, используют семантические веб-технологии в большей степени, чем периферийные и менее специализированные сообщества. Практические ограничения на пути к принятию стали менее сложными в тех случаях, когда сфера охвата и сфера охвата более ограничены, чем у широкой общественности и Всемирной паутины.

Наконец, Маршалл и Шипман видят прагматические проблемы в идее ( навигатор знаний-стиль) интеллектуальные агенты, работающие в основном вручную куратором семантической сети:

   В ситуациях, когда потребности пользователей известны и хорошо описаны распределенные информационные ресурсы, этот подход может быть весьма эффективным; в ситуациях, которые не предусмотрены и которые объединяют непредвиденный массив информационных ресурсов, подход Google является более надежным. Кроме того, семантическая сеть полагается на более хрупкие цепочки вывода; недостающий элемент цепи приводит к неспособности выполнить желаемое действие, в то время как человек может предоставить недостающие части в более похожем на Google подходе. [ ... ] компромиссы затрат и выгод могут работать в пользу специально созданных семантических веб-метаданных, направленных на объединение разумных хорошо структурированных информационных ресурсов, специфичных для домена; пристальное внимание к потребностям пользователей/клиентов будет стимулировать эти Федерации, если они будут успешными. 

Критика Кори Доктороу ("metacrap") происходит с точки зрения человеческого поведения и личных предпочтений. Например, люди могут включать поддельные метаданные в веб-страницы в попытке ввести в заблуждение семантические веб-механизмы, которые наивно принимают правдивость метаданных. Это явление было хорошо известно с помощью метатегов, которые обманули алгоритм ранжирования Altavista в повышении рейтинга определенных веб-страниц: механизм индексирования Google специально ищет такие попытки манипулирования. Питер Гэрденфорс и Тимо Хонкела обратите внимание, что семантические веб-технологии, основанные на логике, охватывают лишь часть релевантных явлений, связанных с семантикой .

Цензура и конфиденциальность[править]

Энтузиазм по поводу семантической сети может быть умерен опасениями относительно цензуры и конфиденциальности . Например, методы анализа текста теперь можно легко обойти, используя другие слова, например метафоры, или используя вместо слов изображения. Усовершенствованная реализация семантической сети значительно облегчила бы правительствам контроль за просмотром и созданием информации в интернете, так как эта информация была бы намного проще для автоматизированной машины блокировки контента. Кроме того, был также поднят вопрос о том, что с использованием файлов FOAF и метаданных геолокации, было бы очень мало анонимности, связанной с авторством статей о таких вещах, как личный блог. Некоторые из этих проблем были рассмотрены в рамках проекта "Policy Aware Web" и являются активной темой исследований и разработок.

Удвоение выходных форматов[править]

Еще одна критика семантической сети заключается в том, что создание и публикация контента отнимает гораздо больше времени, поскольку для одной части данных требуется два формата: один для просмотра человеком и один для машин. Однако многие разрабатываемые веб-приложения решают эту проблему путем создания машиночитаемого формата при публикации данных или при запросе машиной таких данных. Разработка микроформатов была одна реакция на такого рода критику. Еще одним аргументом в защиту целесообразности semantic web является вероятное падение цен на задачи человеческого интеллекта на цифровых рынках труда, таких как Amazon Mechanical Turk .[

Такие спецификации, как eRDF и RDFa, позволяют встраивать произвольные данные RDF в HTML-страницы. Механизм GRDDL (сбор описаний ресурсов из диалектов языка) позволяет автоматически интерпретировать существующие материалы (включая микроформаты) как RDF, поэтому издателям необходимо использовать только один формат, например HTML.

Исследовательская деятельность по корпоративным приложениям[править]

Первой исследовательской группой, уделившей особое внимание корпоративной семантической сети , стала команда ACACIA в INRIA-Sophia-Antipolis, основанная в 2002 году. Результаты их работы включают поисковую систему Corese на основе RDF(S) и применение семантических веб-технологий в области электронного обучения .

С 2008 года корпоративная семантическая веб-исследовательская группа, расположенная в Свободном университете Берлина, фокусируется на строительных блоках: корпоративный семантический поиск, корпоративное семантическое сотрудничество и корпоративная онтология.

Инженерное исследование онтологии включает в себя вопрос о том, как привлечь неопытных пользователей к созданию онтологий и семантически аннотированного контента и для извлечения явных знаний из взаимодействия пользователей внутри предприятий.

Будущее приложений[править]

Тим О'Рейли, который придумал термин Web 2.0, предложил долгосрочное видение семантической сети как сети данных, где сложные приложения манипулируют сетью данных. сеть данных преобразует сеть из распределенной файловой системы в распределенную систему баз данных.

См. также[править]

Пруф[править]

.w3.org/standards/semanticweb/