Онтологические модели представления знаний Существует множество обстоятельств, которые затрудняют распространение и обмен знаниями между людьми, столь. Основные онтологические модели

Эта страница представляет собой главу из нашего методического пособия
"Введение в онтологическое моделирование "
(нажмите для перехода к полной версии пособия в формате PDF).

Писателям-фантастам XX века казалось, что развитие вычислительных машин приведет к появлению интеллектуальных помощников человека, которые будут решать за него многие мыслительные задачи. Возможности сегодняшней техники превышают самые смелые прогнозы многих из этих авторов: компьютер умещается на ладони, всемирная сеть доступна практически везде. При этом для решения аналитических задач мы в большинстве случаев по-прежнему пользуемся в лучшем случае электронными таблицами вроде Excel. Это особенно заметно в бизнес-среде, где цена (не)правильно принятого решения имеет совершенно осязаемый эквивалент в виде многомиллиардных прибылей или убытков. Тем не менее, развитие информационной инфраструктуры бизнеса завязло на пути создания крупных «трехбуквенных систем» (ERP, CRM и т.д.), на которые тратятся огромные средства, но которые не способны дать организации-владельцу ничего особенно «интеллектуального». Современные системы «бизнес-аналитики» (BI) в основном заняты вычислением значений количественных показателей, часто имеющих весьма слабое отношение к описанию реальности, и манипулированию ими.

Отличным примером служит любимый бизнесом показатель EBITDA: он характеризует прибыль, и по этой причине часто используется, например, в качестве базы для начисления бонусов топ-менеджерам. Однако он не характеризует эффективность работы менеджера в том смысле, в каком ее интуитивно оценивает собственник: ведь путем уменьшения расходов можно увеличить значение EBITDA. Это всегда интересно менеджеру, но не всегда верно с точки зрения стратегического развития предприятия. А уж при расчете этого показателя по подразделениям компании возможности манипуляции открываются широчайшие. В большинство статей доходов и расходов вносят вклад сразу несколько подразделений, настройкой алгоритма расчета можно легко «награждать» фаворитов и «наказывать» неугодных. Разумеется, подобные маневры не имеют ничего общего с достижением реальной эффективности работы предприятия.

Еще рельефнее видны методологические проблемы при попытках решать оптимизационные задачи количественными методами. Типичный подход к этому вопросу состоит в формулировании «целевой функции», которая представляет собой описание какого-либо качественного состояния системы, представленного в виде числа – например, «обеспеченность населения такими-то услугами». Далее, также в количественной форме, задаются ограничения, варьируемые параметры, и после вычислений получается некий набор «оптимальных» решений. Однако их практическое воплощение часто приводит к результатам, противоположным поставленным целям, или имеет серьезные побочные последствия. Например, легко может оказаться, что «средняя температура по больнице» – обеспеченность услугами – достигла нужных значений, но определенным группам населения они стали вовсе недоступны. Или же качество этих услуг снизилось настолько, что они практически потеряли смысл для потребителей. Легко понять, что корень проблемы лежит в слишком серьезных модельных допущениях, которые были сделаны при формализации целевого параметра.

Указанные методические проблемы напрямую связаны с вычислительными возможностями – точнее, с ограниченностью той их части, которую освоило бизнес-сообщество. Ведь если более сложный и достоверный алгоритм расчета какого-либо показателя нельзя, по мнению бизнес-заказчика, реализовать в информационной системе – это обосновывает применение неверного, грубого, но технологически понятного способа расчета. Таким образом, в сущности, в сфере бизнеса человек пока по-настоящему доверил компьютеру только одну функцию – складывать и вычитать числа. Все остальное он по-прежнему делает сам, и делает, в большинстве случаев, не слишком качественно.

Разумеется, мы говорим только об общей тенденции; есть немало контрпримеров реализации по-настоящему эффективных систем, помогающих оптимизировать те или иные процессы, но почти все такие системы имеют узкую отраслевую направленность, и содержат жестко запрограммированные алгоритмы решения задач. Таким образом, системного влияния на положение дел они не оказывают.

Что же нужно сделать для того, чтобы компьютер стал по-настоящему помогать нам в решении интеллектуальных бизнес-задач, смог поддерживать принятие решений в любых сферах? Необходимо вдохнуть в него «искру разума», то есть научить его «думать», как мы. Фактически, для этого нужно воспроизвести в цифровом представлении те информационные структуры и процессы, которыми мы сами пользуемся в процессе мышления: понятийный аппарат, логические рассуждения. Тогда мы сможем реализовать и процессы обработки этих структур, то есть имитировать на компьютере отдельные фрагменты наших когнитивных способностей. После этого, получив определенные результаты, мы сможем критически посмотреть на смоделированные структуры и процессы, и улучшить их. В сочетании с недоступной человеку способностью вычислительных машин к быстрой обработке огромных объемов информации, такой подход обещает дать небывало высокий уровень качества поддержки принятия решений со стороны информационных систем.

Мы не случайно привели именно логическое мышление в качестве примера когнитивного процесса, который можно воспроизвести в вычислительной среде. Существуют и другие подходы, наиболее популярным из которых является использование нейросетей – то есть имитация процессов, происходящих при взаимодействии нейронов в головном мозгу. При помощи такого рода средств успешно решаются задачи распознавания образов, речи и т.д. Можно «обучить» нейросети и для применения в качестве средства поддержки принятия решений. Однако с ростом числа факторов, требуемых для оценки ситуации, сложности их структуры, способов влияния на ситуацию, возможности нейросетей становятся все менее убедительными: на обучение требуется больше времени, получаемые результаты носят вероятностный характер, не обеспечивают логической доказуемости. Выход за пределы заранее ограниченного круга ситуаций приводит к невозможности получить от нейросети результат, пригодный для практического использования. Имитация же логического мышления свободна от большинства этих недостатков, а коррекция логической схемы при изменении условий требует куда меньше усилий, чем переобучение нейросети. Зато при составлении логических моделей принципиально важным становится их корректность, непротиворечивость, релевантность, зависящая от человека – автора модели.

Одна из главных особенностей человеческого сознания состоит в том, что оно лениво. Наш мозг отсекает все «лишнее», сводя наше представление о событиях и явлениях к довольно простым определениям. Мы видим только черное и белое, и принимаем решения, исключив из рассмотрения подавляющее большинство объективной информации.

Этим же грехом человек страдает при анализе бизнес-процессов и сред. Вместо того, чтобы воспринимать бизнес как сложную систему, не поддающуюся упрощению дальше определенного предела без критической потери достоверности результатов аналитики, человек старается свести все критерии оценки и управления к нескольким числовым показателям. Таким образом удается упростить получаемую модель, снизить затраты на ее создание. Но поступающим так не следует удивляться, когда их прогнозы не оправдываются, а решения, принятые на основании моделирования оказываются неверными.

Главный принцип качественной аналитики, управления, основанного на знаниях, звучит так: НЕ УПРОЩАТЬ модель без необходимости.

Онтологическое моделирование: цели и средства

К сожалению, распространенные сегодня компьютерные технологии не благоприятствуют реализации этого принципа. Если в качестве инструмента анализа нам доступен только Excel или реляционные базы данных – описание бизнеса неизбежно придется сводить к ограниченному набору числовых показателей. Поэтому одной из наиболее актуальных проблем развития ИТ в настоящий момент является доведение до широкой промышленной эксплуатации таких технологий, которые позволяют строить действительно сложные и комплексные информационные модели, и решать с их помощью те оптимизационные, аналитические, оперативные задачи, перед которыми другие технические средства оказываются бессильны.

Многообещающим, но несколько недооцененным на сегодняшний день направлением решения этой задачи является использование так называемых семантических технологий. Идеи автоматизированной обработки концептуализированного знания неоднократно выдвигались мыслителями начиная с эпохи Возрождения, ограниченно использовались в лучшие годы советской плановой экономики, но до действительно функционального воплощения доросли только сейчас. На сегодняшний день созданы все необходимые компоненты методики и технологий, необходимых для работы с онтологическими моделями, которые являются предметом обработки с помощью семантических технологий. Слово «онтология» означает совокупность знаний; термин «семантические технологии» подчеркивает тот факт, что они обеспечивают работу со смыслом информации. Таким образом, переход с традиционных ИТ на семантические технологии является переходом от работы с данными к работе со знаниями. Разница между этими двумя терминами, которые здесь мы используем исключительно в применении к содержанию информационных систем, подчеркивает отличие в способе использования информации: для восприятия и использования данных необходим человек, субъект, которому приходится выполнять при этом операцию осмысления, выявления смысла данных, и его переноса на интересующую часть реальности. Знания же могут восприниматься непосредственно, так как они уже представлены при помощи того понятийного аппарата, которым пользуется человек. Кроме того, с представленными в электронном виде знаниями (онтологиями) могут выполняться и полностью автоматические операции – получение логических выводов. Результатом этого процесса являются новые знания.

Аналитики Gartner называли семантические технологии одним из наиболее многообещающих ИТ-трендов 2013 года, однако их оптимизм оказался преждевременным. Почему? Все по той же причине – человек ленив, а создание семантических моделей требует серьезных умственных усилий. Тем больше выгод и преимуществ перед конкурентами получат те, кто предпримет эти усилия, и трансформирует их в реальный бизнес-результат.

НАЧАЛО — Онтологии в корпоративных системах. Часть I

Онтологические системы могут применяться для решения задач в сфере бизнеса, создания интеллектуальных систем, представления знаний в Интернет. Круг технологий, связанных с этим вопросом, весьма широк и включает в себя мультиагентные системы, автоматическое извлечение знаний из текстов на естественном языке, поиск информации, интеллектуальное аннотирование, автоматическое составление авторефератов и прочее.

Во второй части статьи вкратце рассмотрены теоретические понятия, инструментальные средства, практические примеры применения.

ФОРМАЛЬНАЯ МОДЕЛЬ ОНТОЛОГИИ

Онтология состоит из терминов (понятий), их определений и атрибутов, а также связанных с ними аксиом и правил вывода.

Формальная модель онтологии O= — это упорядоченная тройка конечных множеств, где:

  • Т — термины прикладной области (ПрО), которую описывает онтология O;
  • R — отношения между терминами заданной ПрО;
  • F — функции интерпретации, заданные на терминах и/или отношениях онтологии O.

Модели онтологий классифицируются таким образом:

  • простые (имеют лишь концепты);
  • на основе фреймов (имеют лишь концепты и свойства);
  • на основе логик (например Ontolingua, DAML+OIL).

Отношения представляют тип взаимодействия между концептами ПрО . Пример бинарного отношения — «является частью». Следует заметить, что отношения, которые целесообразно использовать при создании онтологии, значительно менее разнообразны, чем термины, и, как правило, не специфичны для конкретной ПрО («часть-целое», «является подклассом», «оказывает воздействие», «похоже на» и т. п.).

Аксиомы используются для моделирования утверждений, которые всегда являются истинными.

Между концептами могут быть установлены определенные виды связей. Словарь терминов в определенной прикладной области, тезаурус со своими понятиями (концептами) и связи, которые определяют термины естественного языка, могут рассматриваться как онтологии. Для установления связи между вербально определенными концептами и поиском концептов релевантных запросов используются методы получения информации. Известными примерами онтологии такого типа являются индексы поисковых машин информации в Интернет.

Для описания более сложных систем вводят такие понятия, как модель расширяемой онтологии .

ЯЗЫКИ ОПИСАНИЯ ОНТОЛОГИЙ

Для того чтобы реализовывать различные онтологии, необходимо разработать языки их представления, имеющие достаточную выразительную мощность и позволяющие пользователю избежать «низкоуровневых» проблем.

Ключевым моментом в проектировании онтологии является выбор соответствующего языка спецификации онтологий (Ontology specification language). Цель таких языков — дать возможность указывать дополнительную машинно-интерпретируемую семантику ресурсов, сделать машинное представление данных более похожим на положение вещей в реальном мире, существенно повысить выразительные возможности концептуального моделирования слабо структурированных Web-данных.

Распространение онтологического подхода к представлению знаний оказало содействие при создании разнообразных языков представления онтологии и инструментальных средств, предназначенных для их редактирования и анализа.

Существуют традиционные языки спецификации онтологий: Ontolingua, CycL, языки, основанные на дескриптивных логиках (такие как LOOM), языки, основанные на фреймах (OKBC, OCML, Flogic).

Более поздние языки основаны на Web-стандартах (XOL, SHOE, UPML). Специально для обмена онтологиями через Web были созданы RDF(S), DAML, OIL, OWL, которые будут рассмотрены далее.

В целом, различие между традиционными и Web-языками спецификации онтологии заключается в выразительных возможностях описания предметной области и некоторых возможностях механизма логического вывода для этих языков. Типичные примитивы языков дополнительно включают:

  • конструкции для агрегирования, множественных иерархий классов, правил вывода, аксиом;
  • различные формы модуляризации для записи онтологий и взаимоотношений между ними;
  • возможность мета-описания онтологии, что полезно при установлении отношений между различными видами онтологий. Сегодня некоторые из таких языков приобрели большую популярность и широко применяются (в частности для описания информационных ресурсов и сервисов Интернет).

Язык RDF . В рамках проекта семантической интерпретации информационных ресурсов Интернет (Semantic Web) был предложен стандарт описания метаданных о документе Resource Description Framework, использующий XML-синтаксис.

RDF использует базовую модель данных «объект — атрибут — значение» и способен сыграть роль универсального языка описания семантики ресурсов и взаимосвязей между ними. Ресурсы описываются в виде ориентированного размеченного графа — каждый ресурс может иметь свойства, которые в свою очередь также могут быть ресурсами или их коллекциями. Все словари RDF используют базовую структуру, описывающую классы ресурсов и типы связей между ними. Это позволяет использовать разнородные децентрализованные словари, созданные для машинной обработки по разным принципам и методам. Важной особенностью стандарта является расширяемость: можно задать структуру описания источника, используя и расширяя такие встроенные понятия RDF-схем, как классы, свойства, типы, коллекции. Модель схемы RDF включает наследование классов и свойств.

RDF уже получил поддержку многих ведущих производителей ПО. Разработан ряд программных продуктов, позволяющих создавать RDF-описания для разного рода систем. Предполагаются возможности интеграции существующих хранилищ информации в общую базу семантического описания и интеграции концепции RDF-базы с форматом MPEG. RDF Schema — стандарт, предложенный по инициативе W3C для представления онтологических знаний. Он специфицирует множество всевозможных допустимых схем данных. Модели предметных областей описываются посредством ресурсов, свойств и их значений. RDFS предоставляет хорошие базовые возможности для описания словарей типов предметных областей. Одно из ограничений — невозможность с помощью RDFS выразить аксиоматические знания, т. е. задать аксиомы и правила вывода, построенные на них.

DAML+OIL — семантический язык разметки Web-ресурсов, расширяющий стандарты RDF и RDF Schema за счет более полных примитивов моделирования. Последняя версия DAML+OIL обеспечивает богатый набор конструкций для создания онтологии и разметки информации таким образом, чтобы их могла читать и понимать машина.

Первыми предложениями по описанию онтологии на базе RDFS были DARPA DAML-ONT (DARPA Agent Markup Language) и European Commission OIL (Ontology Inference Layer). Эти стандарты спецификации и обмена онтологиями были разработаны для поддержки процесса обмена знаниями и интеграции знаний. На базе этих предложений и возникло совместное решение DAML+OIL. Онтология DAML+OIL состоит из: заголовков (headers); элементов классов (class elements); элементов свойств (property elements); экземпляров (instances).

OWL (Web Ontology Language) — язык представления онтологий, расширяющий возможности XML, RDF, RDF Schema и DAML+OIL. Этот проект предусматривает создание мощного механизма семантического анализа. Планируется, что в нем будут устранены ограничения конструкций DAML+OIL.

Онтологии OWL — это последовательности аксиом и фактов, а также ссылок на другие онтологии. Они содержат компоненту для записи авторства и другой подробной информации, являются документами Web, на них можно ссылаться через URI.

В упоминавшемся уже проекте Semantic Web «машинная обработка смысла» контента будет сделана максимально четкой при помощи пометки документов указателем «с полным смыслом» на основе использования онтологических терминов. Таким образом, онтологии рассматриваются как ключевая технология для использования в Semantic Web (рис. 1).

Онтологии играют важную роль в организации обработки знаний на основе Web, а также для их совместного использования. Онтологии, определяемые как совместно используемые формальные концепции конкретных предметных областей, дают общее представление о темах, информацией о которых могут обмениваться и люди, и приложения. Онтологии отличаются от XML-схем тем, что это представления знаний, а не форматы сообщений (большинство Web-стандартов состоят из комбинации форматов сообщений и спецификаций протоколов).

ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА ОБРАБОТКИ ОНТОЛОГИЙ

Одним из достоинств онтологии является наличие для них инструментального ПО, обеспечивающего общую доменно-независимую поддержку онтологического анализа. Существует целый ряд инструментов для онтологического анализа, поддерживающих редактирование, визуализацию, документирование, импорт и экспорт онтологий разных форматов, их представление, объединение, сравнение.

Редакторы

Ontolingua. Кроме собственно редактора онтологии, эта система содержит сетевой компонент Webster, предназначенный для определения концептов, сервер, обеспечивающий доступ к онтологиям Ontolingua по протоколу OKBC (Open Knowledge Base Connectivity), и Chimaera — инструментарий для анализа и объединения онтологий.

Protégé — свободно распространяемая Java-программа, предназначенная для построения (создания, редактирования и просмотра) онтологий той или иной прикладной области. Она включает редактор онтологии, позволяющий проектировать онтологии, разворачивая иерархическую структуру абстрактных и конкретных классов и слотов. На основе сформированной онтологии Protégé позволяет генерировать формы получения знаний для введения экземпляров классов и подклассов.

Инструмент поддерживает использование языка OWL и позволяет генерировать html-документы, отображающие структуру онтологий. Поскольку он использует фреймовую модель представления знаний ОКВС, это позволяет адаптировать его и для редактирования моделей ПрО, представленных не в OWL, а в других форматах (UML, XML, SHOE, DAML+OIL, RDF и RDFS и т. п.).

DOE — простой редактор, который позволяет пользователю создавать онтологии. Процесс спецификации онтологии состоит из трех этапов.

На первом этапе пользователь строит таксономию понятий и отношений, явным образом очерчивая позицию каждого элемента (понятие) в иерархии. Затем пользователь указывает, в чем специфика понятия относительно его «родителя», и в чем это понятие подобно или отлично от его «братьев». Пользователь может также прибавить синонимы и энциклопедическое определение на нескольких языках для всех понятий.

На втором этапе две таксономии рассматриваются с разных точек зрения. Пользователь может расширить их новыми объектами или добавить ограничения на области отношений.

На третьем этапе онтология может быть переведена на язык представления знаний.

OntoEdit — инструментальное средство, обеспечивающее просмотр, проверку и модификацию онтологии. Оно поддерживает языки представления онтологии OIL и RDFS, а также внутренний язык представления знаний OXML, основанный на XML. Как и Protégé, это автономное Java-приложение, но его коды закрыты. Свободно распространяемая версия OntoEdit Free ограничена 50 концептами, 50 отношениями и 50 экземплярами.

OilEd -автономный графический редактор онтологии, разработанный в рамках проекта Оп-То-Knowledge. Он свободно распространяется по общедоступной лицензии GPL. Инструмент использует для представления онтологий язык OIL. В OilEd отсутствует поддержка экземпляров классов.

WebOnto разработан для просмотра, создания и редактирования онтологий. Для моделирования онтологий он использует язык OCML (Operational Conceptual Modeling Language). Пользователь может создавать различные структуры, в том числе классы со множественным наследованием. Инструмент имеет ряд полезных особенностей: просмотр отношений, классов и правил, возможна совместная работа над онтологией нескольких пользователей.

ODE (Ontological Design Environment) взаимодействует с пользователями на концептуальном уровне, обеспечивает их набором таблиц для заполнения (концептов, атрибутов, отношений) и автоматически генерирует код на языках LOOM, Ontolingua и FLogic. Инструмент получил свое развитие в WebODE, который интегрирует все сервисы ODE в единую архитектуру, сохраняя свои онтологии в реляционной БД.

Сложные инструментальные средства

Эти средства нужны для того, чтобы не только вводить и редактировать онтологическую информацию, но и анализировать ее, выполняя типичные операции над онтологиями, например:

  • выравнивание (alignment) — установка различного вида соответствий между двумя онтологиями для того, чтобы они могли использовать информацию друг друга;
  • отображение (mapping) — нахождение семантических связей между подобными элементами разных онтологий;
  • объединение (merging) — операция, которая по двум онтологиям генерирует третью, объединяющую информацию из первых двух.

PROMPT служит для объединения и группировки онтологий. Это дополнение к системе Protégé, реализованное в виде плагина. По двум онтологиям, которые надо объединить, PROMPT строит список операций (например, объединение терминов или их копирование в новую онтологию) и передает его пользователю, который может выполнить одну из предлагаемых операций. Затем список операций модифицируется, и создается список конфликтов и их возможных решений. Это повторяется до тех пор, пока не будет готова новая онтология.

Chimaera — интерактивный инструмент для объединения онтологии, базирующийся на редакторе онтологий Ontolingua.

В OntoMerge исходные онтологии транслируются в общее представление на специальном языке.

OntoMorph определяет набор операторов преобразования, которые можно применить к онтологии.

OBSERVER объединяет онтологии с информацией об отображении между ними и находит синонимы в исходных онтологиях.

ONION базируется на алгебре онтологии и предоставляет инструменты для определения правил артикуляции (соединения) между онтологиями.

МЕТОДОЛОГИЯ СОЗДАНИЯ ОНТОЛОГИЙ

Практическая разработка онтологии включает:

  • определение классов в онтологии;
  • расположение классов в таксономическую иерархию (подкласс — надкласс);
  • определение слотов и описание допускаемых значений этих слотов;
  • заполнение значений слотов экземпляров.

После этого можно создать базу знаний, определив отдельные экземпляры этих классов, введя в определенный слот значение и дополнительные ограничения для слота.

Выделим некоторые фундаментальные правила разработки онтологии. Они выглядят довольно категоричными, но во многих случаях помогут принять верные проектные решения.

  • Не существует единственно правильного способа моделирования предметной области — всегда существуют жизнеспособные альтернативы. Лучшее решение почти всегда зависит от предполагаемого приложения и ожидаемых расширений.
  • Разработка онтологии — это обязательно итеративный процесс.
  • Понятия в онтологии должны быть близки к объектам (физическим или логическим) и отношениям в интересующей предметной области. Скорее всего, это существительные (объекты) или глаголы (отношения) в предложениях, которые описывают предметную область.

Знание того, для чего предполагается использовать онтологию, и того, насколько детальной или общей она будет, может повлиять на многие решения, касающиеся моделирования.

Нужно определить, какая из альтернатив поможет лучше решить поставленную задачу и будет более наглядной, более расширяемой и более простой в обслуживании. Следует помнить, что онтология — это модель реального мира, и понятия в онтологии должны отражать эту реальность.

После того как определена начальная версия онтологии, мы можем оценить и отладить ее, используя ее в каких-то приложениях и/или обсудив ее с экспертами предметной области. В результате начальную онтологию скорее всего нужно будет пересмотреть. И этот процесс итеративного проектирования будет продолжаться в течение всего жизненного цикла онтологии.

Повторное использование существующих онтологии может быть необходимым, если системе нужно взаимодействовать с другими приложениями, которые уже вошли в отдельные онтологии или контролируемые словари. Многие полезные онтологии уже доступны в электронном виде и могут быть импортированы. Существуют библиотеки повторно используемых онтологий, например Ontolingua или DAML . Существует также ряд общедоступных коммерческих онтологий, например UNSPSC , RosettaNet , DMOZ .

ОРГАНИЗАЦИОННЫЕ ОНТОЛОГИИ И ПОРТАЛЫ ЗНАНИЙ

Несмотря на то что разработано уже много онтологии, отражающих знания о самых разнообразных объектах, при описании конкретных субъектов экономической деятельности надо учитывать их специфику и вносить ее в соответствующие онтологические модели.

Онтологическое представление знаний о субъектах экономической деятельности, которые входят в состав какой-либо системы, можно использовать для объединения их информационных ресурсов в единое информационное пространство (рис. 2).

Онтология предприятия содержит классы понятий с заданными на них семантическими отношениями. Она состоит из набора технологических онтологий и организационной онтологии , отражающей организационно-функциональную структуру предприятия: состав штатного расписания (работники, администрация, обслуживающий персонал), партнеры, ресурсы и т. п. и отношения между ними. Онтологии технологий содержат понятия, описывающие производственные процессы. Общие знания ПрО, к которой относятся субъекты экономической деятельности, отображает онтология отрасли .

Разработанные онтологии позволят сотрудникам одной отрасли или корпорации использовать общую терминологию и избежать взаимных недоразумений, которые могут усложнить сотрудничество и привести к серьезным убыткам (например, организационная онтология четко отражает взаимную иерархию и связи между подразделениями предприятия, а также сферы их компетенции, а ссылки на определенные нормативные документы обеспечивают одинаковую базу для переговоров). Они обеспечат работу со структурированными источниками данных, для которых может быть построена схема данных, то есть описаны типы данных и связи между ними, и существует формальный способ получения отдельных элементов данных. Примерами структурированных источников данных можно считать различные базы данных (например реляционные и объектные), а также слабо структурированные ресурсы, описанные в форматах XML, RDF, OWL, DAML+OIL.

В качестве примера практического использования онтологических моделей технологий приведем систему ONTOLOGIC , предназначенную для создания и поддержки распределенных систем нормативно-справочной информации (НСИ), ведения словарей, справочников и классификаторов и поддержки системы кодирования объектов учета (см. рис. 3).

Основу системы составляет технологическая среда для постоянного, в режиме реального времени, взаимодействия пользователей: потребителей информации (сотрудников служб и функциональных подразделений) и экспертов, отвечающих за ведение нормативно-справочной информации.

Для обеспечения однозначной идентификации и классификации объектов в системах НСИ разработана методика, использующая онтологическую модель формального описания классифицируемых данных, обеспечивающая выделение ключевых свойств объектов классификации и построение на их основе классификационного кода. Выделяются классы (группы однородной продукции) по принципу однородности набора технических и потребительских характеристик, и для каждого материала формируется классификационный код, включающий код класса и коды всех свойств и их значений для данного материала.

Онтология обеспечивает непротиворечивое накопление любого количества информации в стандартной структуре классификации. Такой подход гарантирует однозначную идентификацию ресурсов независимо от различных трактовок их наименований разными производителями.

Данная технология предусматривает создание типового решения для управления основными данными и НСИ для промышленных предприятий, холдингов и государственных структур. В качестве технологической платформы используется SAP MDM (Master Data Management), предназначенный для интеграции различных (в том числе разноплатформенных) приложений в масштабе компании, холдинга, отрасли, госструктуры и т. п., а также для организации и управления отраслевой или корпоративной нормативно-справочной информацией (мастер-данными).

ПРИМЕРЫ ПРИМЕНЕНИЯ ОНТОЛОГИЙ

TOVE (Toronto Virtual Enterprise). Цель проекта — создание модели данных, которая должна:

  • обеспечить общую терминологию для предметной области, приложения которой могут совместно использоваться и пониматься каждым участником общения;
  • дать точное и по возможности непротиворечивое определение значения каждого термина на основе логики первого порядка;
  • обеспечить задание семантики с помощью множества аксиом, которые автоматически позволяют получать ответ на множество вопросов о предметной области.

TOVE должно обеспечить построение интегрированной модели некоторой предметной области, состоящей из следующих онтологии: операций, состояний и времени, организации, ресурсов, продуктов, сервиса, производства, цены, количества.

Ontolingua — система, разработанная в Стэнфордском университете, которая обеспечивает распределенную совместную среду для просмотра, создания, редактирования, модификации и использования онтологии. Сервер системы поддерживает до 150 активных пользователей, некоторые из которых дополняют систему описанием своих проектов.

Среди множества других проектов Ontolingua использует проект Enterprise project.

Enterprise Project. Целью проекта является улучшение (где необходимо, замена) существующих методов моделирования при помощи набора средств, позволяющих интегрировать различные методы и средства моделирования предприятия. Предполагается создание таких инструментальных средств, которые обеспечат: фиксирование и описание конкретной предметной области; определение задач и требований (согласующихся с онтологией); определение и оценку вариантов решений и альтернативных проектов, реализацию выбранной стратегии.

При независимой разработке инструментальных средств возможно использование разной терминологии, что может привести к конфликтам и неоднозначности при их интегрировании. Для решения этой проблемы была построена онтология, в которой задан набор часто используемых и общепринятых терминов, таких как деятельность, процесс, организация, стратегия, маркетинг.

KACTUS. Цель проекта — построение методологии многократного применения знаний о технических системах во время их жизненного цикла. Это необходимо, чтобы использовать одни и те же базы знаний для проектирования, оценки, функционирования, сопровождения, перепроектирования и обучения.

KACTUS поддерживает интегрированный подход, включающий производственные и инженерные методы и методы инженерии знаний, на основе создания онтологической и вычислительной основы для многократного использования полученных знаний параллельно с различными приложениями технической области. Это достигается при помощи построения онтологии предметной области и ее многократного использования в различных прикладных областях. Кроме того, делается попытка объединить эти онтологии с существующими стандартами (например STEP), применяя онтологии там, где возможно фиксирование данных о конкретной области.

Основным формализмом в KACTUS является CML (Conceptual Modeling Language).

Инструментарий KACTUS представляет собой интерактивную среду, в которой можно экспериментировать с теоретическими результатами (организовывать библиотеки онтологии, преобразовывать данные между онтологиями, делать преобразования для различных формализмов), а также осуществлять практические действия (просмотр, редактирование и уточнение онтологии в разных формализмах).

OntoSeek — информационно-поисковая система, которая разработана для семантически ориентированного поиска информации, комбинируя управляемый онтологией механизм установления соответствия смысла и мощные системы моделирования.

SHOE (Simple HTML Ontology Extensions) позволяет авторам аннотировать свои Web-страницы, внося в них семантическое содержание. Основным компонентом SHOE является онтология, которая содержит информацию о некоторой области. Используя эту информацию, средства поиска и построения запросов обеспечивают более релевантный ответ на запрос по сравнению с существующими поисковыми машинами, так как предоставляется возможность включать в Web-страницы знания, которые интеллектуальные агенты могут действительно прочитать. Для этого SHOE дополняет HTML набором специальных тэгов для представления знаний. SHOE позволяет находить знания с помощью таксономии и правил вывода, существующих в онтологии.

Plinus. Целью проекта является полуавтоматическое извлечение знаний из текстов на естественном языке, в частности, литературы о механических свойствах керамических материалов. Так как тексты охватывают широкий диапазон понятий, требуется множество интегрированных онтологии для охвата таких понятий, как керамические материалы и их свойства, способы их обработки, различные дефекты материалов, например, такие как трещины и поры. Онтология определяет язык, при помощи которого выражается семантическая часть словаря.

ЗАКЛЮЧЕНИЕ

Деятельность отдельных людей и организаций сейчас все в большей степени зависит от имеющейся у них информации и способности ее эффективно использовать (извлекать знания). При этом одни группы людей, занимающихся обработкой информации, используют специальные термины, которые другими организациями используются в ином контексте. В то же время в разных организациях часто применяются разные обозначения для одних и тех же понятий.

Все это значительно усложняет взаимопонимание. Поэтому необходимо разрабатывать формализованные модели представления знаний, которые обеспечивали бы обработку информации на семантическом уровне в системах управления знаниями (СУЗ).

В настоящее время существует значительный интерес к СУЗ со стороны промышленных компаний, которые осознают высокий прикладной потенциал систем, базирующихся на знаниях и используемых для решения целого ряда практических задач предприятия (организации). Вопросы управления знанием приобретают решающее значение для развивающейся экономики, где знание капитализируется и, поэтому, приобретает совершенно иной статус.

Онтологии играют решающую роль в модели описания знания, без которой, как утверждают специалисты, вход в любую предметную область запрещен. Проектирование онтологии — это творческий процесс, и поэтому потенциальные приложения онтологии, а также понимание разработчиком предметной области и его точка зрения на нее будут, несомненно, влиять на принятие решений.

    Гладун Анатолий Ясонович — канд. техн. наук, с.н.с. Международного НУЦ информационных технологий и систем НАНУ,

    Рогушина Юлия Витальевна — канд. физ-мат. наук, с.н.с. Института программных систем НАНУ.

Курск 2007


ББК Печатается по решению

редакционно-издательского совета

Курского государственного Университета

Рецензент -

: Учеб. пособ. для студентов университета. – Курск: Изд-во Курск.гос.ун-та, 200 . – 84 с.

Учебно-методическое пособие посвящено наиболее перспективному подходу к моделированию предметных областей – онтологическому. Рассмотрены основные понятия, определения, методология разработки и построения онтологий на примере учебной базы знаний «Мир Животных». Рассмотрено одно из средств построения онтологий – Protégé.

Предназначено для студентов старших курсов, обучающихся по специальности …….. математическое обеспечение и администрирование информационных систем.


Введение................................................................................... 4

1. Теоретические аспекты построения онтологий................... 5

1. 1. Определение онтологии................................................. 5

1. 2. Модели онтологии и онтологической системы............ 14

1. 3. Применение онтологий................................................ 21

1. 4. Инструменты инженерии онтологий........................... 25

2. Создание онтологии предметной области в Protégé.......... 30

2. 1. Предварительные замечания....................................... 30

2. 2. Основные сведения о Protégé...................................... 37

2. 3. Создание онтологии предметной области в Protégé.... 40

3. Семестровое задание......................................................... 77

Порядок выполнения проекта:............................................ 77

Литература............................................................................. 82


Введение

Экспертная система представляет собой совокупность трех, взаимозависимы «модулей»: база знаний, машина вывода, интерфейс пользователя. Машину вывода и интерфейс обычно объединяют и называют оболочкой экспертной системы. В этом случае можно говорить о двух составляющих: оболочка и база знаний. Наиболее важным компонентом среди них, безусловно, является база знаний. Проблема адекватного метода, или способа, моделирования предметной области и как следствие формализация знаний с последующим занесением их в базу знаний является если не центральной, то, по меньшей мере, важной в теории искусственного интеллекта.



Существует множество методов представления знаний. Это широко известные логические и фреймовые методы, а также семантические сети и правила продукции. При создании систем основанных на знаниях (экспертные системы, несомненно, к ним относятся) применяются различные способы представления знаний.

Каждый из этих методов имеет свои достоинства и недостатки. На данный момент значительный интерес представляет использование онтологии в качестве базы знаний систем основанных на знаниях. Заметим, что в некоторой литературе база знаний отождествляется с онтологией. Вообще говоря, однозначного определения онтологии предметной области не существует, зачастую онтологию определяют так, как выгодно разработчику на данный момент. Этой, и некоторым другим интересным проблемам, связанным с онтологиями, а также вопросы их технической реализации рассмотрены в данном пособии.

Теоретические аспекты построения онтологий

Определение онтологии

Как было замечено ранее, представление знаний является важной проблемой в искусственном интеллекте. Под термином «представление знаний» может пониматься либо способ кодирования знаний в базе знаний, либо формальная система, которая используется для формализации знаний.

Практика разработки систем, основанных на знаниях, для сложных предметных областей и задач показала, что в каждой предметной области существует некоторая структура, занимающая промежуточное положение между представлением знаний, используемым в модели предметной области, и моделью предметной области (базой знаний).

Эта структура получила название "онтология предметной области".

В философии онтология это - термин, определяющий учение о бытии, о сущем, в отличие от гносеологии - учении о познании. С другой точки зрения, онтология - это формально представленные на базе концептуализации знания. Концептуализация предполагает описание множества объектов и понятий, знаний о них и связей между ними.

Онтологией называется эксплицитная спецификация концептуализации. Формально онтология состоит из терминов, организованных в таксономию, их определений и атрибутов, а также связанных с ними аксиом и правил вывода.

В простейшем случае онтология описывает только иерархию концептов, связанных отношениями категоризации. В более сложных случаях в нее добавляются подходящие аксиомы для выражения других отношений между концептами и для того, чтобы ограничить их предполагаемую интерпретацию.

Учитывая это, онтология представляет собой базу знаний, описывающую факты, которые предполагаются всегда истинными в рамках определенного сообщества на основе общепринятого смысла используемого словаря.

Выделим следующие интерпретации этого термина:

1. Онтология как философская дисциплина.

2. Онтология как неформальная концептуальная система.

3. Онтология как формальный взгляд на семантику.

4. Онтология как спецификация «концептуализации».

5. Онтология как представление концептуальной системы через логическую теорию, характеризуемую:

o специальными формальными свойствами или

o только ее назначением

6. Онтология как словарь, используемый логической теорией.

7. Онтология как (метауровневая) спецификация логической теории.

Говоря об онтологии в рамках первой интерпретации имеют в виду философскую дисциплину изучающую природу и организованность сущего.

Согласно второй интерпретации онтология является концептуальной системой, которая может выступать как базис определенной базы знаний. Согласно интерпретации 3 онтология, на основе которой построена база знаний, выражается в терминах подходящих формальных структур на семантическом уровне. Таким образом, эти две интерпретации рассматривают онтологию как концептуальную «семантическую» сущность, неважно, формальную или неформальную, в то время как интерпретации 5-7 трактуют онтологию как специальный «синтаксический» объект. Четвертая интерпретация - одна из наиболее проблематичных, так как точный смысл ее зависит от понимания терминов «спецификация» и «концептуализация».

Первый из подходов к определению понятия "онтология предметной области", условно названный гуманитарным, предполагает определения в интуитивно понимаемых терминах. Второй подход к определению понятия онтология условно назван компьютерным. В рамках этого подхода разрабатываются компьютерные языки для представления онтологий.

Основным достоинством компьютерного подхода является формальность предлагаемых средств для описания онтологий. Определение понятия онтология предметной области в рамках этого подхода не проясняет содержательную сущность этого понятия, а, наоборот, затемняет эту сущность многочисленными техническими деталями, связанными с компьютерной реализацией, и не отличает его от других понятий, в частности от понятия модели предметной области (базы знаний).

В рамках третьего, математического подхода делаются попытки определить понятие онтология в математических терминах или с помощью математических конструкций.

Онтология - это логическая теория, которая ограничивает допустимые модели логического языка. Онтология в этом случае должна обеспечивать аксиомы, которые ограничивают значение нелогических символов (предикатов и функций) логического языка, используемых как "примитивы" для определенных целей представления. Цель онтологии – характеризовать концептуализацию, ограничивая возможные интерпретации нелогических символов логического языка для установления консенсуса о том, как описывать знания с использованием этого языка. Концептуализация рассматривается как множество неформальных правил, которые ограничивают структуру части действительности.

Итак, под онтологией предметной области понимают:

1. Онтология предметной области есть та часть знаний предметной области, относительно которой предполагается ее неизменность. Относительно остальной части знаний предметной области предполагается, что она может изменяться, но должна оставаться согласованной с онтологией предметной области.

2. Онтология предметной области есть та часть знаний предметной области, которая ограничивает значения терминов предметной области. Значения терминов предметной области не зависят от остальной (изменяемой) части знаний предметной области.

3. Онтология предметной области является множеством соглашений о предметной области, другая часть знаний предметной области является множеством эмпирических и других законов этой области. Онтология определяет степень согласования значений терминов специалистами предметной области.

4. Онтология предметной области является явно заданной внешней аппроксимацией неявно заданной концептуализации. Концептуализация есть подмножество множества всех ситуаций, которые могут быть представлены. Множество ситуаций, соответствующих базе знаний, есть подмножество концептуализации. Это подмножество есть некоторая аппроксимация множества ситуаций, возможных в действительности.

В дальнейшем, для определенности, будем считать, что онтология – формальное явное описание понятий в рассматриваемой предметной области (классов (иногда их называют понятиями)), свойств каждого понятия, описывающих различные свойства и атрибуты понятия (слотов (иногда их называют ролями или свойствами)), и ограничений, наложенных на слоты (фацетов (иногда их называют ограничениями ролей)) . Онтология вместе с набором индивидуальных экземпляров классов образует базу знаний.

Приведем некоторые причины необходимости разработки онтологий. Итак, онтологии необходимы для:

· совместного использования людьми или программными агентами общего понимания структуры информации;

· возможности повторного использования знаний в предметной области;

· того чтобы сделать допущения в предметной области явными;

· отделения знаний в предметной области от оперативных знаний;

· анализа знаний в предметной области.

Совместное использование людьми или программными агентами общего понимания структуры информации является одной из наиболее общих целей разработки онтологий. К примеру, пусть, несколько различных веб-сайтов содержат информацию по медицине или предоставляют информацию о платных медицинских услугах, оплачиваемых через Интернет. Если эти веб-сайты совместно используют и публикуют одну и ту же базовую онтологию терминов, которыми они все пользуются, то компьютерные агенты могут извлекать информацию из этих различных сайтов и накапливать ее. Агенты могут использовать накопленную информацию для ответов на запросы пользователей или как входные данные для других приложений.

Обеспечение возможности использования знаний предметной области стало одной из движущих сил недавнего всплеска в изучении онтологий. Например, для моделей многих различных предметных областей необходимо сформулировать понятие времени. Это представление включает понятие временных интервалов, моментов времени, относительных мер времени и т.д. Если одна группа ученых детально разработает такую онтологию, то другие могут просто повторно использовать ее в своих предметных областях. Кроме того, если нам необходимо создать большую онтологию, можно интегрировать несколько существующих онтологий, описывающих части большой предметной области. Возможно повторно использовать основную онтологию, такую как UNSPSC, и расширить ее для описания интересующей нас предметной области.

Создание явных допущений в предметной области , лежащих в основе реализации, дает возможность легко изменить эти допущения при изменении наших знаний о предметной области. Жесткое кодирование предположений о мире на языке программирования приводит к тому, что эти предположения не только сложно найти и понять, но и также сложно изменить, не будучи программистом. Кроме того, явные спецификации знаний в предметной области полезны для новых пользователей, которые должны узнать значения терминов предметной области.

Отделение знаний предметной области от оперативных знаний – это еще один вариант общего применения онтологий. Мы можем описать задачу конфигурирования продукта из его компонентов в соответствии с требуемой спецификацией и внедрить программу, которая делает эту конфигурацию независимой от продукта и самих компонентов. После этого мы можем разработать онтологию компонентов и характеристик ЭВМ и применить этот алгоритм для конфигурирования нестандартных ЭВМ. Мы также можем использовать тот же алгоритм для конфигурирования лифтов, если мы предоставим ему онтологию компонентов лифта.

Анализ знаний в предметной области возможен, когда имеется декларативная спецификация терминов. Формальный анализ терминов чрезвычайно ценен как при попытке повторного использования существующих онтологий, так и при их расширении.

Зачастую возникает вопрос о различии между онтологией и базой данных. Укажем основные различия между ними.

Результатом запроса по базе данных обычно является совокупность данных об экземплярах и ссылки на текстовые документы, в то время как результат запроса по онтологии может включать элементы самой онтологии (например, все подклассы определенного класса).

Онтологии сами по себе включают семантику

Схемы баз данных и каталоги обычно не предоставляют внешнюю семантику для своих данных. Семантика никогда не определялась, либо семантика была определена внешним образом во время разработки базы данных, но эта спецификация не стала частью спецификации базы данных и больше недоступна. Следовательно, при использовании баз данных нам нужны определенные протоколы для решения проблемы конфликтующих ограничений при изменении базы данных. Однако онтологии являются логическими системами, которые сами по себе включают семантику.

Онтологии чаще повторно используются

Схема базы данных определяет структуру определенной базы данных и других баз данных, и схемы не так часто повторно используются напрямую или расширяются. Схема является частью интегрированной системы и редко используются отдельно от нее. С онтологиями ситуация прямо противоположна: онтологии обычно повторно используют и расширяют другие онтологии и они не привязаны к определенной системе.

Онтологии децентрализованы по своей природе

По традиции разработка и обновление схемы базы данных является централизованным процессом: разработчики исходной схемы (или сотрудники той же организации) обычно вносят изменения и поддерживают схему. В самом конце разработчики схемы базы данных обычно знают, какие базы данных используют их схему. По своей природе разработка онтологии – это гораздо более децентрализованный и объединенный процесс. В результате, над тем, кто использует конкретную онтологию, не существует централизованного контроля. Гораздо сложнее (а может быть, и невозможно) распространить или синхронизировать обновления: мы не знаем, кто использует онтологию, не можем сообщить им об обновлениях и не можем предположить, что они сами об этом узнают. Отсутствие централизованного и синхронизированного контроля также делает сложным (а часто и невозможным) проследить последовательность операций, которые преобразовали одну версию онтологии в другую.

Информационные модели онтологии богаче

Во многих онтологиях количество примитивов представления гораздо больше, чем в типичной схеме базы данных. Например, многие онтологические языки и системы позволяют спецификацию ограничения мощности, обратные свойства, транзитивные свойства, обратные классы и т.д. Некоторые языки (например, DAML+OIL) добавляют примитивы для определения новых классов как объединений или пересечений других классов, как перечисление их членов, как ряд объектов, которые удовлетворяют определенному ограничению.

Классы и экземпляры могут быть одними и теми же

В базах данных четко различается информация о схеме и информация об экземплярах. Во многих мощных системах представления знаний сложно определить, где заканчивается онтология и начинаются экземпляры. Использование метаклассов (классов, где в качестве экземпляров используются другие классы) во многих системах (например, Protégé, Ontolingua, RDFS) размывает или стирает границу между классами и экземплярами. Метаклассы – это множества, чьи элементы тоже являются множествами. Это значит, что «экземпляр» и «класс» - на самом деле лишь роли понятия.

Модели онтологии и онтологической системы

Понятие онтологии предполагает определение и использование взаимосвязанной и взаимосогласованной совокупности трех компонент: таксономии терминов, определений терминов и правил их обработки. Введем следующее определение понятия модели онтологии:

Под формальной моделью онтологии О понимается

Х – конечное множество концептов (понятий, терминов) предметной области, которую представляет онтология О;

R – конечное множество отношений между концептами (понятиями, терминами) заданной предметной области;

F – конечное множество функций интерпретации (аксиоматизации), заданных на концептах и/или отношениях онтологии О.

Естественным ограничением, накладываемым на множество X, является его конечность и непустота. Иначе обстоит дело с компонентами F и R в определении онтологии О. Понятно, что и в этом случае F и R должны быть конечными множествами. Укажем, граничные случаи, связанные с их пустотой.

1. Пусть и . Тогда онтология О трансформируется в простой словарь:

.

Такая вырожденная онтология может быть полезна для спецификации, пополнения и поддержки словарей ПО, но онтологии-словари имеют ограниченное использование, поскольку не вводят эксплицитно смысла терминов. Хотя в некоторых случаях, когда используемые термины принадлежат очень узкому (например, техническому) словарю и их смыслы уже заранее хорошо согласованы в пределах определенного (например, научного) сообщества, такие онтологии применяются на практике. Известными примерами онтологии этого типа являются индексы машин поиска информации в сети Интернет.

2. , . Тогда каждому элементу множества терминов из X может быть поставлена в соответствие функция интерпретации f из F. Формально это утверждение может быть записано следующим образом.

где - множество интерпретируемых терминов;

Множество интерпретирующих терминов.

такие что

Пустота пересечения множеств и исключает циклические интерпретации, а введение в рассмотрение функции k аргументов призвано обеспечить более полную интерпретацию. Вид отображения f из F определяет выразительную мощность и практическую полезность этого вида онтологии. Если функция интерпретации задается оператором присваивания значений (), где - имя интерпретации ), то онтология трансформируется в пассивный словарь :

Такой словарь пассивен, так как все определения терминов из берутся из уже существующего и фиксированного множества . Практическая ценность его выше, чем простого словаря, но явно недостаточна, например, для представления знаний в задачах обработки информации в Интернете в силу динамического характера этой среды.

Для того чтобы учесть последнее обстоятельство, предположим, что часть интерпретирующих терминов из множества задается процедурно, а не декларативно и вычисляется каждый раз при интерпретации термина из множества . В этом случае онтология преобразуется в активный словарь определений

Причем

Ценность такого словаря для задач обработки информации в среде Интернет выше, чем у предыдущей модели, но все еще недостаточна, так как интерпретируемые элементы из никак не связаны между собой и, следовательно, играют лишь роль ключей входа в онтологию.

Для представления модели онтологии, которая нужна для решения задач обработки информации в Интернете .

Рассмотрим возможные варианты формирования множества отношений на концептах онтологии.

Введем в рассмотрение специальный подкласс онтологии - простую таксономию следующим образом:

Таксономическая структура - иерархическая система понятий, связанных между собой отношением is_a («быть элементом класса»).

Отношение is_a имеет фиксированную заранее семантику и позволяет организовывать структуру понятий онтологии в виде дерева.

Классификация моделей онтологии

Компоненты модели .
Формальное определение
Пояснение Словарь ПО Пассивный словарь ПО Активный словарь ПО Таксономия понятий ПО

Представления множества концептов X в виде сетевой структуры;

Использования достаточно богатого множества отношений R, включающего не только таксономические отношения, но и отношения, отражающие специфику конкретной предметной области, а также средства расширения множества R;

Использования декларативных и процедурных интерпретаций и отношений, включая возможность определения новых интерпретаций.

Введем в рассмотрение понятие онтологической системы. Под формальной моделью онтологической системы понимают триплет вида:

где - онтология верхнего уровня (метаонтология)

Множество предметных онтологии и онтологии задач предметной области

Модель машины вывода, ассоциированной с онтологической системой .

Использование системы онтологии и специальной машины вывода позволяет решать в такой модели различные задачи. Расширяя систему моделей , можно учитывать предпочтения пользователя, а изменяя модель машины вывода, вводить специализированные критерии релевантности получаемой в процессе поиска информации и формировать специальные репозитории накопленных данных, а также пополнять при необходимости используемые онтологии.

В модели имеются три онтологические компоненты:

Метаонтология;

Предметная онтология;

Онтология задач.

Метаонтология оперирует общими концептами и отношениями, которые не зависят от конкретной предметной области. Концептами метауровня являются общие понятия, такие как «объект», «свойство», «значение» и т. д. Уровни метаонтологии получают интенсиональное описание свойств предметной онтологии и онтологии задач. Онтология метауровня является статической, что дает возможность обеспечить здесь эффективный вывод.

Предметная онтология содержит понятия, описывающие конкретную предметную область, отношения, семантически значимые для данной предметной области, и множество интерпретаций этих понятий и отношений (декларативных и процедурных). Понятия предметной области специфичны в каждой прикладной онтологии, но отношения - более универсальны. Поэтому в качестве базиса обычно выделяют такие отношения модели предметной онтологии, как part_of, kind_of, contained_in, member_of, see also и некоторые другие.

Отношение part_of определено на множестве концептов, является отношением принадлежности и показывает, что концепт может быть частью других концептов. Оно является отношением типа «часть-целое» и по свойствам близко к отношению is_a и может быть задано соответствующими аксиомами. Аналогичным образом можно ввести и другие отношения типа «часть-целое».

Иначе обстоит дело с отношением see_also. Оно обладает другой семантикой и другими свойствами. Поэтому целесообразно вводить его не декларативно, а процедурно, подобно тому, как это делается при определении новых типов в языках программирования, где поддерживаются абстрактные типы данных.

Онтология задач в качестве понятий содержит типы решаемых задач, а отношения этой онтологии, как правило, специфицируют декомпозицию задач на подзадачи. Вместе с тем, если прикладной системой решается единственный тип задач (например, задачи поиска релевантной запросу информации), то онтология задач может в данном случае описываться словарной. Таким образом, модель онтологической системы позволяет описывать необходимые для ее функционирования онтологии разных уровней. Взаимосвязь между онтологиями показана на рисунке:

Машина вывода онтологической системы в общем случае может опираться на сетевое представление онтологии всех уровней. При этом ее функционирование будет связано:

С активацией понятий и/или отношений, фиксирующих решаемую задачу (описание исходной ситуации);

Определением целевого состояния (ситуации);

Выводом на сети, заключающемся в том, что от узлов исходной ситуации распространяются волны активации, использующие свойства отношений, с ними связанных. Критерием остановки процесса является достижение целевой ситуации или превышение длительности исполнения (time-out).

Применение онтологий

Суммируя различные типизации онтологии можно выделить классификации по:

Степени зависимости от конкретной задачи или предметной области;

Уровню детализации аксиоматизации;

«природе» предметной области и т. д.

Дополнительно к этим измерениям можно ввести и классификации, связанные с разработкой, реализацией и сопровождением онтологии.

По степени зависимости от конкретной задачи или предметной области обычно различают:

Онтологии верхнего уровня;

Онтологии, ориентированные на предметную область;

Онтологии, ориентированные на конкретную задачу;

Прикладные онтологии.

Онтологии верхнего уровня описывают очень общие концепты, такие как пространство, время, материя, объект, событие, действие и т. д., которые независимы от конкретной проблемы или области. Поэтому представляется разумным, по крайней мере в теории, унифицировать их для больших сообществ пользователей.

Примером такой общей онтологиии является CYC®. Одноименный проект - CYC® - ориентирован на создание мультиконтекстной базы знаний и специальной машины вывода, разрабатываемой Сусогр. Основная цель этого гигантского проекта - построить базу знаний всех общих понятий (начиная с таких, как время, сущность и т. д.), включающую семантическую структуру терминов, связей между ними и аксиом. Предполагается, что такая база знаний может быть доступна разнообразным программным средствам, работающим со знаниями, и будет играть роль базы «начальных знаний». В онтологии, по некоторым данным, уже представлены 10 6 концептов и 10 5 аксиом. Для представления знаний в рамках этого проекта разработан специальный язык CYCL.

Другим примером онтологии верхнего уровня является онтология системы Gene-railized Upper Model, ориентированная на поддержку процессов обработки естественного языка: английского, немецкого и итальянского. Уровень абстракции этой онтологии находится между лексическими и концептуальными знаниями, что определяется требованиями упрощения интерфейсов с лингвистическими ресурсами. Модель Generalized Upper Model включает таксономию, организованную в виде иерархии концептов (около 250 понятий) и отдельной иерархии связей.

Создание достаточно общих онтологии верхнего уровня представляет собой очень серьезную задачу, которая еще не имеет удовлетворительного решения.

Предметные онтологии и онтологии задач описывают, соответственно, словарь, связанный с предметной областью (медицина, коммерция и т. д.) или с конкретной задачей или деятельностью (диагностика, продажи и т. п.) за счет специализации терминов, введенных в онтологии верхнего уровня. Примерами онтологии, ориентированных на определенную предметную область и конкретную задачу, являются TOVE и Plinius соответственно.

Онтология в системе TOVE (Toronto Virtual Enterprise Project) предметно ориентирована на представление модели корпорации. Основная цель ее разработки - отвечать на вопросы пользователей по реинжинирингу бизнес-процессов, извлекая эксплицитно представленные в онтологии знания. При этом система может проводить дедуктивный вывод ответов. В онтологии нет средств для интеграции с другими онтологиями. Формально онтология описывается с помощью фреймов.

В настоящее время построены онтологии некоторых разделов молекулярной биологии, которые предлагают терминологию для определения множества химических элементов, описания процессов внутри клетки. Онтология TAMBIS (TaO) описывает биоинформатику, покрывает основные понятия молекулярной биологии и биоинформатики: макромолекулы, их предназначение, структуру, функции, клеточное расположение и процессы, в которых они взаимодействуют. ТаО онтологии построена с использованием языка OIL.

Существует также экспериментальная онтология для бионеорганических центров, известная под именем СОМЕ. СОМЕ состоит из сущностей трех видов: Молекула (MOL), Бионеорганический Мотив (BIM) и Бионеорганические Протеины (PRX).

Так же построены онтологии, представляющие понятия и отношения в более узко направленных областях – таких как химические кристаллы, керамические материалы, биоэнергетические центры. Примером таких онтологий может служить онтология Chemical-Crystals. Онтология Chemical-Crystals описывает различные типы кристаллической структуры веществ. Эта онтология построена с использованием методологии, известной как METHONTOLOG.

Другой пример онтологии – онтология чистых веществ. Определение чистых веществ дано через химический состав, т.е. через структурные правила, которые определяют чистые вещества в терминах химических веществ и натуральных чисел. Разработана иерархическая модель онтологии физической химии. Модульная онтология физической химии определяет множество разделов предметной области и связи между ними, описывает систему понятий каждого раздела и задает связи между понятиями разделов. Онтология физической химии состоит из восьми связанных друг с другом разделов: «Элементы», «Вещества», «Реакции», «Основы термодинамики», «Термодинамика. Химические свойства», «Термодинамика. Физические свойства», «Термодинамика. Связь физических и химических свойств», «Химическая кинетика». В основе онтологии данной предметной области лежит метаонтология, которая определяет метапонятия, используемые при определении систем понятий каждого раздела.

Прикладные онтологии описывают концепты, зависящие как от конкретной предметной области, так и от задач, которые в них решаются. Концепты в таких онтологиях часто соответствуют ролям, которые играют объекты в предметной области в процессе, выполнения определенной деятельности. Пример такой онтологии - онтология системы Plinius, предназначенная для полуавтоматического извлечения знаний из текстов в области химии. В отличие от других, упомянутых выше онтологии, здесь нет явной таксономии понятий.

Вместо этого определено несколько множеств атомарных концептов, таких как, например, химический элемент, целое число и т. п., и правила конструирования остальных концептов. В онтологии описано около 150 концептов и 6 правил. Формально онтология Plinius тоже описывается с помощью фреймов.

Понятие субстанции в онтологических системах. Понятие субстанции и бытие. Поиски субстанциальной основы бытия в истории философии. Субстанция как самодетерминирующаяся основа бытийных процессов. Общее представление о соотношении духа и материи, души и тела. Субстанция, дух и разум. Категории «абсолютное», «относительное», «всеобщее», «единичное», «сущность» и «явление» для решения вопроса о соотношении субстанции и форм ее проявления. Материализм и идеализм о природе сознания и мышления и их соотношения с материей.

Материалистический субстанциализм. Разновидности построения материалистической онтологии. Чувственно-материальный Космос как основная черта античной натурфилософии. Диалектический материализм как один из вариантов материалистического субстанциализма и его место в современной философии. Понимание материи как объективной реальности и как субстанции всех процессов в мире. Принцип материалистического единства мира. Наука и материалистическая философия. Современные представления о структуре материи, веществе и полях. Иерархия материальных систем в мире. Структурная бесконечность и вечность материи в качестве субстанции. Всеобщие атрибуты материи. Взаимоотношение всеобщих и специфических свойств материи. Структурные уровни материи и формы ее системной организации. Методы выявления всеобщих свойств материи и доказательство их универсальности. Взаимодействие и движение как атрибуты материи. Соотношение взаимодействия и связи. Типы взаимосвязей в мире. Асимметрия причинных связей в необратимых изменениях. Проблема распространения связей и взаимодействий в пространстве и времени. Является ли мир бесконечным или представляет собой связанное целостное образование, целостную систему? Взаимодействие и автономность материальных систем. Основные формы движения материи и критерии их классификации. Взаимосвязь живой и неживой природы.

Идеалистический субстанциализм. Разновидности идеалистического субстанциализма в истории философии. Идея универсализма мира и чувственно-воспринимающий Космос в античной философии. Античный идеализм. Религиозно-философские модели идеалистического субстанциализма. Особенности построения онтологической системы в логическом идеализме. Духовно-идеальные начала бытия. Соотношение идеального и материального в идеалистической интерпретации. Атрибуты идеальной субстанции: сознание, целеполагание, свобода, творчество. Сознание как идеальная субстанциальная основа мира. Понятие эйдоса как причинно-целевой конструкции мира, как самомыслящего существа в античной философии. Античное понятие Космоса как "мирового субъекта". Абсолютный дух в философии Гегеля. Концепция мирового космического разума. Понятие Бога в истории религии и философии в качестве идеальной субстанциальной основы мира. Логос и Бог.



Креационистские варианты онтологии. Соотношение Бога и Мира в онтологических системах средневековья. Разум и воля. Божественный дух и душа человека. Развитие представлений о душе. Душа как носитель сознания и всего духовного мира человека. Понятие духовности. Духовность и религиозность. Идеально-смысловое содержание сознания и его онтологический статус. Достижения и ограниченности идеалистической онтологии.

Персоналистский субстанциализм. Человек как микрокосм в философии эпохи Возрождения. Ценности человеческого существования и место Человека в Космосе. Творчество как главный признак особого места человека в мире. Монадология Лейбница и идеал-реализм Н.О. Лосского. Динамическое понимание материи. Антропный принцип в космологии. Космический подход к человеку и сознанию. Особенности онтологических исканий в русской философии.

Кризис онтологизма и антисубстанциалистские модели философии. Кризис онтологизма в истории философии, тезис о «смерти метафизики» (предпосылки, мотивы, декларации и аргументы). Бытие и сознание: проблема соответствия философских онтологических построений объективной реальности. Онтологическая картина мира, реальный мир и индивид. Конструктивная и творческая активность человеческого "Я" и критика онтологизма.

Онтологические модели в современной философии. Программы реабилитации метафизики и проекты «новой онтологии». Иерархические модели онтологии: Бытие как совокупность форм движения материи Ф. Энгельса. Слои бытия Н. Гартмана. Региональные онтологии Э.Гуссерля. Проблема выделения региональных онтологий: онтология социума. Онтология сознания и самосознания. Онтология языка. Онтология личного существования (экзистенция). Онтология телесности. Онтология культуры. Варианты экзистенциальной метафизики: фундаментальная онтология М. Хайдеггера. Мир трансцендентного бытия К. Ясперса.

Диалектико-материалистическая модель онтологии. Материалистическое решение основного вопроса философии. Понятие материи как объективной реальности. Структурные уровни бытия.

Проблема типологизации онтологических моделей. Монистическая, плюралистическая и дуалистическая онтологии. Эссенциалистские и антиэссенциалистские онтологии. Иерархические и неиерархические онтологические построения. Натурфилософские модели. Теистические модели. Экзистенциально-антропологические модели. Феноменолого-герменевтические модели.

Бытие и развитие

Проблема движения в истории философии. Соотношение движения, изменения и развития. Основные свойства движения. Философские модели развития: креационизм, теория эманации, преформизм, эмерджентизм, эволюционизм. Многообразие форм движения и структурные уровни бытия. Изменяющееся и неизменяющееся бытие. Проблема движения в истории философии. Проблема всеобщности движения. Парадоксы движения.

Развитие и возникновение новых форм бытия. Развитие и диалектика. Диалектические концепции развития. Их структура, законы, принципы, основные понятия. Парадокс возникновения нового. Проблема соотношения актуального и потенциального в развитии. Нелинейность развития. Законы и категории развития.

Виды диалектики. Источник, механизм и направленность развития. Философские законы, описывающие развитие мира (Г.В.Ф.Гегель, К.Маркс, диалектический материализм). Закон единства, взаимодействия и борьбы противоположностей. Закон взаимного перехода количественных и качественных изменений. Закон диалектического отрицания.

Современные взгляды на эволюцию человека, общества и Вселенной. Человек, природа, космос. Феномен жизни и ее место во Вселенной. Проблема иных форм жизни во Вселенной и гипотеза об уникальности человеческого разума (В.Шкловский). Глобальный кризис техногенно-потребительской цивилизации и концепция ноосферы. Черты антропокосмического поворота в современной науке и культуре.

Человек как "био-логосное" существо.

"Логосная" компонента человека. Человек как присутствие. Понятие "культурных машин". Основные феномены человеческого бытия. Человек как "символическое" существо. Структура "символического пространства". Исторические типы ментальности. Трансцендентальные условия порождения символов: декларативность и способность человека к синтетическим актам. Право человека на ошибку. Прогресс и обострение глобальных проблем человечества. Синергетика и процессы самоорганизации в открытых нелинейных системах. Глобальный эволюционизм в структуре современного сознания. Процессы самоорганизации в открытых нелинейных системах. Синергетика и ее основные понятия (аттракторы, точки бифуркации, флуктуации, фракталы). Глобальный эволюционизм.

Роль информации в процессах развития. Изменение системы коммуникационных средств в современном мире как важнейшее условие ускорения темпов развития.

Понятие онтологии предполагает определение и использование взаимосвязанной и взаимозависимой совокупности трех компонент: O=<Х, К, Ф>, где Х – конечное и непустое множество концептов (понятий, терминов) предметной области, которую представляет онтология О; К – конечное множество отношения между концептами заданной предметной области; Ф – конечное множество функций интерпретации (аксиоматизация), заданных на концептах и/или отношениях онтологии О. Рассмотрим случаи, связанные с пустотой К и Ф. Пусть К= и Ф=. Тогда онтология трансформируется в простой словарь:

О=< X 1 X 2 , {}, {:=}>. Онтологии-словари имеют ограниченное использование, поскольку не вводят эксплицитно смысла терминов. Хотя в некоторых случаях, когда используемые термины принадлежа очень узкому словарю и их смыслы уже заранее хорошо согласованы в пределах определенного сообщества, такие онтологии применяются на практике. Именно такие онтологии сейчас широко применяются – это индексы машин поиска информации в сети Internet. Иная ситуация в случае использования терминов обычного естественного языка или в тех случаях, когда общаются программные агенты. В этом случае необходимо характеризовать предполагаемый смысл элементов словаря с помощью подходящей аксиоматизации, цель использования которой – в исключении нежелательных моделей и в том, чтобы интерпретация была единой для всех участников общения. Другой вариант соответствует случаю К= , но Ф. Тогда каждому элементу множества терминов Х может быть поставлена в соответствме функция интерпретации f из Ф. Формально это утверждение может быть записано следующим образом: Пусть X=X 1 X 2 , Причем X 1 X 2 =, Где X 1 – множество интерпретируемых терминов; X 2 – множество интерпретирующих терминов. Тогда (хХ 1 , у 1 ,у 2 , … у k Х 2), Такие, что Х=f(у 1 ,у 2 , … у k), Где fФ. Пустота пересечения множеств X 1 и X 2 исключает циклические интерпретации, а введение в рассмотрение функции k аргументов призвано обеспечить более полную интерпретацию. Вид отображения f из Ф определяет выразительную мощность и практическую полезность этого вида онтологии. Так, если предположить, что функция интерпретации задается оператором присваивания значений (X 1:=X 2), то онтология трансформируется в пассивный словарь: О=< X 1 X 2 , {}, {:=}>. Такой словарь пассивен, так как все определения терминов из X 1 берутся из уже существующего фиксированного множества X 2 . Практическая ценность его выше, чем простого словаря, но явно недостаточна, например, для представления знаний в задачах обработки информации в Internet в силу динамического характера этой среды. Для того, чтобы учесть последнее обстоятельство, предположим, что часть интерпретирующих терминов из множества X 2 задается процедурно, а не декларативно. Смысл таких терминов «вычисляется» каждый раз при их интерпретации. Ценность такого словаря для задач обработки информации в среде Internet выше, чем у предыдущей модели, но все еще недостаточна, так как интерпретируемые элементы X 1 никак не связаны между собой и, следовательно, играют роль ключей входа в онтологию. Для представления модели, которая нужна для решения задач обработки информации в Internet, очевидно, требуется отказаться от предположения К=. Далее можно обобщить частные случаи модели онтологии таким образом, чтобы обеспечить возможность:

    представления множества концептов в виде сетевой структуры;

    использования достаточно богатого множества К, включающего не только таксономические отношения, но и отношения, отражающие специфику конкретной предметной области, а также средства расширения множества К;

    использования декларативных и процедурных интерпретаций и отношений, включая возможность определения новых интерпретаций.

Тогда можно ввести в рассмотрение модель расширяемой онтологии. Модель расширяемой онтологии является достаточно мощной для спецификации процессов формирования пространств знаний в Internet. Вместе с тем, и эта модель является неполной в силу своей пассивности даже там, где определены соответствующие процедурные интерпретации и введены специальные функции пополнения онтологии. Введем в рассмотрение понятие онтологической системы. Под формальной моделью онтологической системы  о будем понимать триплет вида: о= Ometa – онтология верхнего уровня (метаонтология); {Odt} – множество предметных онтологий и задач предметной области; inf – модель машины вывода, ассоциированной с онтологической системой о. Использование системы онтологий и специальной машины вывода позволяет решать в такой модели различные задачи. Расширяя систему моделей {Odt}, можно учитывать предпочтения пользователя, а изменяя модель машины вывода, вводить специализированные критерии релевантность получаемой в процессе поиска информации и формировать специальные репозитарии накопленных данных, а также пополнять при необходимости используемые онтологии. В модели о имеются три онтологические компоненты:

    метаонтология;

    предметная онтология;

    онтология задач.

Как указывалось выше, метаонтология оперирует общими концептами и отношениями, которые не зависят от конкретной предметной области. Концептами метауровня являются общие понятия. Тогда на уровне метаонтологии мы получаем интенсиональное описание свойств предметной онтологии и онтологии задач. Онтология метауровня является статической, что дает возможность обеспечить здесь эффективный вывод. Предметная онтология содержит прнятия, описывающие конкретную предметную область, отношения, семантически значимые для данной предметной области, и множество интерпретаций этих понятий и отношений (декларативных и процедурных). Понятия предметной области специфичны в каждой прикладной онтологии, но отношения – более универсальны. Поэтому в качестве базиса обычно выделяют такие отношения модели предметной онтологии, как part_of, kind_of, contained_in, member_of, see_also и некоторые другие. Онтология задач в качестве понятий содержит типы решаемых задач, а отношения этой онтологии, как правило, специфицируют декомпозицию задач на подзадачи. Машина вывода онтологической системы в общем случае может опираться на сетевое представление онтологий всех уровней. При этом ее функционирование будет связано: с активацией понятий и/или отношений, фиксирующих решаемую задачу (описание исходной ситуации); определением целевого состояния(ситуации); выводом на сети, заключающемся в том, что от узлов исходной ситуации распространяются волны активации, использующие свойства отношений, с ними связанных. Критерием остановки процесса является достижение целевой ситуации или превышение длительности исполнения.



Случайные статьи

Вверх