Онтологічні моделі уявлення знань Існує безліч обставин, які ускладнюють поширення та обмін знаннями для людей, настільки. Основні онтологічні моделі

Ця сторінка є главою нашого методичного посібника
"Введення в онтологічне моделювання"
(натисніть , щоб перейти до повної версії посібника у форматі PDF).

Письменникам-фантастам XX століття здавалося, що розвиток обчислювальних машин призведе до появи інтелектуальних помічників людини, які вирішуватимуть за нього багато розумових завдань. Можливості сьогоднішньої техніки перевищують найсміливіші прогнози багатьох із цих авторів: комп'ютер вміщується на долоні, всесвітня мережа доступна практично скрізь. При цьому для вирішення аналітичних завдань ми в більшості випадків, як і раніше, користуємося в кращому випадку електронними таблицями на кшталт Excel. Це особливо помітно в бізнес-середовищі, де ціна (не) правильно прийнятого рішення має еквівалент, що цілком відчутний, у вигляді багатомільярдних прибутків або збитків. Проте розвиток інформаційної інфраструктури бізнесу зав'язнув на шляху створення великих «трибуквенних систем» (ERP, CRM тощо), на які витрачаються величезні кошти, але які не здатні дати організації-власнику нічого особливо «інтелектуального». Сучасні системи «бізнес-аналітики» (BI) в основному зайняті обчисленням значень кількісних показників, що часто мають дуже слабке відношення до опису реальності, та маніпулювання ними.

Відмінним прикладом є улюблений бізнесом показник EBITDA: він характеризує прибуток, і з цієї причини часто використовується, наприклад, як база для нарахування бонусів топ-менеджерам. Однак він не характеризує ефективності роботи менеджера в тому сенсі, в якому її інтуїтивно оцінює власник: адже шляхом зменшення витрат можна збільшити значення EBITDA. Це завжди цікаво менеджеру, але не завжди правильно з погляду стратегічного розвитку підприємства. А вже при розрахунку цього показника за підрозділами компанії можливості маніпуляції відкриваються найширші. Більшість статей доходів і витрат роблять внесок відразу кілька підрозділів, налаштуванням алгоритму розрахунку можна легко «нагороджувати» фаворитів і «карати» неугодних. Зрозуміло, подібні маневри немає нічого спільного з досягненням реальної ефективності роботи підприємства.

Ще рельєфніше видно методологічні проблеми під час спроб вирішувати оптимізаційні завдання кількісними методами. Типовий підхід до цього питання полягає у формулюванні «цільової функції», яка є описом будь-якого якісного стану системи, представленого у вигляді числа – наприклад, «забезпеченість населення такими послугами». Далі, також у кількісній формі, задаються обмеження, параметри, що варіюються, і після обчислень виходить якийсь набір «оптимальних» рішень. Проте їхнє практичне втілення часто призводить до результатів, протилежних поставленим цілям, або має серйозні побічні наслідки. Наприклад, може виявитися, що «середня температура по лікарні» – забезпеченість послугами – досягла потрібних значень, але певним групам населення вони стали зовсім недоступні. Або якість цих послуг знизилася настільки, що вони практично втратили сенс для споживачів. Легко зрозуміти, що корінь проблеми лежить у дуже серйозних модельних припущеннях, зроблених при формалізації цільового параметра.

Зазначені методичні проблеми пов'язані з обчислювальними можливостями – точніше, з обмеженістю тієї їх частини, яку освоїла бізнес-спільнота. Адже якщо складніший і достовірніший алгоритм розрахунку будь-якого показника не можна, на думку бізнес-замовника, реалізувати в інформаційній системі – це доводить застосування невірного, грубого, але технологічно зрозумілого способу розрахунку. Таким чином, по суті, у сфері бізнесу людина поки що по-справжньому довірила комп'ютеру лише одну функцію – складати та віднімати числа. Все інше він, як і раніше, робить сам, і робить, в більшості випадків, не надто якісно.

Зрозуміло, ми говоримо лише про загальну тенденцію; є чимало контрприкладів реалізації по-справжньому ефективних систем, що допомагають оптимізувати ті чи інші процеси, але майже всі такі системи мають вузьку галузеву спрямованість і містять жорстко запрограмовані алгоритми розв'язання задач. Таким чином, системного впливу на стан справ вони не надають.

Що ж потрібно зробити для того, щоб комп'ютер став по-справжньому допомагати нам у вирішенні інтелектуальних бізнес-завдань, зміг підтримувати ухвалення рішень у будь-яких сферах? Необхідно вдихнути в нього "іскру розуму", тобто навчити його "думати", як ми. Фактично, для цього потрібно відтворити у цифровому поданні ті інформаційні структури та процеси, якими ми самі користуємося у процесі мислення: понятійний апарат, логічні міркування. Тоді ми зможемо реалізувати процеси обробки цих структур, тобто імітувати на комп'ютері окремі фрагменти наших когнітивних здібностей. Після цього, отримавши певні результати, ми зможемо критично подивитися на змодельовані структури та процеси та покращити їх. У поєднанні з недоступною людині здатністю обчислювальних машин швидкої обробки величезних обсягів інформації, такий підхід обіцяє дати небувало високий рівень якості підтримки прийняття рішень з боку інформаційних систем.

Ми не випадково навели саме логічне мислення як приклад когнітивного процесу, який можна відтворити у обчислювальному середовищі. Існують і інші підходи, найбільш популярним з яких є використання нейромереж – тобто імітація процесів, що відбуваються при взаємодії нейронів у головному мозку. За допомогою такого роду засобів успішно вирішуються завдання розпізнавання образів, мовлення і т.д. Можна «навчити» нейромережі і для застосування як засіб підтримки прийняття рішень. Однак із зростанням числа факторів, необхідних для оцінки ситуації, складності їх структури, способів впливу на ситуацію, можливості нейромереж стають все менш переконливими: на навчання потрібно більше часу, результати, що отримуються, носять імовірнісний характер, не забезпечують логічної доказовості. Вихід межі заздалегідь обмеженого кола ситуацій призводить до неможливості отримати від нейромережі результат, придатний практичного використання. Імітація ж логічного мислення вільна від більшості цих недоліків, а корекція логічної схеми при зміні умов вимагає значно менше зусиль, ніж перенавчання нейромережі. Зате при складанні логічних моделей принципово важливим стає їхня коректність, несуперечність, релевантність, яка залежить від людини – автора моделі.

Одна з головних особливостей людської свідомості полягає в тому, що вона ліниво. Наш мозок відсікає все «зайве», зводячи наше уявлення про події та явища до досить простих визначень. Ми бачимо лише чорне та біле, і приймаємо рішення, виключивши з розгляду переважну більшість об'єктивної інформації.

Цим же гріхом людина страждає під час аналізу бізнес-процесів та середовищ. Замість того, щоб сприймати бізнес як складну систему, що не піддається спрощенню далі за певну межу без критичної втрати достовірності результатів аналітики, людина намагається звести всі критерії оцінки та управління до кількох числових показників. Таким чином, вдається спростити отримувану модель, знизити витрати на її створення. Але вступникам не слід дивуватися, коли їх прогнози не виправдовуються, а рішення, прийняті виходячи з моделювання виявляються неправильними.

Головний принцип якісної аналітики, управління, що базується на знаннях, звучить так: НЕ СПРОЩУВАТИмодель без потреби.

Онтологічне моделювання: цілі та засоби

На жаль, поширені сьогодні комп'ютерні технології не сприяють реалізації цього принципу. Якщо як інструмент аналізу нам доступний лише Excel або реляційні бази даних – опис бізнесу неминуче доведеться зводити до обмеженого набору числових показників. Тому однією з найбільш актуальних проблем розвитку ІТ зараз є доведення до широкої промислової експлуатації таких технологій, які дозволяють будувати справді складні та комплексні інформаційні моделі, та вирішувати за їх допомогою ті оптимізаційні, аналітичні, оперативні завдання, перед якими інші технічні засоби виявляються безсилими. .

Багатообіцяючим, але дещо недооціненим на сьогоднішній день напрямом вирішення цього завдання є використання так званих семантичних технологій. Ідеї ​​автоматизованої обробки концептуалізованого знання неодноразово висувалися мислителями починаючи з епохи Відродження, обмежено використовувалися в найкращі роки радянської планової економіки, але до функціонального втілення дорослі тільки зараз. На сьогоднішній день створено всі необхідні компоненти методики та технологій, необхідні для роботи з онтологічними моделями, які є предметом обробки за допомогою семантичних технологій. Слово "онтологія" означає сукупність знань; термін «семантичні технології» наголошує на тому, що вони забезпечують роботу із змістом інформації. Таким чином, перехід із традиційних ІТ на семантичні технології є переходом від роботи з даними до роботи зі знаннями. Різниця між цими двома термінами, які тут ми використовуємо виключно у застосуванні до змісту інформаційних систем, підкреслює відмінність у способі використання інформації: для сприйняття та використання даних необхідна людина, суб'єкт, якому доводиться виконувати при цьому операцію осмислення, виявлення сенсу даних та її перенесення на цікаву частину дійсності. Знання можуть сприйматися безпосередньо, оскільки вони представлені з допомогою того понятійного апарату, яким користується людина. Крім того, з представленими в електронному вигляді знаннями (онтологіями) можуть виконуватись і повністю автоматичні операції – отримання логічних висновків. Результатом цього є нові знання.

Аналітики Gartner називали семантичні технології одним з найбільш перспективних ІТ-трендів 2013 року, проте їхній оптимізм виявився передчасним. Чому? Все з тієї ж причини – людина лінива, а створення семантичних моделей потребує серйозних розумових зусиль. Тим більше вигод та переваг перед конкурентами отримають ті, хто зробить ці зусилля, та трансформує їх у реальний бізнес-результат.

ПОЧАТОК - Онтології в корпоративних системах. Частина I

Онтологічні системи можуть застосовуватись для вирішення завдань у сфері бізнесу, створення інтелектуальних систем, представлення знань в Інтернеті. Коло технологій, пов'язаних з цим питанням, дуже широке і включає мультиагентні системи, автоматичне вилучення знань з текстів природною мовою, пошук інформації, інтелектуальне анотування, автоматичне складання авторефератів та інше.

У другій частині статті розглянуто теоретичні поняття, інструментальні засоби, практичні приклади застосування.

ФОРМАЛЬНА МОДЕЛЬ ОНТОЛОГІЇ

Онтологія складається з термінів (понять), їх визначень та атрибутів, а також пов'язаних з ними аксіом та правил виведення.

Формальна модель онтології O = - це впорядкована трійка кінцевих множин, де:

  • Т - терміни прикладної області (ПрО), яку описує онтологія O;
  • R - відносини між термінами заданої ПрО;
  • F - функції інтерпретації, задані на термінах та/або відносинах онтології O.

Моделі онтологій класифікуються таким чином:

  • прості (мають лише концепти);
  • на основі фреймів (мають лише концепти та властивості);
  • на основі логік (наприклад, Ontolingua, DAML+OIL).

Відносини становлять тип взаємодії між концептами ПрО. Приклад бінарного відношення - є частиною. Слід зауважити, що відносини, які доцільно використовувати при створенні онтології, значно менш різноманітні, ніж терміни, і, як правило, не специфічні для конкретної ПрО («частина-ціле», «є підкласом», «надає вплив», «схоже на " і т.п.).

Аксіоми використовуються для моделювання тверджень, які завжди є дійсними.

Між концептами можуть бути певні види зв'язків. Словник термінів у певній прикладній галузі, тезаурус зі своїми поняттями (концептами) та зв'язки, що визначають терміни природної мови, можуть розглядатися як онтологія. Для встановлення зв'язку між вербально визначеними концептами та пошуком концептів релевантних запитів використовуються методи отримання інформації. Відомими прикладами такого типу онтології є індекси пошукових машин інформації в Інтернет.

Для опису складніших систем вводять такі поняття, як модель онтології, що розширюється.

МОВИ ОПИСАННЯ ОНТОЛОГІЙ

Для того, щоб реалізовувати різні онтології, необхідно розробити мови їх уявлення, які мають достатню виразну потужність і дозволяють користувачеві уникнути «низькорівневих» проблем.

Ключовим моментом у проектуванні онтології є вибір відповідної мови специфікації онтологій (Ontology specification language). Мета таких мов — дати можливість вказувати додаткову машинно-інтерпретовану семантику ресурсів, зробити машинне подання даних більш схожим на стан речей у реальному світі, суттєво підвищити виразні можливості концептуального моделювання слабо структурованих Web-даних.

Поширення онтологічного підходу до подання знань сприяло створенню різноманітних мов уявлення онтології та інструментальних засобів, призначених для їх редагування та аналізу.

Існують традиційні мови специфікації онтологій: Ontolingua, CycL, мови, що базуються на дескриптивних логіках (такі як LOOM), мови, засновані на фреймах (OKBC, OCML, Flogic).

Пізніші мови базуються на Web-стандартах (XOL, SHOE, UPML). Спеціально для обміну онтологіями через Web було створено RDF(S), DAML, OIL, OWL, які будуть розглянуті далі.

В цілому, відмінність між традиційними та Web-мовами специфікації онтології полягає у виразних можливостях опису предметної області та деяких можливостях механізму логічного висновку для цих мов. Типові примітиви мов додатково включають:

  • конструкції для агрегування, множинних ієрархій класів, правил виведення, аксіом;
  • різні форми модуляризації для запису онтологій та взаємовідносин між ними;
  • можливість мета-опису онтології, що корисно під час встановлення відносин між різними видами онтологій. Сьогодні деякі з таких мов набули великої популярності та широко застосовуються (зокрема для опису інформаційних ресурсів та сервісів Інтернет).

Мова RDF. У рамках проекту семантичної інтерпретації інформаційних ресурсів Інтернет (Semantic Web) було запропоновано стандарт опису метаданих про документ Resource Description Framework, який використовує XML-синтаксис.

RDF використовує базову модель даних «об'єкт – атрибут – значення»і здатний зіграти роль універсальної мови опису семантики ресурсів та взаємозв'язків між ними. Ресурси описуються як орієнтованого розміченого графа — кожен ресурс може мати властивості, які також можуть бути ресурсами чи його колекціями. Всі словники RDF використовують базову структуру, що описує класи ресурсів та типи зв'язків між ними. Це дозволяє використовувати різнорідні децентралізовані словники, створені для машинної обробки за різними принципами та методами. Важливою особливістю стандарту є розширюваність: можна встановити структуру опису джерела, використовуючи і розширюючи такі вбудовані поняття RDF-схем, як класи, властивості, типи, колекції. Модель схеми RDF включає успадкування класів та властивостей.

RDF вже отримав підтримку багатьох провідних виробників програмного забезпечення. Розроблено низку програмних продуктів, що дозволяють створювати RDF-описи для різноманітних систем. Передбачаються можливості інтеграції існуючих сховищ інформації до загальної бази семантичного опису та інтеграції концепції RDF-бази з форматом MPEG. RDF Schema – стандарт, запропонований з ініціативи W3C для представлення онтологічних знань. Він специфікує безліч допустимих схем даних. Моделі предметних областей описуються у вигляді ресурсів, властивостей та його значень. RDFS надає хороші базові можливості для опису словників типів предметних областей. Одне з обмежень - неможливість за допомогою RDFS висловити аксіоматичні знання, тобто задати аксіоми та правила виведення, побудовані на них.

DAML+OIL- Семантична мова розмітки Web-ресурсів, що розширює стандарти RDF і RDF Schema за рахунок більш повних примітивів моделювання. Остання версія DAML+OIL забезпечує багатий набір конструкцій для створення онтології та розмітки інформації таким чином, щоб їх могла читати та розуміти машина.

Першими пропозиціями щодо опису онтології на базі RDFS були DARPA DAML-ONT (DARPA Agent Markup Language) та European Commission OIL (Ontology Inference Layer). Ці стандарти специфікації та обміну онтологіями були розроблені для підтримки процесу обміну знаннями та інтеграції знань. На основі цих пропозицій і виникло спільне рішення DAML+OIL. Онтологія DAML+OIL складається з: заголовків (headers); елементів класів (class elements); елементів властивостей (property elements); екземплярів (instances).

OWL(Web Ontology Language) - мова представлення онтологій, що розширює можливості XML, RDF, RDF Schema та DAML+OIL. Цей проект передбачає створення потужного механізму семантичного аналізу. Планується, що у ньому буде усунено обмеження конструкцій DAML+OIL.

Онтології OWL – це послідовності аксіом та фактів, а також посилань на інші онтології. Вони містять компонент для запису авторства та іншої детальної інформації, є документами Web, на них можна посилатися через URI.

У згадуваному проекті Semantic Web «машинна обробка сенсу» контенту буде зроблено максимально чіткою за допомогою позначки документів покажчиком «з повним змістом» на основі використання онтологічних термінів. Таким чином, онтології розглядаються як ключова технологія для використання у Semantic Web (рис. 1).

Онтології відіграють важливу роль організації обробки знань на основі Web, а також для їх спільного використання. Онтології, зумовлені як спільно використовувані формальні концепції конкретних предметних областей, дають загальне уявлення про теми, інформацією яких можуть обмінюватися і, і докладання. Онтології від XML-схем тим, що це уявлення знань, а чи не формати повідомлень (більшість Web-стандартів складаються з комбінації форматів повідомлень і специфікацій протоколів).

ІНСТРУМЕНТАЛЬНІ ЗАСОБИ ОБРОБКИ ОНТОЛОГІЙ

Однією з переваг онтології є наявність для них інструментального програмного забезпечення, що забезпечує загальну доменно-незалежну підтримку онтологічного аналізу. Існує ціла низка інструментів для онтологічного аналізу, що підтримують редагування, візуалізацію, документування, імпорт та експорт онтологій різних форматів, їх подання, об'єднання, порівняння.

Редактори

Ontolingua.Крім власне редактора онтології, ця система містить мережевий компонент Webster, призначений для визначення концептів, сервер, що забезпечує доступ до онтологій Ontolingua за протоколом OKBC (Open Knowledge Base Connectivity), та Chimaera – інструментарій для аналізу та об'єднання онтологій.

Protégé— Java-програма, що вільно розповсюджується, призначена для побудови (створення, редагування та перегляду) онтологій тієї чи іншої прикладної області. Вона включає редактор онтології, що дозволяє проектувати онтології, розгортаючи ієрархічну структуру абстрактних та конкретних класів та слотів. На основі сформованої онтології Protégé дозволяє генерувати форми здобуття знань для введення екземплярів класів та підкласів.

Інструмент підтримує використання мови OWL і дозволяє генерувати HTML-документи, що відображають структуру онтологій. Оскільки він використовує фреймову модель представлення знань ОКВС, це дозволяє адаптувати його і для редагування моделей ПрО, представлених не в OWL, а в інших форматах (UML, XML, SHOE, DAML+OIL, RDF та RDFS тощо).

DOE- Простий редактор, який дозволяє користувачеві створювати онтології. Процес специфікації онтології складається із трьох етапів.

На першому етапі користувач будує таксономію понять та відносин, явно окреслюючи позицію кожного елемента (поняття) в ієрархії. Потім користувач вказує, у чому специфіка поняття щодо його «батька», і в чому це поняття подібне або на відміну від його «братів». Користувач може також додати синоніми та енциклопедичне визначення кількома мовами для всіх понять.

З другого краю етапі дві таксономії розглядаються з різних точок зору. Користувач може розширити їх новими об'єктами або додати обмеження щодо відносин.

На третьому етапі онтологія може бути перекладена мовою уявлення знань.

OntoEdit- Інструментальний засіб, що забезпечує перегляд, перевірку та модифікацію онтології. Воно підтримує мови представлення онтології OIL і RDFS, а також внутрішню мову представлення знань OXML, що базується на XML. Як і Protégé, це автономний Java-додаток, але його коди закриті. Вільно розповсюджувана версія OntoEdit Free обмежена 50 концептами, 50 стосунками та 50 екземплярами.

OilEd-Автономний графічний редактор онтології, розроблений у рамках проекту Оп-То-Knowledge. Він вільно розповсюджується за загальнодоступною ліцензією GPL. Інструмент використовує для представлення онтологію мову OIL. В OilEd відсутня підтримка екземплярів класів.

WebOntoрозроблений для перегляду, створення та редагування онтологій. Для моделювання онтологій він використовує мову OCML (Operational Conceptual Modeling Language). Користувач може створювати різні структури, у тому числі класи з численним наслідуванням. Інструмент має низку корисних особливостей: перегляд відносин, класів та правил, можлива спільна робота над онтологією кількох користувачів.

ODE(Ontological Design Environment) взаємодіє з користувачами на концептуальному рівні, забезпечує їх набором таблиць для заповнення (концептів, атрибутів, відносин) та автоматично генерує код мовами LOOM, Ontolingua та FLogic. Інструмент отримав свій розвиток у WebODE, який інтегрує всі сервіси ODE у єдину архітектуру, зберігаючи свої онтології у реляційній БД.

Складні інструментальні засоби

Ці засоби потрібні для того, щоб не тільки вводити та редагувати онтологічну інформацію, але й аналізувати її, виконуючи типові операції над онтологіями, наприклад:

  • вирівнювання(alignment) - встановлення різного виду відповідностей між двома онтологіями для того, щоб вони могли використовувати інформацію один одного;
  • відображення(mapping) - знаходження семантичних зв'язків між подібними елементами різних онтологій;
  • об'єднання(merging) - операція, яка за двома онтологіями генерує третю, що об'єднує інформацію з перших двох.

PROMPTслужить для об'єднання та угруповання онтологій. Це доповнення до системи Protégé, реалізоване у вигляді плагіна. За двома онтологіями, які треба об'єднати, PROMPT будує список операцій (наприклад, об'єднання термінів або їхнє копіювання в нову онтологію) і передає його користувачу, який може виконати одну з запропонованих операцій. Потім перелік операцій модифікується, і створюється перелік конфліктів та його можливих рішень. Це повторюється доти, доки не буде готова нова онтологія.

Chimaera- інтерактивний інструмент для поєднання онтології, що базується на редакторі онтологій Ontolingua.

У OntoMergeвихідні онтології транслюються у загальне уявлення спеціальною мовою.

OntoMorphвизначає набір операторів перетворення, які можна застосувати до онтології.

OBSERVERпоєднує онтології з інформацією про відображення між ними та знаходить синоніми у вихідних онтологіях.

ONIONбазується на алгебрі онтології та надає інструменти для визначення правил артикуляції (сполуки) між онтологіями.

МЕТОДОЛОГІЯ СТВОРЕННЯ ОНТОЛОГІЙ

Практична розробка онтології включає:

  • визначення класів у онтології;
  • розташування класів у таксономічну ієрархію (підклас - надклас);
  • визначення слотів і опис значень цих слотів, що допускаються;
  • заповнення значень слотів екземплярів.

Після цього можна створити базу знань, визначивши окремі екземпляри цих класів, ввівши в певний слот значення та додаткові обмеження для слота.

Виділимо деякі фундаментальні правила розробки онтології. Вони виглядають досить категоричними, але у багатьох випадках допоможуть ухвалити вірні проектні рішення.

  • Немає єдино правильного способу моделювання предметної області — завжди існують життєздатні альтернативи. Найкраще рішення майже завжди залежить від передбачуваного застосування та очікуваних розширень.
  • Розробка онтології – це обов'язково ітеративний процес.
  • Поняття в онтології повинні бути близькими до об'єктів (фізичних або логічних) і відносин у предметній галузі, що цікавить. Найімовірніше, це іменники (об'єкти) чи дієслова (відносини) у реченнях, які описують предметну область.

Знання того, для чого передбачається використовувати онтологію, і того, наскільки детальною чи загальною вона буде, може вплинути на багато рішень щодо моделювання.

Потрібно визначити, яка з альтернатив допоможе краще вирішити поставлене завдання і буде наочнішою, більш розширюваною і простішою в обслуговуванні. Слід пам'ятати, що онтологія - це модель реального світу, і поняття в онтології мають відображати цю реальність.

Після того, як визначено початкову версію онтології, ми можемо оцінити та налагодити її, використовуючи її в якихось додатках та/або обговоривши її з експертами предметної галузі. В результаті початкову онтологію, швидше за все, потрібно буде переглянути. І цей процес ітеративного проектування продовжуватиметься протягом усього життєвого циклу онтології.

Повторне використання існуючих онтології може бути необхідним, якщо системі потрібно взаємодіяти з іншими додатками, які вже увійшли до окремих онтологій або контрольованих словників. Багато корисних онтології вже доступні в електронному вигляді і можуть бути імпортовані. Існують бібліотеки повторно використовуваних онтологій, наприклад Ontolingua або DAML. Існує також низка загальнодоступних комерційних онтологій, наприклад UNSPSC, RosettaNet, DMOZ.

ОРГАНІЗАЦІЙНІ ОНТОЛОГІЇ І ПОРТАЛИ ЗНАНЬ

Незважаючи на те, що розроблено вже багато онтології, що відображають знання про найрізноманітніші об'єкти, при описі конкретних суб'єктів економічної діяльності треба враховувати їх специфіку та вносити її у відповідні онтологічні моделі.

Онтологічне уявлення знань про суб'єктів економічної діяльності, що входять до складу якоїсь системи, можна використовувати для об'єднання їх інформаційних ресурсів у єдиний інформаційний простір (рис. 2).

Онтологія підприємства містить класи понять із заданими ними семантичними відносинами. Вона складається з набору технологічних онтологій та організаційної онтології, що відображає організаційно-функціональну структуру підприємства: склад штатного розкладу (працівники, адміністрація, обслуговуючий персонал), партнери, ресурси тощо і відносини між ними. Онтології технологій містять поняття, що описують виробничі процеси. Загальні знання ПрО, до яких належать суб'єкти економічної діяльності, відображає онтологія галузі.

Розроблені онтології дозволять співробітникам однієї галузі або корпорації використовувати загальну термінологію та уникнути взаємних непорозумінь, які можуть ускладнити співпрацю та призвести до серйозних збитків (наприклад, організаційна онтологія чітко відображає взаємну ієрархію та зв'язки між підрозділами підприємства, а також сфери їх компетенції, нормативні документи забезпечують однакову базу для переговорів. Вони забезпечать роботу зі структурованими джерелами даних, для яких може бути побудована схема даних, тобто описані типи даних та зв'язки між ними, та існує формальний спосіб отримання окремих елементів даних. Прикладами структурованих джерел даних можна вважати різні бази даних (наприклад, реляційні та об'єктні), а також слабо структуровані ресурси, описані у форматах XML, RDF, OWL, DAML+OIL.

Як приклад практичного використання онтологічних моделей технологій наведемо систему ONTOLOGIC, призначену для створення та підтримки розподілених систем нормативно-довідкової інформації (НДІ), ведення словників, довідників та класифікаторів та підтримки системи кодування об'єктів обліку (див. рис. 3).

Основу системи становить технологічне середовище для постійної, в режимі реального часу, взаємодії користувачів: споживачів інформації (співробітників служб та функціональних підрозділів) та експертів, які відповідають за ведення нормативно-довідкової інформації.

Для забезпечення однозначної ідентифікації та класифікації об'єктів у системах НСІ розроблено методику, що використовує онтологічну модель формального опису даних, що класифікуються, що забезпечує виділення ключових властивостей об'єктів класифікації та побудову на їх основі класифікаційного коду. Виділяються класи (групи однорідної продукції) за принципом однорідності набору технічних і споживчих характеристик, й у кожного матеріалу формується класифікаційний код, куди входять код класу та коди всіх властивостей та його значень даного матеріалу.

Онтологія забезпечує несуперечливе накопичення будь-якої кількості інформації у стандартній структурі класифікації. Такий підхід гарантує однозначну ідентифікацію ресурсів незалежно від різних трактувань їх найменувань різними виробниками.

Дана технологія передбачає створення типового рішення для управління основними даними та НСІ для промислових підприємств, холдингів та державних структур. Як технологічна платформа використовується SAP MDM (Master Data Management), призначений для інтеграції різних (у тому числі різноплатформових) додатків у масштабі компанії, холдингу, галузі, держструктури тощо, а також для організації та управління галузевою чи корпоративною нормативно- довідковою інформацією (майстер-даними).

ПРИКЛАДИ ЗАСТОСУВАННЯ ОНТОЛОГІЙ

TOVE (Toronto Virtual Enterprise). Мета проекту - створення моделі даних, яка повинна:

  • забезпечити загальну термінологію для предметної галузі, програми якої можуть спільно використовуватися і розумітися кожним учасником спілкування;
  • дати точне і наскільки можна несуперечливе визначення значення кожного терміна з урахуванням логіки першого порядку;
  • забезпечити завдання семантики з допомогою безлічі аксіом, які автоматично дозволяють отримувати відповідь безліч запитань про предметної області.

TOVE має забезпечити побудову інтегрованої моделі деякої предметної галузі, що складається з наступних онтології: операцій, станів та часу, організації, ресурсів, продуктів, сервісу, виробництва, ціни, кількості.

Ontolingua - система, розроблена в Стенфордському університеті, яка забезпечує розподілене спільне середовище для перегляду, створення, редагування, модифікації та використання онтології. Сервер системи підтримує до 150 активних користувачів, деякі з яких доповнюють систему описом своїх проектів.

Серед багатьох інших проектів Ontolingua використовує проект Enterprise project.

Enterprise Project. Метою проекту є покращення (де необхідно, заміна) існуючих методів моделювання за допомогою набору засобів, що дозволяють інтегрувати різні методи та засоби моделювання підприємства. Передбачається створення таких інструментальних засобів, які забезпечать: фіксування та опис конкретної предметної галузі; визначення завдань та вимог (що погоджуються з онтологією); визначення та оцінку варіантів рішень та альтернативних проектів, реалізацію обраної стратегії.

За незалежної розробки інструментальних засобів можливе використання різної термінології, що може призвести до конфліктів та неоднозначності при їх інтегруванні. Для вирішення цієї проблеми було побудовано онтологію, в якій заданий набір часто використовуваних і загальноприйнятих термінів, таких як діяльність, процес, організація, стратегія, маркетинг.

KACTUS. Мета проекту — побудова методології багаторазового застосування знань про технічні системи під час їхнього життєвого циклу. Це необхідно, щоб використовувати ті самі бази знань для проектування, оцінки, функціонування, супроводу, перепроектування та навчання.

KACTUS підтримує інтегрований підхід, що включає виробничі та інженерні методи та методи інженерії знань, на основі створення онтологічної та обчислювальної основи для багаторазового використання отриманих знань паралельно з різними програмами технічної галузі. Це досягається за допомогою побудови онтології предметної області та її багаторазового використання у різних прикладних областях. Крім того, робиться спроба поєднати ці онтології з існуючими стандартами (наприклад STEP), застосовуючи онтології там, де можливе фіксування даних про конкретну область.

Основним формалізмом у KACTUS є CML (Conceptual Modeling Language).

Інструментарій KACTUS є інтерактивним середовищем, в якому можна експериментувати з теоретичними результатами (організовувати бібліотеки онтології, перетворювати дані між онтологіями, робити перетворення для різних формалізмів), а також здійснювати практичні дії (перегляд, редагування та уточнення онтології в різних формалізмах).

OntoSeek – інформаційно-пошукова система, яка розроблена для семантично орієнтованого пошуку інформації, комбінуючи керований онтологією механізм встановлення відповідності сенсу та потужні системи моделювання.

SHOE (Simple HTML Ontology Extensions) дозволяє авторам анотувати свої Web-сторінки, вносячи до них семантичний зміст. Основним компонентом SHOE є онтологія, яка містить інформацію про деяку область. Використовуючи цю інформацію, засоби пошуку та побудови запитів забезпечують більш релевантну відповідь на запит порівняно з існуючими пошуковими машинами, оскільки надається можливість включати до Web-сторінок знання, які інтелектуальні агенти можуть дійсно прочитати. Для цього SHOE доповнює HTML набором спеціальних тегів для представлення знань. SHOE дозволяє знаходити знання за допомогою таксономії та правил виведення, що існують в онтології.

Plinus. Метою проекту є напівавтоматичне вилучення знань із текстів природною мовою, зокрема, літератури про механічні властивості керамічних матеріалів. Так як тексти охоплюють широкий діапазон понять, потрібно безліч інтегрованих онтології для охоплення таких понять, як керамічні матеріали та їх властивості, способи їх обробки, різні дефекти матеріалів, наприклад, такі як тріщини та пори. Онтологія визначає мову, з якої виражається семантична частина словника.

ВИСНОВОК

Діяльність окремих громадян і організацій сьогодні все більшою мірою залежить від наявної в них інформації та здатності її ефективно використовувати (отримувати знання). При цьому одні групи людей, які займаються обробкою інформації, використовують спеціальні терміни, які використовуються іншими організаціями в іншому контексті. У той самий час у різних організаціях часто застосовуються різні позначення одних і тих понять.

Усе це значно ускладнює порозуміння. Тому необхідно розробляти формалізовані моделі уявлення знань, які б обробку інформації на семантичному рівні у системах управління знаннями (СУЗ).

В даний час існує значний інтерес до СУЗ з боку промислових компаній, які усвідомлюють високий прикладний потенціал систем, що базуються на знаннях і використовуються для вирішення практичних завдань підприємства (організації). Питання управління знанням набувають вирішального значення для економіки, що розвивається, де знання капіталізується і, тому, набуває зовсім іншого статусу.

Онтології грають вирішальну роль моделі опису знання, без якої, як стверджують фахівці, вхід у будь-яку предметну область заборонено. Проектування онтології - це творчий процес, і тому потенційні додатки онтології, а також розуміння розробником предметної галузі та його точка зору на неї, безсумнівно, впливатимуть на прийняття рішень.

    Гладун Анатолій Ясонович- Канд. техн. наук, с.м.с. Міжнародного НУЦ інформаційних технологій та систем НАНУ,

    Рогушина Юлія Віталіївна- Канд. фіз-мат. наук, с.м.с. Інститут програмних систем НАНУ.

Курськ 2007


ББК Друкується за рішенням

редакційно-видавничої ради

Курського державного університету

Рецензент -

: Навч. посіб. студентів університету. - Курськ: Вид-во Курськ.гос.ун-ту, 200 . - 84 с.

Навчально-методичний посібник присвячений найбільш перспективному підходу до моделювання предметних областей – онтологічного. Розглянуто основні поняття, визначення, методологію розробки та побудови онтологій на прикладі навчальної бази знань «Світ Тварин». Розглянуто один із засобів побудови онтологій – Protégé.

Призначено для студентів старших курсів, які навчаються за спеціальністю …….. математичне забезпечення та адміністрування інформаційних систем.


Вступ................................................. .................................. 4

1. Теоретичні аспекти побудови онтологій 5 5

1. 1. Визначення онтології............................................ ..... 5

1. 2. Моделі онтології та онтологічної системи............ 14

1. 3. Застосування онтологій............................................ .... 21

1. 4. Інструменти інженерії онтологій........................... 25

2. Створення онтології предметної області в Protégé.......... 30

2. 1. Попередні зауваження....................................... 30

2. 2. Основні відомості про Protégé 37

2. 3. Створення онтології предметної області в Protégé.... 40

3. Семестрове завдання.............................................. ........... 77

Порядок виконання проекту:............................................ 77

Література................................................. ............................ 82


Вступ

Експертна система є сукупністю трьох, взаємозалежних «модулів»: база знань, машина виведення, інтерфейс користувача. Машину виведення та інтерфейс зазвичай поєднують і називають оболонкою експертної системи. У цьому випадку можна говорити про дві складові: оболонку та базу знань. Найважливішим компонентом у тому числі, безумовно, є база знань. Проблема адекватного методу, чи способу, моделювання предметної області як наслідок формалізація знань із наступним занесенням їх у основу знань є якщо центральної, то, щонайменше, важливою теорії штучного інтелекту.



Існує безліч методів уявлення знань. Це широко відомі логічні та кадрові методи, а також семантичні мережі та правила продукції. p align="justify"> При створенні систем заснованих на знаннях (експертні системи, безсумнівно, до них відносяться) застосовуються різні способи представлення знань.

Кожен із цих методів має свої переваги та недоліки. На даний момент значний інтерес є використання онтології як бази знань систем заснованих на знаннях. Зауважимо, що у деякій літературі база знань ототожнюється з онтологією. Взагалі кажучи, однозначного визначення онтології предметної області немає, найчастіше онтологію визначають оскільки вигідно розробнику на даний момент. Цій та деяким іншим цікавим проблемам, пов'язаним з онтологіями, а також питання їх технічної реалізації розглянуті в цьому посібнику.

Теоретичні аспекти побудови онтологій

Визначення онтології

Як було зазначено раніше, уявлення знань є важливою проблемою в штучному інтелекті. Під терміном «представлення знань» може розумітися або спосіб кодування знань у основі знань, або формальна система, що використовується для формалізації знань.

Практика розробки систем, заснованих на знаннях, для складних предметних областей і завдань показала, що в кожній предметній області існує деяка структура, що займає проміжне положення між уявленням знань, що використовується в моделі предметної області, та моделлю предметної області (базою знань).

Ця структура отримала назву "онтологія предметної галузі".

У філософії онтологія це - термін, що визначає вчення про буття, про суще, на відміну від гносеології -вчення про пізнання. З іншого погляду, онтологія - це формально представлені з урахуванням концептуалізації знання. Концептуалізація передбачає опис безлічі об'єктів і понять, знання них і зв'язків з-поміж них.

Онтологієюназивається експліцитна специфікація концептуалізації. Формально онтологія складається з термінів, організованих у таксономію, їх визначень та атрибутів, а також пов'язаних з ними аксіом та правил виведення.

У найпростішому випадку онтологія визначає лише ієрархію концептів, пов'язаних відносинами категоризації. У більш складних випадках до неї додаються відповідні аксіоми для вираження інших відносин між концептами і для того, щоб обмежити їхню гадану інтерпретацію.

З огляду на це, онтологія є основою знань, що описує факти, які передбачаються завжди істинними у межах певного співтовариства з урахуванням загальноприйнятого сенсу використовуваного словника.

Виділимо такі інтерпретації цього терміна:

1. Онтологія як філософська дисципліна.

2. Онтологія як неформальна концептуальна система.

3. Онтологія як формальний погляд семантику.

4. Онтологія як специфікація "концептуалізації".

5. Онтологія як уявлення концептуальної системи через логічну теорію, що характеризується:

o спеціальними формальними властивостями або

o тільки її призначенням

6. Онтологія як словник, який використовується логічною теорією.

7. Онтологія як (метарівнева) специфікація логічної теорії.

Говорячи про онтологію в рамках першої інтерпретації мають на увазі філософську дисципліну, що вивчає природу та організованість сущого.

Згідно з другою інтерпретацією онтологія є концептуальною системою, яка може виступати як базис певної бази знань. Відповідно до інтерпретації 3 онтологія, на основі якої побудовано базу знань, виражається в термінах відповідних формальних структур на семантичному рівні. Таким чином, ці дві інтерпретації розглядають онтологію як концептуальну «семантичну» сутність, не має значення, формальну чи неформальну, тоді як інтерпретації 5-7 трактують онтологію як спеціальний «синтаксичний» об'єкт. Четверта інтерпретація - одна з найбільш проблематичних, тому що точний зміст її залежить від розуміння термінів "специфікація" та "концептуалізація".

Перший з підходів до визначення поняття "онтологія предметної галузі", умовно названий гуманітарним, передбачає визначення в термінах, що інтуїтивно розуміються. Другий підхід до визначення поняття онтології умовно названо комп'ютерним. У межах цього підходу розробляються комп'ютерні мови уявлення онтологій.

p align="justify"> Основною перевагою комп'ютерного підходу є формальність пропонованих засобів для опису онтологій. Визначення поняття онтологія предметної області у межах цього підходу не прояснює змістовну сутність цього поняття, а, навпаки, затемнює цю сутність численними технічними деталями, пов'язаними з комп'ютерною реалізацією, і не відрізняє його від інших понять, зокрема поняття моделі предметної області (бази знань) ).

У рамках третього математичного підходу робляться спроби визначити поняття онтологія в математичних термінах або за допомогою математичних конструкцій.

Онтологія – це логічна теорія, яка обмежує допустимі моделі логічної мови. Онтологія в цьому випадку повинна забезпечувати аксіоми, які обмежують значення нелогічних символів (предикатів та функцій) логічної мови, які використовуються як "примітиви" для певних цілей уявлення. Ціль онтології – характеризувати концептуалізацію, обмежуючи можливі інтерпретації нелогічних символів логічної мови для встановлення консенсусу про те, як описувати знання з використанням цієї мови. Концептуалізація сприймається як безліч неформальних правил, які обмежують структуру частини дійсності.

Отже, під онтологією предметної галузі розуміють:

1. Онтологія предметної галузі є та частина знань предметної галузі, щодо якої передбачається її незмінність. Щодо решти знань предметної області передбачається, що може змінюватися, але має залишатися узгодженої з онтологією предметної області.

2. Онтологія предметної галузі є та частина знань предметної галузі, яка обмежує значення термінів предметної галузі. Значення термінів предметної області не залежить від решти (змінюваної) частини знань предметної області.

3. Онтологія предметної галузі є безліччю угод про предметної області, інша частина знань предметної області є безліччю емпіричних та інших законів цієї галузі. Онтологія визначає ступінь узгодження значень термінів спеціалістами предметної галузі.

4. Онтологія предметної галузі є явно заданою зовнішньої апроксимацією неявно заданої концептуалізації. Концептуалізація є підмножина багатьох ситуацій, які можуть бути представлені. Безліч ситуацій, відповідних основі знань, є підмножина концептуалізації. Це підмножина є деякою апроксимацією безлічі ситуацій, можливих насправді.

Надалі, для певності, вважатимемо, що онтологія – формальний явний опис понять у предметній галузі (класів (іноді їх називають поняттями)), властивостей кожного поняття, що описують різні властивості та атрибути поняття (слотів (іноді їх називають ролями або властивостями)), і обмежень, накладених на слоти (фацетів (іноді їх називають обмеженнями ролей)) . Онтологія разом із набором індивідуальних екземплярів класів утворює основу знань.

Наведемо деякі причини потреби розробки онтологій. Отже, онтології необхідні для:

· Спільного використання людьми або програмними агентами загального розуміння структури інформації;

· Можливості повторного використання знань у предметній галузі;

· того щоб зробити припущення у предметній галузі явними;

· Відділення знань у предметній області від оперативних знань;

· Аналізу знань у предметній галузі.

Спільне використання людьми чи програмними агентами загального розуміння структури інформаціїє одним із найбільш загальних цілей розробки онтологій. Наприклад, кілька різних веб-сайтів містять інформацію з медицини або надають інформацію про платні медичні послуги, що оплачуються через Інтернет. Якщо ці веб-сайти спільно використовують і публікують одну й ту саму базову онтологію термінів, якими всі вони користуються, то комп'ютерні агенти можуть отримувати інформацію з цих різних сайтів і накопичувати її. Агенти можуть використовувати накопичену інформацію для відповідей на запити користувачів або як вхідні дані для інших програм.

Забезпечення можливості використання знань предметної галузістало однією із рушійних сил недавнього сплеску у вивченні онтологій. Наприклад, для багатьох різних предметних областей необхідно сформулювати поняття часу. Це уявлення включає поняття часових інтервалів, моментів часу, відносних заходів часу тощо. Якщо одна група вчених детально розробить таку онтологію, інші можуть просто повторно використовувати її у своїх предметних областях. Крім того, якщо нам необхідно створити велику онтологію, можна інтегрувати декілька онтологій, що описують частини великої предметної області. Можливо повторно використовувати основну онтологію, таку як UNSPSC, і розширити її для опису цікавої для нас предметної області.

Створення явних припущень у предметній галузі, що лежать в основі реалізації, дозволяє легко змінити ці припущення при зміні наших знань про предметну область. Жорстке кодування припущень про світ мовою програмування призводить до того, що ці припущення не тільки складно знайти і зрозуміти, але й складно змінити, не будучи програмістом. Крім того, явні специфікації знань у предметній галузі корисні для нових користувачів, які повинні дізнатися про значення термінів предметної області.

Відділення знань предметної галузі від оперативних знань- Це ще один варіант загального застосування онтологій. Ми можемо описати завдання конфігурування продукту з його компонентів відповідно до необхідної специфікації та впровадити програму, яка робить цю конфігурацію незалежною від продукту та самих компонентів. Після цього ми можемо розробити онтологію компонентів та характеристик ЕОМ та застосувати цей алгоритм для конфігурування нестандартних ЕОМ. Ми також можемо використовувати той самий алгоритм для конфігурування ліфтів, якщо надамо йому онтологію компонентів ліфта.

Аналіз знань у предметній галузіможливе, коли є декларативна специфікація термінів. Формальний аналіз термінів надзвичайно цінний як із спробі повторного використання існуючих онтологій, і за її розширенні.

Найчастіше виникає питання про різницю між онтологією та базою даних. Вкажемо основні різницю між ними.

Результатом запиту з бази даних зазвичай є сукупність даних про екземплярах і посилання текстові документи, тоді як результат запиту з онтології може містити елементи самої онтології (наприклад, всі підкласи певного класу).

Онтології самі собою включають семантику

Схеми баз даних та каталоги зазвичай не надають зовнішньої семантики для своїх даних. Семантика ніколи не визначалася, або семантика була визначена зовнішнім чином під час розробки бази даних, але ця специфікація стала частиною специфікації бази даних і більше недоступна. Отже, при використанні баз даних нам потрібні певні протоколи для вирішення проблеми обмежень, що конфліктують при зміні бази даних. Проте онтології є логічними системами, які власними силами включають семантику.

Онтології найчастіше повторно використовуються

Схема бази даних визначає структуру певної бази даних та інших баз даних, і схеми не так часто повторно використовуються безпосередньо або розширюються. Схема є частиною інтегрованої системи та рідко використовуються окремо від неї. З онтологіями ситуація прямо протилежна: онтології зазвичай повторно використовують та розширюють інші онтології і вони не прив'язані до певної системи.

Онтології децентралізовані за своєю природою

За традицією, розробка та оновлення схеми бази даних є централізованим процесом: розробники вихідної схеми (або співробітники тієї ж організації) зазвичай вносять зміни та підтримують схему. Наприкінці розробники схеми бази даних зазвичай знають, які бази даних використовують їхню схему. За своєю природою розробка онтології – це набагато децентралізованіший і об'єднаніший процес. У результаті над тим, хто використовує конкретну онтологію, не існує централізованого контролю. Набагато складніше (а можливо, і неможливо) поширити або синхронізувати оновлення: ми не знаємо, хто використовує онтологію, не можемо повідомити їх про оновлення і не можемо припустити, що вони самі про це дізнаються. Відсутність централізованого та синхронізованого контролю також робить складною (а часто й неможливою) простежити послідовність операцій, які перетворили одну версію онтології на іншу.

Інформаційні моделі онтології багатші

У багатьох онтологіях кількість примітивів уявлення набагато більша, ніж у типовій схемі бази даних. Наприклад, багато онтологічних мов і систем дозволяють специфікацію обмеження потужності, зворотні властивості, транзитивні властивості, зворотні класи тощо. Деякі мови (наприклад, DAML+OIL) додають примітиви для визначення нових класів як об'єднань або перетинів інших класів, як перерахування їх членів, як ряд об'єктів, які задовольняють певне обмеження.

Класи та екземпляри можуть бути одними і тими ж

У базах даних чітко різниться інформація про схему та інформація про екземпляри. Багато потужних системах уявлення знань складно визначити, де закінчується онтологія і починаються екземпляри. Використання метакласів (класів, де як екземпляри використовуються інші класи) у багатьох системах (наприклад, Protégé, Ontolingua, RDFS) розмиває або стирає кордон між класами та екземплярами. Метакласи – це множини, чиї елементи теж є множинами. Це означає, що «примірник» і «клас» - насправді лише ролі поняття.

Моделі онтології та онтологічної системи

Поняття онтології передбачає визначення та використання взаємопов'язаної та взаємоузгодженої сукупності трьох компонентів: таксономії термінів, визначень термінів та правил їх обробки. Введемо таке визначення поняття моделі онтології:

Під формальною моделлю онтології О розуміється

Х – кінцева множина концептів (понять, термінів) предметної області, яку представляє онтологія;

R – кінцева множина відносин між концептами (поняттями, термінами) заданої предметної області;

F – кінцева множина функцій інтерпретації (аксіоматизації), заданих на концептах та/або відносинах онтології Про.

Природним обмеженням, що накладається на безліч X, є його кінцівка та непустота. Інакше справа з компонентами F і R у визначенні онтології О. Зрозуміло, що і в цьому випадку F і R повинні бути кінцевими множинами. Вкажемо, граничні випадки, пов'язані з їхньою порожнечею.

1. Нехай і. Тоді онтологія Про трансформується у простий словник:

.

Така вироджена онтологія може бути корисною для специфікації, поповнення та підтримки словників ПЗ, але онтології-словники мають обмежене використання, оскільки не вводять експліцитного сенсу термінів. Хоча в деяких випадках, коли терміни, що використовуються, належать дуже вузькому (наприклад, технічному) словнику та їх смисли вже заздалегідь добре узгоджені в межах певної (наприклад, наукової) спільноти, такі онтології застосовуються на практиці. Відомими прикладами онтології цього є індекси машин пошуку інформації у мережі Інтернет.

2. , . Тоді кожному елементу безлічі термінів X може бути поставлена ​​у відповідність функція інтерпретації f з F. Формально це твердження може бути записано наступним чином.

де - безліч інтерпретованих термінів;

Безліч інтерпретують термінів.

такі що

Порожнеча перетину множин і виключає циклічні інтерпретації, а введення в розгляд функції аргументів покликане забезпечити більш повну інтерпретацію. Вигляд відображення f з F визначає виразну потужність та практичну корисність цього виду онтології. Якщо функція інтерпретації задається оператором присвоєння значень (), де ім'я інтерпретації ), то онтологія трансформується в пасивний словник :

Такий словник пасивний, тому що всі визначення термінів беруться з вже існуючої та фіксованої множини. Практична цінність його вища, ніж простого словника, але явно недостатня, наприклад, для подання знань у завданнях обробки інформації в Інтернеті через динамічний характер цього середовища.

Щоб врахувати останню обставину, припустимо, що частина інтерпретують термінів з безлічі задається процедурно, а чи не декларативно і обчислюється щоразу при інтерпретації терміна з безлічі . У цьому випадку онтологія перетворюється на активний словник визначень

Причому

Цінність такого словника для завдань обробки інформації в середовищі Інтернет вища, ніж у попередньої моделі, але все ще недостатня, оскільки інтерпретовані елементи ніяк не пов'язані між собою і, отже, грають лише роль ключів входу в онтологію.

Для представлення моделі онтології, яка потрібна для вирішення задач обробки інформації в Інтернеті.

Розглянемо можливі варіанти формування множини відносин на концептах онтології.

Введемо до розгляду спеціальний підклас онтології - просту таксономію наступним чином:

Таксономічна структура - ієрархічна система понять, пов'язаних між собою ставленням is_a («бути елементом класу»).

Ставлення is_a має заздалегідь фіксовану семантику і дозволяє організовувати структуру понять онтології у вигляді дерева.

Класифікація моделей онтології

Компоненти моделі .
Формальне визначення
Пояснення Словник ПЗ Пасивний словник ПЗ Активний словник ПЗ Таксономія понять ПЗ

Уявлення безлічі концептів X як мережевий структури;

Використання досить багатої множини відносин R, що включає не тільки таксономічні відносини, але і відносини, що відображають специфіку конкретної предметної області, а також засоби розширення множини R;

Використання декларативних та процедурних інтерпретацій та відносин, включаючи можливість визначення нових інтерпретацій.

Введемо на розгляд поняття онтологічної системи. Під формальною моделлю онтологічної системи розуміють триплет виду:

де – онтологія верхнього рівня (метаонтологія)

Безліч предметних онтології та онтології завдань предметної галузі

Модель машини виведення, асоційованої з онтологічною системою.

Використання системи онтології та спеціальної машини виводу дозволяє вирішувати у такій моделі різні завдання. Розширюючи систему моделей , можна враховувати переваги користувача, а змінюючи модель машини виведення, вводити спеціалізовані критерії релевантності інформації, що отримується в процесі пошуку, і формувати спеціальні репозиторії накопичених даних, а також поповнювати при необхідності використовувані онтології.

У моделі є три онтологічні компоненти:

Метаонтологія;

Предметна онтологія;

Онтологія завдань.

Метаонтологія оперує загальними концептами та відносинами, які не залежать від конкретної предметної галузі. Концептами метарівня є загальні поняття, такі як «об'єкт», «властивість», «значення» і т. д. Рівні метаонтології отримують інтенсивний опис властивостей предметної онтології та онтології задач. Онтологія метарівня є статичною, що дозволяє забезпечити тут ефективний висновок.

Предметна онтологія містить поняття, що описують конкретну предметну область, відносини, семантично значущі для даної предметної галузі, і безліч інтерпретацій цих понять та відносин (декларативних та процедурних). Поняття предметної області специфічні кожної прикладної онтології, але відносини - більш універсальні. Тому як базис зазвичай виділяють такі відносини моделі предметної онтології, як part_of, kind_of, contained_in, member_of, see alsoта деякі інші.

Ставлення part_ofвизначено на множині концептів, є відношенням приналежності і показує, що концепт може бути частиною інших концептів. Воно є ставленням типу «частина-ціле» і за властивостями близьке до відношення is_aі може бути поставлено відповідними аксіомами. Аналогічно можна запровадити й інші відносини типу «частина-ціле».

Інакше справа зі ставленням see_also.Воно має іншу семантику та інші властивості. Тому доцільно вводити його не декларативно, а процедурно, подібно до того, як це робиться при визначенні нових типів у мовах програмування, де підтримуються абстрактні типи даних.

Онтологія завдань як понять містить типи розв'язуваних завдань, а відносини цієї онтології, зазвичай, специфікують декомпозицію завдань підзавдання. Разом про те, якщо прикладної системою вирішується єдиний тип завдань (наприклад, завдання пошуку релевантної запиту інформації), то онтологія завдань може у разі описуватися словниковою. Таким чином, модель онтологічної системи дозволяє описувати необхідні її функціонування онтології різних рівнів. Взаємозв'язок між онтологіями показано малюнку:

Машина виведення онтологічної системи у випадку може спиратися на мережне уявлення онтології всіх рівнів. При цьому її функціонування буде пов'язане:

з активацією понять та/або відносин, що фіксують вирішуване завдання (опис вихідної ситуації);

визначенням цільового стану (ситуації);

Висновок на мережі, що полягає в тому, що від вузлів вихідної ситуації поширюються хвилі активації, що використовують властивості відносин, пов'язаних з ними. Критерієм зупинення процесу є досягнення цільової ситуації чи перевищення тривалості виконання (time-out).

Застосування онтологій

Підсумовуючи різні типізації онтології, можна виділити класифікації за:

ступеня залежності від конкретної задачі або предметної області;

рівню деталізації аксіоматизації;

"природі" предметної області і т.д.

Додатково до цих вимірів можна запровадити і класифікації, пов'язані з розробкою, реалізацією та супроводом онтології.

За рівнем залежності від конкретного завдання або предметної області зазвичай розрізняють:

Онтологія верхнього рівня;

Онтології, орієнтовані предметну область;

Онтології, орієнтовані конкретне завдання;

Прикладна онтологія.

Онтології верхнього рівня описують дуже загальні концепти, такі як простір, час, матерія, об'єкт, подія, дія тощо, які незалежні від конкретної проблеми чи області. Тому видається розумним, принаймні теоретично, уніфікувати їх для великих спільнот користувачів.

Прикладом загальної онтології є CYC®. Однойменний проект – CYC® – орієнтований на створення мультиконтекстної бази знань та спеціальної машини виведення, що розробляється Сусогр. Основна мета цього гігантського проекту - побудувати базу знань всіх загальних понять (починаючи з таких, як час, сутність тощо), що включає семантичну структуру термінів, зв'язків між ними та аксіом. Передбачається, що така база знань може бути доступна різноманітним програмним засобам, що працюють зі знаннями, і відіграватиме роль бази «початкових знань». В онтології, за деякими даними, вже представлені 106 концептів і 105 аксіом. Для представлення знань у рамках цього проекту розроблено спеціальну мову CYCL.

Іншим прикладом онтології верхнього рівня є онтологія системи Gene-railized Upper Model, орієнтована на підтримку процесів обробки природної мови: англійської, німецької та італійської. Рівень абстракції цієї онтології перебуває між лексичними та концептуальними знаннями, що визначається вимогами спрощення інтерфейсів із лінгвістичними ресурсами. Модель Generalized Upper Model включає таксономію, організовану у вигляді ієрархії концептів (близько 250 понять) та окремої ієрархії зв'язків.

Створення досить загальних онтології верхнього рівня є дуже серйозним завданням, яке ще не має задовільного рішення.

Предметні онтології та онтології завдань описують, відповідно, словник, пов'язаний з предметною областю (медицина, комерція тощо) або з конкретним завданням або діяльністю (діагностика, продаж тощо) за рахунок спеціалізації термінів, введених в онтології верхнього рівня. Прикладами онтології, орієнтованих на певну предметну область та конкретне завдання, є TOVE та Plinius відповідно.

Онтологія у системі TOVE (Toronto Virtual Enterprise Project) предметно орієнтована представлення моделі корпорації. Основна мета її розробки - відповідати на запитання користувачів з реінжинірингу бізнес-процесів, одержуючи експліцитно представлені в онтології знання. У цьому система може проводити дедуктивний висновок відповідей. В онтології немає коштів на інтеграцію коїться з іншими онтологіями. Формально онтологія описується з допомогою фреймів.

В даний час побудовані онтології деяких розділів молекулярної біології, які пропонують термінологію для визначення безлічі хімічних елементів, опис процесів усередині клітини. Онтологія TAMBIS (TaO) описує біоінформатику, покриває основні поняття молекулярної біології та біоінформатики: макромолекули, їх призначення, структуру, функції, клітинне розташування та процеси, в яких вони взаємодіють. Тао онтології побудована з використанням мови OIL.

Існує також експериментальна онтологія біонеорганічних центрів, відома під ім'ям СОМЕ. СОМЕ складається з сутностей трьох видів: Молекула (MOL), Біонеорганічний Мотив (BIM) та Біонеорганічні Протеїни (PRX).

Так само побудовані онтології, що представляють поняття та відносини у вузько спрямованих галузях – таких як хімічні кристали, керамічні матеріали, біоенергетичні центри. Прикладом таких онтологій може бути онтологія Chemical-Crystals. Онтологія Chemical-Crystals описує різні типи кристалічної структури речовин. Ця онтологія побудована за допомогою методології, відомої як METHONTOLOG.

Інший приклад онтології – онтологія чистих речовин. Визначення чистих речовин надано через хімічний склад, тобто. через структурні правила, які визначають чисті речовини у термінах хімічних речовин та натуральних чисел. Розроблено ієрархічну модель онтології фізичної хімії. Модульна онтологія фізичної хімії визначає безліч розділів предметної галузі та зв'язку між ними, описує систему понять кожного розділу та задає зв'язки між поняттями розділів. Онтологія фізичної хімії складається з восьми пов'язаних один з одним розділів: «Елементи», «Речовини», «Реакції», «Основи термодинаміки», «Термодинаміка». Хімічні властивості», «Термодинаміка. Фізичні властивості», «Термодинаміка. Зв'язок фізичних та хімічних властивостей», «Хімічна кінетика». У основі онтології даної предметної області лежить метаонтологія, що визначає метапоняття, використовувані щодо систем понять кожного розділу.

Прикладні онтології описують концепти, що залежать як від конкретної предметної області, і від завдань, що у них решаются. Концепти в таких онтологіях часто відповідають ролям, які грають об'єкти в предметній галузі в процесі виконання певної діяльності. Приклад такої онтології - онтологія системи Plinius, призначена для напівавтоматичного отримання знань з текстів у галузі хімії. На відміну від інших, згаданих вище онтології, тут немає явної таксономії понять.

Натомість визначено кілька множин атомарних концептів, таких як, наприклад, хімічний елемент, ціле число тощо, і правила конструювання інших концептів. В онтології описано близько 150 концептів та 6 правил. Формально онтологія Plinius теж описується за допомогою кадрів.

Поняття субстанції у онтологічних системах. Поняття субстанції та буття. Пошуки субстанціальної основи буття історія філософії. Субстанція як основа буттєвих процесів, що самодетермінується. Загальне уявлення про співвідношення духу та матерії, душі та тіла. Субстанція, дух та розум. Категорії «абсолютне», «відносне», «загальне», «одиничне», «сутність» та «явище» для вирішення питання про співвідношення субстанції та форм її прояву. Матеріалізм та ідеалізм про природу свідомості та мислення та їх співвідношення з матерією.

Матеріалістичний субстанціалізм. Різновиди побудови матеріалістичної онтології. Чуттєво-матеріальний Космос як основна риса античної натурфілософії. Діалектичний матеріалізм як із варіантів матеріалістичного субстанціалізму та її місце у сучасної філософії. Розуміння матерії як об'єктивної реальності та як субстанції всіх процесів у світі. Принцип матеріалістичної єдності світу. Наука та матеріалістична філософія. Сучасні уявлення про структуру матерії, речовину та поля. Ієрархія матеріальних систем у світі. Структурна нескінченність і вічність матерії як субстанція. Загальні атрибути матерії. Взаємини загальних та специфічних властивостей матерії. Структурні рівні матерії та форми її системної організації. Методи виявлення загальних властивостей матерії та доказ їхньої універсальності. Взаємодія та рух як атрибути матерії. Співвідношення взаємодії та зв'язку. Типи взаємозв'язків у світі. Асиметрія причинних зв'язків у незворотних змінах. Проблема поширення зв'язків та взаємодій у просторі та часі. Чи світ нескінченним чи є пов'язане цілісне освіту, цілісну систему? Взаємодія та автономність матеріальних систем. Основні форми руху матерії та критерії їх класифікації. Взаємозв'язок живої та неживої природи.

Ідеалістичний субстанціалізм. Різновиди ідеалістичного субстанціалізму історія філософії. Ідея універсалізму світу та чуттєво-сприймаючий Космос в античній філософії. Античний ідеалізм. Релігійно-філософські моделі ідеалістичного субстанціалізму. Особливості побудови онтологічної системи у логічному ідеалізмі. Духовно-ідеальні засади буття. Співвідношення ідеального та матеріального в ідеалістичній інтерпретації. Атрибути ідеальної субстанції: свідомість, цілепокладання, свобода, творчість. Свідомість як ідеальна субстанціальна основа світу. Поняття ейдосу як причинно-цільової конструкції світу, як самомислячої істоти в античній філософії. Античне поняття Космосу як "світового суб'єкта". Абсолютний дух у філософії Гегеля. Концепція світового космічного розуму. Поняття Бога в історії релігії та філософії як ідеальна субстанціальна основа світу. Логос та Бог.



Креаціоністські варіанти онтології Співвідношення Бога та Світу в онтологічних системах середньовіччя. Розум та воля. Божественний дух та душа людини. Розвиток уявлень про душу. Душа як носій свідомості та всього духовного світу людини. Концепція духовності. Духовність та релігійність. Ідеально-смисловий зміст свідомості та її онтологічний статус. Досягнення та обмеженості ідеалістичної онтології.

Персоналістський субстанціалізм. Людина як мікрокосм у філософії епохи Відродження. Цінності людського існування та місце Людини в Космосі. Творчість як головна ознака особливого місця людини у світі. Монадологія Лейбніца та ідеал-реалізм Н.О. Лоського. Динамічне розуміння матерії. Антропний принцип у космології. Космічний підхід до людини та свідомості. Особливості онтологічних шукань у російській філософії.

Криза онтологізму та антисубстанціалістські моделі філософії. Криза онтологізму в історії філософії, теза про «смерть метафізики» (передумови, мотиви, декларації та аргументи). Буття та свідомість: проблема відповідності філософських онтологічних побудов об'єктивної реальності. Онтологічна картина світу, реальний світ та індивід. Конструктивна та творча активність людського "Я" та критика онтологізму.

Онтологічні моделі у сучасній філософії. Програми реабілітації метафізики та проекти «нової онтології». Ієрархічні моделі онтології: Буття як сукупність форм руху матерії Ф. Енгельса. Шари буття М. Гартмана. Регіональні онтології Е. Гуссерля. Проблема виділення регіональних онтологій: онтологія соціуму. Онтологія свідомості та самосвідомості. Онтологія мови. Онтологія особистого існування (екзистенція). Онтологія тілесності. Онтологія культури. Варіанти екзистенційної метафізики: онтологія фундаментальна М. Хайдеггера. Світ трансцендентного буття К. Ясперс.

Діалектико-матеріалістична модель онтології. Матеріалістичне вирішення основного питання філософії. Поняття матерії як об'єктивну реальність. Структурні рівні буття.

Проблема типологізації онтологічних моделей. Моністична, плюралістична та дуалістична онтології. Есенціалістські та антиесенціалістські онтології. Ієрархічні та неієрархічні онтологічні побудови. Натурфілософські моделі. Теїстичні моделі. Екзистенційно-антропологічні моделі. Феноменолого-герменевтичні моделі.

Буття та розвиток

Проблема руху історія філософії. Співвідношення руху, зміни та розвитку. Основні характеристики руху. Філософські моделі розвитку: креаціонізм, теорія еманації, преформізм, емерджентизм, еволюціонізм. Різноманітність форм руху та структурні рівні буття. Змінне і незмінне буття. Проблема руху історія філософії. Проблема загальності руху. Парадокси руху.

Розвиток та виникнення нових форм буття. Розвиток та діалектика. Діалектична концепція розвитку. Їхня структура, закони, принципи, основні поняття. Парадокс виникнення нового. Проблема співвідношення актуального та потенційного у розвитку. Нелінійність розвитку. Закони та категорії розвитку.

Види діалектики. Джерело, механізм та спрямованість розвитку. Філософські закони, що описують розвиток світу (Г.В.Ф.Гегель, К.Маркс, діалектичний матеріалізм). Закон єдності, взаємодії та боротьби протилежностей. Закон взаємного переходу кількісних та якісних змін. Закон діалектичного заперечення.

Сучасні погляди на еволюцію людини, суспільства та Всесвіту. Людина, природа, космос. Феномен життя та його місце у Всесвіті. Проблема інших форм життя у Всесвіті та гіпотеза про унікальність людського розуму (В.Шкловський). Глобальна криза техногенно-споживчої цивілізації та концепція ноосфери. Риси антропокосмічного повороту у сучасній науці та культурі.

Людина як "біологічна" істота.

"Логосна" компонента людини. Людина як присутність. Поняття "культурних машин". Основні феномени людського буття. Людина як "символічна" істота. Структура "символічного простору". Історичні типи ментальності. Трансцендентальні умови породження символів: декларативність та здатність людини до синтетичних актів. Право на помилку. Прогрес та загострення глобальних проблем людства. Синергетика та процеси самоорганізації у відкритих нелінійних системах. Світовий еволюціонізм у структурі сучасної свідомості. Процеси самоорганізації у відкритих нелінійних системах. Синергетика та її основні поняття (атрактори, точки біфуркації, флуктуації, фрактали). Світовий еволюціонізм.

Роль інформації у процесах розвитку. Зміна системи комунікаційних засобів у світі як найважливіша умова прискорення темпів розвитку.

Поняття онтології передбачає визначення та використання взаємопов'язаної та взаємозалежної сукупності трьох компонентів: O=<Х, К, Ф>, де Х - кінцева і непорожня безліч концептів (понять, термінів) предметної області, яку представляє онтологія; К - кінцеве безліч відносин між концептами заданої предметної області; Ф – кінцева безліч функцій інтерпретації (аксіоматизація), заданих на концептах та/або відносинах онтології О. Розглянемо випадки, пов'язані з порожнечею К та Ф. Нехай К= та Ф=. Тоді онтологія трансформується у простий словник:

О =< X 1 X 2 , {}, {:=}>. Онтології-словники мають обмежене використання, оскільки не вводять експліцитного сенсу термінів. Хоча в деяких випадках, коли терміни, що використовуються, належать дуже вузькому словнику і їх смисли вже заздалегідь добре узгоджені в межах певного співтовариства, такі онтології застосовуються на практиці. Саме такі онтології зараз широко застосовуються – це індекси машин пошуку інформації у мережі Internet. Інша ситуація у разі використання термінів звичайної природної мови або у випадках, коли спілкуються програмні агенти. І тут необхідно характеризувати гаданий зміст елементів словника з допомогою підходящої аксіоматизації, мета використання якої – у виключенні небажаних моделей й у тому, щоб інтерпретація була єдиною всім учасників спілкування. Інший варіант відповідає випадку К = , але Ф. Тоді кожному елементу множини термінів Х може бути поставлена ​​у відповідності функція інтерпретації f з Ф. Формально це твердження може бути записано таким чином: Нехай X=X 1 X 2 , причому X 1 X 2 =, де X 1 – безліч інтерпретованих термінів; X 2 - безліч інтерпретують термінів. Тоді (хХ 1 , у 1 ,у 2 , … у k Х 2), Такі, що Х=f(у 1 ,у 2 , … у k), Де fФ. Порожнеча перетину множин X 1 і X 2 виключає циклічні інтерпретації, а введення в розгляд функції аргументів покликане забезпечити більш повну інтерпретацію. Вигляд відображення f з Ф визначає виразну потужність та практичну корисність цього виду онтології. Тож якщо припустити, що функція інтерпретації задається оператором присвоєння значень (X 1:=X 2), то онтологія трансформується в пасивний словник: О=< X 1 X 2 , {}, {:=}>. Такий словник пасивний, тому що всі визначення термінів з X 1 беруться з вже існуючої фіксованої множини X 2 . Практична цінність його вища, ніж простого словника, але явно недостатня, наприклад, уявлення знань у завданнях обробки інформації в Internet в силу динамічного характеру цього середовища. Для того, щоб врахувати останню обставину, припустимо, що частина інтерпретуючих термінів з множини X 2 визначається процедурно, а не декларативно. Сенс таких термінів «обчислюється» щоразу за її інтерпретації. Цінність такого словника для завдань обробки інформації в середовищі Internet вище, ніж у попередньої моделі, але все ще недостатня, так як елементи X 1, що інтерпретуються, ніяк не пов'язані між собою і, отже, відіграють роль ключів входу в онтологію. Для представлення моделі, яка потрібна на вирішення завдань обробки інформації у Internet, очевидно, потрібно відмовитися від припущення К=. Далі можна узагальнити окремі випадки моделі онтології таким чином, щоб забезпечити можливість:

    уявлення безлічі концептів у вигляді мережевої структури;

    використання досить багатої множини До, що включає як таксономічні відносини, а й відносини, що відбивають специфіку конкретної предметної області, і навіть засоби розширення множини До;

    використання декларативних та процедурних інтерпретацій та відносин, включаючи можливість визначення нових інтерпретацій.

Тоді можна ввести в розгляд модель онтології, що розширюється. Модель онтології, що розширюється, є достатньо потужною для специфікації процесів формування просторів знань в Internet. Водночас і ця модель є неповною через свою пасивність навіть там, де визначено відповідні процедурні інтерпретації та введено спеціальні функції поповнення онтології. Введемо на розгляд поняття онтологічної системи. Під формальною моделлю онтологічної системи  будемо розуміти триплет виду: о= Ometa - онтологія верхнього рівня (метаонтологія); (Odt) – безліч предметних онтологій та завдань предметної галузі; inf – модель машини виведення, асоційованої з онтологічною системою о. Використання системи онтологій та спеціальної машини виводу дозволяє вирішувати у такій моделі різні завдання. Розширюючи систему моделей (Odt), ​​можна враховувати переваги користувача, а змінюючи модель машини виведення, вводити спеціалізовані критерії релевантність інформації, що отримується в процесі пошуку, і формувати спеціальні репозитарії накопичених даних, а також поповнювати при необхідності використовувані онтології. У моделі о є три онтологічні компоненти:

    метаонтологія;

    предметна онтологія;

    онтологія завдань.

Як зазначалося вище, метаонтологія оперує загальними концептами та відносинами, які не залежать від конкретної предметної галузі. Концептами метарівня є загальні поняття. Тоді на рівні метаонтології ми отримуємо інтенсивний опис властивостей предметної онтології та онтології завдань. Онтологія метарівня є статичною, що дозволяє забезпечити тут ефективний висновок. Предметна онтологія містить прняття, що описують конкретну предметну область, відносини, семантично значущі для даної предметної області, і безліч інтерпретацій цих понять та відносин (декларативних та процедурних). Поняття предметної області специфічні кожної прикладної онтології, але відносини – більш універсальні. Тому як базис зазвичай виділяють такі відносини моделі предметної онтології, як part_of, kind_of, contained_in, member_of, see_also та деякі інші. Онтологія завдань як понять містить типи розв'язуваних завдань, а відносини цієї онтології, зазвичай, специфікують декомпозицію завдань підзавдання. Машина виведення онтологічної системи у випадку може спиратися на мережне уявлення онтологій всіх рівнів. При цьому її функціонування буде пов'язане: з активацією понять та/або відносин, що фіксують завдання (опис вихідної ситуації); визначенням цільового стану (ситуації); висновком на мережі, що полягає в тому, що від вузлів вихідної ситуації поширюються хвилі активації, що використовують властивості відносин, пов'язаних з ними. Критерієм зупинення процесу є досягнення цільової ситуації чи перевищення тривалості виконання.



Випадкові статті

Вгору