현재의 웹은 사용자가 목적에 맞게 정보를 클릭하면서 정보를 찾아내는 것이 일반적인 방식이지만, 시맨틱 웹은 임무를 부여받은 자동화된 프로그램이 사람을 대신해 웹상의 정보를 추출하고 이를 가공해 새로운 정보를 만들어낼 수 있습니다. 즉, 현재의 웹에 온톨로지(지식자원의 의미정보 메타데이터)를 추가 구성하여, 컴퓨터가 온톨로지를 기반으로 스스로 추론하여 의미 있는 정보를 추출할 수 있도록 구성한 웹 시스템입니다.
시맨틱 웹은 웹 상에 존재하는 정보들을 컴퓨터가 해독하고 작업하기 용이하게 표현해 이들 정보간의 관계(Relation)를 추출하면서 다양한 응용 영역까지 자동화되고 통합된 정보 공유를 이루는 것이 목표입니다.
원리는 사람들이 이해할 수 있도록 자연어 위주로 되어 있는 현재의 웹 문서와 달리, 정보자원들 사이에 연결되어 있는 의미를 컴퓨터가 이해할 수 있는 형태의 언어로 바꾸는 것입니다. 이렇게 되면 컴퓨터가 정보자원의 뜻을 해석하고, 기계들끼리 서로 정보를 주고 받으면서 자체적으로 필요한 일을 처리하여 사용자가 필요로 하는 정보를 검색하고, 검색된 정보에서 지식을 추론할 수 있는 기능을 제공합니다.
시맨틱 웹의 이상향은, 인터넷에 방대한 양의 온톨로지가 산재하고, 이를 자동으로 해석하여 처리할 수 있는 에이전트 소프트웨어에 사람 또는 에이전트가 질의를 하면, 컴퓨터가 자동으로 분산된 온톨로지를 탐색하고 추론하여 원하는 결과를 알려주는 것입니다.
시맨틱 웹 기능을 지원하기 위해서는 컴퓨터의 지능적인 정보처리가 가능토록 웹 문서 내에 지식 표현을 위한 개념을 삽입하고, 지식간의 관계를 설정하며 추론 규칙을 포함 시켜야 합니다.
온톨로지는 정보시스템의 대상이 되는 분야에 존재하는 개체와 개념에 대한 명세로서, 사람과 컴퓨터간에 공유되는 지식을 개념화한 구체적인 형식이며, 개념화와 개념화간의 관계를 표현하는 것입니다.
온톨로지는 단어와 관계들로 구성된 일종의 사전으로서 생각할 수 있으며,그 속에는 특정 도메인에 관련된 단어들이 계층적으로 표현되어 있고, 추가적으로 이를 확장할 수 있는 연관관계가 포함되어 있어, 웹 기반의 지식 처리나 응용프로그램 사이의 지식 공유 등이 가능합니다. 즉, 시맨틱 웹의 목적인 자동적인 실행과 추론을 하기 위해 온톨로지는 가장 핵심적인 개념이라고 할 수 있습니다.
RDF는 현행 웹 기술이 가지고 있는 한계를 극복하기 위해 개발 되었습니다. 기존 HTML 방식의 단순 링크위주의 구조적 연결의 한계점, 자원들간의 의미적 연결 부족 및 정보검색의 비효율성 한계점이었습니다. 그리하여 웹 자원에 대한 의미성을 부여하기 위해 자원과 속성, 속성값 등의 3차원 구조를 표현함으로써 메타 데이터를 정의할 수 있는 기술언어인 RDF를 개발하게 되었습니다.
RDF 데이터 모형(Data Model)
RDF는 기본적으로 주어(subject), 서술(predicate), 목적(object)의 트리플(triple)모델로 기술됩니다. 주어란 표현하고자 하는 데이터를 의미하며, 서술은 주어에 대해 기술하거나 주어와 목적의 관계를 의미하고, 목적이란 서술에 대한 내용이나 값을 의미합니다. 또한 각 내용들에 대해서 URI를 통해 기술할 수 있습니다.
RDF 스키마(Schema)
RDF 스키마는 특정 메타데이터에서 정의하고 있는 어휘들을 선언하기 위해서 사용됩니다. 어휘란 속성집합으로 자원을 기술하기 위해 각 메타데이터 형식들에서 정의하고 있는 메타데이터 요소집합을 말합니다.
인간이 읽을 수 있고 기계처리가 가능한 어휘들을 정형화 하는 것은 상이한 메타데이터 형식들간의 어휘 확장과 재사용, 상호교환을 가능하게 해 주는 것이며, 이러한 정형화를 위한 것이 바로 RDF 스키마입니다. RDF 스키마에 대한 자원과 클래스들의 집합과 요소들을 표현하면 아래 그림과 같습니다. 그림에서 둥근 직사각형은 클래스를 나타내며, 큰 점들은 각 자원을, 화살표는 자원이 정의하는 클래스를 나타냅니다.
OWL은 웹 온톨로지와 그에 관련된 지식을 정의하는 언어로 추론 시스템에 축적된 명제들을 정의합니다. OWL을 이용하면 임의의 어휘를 구성하는 용어의 의미와 용어들 간의 관계를 명시적으로 표현할 수 있으며, 이와 같이 용어와 용어들간의 관계를 표현하는 것이 온톨로지라 합니다.
OWL은 RDF 스키마가 제공하는 기본적인 기능 및 기계가 자원에 대한 추론이 가능합니다. 또, RDF와 RDF 스키마를 기반으로, 속성과 클래스의 기술에 있어 더욱 풍부한 어휘를 제공하여 RDF 스키마 클래스간의 복잡한 관계나 클래스 및 속성에 관한 정교한 제한사항의 표현을 가능합니다.
강점 | 정보 통합 및 공유 어휘의 재사용 지원 |
---|---|
구조화되지 않은 데이터 처리 | |
데이터 모델링과 구문체계의 분리 | |
확장성 | |
세밀한 구문체계에 기초한 추론과 분류 기능 | |
그래프 구조 모델링을 통한 표현방식의 융통성 | |
응용부분 | 인터넷 포탈: 분류 법칙을 이용한 검색 기능 확장 |
멀티미디어: 멀티미디어 내용에 기반을 둔 검색 | |
기업 웹 사이트 관리, 데이터와 문서의 자동 텍사노미 생성, 기업부서나 기업 간의 합병에 따른 데이터 매핑 | |
지능형 에이전트 : 사용자 선택사항 및 관심사항 표현, 웹사이트 간의 콘텐츠 매핑 | |
세밀한 구문체계에 기초한 추론과 분류 기능 | |
웹 서비스 및 유비쿼터스 컴퓨팅 : 웹서비스 구성, 저작권 및 접근 관리 |
특징 | 설명 |
---|---|
사용성 및 접근 | – 언제든지 전체 데이터 이용/다운로드 가능
– 편리하고 수정 가능한 형태로 제공 |
재사용 재배포 | – 사용 및 재사용, 저작권 표시와 변경 허락 조건하에 변경 후 재배포 가능 |
보편적 참여 | – 누구나 데이터를 이용 / 재배포 가능 – 활동분야, 특정 사람/그룹 비차별 |
상호 운용성 | – 서로 다른 데이터셋 사이 혼합/참조 – 데이터 간 연결이 가능한 구조 |
구분 | 웹문서 | Linked Data |
---|---|---|
유사점 | 글로벌 파일시스템(File) | 글로벌 데이터베이스(DB) |
디자인 | 인간 소비 지향 | 기계화 우선, 인간지향 후 순위 |
주요객체 | 문서 | 사물, 사물에 대한 묘사 |
연결 | 문서간의 연결 | 사물간의 연결 |
객체의 구조화 정도 | 상당히 낮음 | 높음 |
컨텐츠와 연결의 의미화 | 암묵적 | 명시적 |
장점
시맨틱웹 추론엔진은 온톨로지 클래스를 형성하는 OWL file, 온톨로지 인스턴스를 형성하는 RDF file 및 규칙을 정의한 Rule file을 조합하여 온톨로지 데이터를 지식베이스인 Triple 저장소에 추론기반으로 저장하고 이를 조회하여 의미기반 정보를 제시해 줍니다.
특징 및 장점
온톨로지를 구축하는데 있어서 온톨로지 모델링 과정에서 산출된 온톨로지 스키마 (클래스, 관계속성, 데이터 속성, 제약사항)에 따라 온톨로지 인스턴스를 자동으로 구축해 줍니다.
온톨로지 전문가가 아니어도 온톨로지 검증이 가능하고, 대용량 온톨로지 데이터 저장소에서 데이터간 복잡한 연관관계 를 효율적으로 분석 및 검증할 수 있습니다.
각 도메인 별 온톨로지 구축 정보, 각 도메인 별 온톨로지의 클래스 트리 정보 및 구축된 온톨로지 데이터의 검색, SPARQL 쿼리 엔드포인트, 온톨로지 데이터의 세부 내역, 온톨로지 데이터의 OWL 구조에 대한 시각화된 동적 뷰, 온톨로지 명 관리, 온톨로지 파일의 업로드 및 다운로드 등의 기능을 제공합니다.
[도메인별 온톨로지 정보 및 관리]
[온톨로지 클래스 정보]
[OWL 뷰]
작업 중에도 트리구조, 리스트 또는 그래픽을 통해 토픽맵을 점검하면서 편집할 수 있습니다.
신규로 생성되는 데이터 또한 자동적으로 토픽맵화 할 수 있도록 주기, 조건 등을 설정할 수 있도록 되어 있어 신규구축시 뿐 아니라 시스템구축 후 DB 갱신 등의 경우 토픽맵 자동업데이트를 통해 서비스의 현행화를 지원합니다.