Nghiên cứu, tìm hiểu và xây dựng ứng dụng với semantic web

Upload: ChuThiThanhNhan.dokovn|Ngày: 11/08/2012|Lượt xem: 514|Tải về: 2|Cấp: Tiến sĩ

Chuyên mục:

mục lụcchương 1 giới thiệu semantic web . 51.1 world wide web và những hạn chế của nó . 51.2 sự ra đời của semantic web . 61.2.1 semantic web là gì? ...

MỤC LỤC

Chương 1 GIỚI THIỆU SEMANTIC WEB . 5

1.1 World Wide Web và những hạn chế của nó . 5

1.2 Sự ra đời của Semantic Web . 6

1.2.1 Semantic Web là gì? 7

1.2.2 Semantic Web mang lại những gì? 9

1.2.3 Kiến trúc Semantic Web 11

1.3 Hoạt động của W3C về Semantic Web . 21

1.3.1 Nhóm quan tâm đến Semantic Web (Semantic Web Interest) . 21

1.3.2 Nhóm hoạt động và phát triển Semantic (Web Semantic Web Best

Practices and Deployment Working ) . 21

1.3.3 Nhóm hoạt động truy xuất dữ liệu(Data Access Working) 22

1.3.4 Nhóm RDF Core 22

1.3.5 Nhóm WebOnt . 22

Chương 2 CÁC NGÔN NGỮ SEMANTIC WEB . 23

2.1 XML (eXtensible Markup Language) – Ngôn ngữ đánh dấu mở rộng 23

2.2 DTDs và XML Schema . 25

2.3 RDF - Biểu diễn dữ liệu về dữ liệu . 26

2.4 RDF Schema - Định nghĩa RDF vocabulary 28

2.5 DAML+OIL (DARPA Agent Markup Language + Ontology Inference

Layer) 31

2.5.1 Giới thiệu về DAML : 31

2.5.2 Tại sao sử dụng DAML? . 33

Chương 3 RDF – NẾN TẢNG CỦA SEMANTIC WEB 35

Luận văn tốt nghiệp: Nghiên cứu, tìm hiểu và xây dựng ứng dụng với

3.1 Giới thiệu . 35

3.2 Các khái niệm cơ bản 35

3.2.1 Namespace và cách khai báo . 35

3.2.2 Qualified name(QName) và cách sử dụng . 36

3.2.3 Mô hình RDF ( RDF Model) . 37

3.2.4 Tripple và cách sử dụng namespace 42

3.2.5 Kiểu dữ liệu có cấu trúc và Blank node . 44

3.3 Cấu trúc RDF/XML 47

3.3.1 Cú pháp RDF/XML cơ bản . 47

3.3.2 RDF Container . 50

3.4 RDF Collection . 55

3.5 RDF Schema . 58

3.5.1 Giới thiệu . 58

3.5.2 Định nghĩa class (lớp) 59

3.5.3 Định nghĩa property( thuộc tính) . 61

3.6 FOAF : Sự mở rộng của RDF . 67

Chương 4 TRUY VẤN DỮ LIỆU TRONG RDF 75

4.1 Giới thiệu . 75

4.2 Tạo một câu truy vấn đơn giản 76

4.3 Cú pháp của câu truy vấn . 77

4.4 Những dạng cú pháp khác . 79

4.5 Ràng buộc dữ liệu . 81

4.5.1 Thêm vào kiểu Optional 82

4.5.2 Ràng buộc trong khối Optional 83

4.5.3 Nhiều khối Optional . 84

4.5.4 Khối Optional lồng nhau 85

4.6 Các phép toán và điều kiện trên câu truy vấn . 86

Luận văn tốt nghiệp: Nghiên cứu, tìm hiểu và xây dựng ứng dụng với

4.6.1 Phép hội . 86

4.6.2 Phép chiếu 87

4.6.3 DISTINCT . 87

4.6.4 ORDER BY . 88

4.6.5 LIMIT 89

4.7 Lựa chọn biến được trả về . 89

4.8 Các toán tử trong ngôn ngữ SPARQL 92

4.8.1 sop:RDFterm-equal 94

4.8.2 sop:isURI . 94

4.8.3 sop:isBLANK 95

4.8.4 sop:isLiteral . 96

4.8.5 sop:logical-or . 96

4.8.6 sop:logical-and . 96

4.8.7 sop:str . 96

4.8.8 so:lang 96

4.8.9 sop:datatype . 96

Chương 5 CÁC ỨNG DỤNG SEMANTIC WEB . 97

5.1 Các lĩnh vực ứng dụng 97

5.1.1 Search Engine 97

5.1.2 Khung làm việc để quản lý tri thức - Framework for Knowledge

Management . 98

5.1.3 Internet Agent 100

5.1.4 Push System .100

5.1.5 Relationship .100

5.2 Các ứng dụng & dự án hiện có 101

5.3 Các công cụ phát triển .101

5.4 Giới thiệu Semantic Search Engine 101

Luận văn tốt nghiệp: Nghiên cứu, tìm hiểu và xây dựng ứng dụng với

5.4.1 Giới thiệu: 101

5.4.2 So sánh giữa Search Engine truyền thống( Keyword/Free-Text Search

Engine) và Semantic Search Engine: .102

Chương 6 ỨNG DỤNG MINH HỌA : TÌM KIẾM THÔNG TIN CỦA MỘT

NGƯỜI, MỘT NHÓM NGƯỜI VÀ KHẢ NĂNG CỦA HỌ TRONG MỘT TỔ

CHỨC 105

6.1 Giới thiệu ứng dụng .105

6.2 Các yêu cầu của ứng dụng .107

6.2.1 Các yêu cầu lưu trữ 107

6.2.2 Các yêu cầu giao diện 108

6.2.3 Các yêu cầu chức năng 108

6.2.4 Các yêu cầu phi chức năng 109

6.3 Hướng tiếp cận và giải pháp .110

Chương 7 PHÂN TÍCH ỨNG DỤNG 113

7.1 Mô hình use-case .113

7.2 Đặc tả use case 115

7.2.1 Chức năng Tìm Người .115

7.2.2 Chức năng Tìm Nhóm Người 116

7.2.3 Chức năng Tìm Khả Năng .117

7.2.4 Chức năng Xem Thông Tin Chi Tiết .118

7.2.5 Chức năng Xem Lược Đồ 120

7.2.6 Chức năng Quản Lý Người 121

7.2.7 Chức năng Quản Lý Nhóm Người .129

7.2.8 Chức năng Quản Lý Khả Năng 134

Chương 8 THIẾT KẾ VÀ CÀI ĐẶT ỨNG DỤNG 141

8.1 Thiết kế dữ liệu .141

Luận văn tốt nghiệp: Nghiên cứu, tìm hiểu và xây dựng ứng dụng với

8.1.1 Xây dựng ontology PC( Person’s Competence) 141

8.1.2 Thiết kế dữ liệu mô tả tài nguyên người 145

8.1.3 Thiết kế dữ liệu mô tả tài nguyên nhóm người 149

8.1.4 Thiết kế dữ liệu mô tả tài nguyên khả năng .153

8.1.5 Thiết kế file RDF (persons.rdf, groups.rdf, competences.rdf) lưu trữ

toàn bộ các tài nguyên người, nhóm người và khả năng trong hệ thống. 156

8.1.6 Thiết kế file personlist.rdf, grouplist.rdf, competencelist.rdf 160

8.1.7 Thiết kế file XSL để chuyển file RDF sang file SVG .162

8.2 Thiết kế xử lý 174

8.3 Thiết kế giao diện 187

8.3.1 Sơ đồ liên kết các màn hình .187

8.3.2 Một số màn hình chính của ứng dụng: 188

Chương 9 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 199

9.1 Kết luận .199

9.1.1 Kết quả về mặt nghiên cứu 200

Qua quá trình nghiên cứu và tìm hiểu về lĩnh vực Semantic Web, chúng em đã

hiểu được và ghi nhận lại một số kết quả đạt được như sau: 200

9.1.2 Kết quả về chương trình ứng dụng 201

9.2 Hướng phát triển .202

TÀI LIỆU THAM KHẢO .203

PHỤ LỤC A 211

CÁC ỨNG DỤNG VÀ DỰ ÁN VỀ Semantic Web .211

PHỤ LỤC B 215

MỘT SỐ TOOL VÀ EDITOR 215

PHỤ LỤC C 222

CÁC SEMANTIC SEARCH ENGINE HIỆN CÓ 222

Như John Naisbitt đã nói:

" Chúng ta đang chìm ngập trong thông tin nhưng lại khát khao tri thức "

Đúng vậy, World Wide Web chứa một lượng thông tin khổng lồ, chúng được

tạo ra từ các tổ chức, cộng đồng và nhiều cá nhân với nhiều lý do khác nhau. Người

sử dụng Web có thể dễ dàng truy cập những thông tin này bằng cách chỉ ra địa chỉ

URL – Uniform Resource Locator và theo các liên kết để tìm ra các tài nguyên liên

quan khác.

Tính đơn giản của Web hiện nay đã dẫn đến một số mặt hạn chế. Chẳng hạn

như chúng ta có thể dễ dàng bị lạc hay phải đối đầu với một lượng thông tin không

hợp lý và không liên quan được trả về từ kết quả tìm kiếm trên Web. Một ví dụ minh

họa cho vấn đề được đề cập ở trên là giả sử chúng ta muốn tìm toàn bộ các tài liệu

được viết bởi Eric Miller. Nhưng với chức năng tìm kiếm trên Web hiện nay, kết quả

trả về có thể là tất cả các thông tin khác trên Web có đề cập đến Eric hay/và Miller

như sổ nhật kí, danh bạ điện thoại, . . Vấn đề tương tự cũng xuất hiện khi ta tìm

kiếm các tài nguyên về Marja, kết quả tìm thấy là bất kì thông tin nào liên quan đến

Marja như tên của một người hoặc là tên của một địa danh Hoặc khi chúng ta

muốn tìm thông tin của một chuyên gia về XML, nhưng với kết quả tìm kiếm hiện tại

chỉ cho ra một kết quả khổng lồ như các tài liệu liên quan đến XML , các ứng dụng

hay công cụ về XML mà không cho ra chính xác thông tin mà chúng ta cần tìm kiếm.

Như vậy câu hỏi đặt ra là làm thế nào để chúng ta có được một kết quả tìm kiềm chính

xác và nhanh chóng theo đúng những gì mà chúng ta mong muốn?.

Các kĩ thuật Web hiện nay đã cản trở khả năng phát triển thông tin của nó.

Tính đơn giản của các kĩ thuật này đã gây ra hiện tượng thắt cổ chai, tạo khó khăn

Luận văn tốt nghiệp: Nghiên cứu, tìm hiểu và xây dựng ứng dụng với

2

trong việc tìm kiếm, rút trích, bảo trì, và phát sinh thông tin. Máy tính chỉ được dùng

như những thiết bị gửi và trả thông tin , chúng không thể truy xuất được những nội

dung thật sự cần và do đó chúng chỉ hỗ trợ ở một mức giới hạn nào đó trong việc truy

xuất và xử lý thông tin. Kết quả tất yếu là con người (người sử dụng) phải gánh trên

vai trách nhiệm không những truy cập và xử lý thông tin mà còn rút trích và thông

dịch mọi thông tin.

Để khắc phục các yếu điểm của Web hiện tại khái niệm “Semantic Web” đã ra

đời. Và khái niệm này đã được Tim Berners-Lee định nghĩa như sau:

“Semantic Web như một sự mở rộng của web hiện tại mà trong đó thông tin

được xử lý một cách tự dộng bằng máy tính, làm cho máy tính và con người có thể

hợp tác với nhau” .

Hình 0-1 Semantic Web như một sự mở rộng của World Wide Web

Như vậy Semantic Web là một mạng lưới các thông tin được liên kết theo một

cách thức để máy có thể dễ dàng xử lý thông tin ở mức độ toàn cầu. Chúng ta có thể

hiểu đơn giản về nó như là một cách trình bày dữ liệu có hiệu quả trên mạng toàn cầu,

Luận văn tốt nghiệp: Nghiên cứu, tìm hiểu và xây dựng ứng dụng với

3

hoặc là một cơ sở dữ liệu được kết nối toàn cầu. Kỹ thuật Web hiện tại chỉ cho phép

chúng ta lưu trữ thông tin và tìm kiếm thông tin trên những thông tin đã được lưu trữ.

Chính vì vậy mà sự ra đời của Semantic Web là một bước tiến vượt bậc so với kỹ

thuật Web hiện tại dựa vào khả năng làm việc với thông tin của chúng thay vì chỉ đơn

thuần là lưu trữ thông tin.

Với sự lớn mạnh và khả năng lưu trữ thông tin ngữ nghĩa, Semantic Web sẽ trở

thành một thế hệ Web cho tương lai, thế hệ Web mà chúng ta đang chờ đợi. Và đó

cũng là lý do đề tài “Nghiên cứu, tìm hiểu và xây dựng ứng dụng với Semantic

Web” được chúng em quan tâm và chọn làm khóa luận tốt nghiệp

[Ẩn quảng cáo]