Models for Data Source Tracking with XML

Air Force Institute of Technology AFIT Scholar Theses and Dissertations Student Graduate Works 3-2001 Models for Data Source Tracking with XML Teoman Yoruk Follow this and additional works at: https://scholar.afit.edu/etd Part of the Computer Sciences Commons Recommended Citation Yoruk, Teoman, "Models for Data Source Tracking with XML" (2001). Theses and Dissertations. 4728. https://scholar.afit.edu/etd/4728 This Thesis is brought to you for free and open access by the Student Graduate Works at AFIT Scholar. It has been accepted for inclusion in Theses and Dissertations by an authorized administrator of AFIT Scholar. For more information, please contact [email protected]. MODELS FOR DATA SOURCE TRACING WITH XML THESIS Teoman YORUK, 1st Lt., TUAF AFIT/GCE/ENG/01M-05 DEPARTMENT OF THE AIR FORCE AIR UNIVERSITY AIR FORCE INSTITUTE OF TECHNOLOGY Wright-Patterson Air Force Base, Ohio APPROVED FOR PUBLIC RELEASE, DISTRIBUTION UNLIMITED. 2Q010706 Hi The views expressed in this thesis are those of the author and do not reflect the official policy or position of the United States Air Force, Department of Defense or United States Government or the Government of the Turkish Republic. AFIT/GCE/ENG/OlM-05 MODELS FOR DATA SOURCE TRACING WITH XML THESIS Presented to the Faculty Department of Electrical and Computer Engineering Graduate School of Engineering and Management Air Force Institute of Technology Air University Air Education and Training Command In Partial Fulfillment of the Requirements for the Degree of Master of Science Teoman YORUK, B. S. Computer Engineering 1st Lt., TUAF March 2001 APPROVED FOR PUBLIC RELEASE, DISTRIBUTION UNLIMITED. AFIT/GCE/ENG/01M-05 MODELS FOR DATA SOURCE TRACING WITH XML THESIS Teoman YORUK, B.S. Computer Engineering lstLt.,TUAF Approved: l^rfW Mich id L. Talbert, Ph.D., Major, USAF date Comrtittee Chairman H#iry B. Potoczny, Ph.Df 0 date Committee Member S~ /*/>ecH Zoo/ £arl S. Mathias, Ph.D., Major, USAF date Committee Member ACKNOWLEDGMENTS Much appreciation is due to all those who have contributed to this work. I would like to thank Major Michael Talbert whose expertise and guidance not only helped frame the outline of this diesis, but also kept me on an academic focus from start to finish. I have learned a lot from him. Thanks also to Major Karl Mathias and Dr. Henry Potoczny for their guidance. I also would like to thank my family (my mother my father. , and my three sisters and ). Their love gave me the power and the ability to put up with all the difficulties I had during my education at AFIT. I would like to thank my classmates who have always been good friends. They made the life at AFIT more bearable. Finally, I would like to thank the Turkish Air Force and the Turkish people for providing me such a great opportunity. Teoman YORUK IV TABLE OF CONTENTS ACKNOWLEDGMENTS iv TABLE OF CONTENTS v TABLE OF FIGURES ix ABSTRACT xiii 1 INTRODUCTION 1 1.1 BACKGROUND 1 1. 2 PROBLEM DESCRIPTION 2 1. 3 RESEARCH FOCUS. 4 1.4 LIMITATIONS 5 1.5 SUMMARY 5 2 LITERATURE REVIEW 6 2.1 INTRODUCTION. 6 2.2 XML HISTORY 6 2.3 XML DOCUMENT STRUCTURE 8 2.3.1 Testing the Structural Correctness of an XML Document 9 2.3.1.1 Well-Formed Document 9 2.3.1.2 Valid Document 10 2.4 BENEFITS OF XML 12 2.5 KEY XML TECHNOLOGIES. 15 2.5.1 Document Object Model (DOM) 16 2.5.2 Simple API for XML (SAX) 19 2.5.3 XML Style Language (XSL) 19 2.5.4 XML Linking Language (XLINK) 22 2.5.5 XPointer 26 2.6 XML AND JAVA 27 2.7 OTHER USES OF XML FOR INTERMEDIATE DATA REPRESENTATION 29 2.7.1 XML and Databases 30 2.8 SUMMARY 31 3 METHODOLOGY 32 3.1 INTRODUCTION. 32 3.2 REPRESENTATIVE TEXT DOCUMENT 33 3.3 CONVERTING TEXT DOCUMENTS TO XML 34 3.3.1 Manual Conversion 34 3.3.2 Using eXcelon™ Tools 35 3.3.3 Using Java DOM API 40 3.4 HOW TO TRA VERSE FROM OBJECT GRAPH TO THE DATA SOURCE 43 3.4.1 Mirror-Tree Model 45 3.4.2 Link Builder Model 49 3.4.3 Drawbacks of the First Two Approaches 51 3.4.4 Meta-Class Instance Model 52 3.4.4.1 XSLT Model 54 3.4.4.2 Editing the Meta-Class Instance Model's Link Values 56 3.5 INFORMATION RETRIEVAL ASPECT 59 3.6 CHAPTER SUMMARY. 60 4 IMPLEMENTATION 61 4.1 INTRODUCTION. 61 4.2 REPRESENTATIVE TEXT DOCUMENT. 61 4.3 CONVERTING TEXT TO XML 61 4.4 HOW TO TRA VERSE FROM AN OBJECT GRAPH TO THE DA TA SOURCE 64 4.4.1 Mirror-Tree Model 66 VI 4.4.1.1 Finding XML-Links in the Mirror Java Tree 72 4.4.1.2 Mechanism to Fetch XML Document Fragments 74 4.4.2 Link Builder Model 76 4.4.3 Meta-Class Instance Model 79 4.4.3.1 The Mechanism to Traverse to Meta-Class Instance Model 80 4.4.3.2 XSLT Model 83 4.4.3.3 Editing the Meta-Class Instance Model's Link Values 85 4.4.5 Information Retrieval Aspect 86 4.5 CHAPTER SUMMARY. 87 5 DEMONSTRATION 88 5.1 INTRODUCTION. 88 5.2 DEVELOPMENT ENVIRONMENT 88 5.3 RUNTIME ENVIRONMENT. 88 5.4 THE APPLICATIONS DEVELOPED 89 5.4.1 Mirror Tree Model 91 5.4.2 Link Builder Model 96 5.4.3 Meta-Class Instance Model 99 5.5 CHAPTER SUMMARY. 104 6 CONCLUSIONS AND RECOMMENDATIONS 105 6.1 RESEARCH SUMMARY. 105 6.2 BENEFITS OF THIS RESEARCH 106 6.3 FUTURE RESEARCH RECOMMENDATIONS 107 APPENDIX.A 109 INTEGRATING THE LINK BUILDER MODEL WITH THE AGENT-BASED FRAMEWORK 109 1. The Existing Agent-Based Framework Architecture 109 2. The Integration Process 112 Vll 2.1 The Demonstration of the Integration Process 112 3. Conclusion 120 APPENDIX.B 121 PERSISTENCE MECHANISMS FOR THE LINK BUILDER MODEL 121 1. Introduction 121 2. Background 121 2.1 Problem 124 3. Contemporary Technologies to Make an Object Model Persistent 124 3.1 The Java Serialization Mechanism 124 3.2 Relational Database Management Systems (RDBMS) 125 3.3 Object Oriented Database Management Systems (OODBMS) 126 4. Approach 127 4.1 Persistence by the Java Serialization Mechanism 127 4.2 Persistence by Relational Database Management System (RDBMS) 128 4.3 Persistence by Object Oriented Database Management System (OODBMS) 132 5. Conclusions 135 BIBLIOGRAPHY 136 VITA 140 vin TABLE OF FIGURES FIGURE 1- SOURCE DATA TO SCENARIO FILE MAPPING 2 FIGURE 2-CERTCORT ARCHITECTURE 3 FIGURE 3-A SIMPLE XML DOCUMENT 8 FIGURE 4- TREE REPRESENTATION OF THE SIMPLE XML DOCUMENT 8 FIGURE 5- NOT A WELL-FORMED XML DOCUMENT 9 FIGURE 6- A VALID XML DOCUMENT AND ITS DTD 10 FIGURE 7- AN INVALID XML DOCUMENT 11 FIGURE 8-How EXTERNAL DTD IS DEFINED 12 FIGURE 9-AN XML DOCUMENT FRAGMENT 16 FIGURE 10- TREE OBJECT CONSTRUCTED FROM THE XML DOCUMENT FRAGMENT 17 FIGURE 11- JAVA CODE FRAGMENT SHOWING THE USAGE OF METHODS IN DOM API 18 FIGURE 12-How XSLT WORKS WITH XML 20 FIGURE 13-A WELL-FORMED XML DOCUMENT 21 FIGURE14- CONTENT OF THE "TEZOLA.XSL" 21 FIGURE 15-RESULT OF THE TRANSFORMATION 22 FIGURE 16-SAMPLE XML DOCUMENT CONTAINING HYPERTEXT LINK 23 FIGURE 17- SIMPLE AND EXTENDED LINKS 25 FIGURE 18-COMBINATION OF XLL AND XPOINTER 26 FIGURE 19-CONVERSIONS BETWEEN XML AND JAVA 27 FIGURE 20- INTERMEDIATE DATA REPRESENTATION BETWEEN DIFFERENT PLATFORMS 29 FIGURE 21- SCENARIO OBJECT SOURCE DATA 32 FIGURE 22-GENERAL VIEW OF EXCELON™ 35 FIGURE 23- DEFINING THE SCHEMA OF THE XML DOCUMENT USING EXCELON™ STUDIO 36 FIGURE 24- POPULATING THE XML DOCUMENT STRUCTURE USING EXCELON™ STUDIO 37 FIGURE 25- THE XML DOCUMENT VIEWED USING EXCELON™ EXPLORER 38 FIGURE 26-THE XML DOCUMENT STRUCTURE CREATED BY XML AUTHORITY 1.1 39 FIGURE 27-THE ACTUAL DTD 40 ix FIGURE 28- THE SOURCE CODE TO CREATE XML DOCUMENT VIA DOM API 41 FIGURE 29- THE SIMPLE XML DOCUMENT CREATED BY DOM API 42 FIGURE 30- How MCDONALD VISUALIZES HIS POPULATED OBJECT GRAPH 44 FIGURE 31- How TDB TEXT FILE IS PARSED INTO OBJECT MODEL AND JAVA TREE 45 FIGURE 32- THE NEW JAVA TREE REPRESENTATION OBTAINED AS A RESULT OF MODIFIED PARSE() AND TOTREEO METHODS 46 FIGURE 33- MAPPING BETWEEN THE ORIGINAL JTREE REPRESENTATION AND THE MIRROR JTREE 47 FIGURE 34- XML PARSER'S FUNCTION 48 FIGURE 35- THE COMMUNICATION BETWEEN THE SCENARIO BUILDER AND THE LINK BUILDER 50 FIGURE 36- MAPPING BETWEEN OBJECT MODELS 53 FIGURE 37-How XSLT WORKS WITH XML 54 FIGURE 38- MODIFICATIONS ON THE META-CLASS INSTANCE MODEL TO STORE XSLT VALUES 55 FIGURE 39- STORING META-CLASS INSTANCE MODEL IN OBJECT STORE 58 FIGURE 40- MANUALLY CREATED XML DOCUMENT 62 FIGURE 41-THE RESEARCH AREA ON MCDONALD'S OBJECT MODEL 64 FIGURE 42- PARTIAL CLASS HIERARCHY OF A SUSCEPTIBILITY OBJECT 65 FIGURE 43- POPULATION OF SUPPRESSOR SCENARIO OBJECT 67 FIGURE 44- JAVA SWING TREE REPRESENTATION OF THE SUPPRESSOR SCENARIO OBJECT 68 FIGURE 45- DATA SOURCE TO BE FOUND 69 FIGURE 46- FRAGMENT OF SCENARIO DATA FILE "TDB.TXT" 70 FIGURE 47- FRAGMENT OF "TDB_M.TXT" WHICH HAS THE LINK INFORMATION 70 FIGURE 48- ORIGINAL JAVA TREE AND MIRROR JAVA TREE 71 FIGURE 49- ELEMENTS OF THE PATH ARRAY OF THE SELECTED NODE ON THE ORIGINAL JTREE 72 FIGURE 50- TRAVERSAL ON THE MIRROR JTREE 74 FIGURE 51- EXTRACTION OF SOURCE DATA FROM THE XML DOCUMENT 75 FIGURE 52- VARIOUS FORMATS THE DATA SOURCE CAN HAVE 76 FIGURE 53- SEQUENCE OF EVENTS IN THE LINK BUILDER MODEL 77 FIGURE 54- THE MAPPING BETWEEN THE TWO CLASS HIERARCHIES 79 FIGURE 55-PART OF THE DFA ESTABLISHED 82 FIGURE 56- THE EXTENDED META OBJECT MODEL TO INCLUDE XSLT-INFO 83 FIGURE 57-XSLT IMPLEMENTATION 84 FIGURE 58- JTREE REPRESENTATION OF THE DOM OF AN XML DOCUMENT 85 FIGURE 59- SELECTION OF THE LOAD MENU ITEM 89 FIGURE 60-SELECTION OF THE SCENARIO DATA FILE 90 FIGURE 61-JTREE REPRESENTATION OF THE SUPPRESSOR OBJECT 91 FIGURE 62- MAPPING BETWEEN THE ORIGINAL JTREE AND THE MIRROR JTREE 92 FIGURE 63- THE POP UP MENU TO ACTIVATE MECHANISMS 93 FIGURE 64- XML DOCUMENT FRAGMENTS SHOWN IN DISPLAY WINDOWS 94 FIGURE 65- TRAVERSING TO A WEB PAGE 95 FIGURE 66- PROCESSING AN IMAGE FILE

Models for Data Source Tracking with XML

Toward the Discovery and Extraction of Money Laundering Evidence from Arbitrary Data Formats Using Combinatory Reductions

O'reilly Xpath and Xpointer.Pdf

Annotea: an Open RDF Infrastructure for Shared Web Annotations

Advanced XHTML Plug-In for Iserver

Dynamic and Interactive R Graphics for the Web: the Gridsvg Package

Bibliography of Erik Wilde

Interactive Topographic Web Mapping Using Scalable Vector Graphics

Extended Link Visualization with DHTML: the Web As an Open Hypermedia System

SMIL 2.0 — Interactive Multimedia on the Web Lloyd Rutledge

XML Projects in Japan and Fujitsu's Approach to Xlink/Xpointer

What Are... Xlink and Xpointer?

Web Engineering § Easy to Author for Non-Computer-Experts