ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN

PHẠM THỊ THỊNH

CÔNG CỤ CHUYỂN ĐỔI DỮ LIỆU ĐỊA LÝ VÀ TÍCH HỢP VÀO GIS

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội - 2016

ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN

PHẠM THỊ THỊNH

CÔNG CỤ CHUYỂN ĐỔI DỮ LIỆU ĐỊA LÝ VÀ TÍCH HỢP VÀO GIS

Ngành: Công nghệ thông tin Chuyên ngành: Quản Lý Hệ thống Thông tin Mã số: Chuyên ngành đào tạo thí điểm

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Đình Hóa

Hà Nội - 2016

0 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của tôi và không sao chép của bất kỳ ai. Những kiến thức trình bày trong luận văn là do tôi tìm hiểu, nghiên cứu và trình bày lại theo cách hiểu. Trong quá trình làm luận văn, tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệu tham khảo. Hà Nội, ngày tháng năm 2016 Học viên

Phạm Thị Thịnh

1 LỜI CẢM ƠN Lời đầu tiên, em xin trân trọng gửi lời cảm ơn sâu sắc đến thầy giáo PGS.TS. Nguyễn Đình Hóa – Viện CNTT – Trƣờng Đại học Quốc gia Hà Nội và anh Phan Thế Hùng– Viện quy hoạch xây dựng Hà Nội đã trực tiếp hƣớng dẫn và tận tình giúp đỡ em trong suốt thời gian thực hiện luận văn. Thứ hai, em xin bày tỏ lòng biết ơn chân thành tới toàn thể các thầy cô giáo trong Viện CNTT –Đại học Quốc gia Hà Nội đã dạy bảo tận tình em trong suốt quá trình em học tập tại khoa. Trong quá trình thực hiện luận văn, em cũng nhận đƣợc sự giúp đỡ rất nhiều từ các anh chị và các bạn tại Viện Quy hoạch Xây dựng Hà Nội. Cảm ơn anh chị đã giúp đỡ, tạo điều kiện để em có thể hoàn thành luận văn. Cuối cùng, em xin gửi lời cảm ơn tới gia đình, bạn bè, đồng nghiệp, những ngƣời đã luôn bên cạnh em để động viên, giúp đỡ và tạo điều kiện tốt nhất để em có thể hoàn thành luận văn. Hà Nội, ngày tháng năm 2016 Học viên

Phạm Thị Thịnh

2 MỤC LỤC

LỜI CAM ĐOAN ...... 1

LỜI CẢM ƠN ...... 2

MỤC LỤC ...... 3

DANH MỤC CÁC THUẬT NGỮ VÀ TỪ VIẾT TẮT ...... 5

DANH MỤC CÁC HÌNH VẼ ...... 7

MỞ ĐẦU ...... 8

CHƢƠNG 1: DỮ LIỆU ĐỊA LÝ TRONG GIS VÀ VẤN ĐỀ CHUYỂN ĐỔI DỮ LIỆU ĐỊA LÝ ...... 9 1.1 Khái quát về hệ thống thông tin địa lý và ứng dụng ...... 9 1.1.1 GIS là gì...... 9 1.1.2 Các thành phần của GIS ...... 10 1.1.3 Chức năng của GIS...... 11 1.1.4 Ứng dụng của GIS ...... 11 1.2 Một số hệ GIS thông dụng ...... 12 1.2.1 MapInfo ...... 13 1.2.2 ArcGIS...... 15 1.2.3 QGIS ...... 17 1.3 Các chuẩn và định dạng dữ liệu CAD, GIS và sự liên quan ... 20 1.3.1 CAD là gì...... 20 1.3.2 Một số định dạng trong CAD ...... 20 1.3.3 Dữ liệu địa lý trong GIS ...... 22 1.3.4 CAD và GIS ...... 27 1.4 Xây dựng CSDL địa lý phục vụ quy hoạch hạ tầng và bài toán chuyển đổi dữ liệu địa lý ở Việt Nam ...... 29 1.4.1 Nhu cầu xây dựng CSDL địa lý ...... 29 1.4.2 Các phƣơng pháp chuyển đổi hiện tại ...... 30 1.4.3 Các GIS xử lý dữ liệu CAD nhƣ thế nào ...... 32

CHƢƠNG 2: PHÁT TRIỂN CÔNG CỤ HỖ TRỢ CHUYỂN ĐỔI DỮ LIỆU ĐỊA LÝ ...... 35 2.1 Phân tích hiện trạng dữ liệu và đề xuất cách giải quyết ...... 35 2.1.1 Kết quả khảo sát các bản vẽ ...... 35

3 2.1.2 Phƣơng hƣớng giải quyết ...... 38 2.2 Đề xuất tiêu chuẩn cho bản vẽ CAD để chuyển đổi tự động vào CSDL địa lý ...... 39 2.2.1 Các yêu cầu kỹ thuật ...... 39 2.2.2 Các khuyến cáo về tổ chức dữ liệu ...... 39 2.3 Phát triển công cụ chuyển đổi dữ liệu địa lý ...... 40 2.3.1 Cách tiếp cận, lựa chọn công nghệ và môi trƣờng phát triển ... 40 2.3.2 Khung phát triển plug-in cho hệ thống GIS ...... 42 2.4 Phân tích thiết kế công cụ hỗ trợ chuyển đổi dữ liệu địa lý .... 44 2.4.1 Mô hình ca sử dụng ...... 44 2.4.2 Mô tả ca sử dụng ...... 44 2.4.3 Biểu đồ lớp ...... 45 2.4.4 Thiết kế lớp ...... 45

CHƢƠNG 3: KẾT QUẢ CÀI ĐẶT VÀ THỬ NGHIỆM ...... 48 3.1 Tổ chức thực nghiệm ...... 48 3.1.1 Môi trƣờng thực nghiệm ...... 48 3.1.2 Dữ liệu thực nghiệm ...... 48 3.2 Kết quả thử nghiệm chƣơng trình ...... 49 3.2.1 Một số giao diện chƣơng trình và hƣớng dẫn thao tác ...... 49 3.2.2 Hiển thị kết quả ...... 52 3.3 Nhận xét và đánh giá ...... 54

KẾT LUẬN ...... 56

TÀI LIỆU THAM KHẢO ...... 57

4 DANH MỤC CÁC THUẬT NGỮ VÀ TỪ VIẾT TẮT

STT Từ viết Từ tiếng Anh Ý nghĩa tắt/thuật ngữ 1 GIS Geographical Hệ thống thông tin địa lý Information System

2 CSDL Cơ sở dữ liệu 3 CAD Computer Aided Design Thiết kế hay vẽ có trợ giúp or Drafting bởi máy tính 4 ESRI Environmental System Viện nghiên cứu hệ thống Research Institute môi trƣờng 5 NCGIA National Center for Trung tâm quốc gia về Geography Information Thông tin và Phân tích địa and Analysis lý 6 FIG Federation International Liên đoàn quốc tế các nhà of Surveyors giám sát 7 CAE Computer-aided Kỹ nghệ có máy tính trợ engineering giúp Công nghệ liên quan đến việc sử dụng hệ thống máy tính để phân tích đối tƣợng hình học CAD

8 FEA Finite element analysis Giải tích phần tử hữu hạn Ngành học thuật nghiên cứu cung cấp các giải pháp số cho các phƣơng trình vật lý của các mô hình từ các lĩnh vực khác nhau. 9 CAM Computer-aided Sản xuất chế tạo có máy manufacturing tính trợ giúp Những phần mềm dùng để sinh ra những đoạn mã (code) hợp lệ cho máy

5 CNC 10 CNC Computer numerical Điều khiển bằng máy tính control 11 PDM Product Data Một dạng phần mềm Management chuyên dùng để quản lí dữ liệu 12 DBMS Database Management Hệ quản trị cơ sở dữ liệu System 13 UT Universal translator Một công cụ chuyển đổi dữ liệu địa lý 14 QH Quy hoạch

15 CGDD Chỉ giới đƣờng đỏ

6 DANH MỤC CÁC HÌNH VẼ Hình 1.1. Thành phần của GIS ...... 10 Hình 1.2. Bản đồ hiện trạng sử dụng đất thị trấn Yên Thanh, huyện Yên Thành, tỉnh Nghệ An ...... 14 Hình 1.3. Bộ phần mềm ứng dụng ArcGIS (Nguồn: ESRI) ...... 15 Hình 1.4. Tổ chức cơ sở dữ liệu – Geodatabase ...... 25 Hình 2.1. Bản đồ quy hoạch giao thông-QHPK N2 ...... 36 Hình 2.2 SDD Phân Khu N8 và SDD Phân Khu N1 ...... 36 Hình 2.3. Sơ đồ quy trình chuyển đổi dữ liệu CAD sang GIS ...... 43 Hình 2.4. Mô hình ca sử dụng của phần mềm ...... 44 Hình 2.5. Biểu đồ lớp của phần mềm ...... 45 Hình 2.6. Lớp giao diện chính của phần mềm ...... 45 Hình 2.7. Lớp giao diện tải dữ liệu CAD ...... 46 Hình 2.8. Lớp giao diện nhập địa chỉ lƣu trữ ...... 46 Hình 2.9. Lớp điều khiển ...... 47 Hình 3.1. Giao diện phần mềm chuyển đổi dữ liệu CAD sang GIS ...... 50 Hình 3.2. Giao diện chọn dữ liệu CAD ...... 50 Hình 3.3. Giao diện chọn lƣới chiếu ...... 51 Hình 3.4. Giao diện chọn vùng lƣu trữ cho dữ liệu sau khi chuyển đổi ...... 52 Hình 3.5. Bản vẽ quy hoạch dạng GIS sau khi đƣợc chuyển đổi ...... 53 Hình 3.6. Dữ liệu thuộc tính của CSDL Quy hoạch ...... 53 Hình 3.7. Bản vẽ chỉ giới đƣờng đỏ dạng GIS sau khi chuyển đổi...... 54 Hình 3.8. Dữ liệu thuộc tính của CSDL Chỉ giới đƣờng đỏ ...... 54

7 MỞ ĐẦU Dữ liệu địa lý là tài nguyên quan trọng nhất trong mọi GIS. Việc xây dựng CSDL GIS và cập nhật, bổ sung dữ liệu đòi hỏi sử dụng nhiều công nghệ thu thập dữ liệu khác nhau. Chuyển đổi dữ liệu từ các nguồn có sẵn khác là một biện pháp thƣờng sử dụng, cho phép tận dụng các nguồn dữ liệu số có sẵn nhƣ bản vẽ quy hoạch, thiết kế bằng CAD... Hỗ trợ ngƣời sử dụng chuyển đổi dữ liệu sao cho hiệu quả (nhanh chóng, đảm bảo độ chính xác, tuân thủ các chuẩn …) luôn là một vấn đề cần đƣợc nghiên cứu hoàn thiện. Hiện nay chủ yếu ngƣời sử dụng vẫn dùng các công cụ xử lý từng file dữ liệu và thiết lập tham số cho quá trình chuyển đổi một cách thủ công. Trong khi đó các phần mềm hệ thống thông tin địa lý cho phép mở rộng thêm chức năng bằng các plug-in tự xây dựng. Đề tài “Công cụ chuyển đổi dữ liệu địa lý và tích hợp vào GIS” đặt mục tiêu nghiên cứu hỗ trợ tốt hơn cho ngƣời sử dụng GIS trong việc chuyển đổi dữ liệu một cách hiệu quả nhất. Bố cục của luận văn gồm 3 chƣơng: Chƣơng 1: Trình bày các khái niệm chung về GIS và dữ liệu địa lý, vấn đề chuyển đổi dữ liệu địa lý. Chƣơng 2: Tìm hiểu hiện trạng thực tế dữ liệu CAD, những vấn đề cần giải quyết khi chuyển đổi dữ liệu CAD sang GIS. Từ đó, phân tích thiết kế và cách thức xây dựng công cụ hỗ trợ chuyển đổi dữ liệu địa lý. Chƣơng 3. Thử nghiệm chạy chƣơng trình, đánh giá, phân tích kết quả.

8 CHƢƠNG 1: DỮ LIỆU ĐỊA LÝ TRONG GIS VÀ VẤN ĐỀ CHUYỂN ĐỔI DỮ LIỆU ĐỊA LÝ 1.1 Khái quát về hệ thống thông tin địa lý và ứng dụng 1.1.1 GIS là gì GIS - Geographic Information System(GIS) là một nhánh của công nghệ thông tin, đã hình thành từ những năm 60 của thế kỷ trƣớc và phát triển rất mạnh trong những năm gần đây. GIS đƣợc sử dụng nhằm xử lý đồng bộ các lớp thông tin không gian (bản đồ) gắn với các thông tin thuộc tính, phục vụ nghiên cứu, quy hoạch và quản lý các hoạt động theo lãnh thổ. Ngày nay, ở nhiều quốc gia trên thế giới, GIS đã trở thành công cụ trợ giúp quyết định trong hầu hết các hoạt động kinh tế-xã hội, an ninh, quốc phòng, đối phó với thảm hoạ thiên tai v.v... GIS có khả năng trợ giúp các cơ quan chính phủ, các nhà quản lý, các doanh nghiệp, các cá nhân v.v... đánh giá đƣợc hiện trạng của các quá trình, các thực thể tự nhiên, kinh tế-xã hội thông qua các chức năng thu thập, quản lý, truy vấn, phân tích và tích hợp các thông tin đƣợc gắn với một nền bản đồ số nhất quán trên cơ sở toạ độ của các dữ liệu bản đồ đầu vào. Hệ thông tin địa lý (Geographical Information System – GIS) là tập hợp các công cụ để thu thập, lƣu trữ, chỉnh sửa, truy cập, phân tích và cập nhật các thông tin địa lý cho một mục đích chuyên biệt. Ngoài ra cũng có nhiều định nghĩa khác về GIS [1]: GIS là công cụ trên cơ sở nền máy tính để lập bản đồ và phân tích những hiện tƣợng đang tồn tại và các sự kiện xảy ra trên trái đất (Environmental System Research Institute ESRI – Mỹ). GIS là hệ thống phần cứng, phần mềm và các thủ tục đƣợc thiết kế nhằm thu thập, quản lý, xử lý, phân tích, mô hình hóa và hiển thị các dữ liệu quy chiếu không gian để giải quyết các vấn đề quản lý và lập kế hoạch (National Center for Geography Information and Analysis NCGIA – Mỹ). GIS là một tập hợp các nguyên lý, phƣơng pháp, dụng cụ và dữ liệu quy chiếu không gian đƣợc sử dụng để nhập, lƣu trữ, chuyển đổi, phân tích, lập mô hình, mô phỏng và lập bản đồ các hiện tƣợng, sự kiện trên trái đất, nhằm sản sinh các thông tin thiết thực hổ trợ cho việc ra quyết định (Thériault – Canada).

9 1.1.2 Các thành phần của GIS GIS bao gồm 4 thành phần chính (đƣợc FIG - Federation International of Surveyors công nhận) đó là: phần cứng (Hardware), phần mềm (), dữ liệu (Data) và ngƣời sử dụng (User). Ngoài 4 thành phần cơ bản trên, để quản lý toàn bộ cơ sở dữ liệu của một vùng không gian rộng lớn, quy trình và cách thức tổ chức hệ thống GIS đƣợc xem là thành phần thứ 5 góp phần giữ vai trò quan trọng trong việc phát triển ứng dụng GIS.

Hình 1.1. Thành phần của GIS Phần cứng: bao gồm máy tính và các thiết bị ngoại vi Phần mềm: là bộ não của hệ thống, phần mềm GIS rất đa dạng và có thể chia làm 3 nhóm (nhóm phần mềm quản đồ họa, nhóm phần mềm quản trị bản đồ và nhóm phần mềm quản trị, phân tích không gian). Dữ liệu: bao gồm dữ liệu không gian (dữ liệu bản đồ) và dữ liệu thuộc tính (dữ liệu phi không gian). Dữ liệu không gian miêu tả vị trí địa lý của đối tƣợng trên bề mặt Trái đất. Dữ liệu thuộc tính miêu tả các thông tin liên quan đến đối tƣợng, các thông tin này có thể đƣợc định lƣợng hay định tính. Con ngƣời: Trong GIS, thành phần con ngƣời là thành phần quan trọng nhất bởi con ngƣời tham gia vào mọi hoạt động của hệ thống GIS (từ việc xây dựng cơ sở dữ liệu, việc tìm kiếm, phân tích dữ liệu …). Có 2 nhóm ngƣời quan trọng là ngƣời sử dụng và ngƣời quản lý GIS. Phƣơng pháp: một phần quan trọng để đảm bảo sự hoạt động liên tục và có hiệu quả của hệ thống phục vụ cho mục đích của ngƣời sử dụng

10 1.1.3 Chức năng của GIS GIS gồm 4 chức năng chính: Nhập dữ liệu, quản lý dữ liệu, phân tích dữ liệu, và hiển thị dữ liệu. Nhập dữ liệu: Nhập dữ liệu là quá trình mã hóa dữ liệu thành dạng có thể đọc và lƣu trữ trên máy tính (tạo cơ sở dữ liệu GIS). Nhập dƣ liệu giữ vai trò rất quan trọng trong việc tạo ra cơ sở dữ liệu đầy đủ và chính xác. Nhập dữ liệu có thể từ nhiều nguồn khác nhau nhƣ ảnh vệ tinh, ảnh chụp máy bay, chuyển đổi dữ liệu,… Quản lý dữ liệu: Dữ liệu thuộc tính thƣờng đƣợc quản lý dƣới dạng mô hình quan hệ, trong khi dữ liệu không gian đƣợc quản lý dƣới dạng mô hình dữ liệu vector và raster. Có thể chuyển đổi qua lại giữa hai mô hình: Vector sang Raster (Raster hóa) hoặc raster sang vector (vector hóa). Quản lý dữ liệu giữ vai trò rất quan trọng trong việc truy cập nhanh cơ sở dữ liệu không gian và thuộc tính, góp phần phân tích dữ liệu hiệu quả cho các bài toán ứng dụng thực tế. Quản lý dữ liệu phụ thuộc vào thiết bị lƣu trữ dữ liệu (máy tính) rất nhiều, đặc biệt là bộ nhớ thiết bị. Phân tích dữ liệu: GIS có thể phân biệt với các hệ thống thông tin khác bởi khả năng phân tích kết hợp dữ liệu không gian và thuộc tính cùng lúc. Đây đƣợc xem nhƣ thế mạnh mà các công cụ GIS mang lại cho ngƣời dùng, với nhu cầu phân tích, giải quyết các bài toán dựa trên dữ liệu không gian địa lý. Hiển thị dữ liệu: GIS cho phép lƣu trữ và hiển thị thông tin hoàn toàn tách biệt, có thể hiển thị đƣợc thông tin ở các tỉ lệ khác nhau, mức độ chi tiết của thông tin đƣợc lƣu trữ chỉ bị giới hạn bởi khả năng lƣu trữ phần cứng và phƣơng pháp mà phần mêm dùng để hiển thị dữ liệu. Với sự phát triển của công nghệ, GIS cũng đã cho phép hiển thị dữ liệu không gian địa lý ở nhiều định dạng khác nhau, kể cả mô hình 3D mô phỏng gần giống thế giới thực. 1.1.4 Ứng dụng của GIS Sử dụng GIS để tạo và lƣu trữ dữ liệu địa lý - tạo cơ sở dữ liệu. Cơ sở dữ liệu địa lý đƣợc tạo và quản lý bằng GIS cho phép các ứng dụng đa ngành có thể đƣợc thực hiện trên cùng một nền dữ liệu thống nhất. Tính toán theo các mô hình để tạo ra thông tin mới: Ví dụ - Bản đồ thích nghi cây trồng đƣợc tính toán dựa trên việc chồng xếp có trọng số các thông tin: bản đồ thổ nhƣỡng, bản đồ độ dốc.

11 - Bản đồ hiện trạng rừng hai thời kỳ đƣợc chồng xếp để có bản đồ về biến động rừng giữa hai thời kỳ… Các bài toán mô phỏng: Theo các mô hình lý thuyết (mang tính giả định), GIS còn có ứng dụng trong các bài toán mô phỏng nhƣ các ví dụ sau: - Với một chiều cao đập cho trƣớc, GIS có thể mô phỏng đƣợc mức, lƣợng, diện tích nƣớc ngập. - Với các chiều rộng mở đƣờng khác nhau trên bản đồ hiện trạng sử dụng đất, GIS cho phép mô phỏng các phƣơng án mở đƣờng và tiền đền bù. Các ứng dụng có liên quan đến mô hình số độ cao: - Nhƣ tính toán phạm vi quan sát từ điểm phục vụ cho các yêu cầu quân sự hoặc đặt trạm ăng ten viễn thông (điện thoại di động). - Các thông số của địa hình đƣợc xác định nhƣ độ cao, độ dốc còn phục vụ cho công tác qui hoạch (ví dụ phân cấp phòng hộ đầu nguồn) và các khoa học trái đất (địa mạo, địa lý). Các phân tích mạng Để giải quyết các bài toán tìm đƣờng ngắn nhất hay thời gian thích hợp để bật tắt đèn xanh đèn đỏ trong giao thông đô thị. Các phân tích khoảng cách Có thể ứng dụng tìm đặt vị trí (allocation) nhƣ trạm xe buýt, trạm xăng, siêu thị hay trƣờng học một cách hiệu quả nhất. Các ứng dụng trên có thể coi là “cổ điển” và đã đƣợc áp dụng thành công. Ngày nay GIS đang phát triển mạnh theo hƣớng tổ hợp, phát triển GIS lớn (enterprise), liên kết mạng, ứng dụng thành quả của các ngành khoa học khác vào GIS, nhƣ ứng dụng trí tuệ nhân tạo, lý thuyết mờ vào trong việc xử lý dữ liệu GIS, tích hợp GIS với các thông tin chuyên đề để hình thành hệ thông tin giải quyết một vấn đề cụ thể cũng nhƣ trợ giúp quyết định, nhất là trong quản lý lãnh thổ….

1.2 Một số hệ GIS thông dụng Các phần mềm mã nguồn mở đã thực sự trƣởng thành trong những năm qua và đã trở thành những công cụ thiết thực và hỗ trợ tốt cho ngƣời dùng. Các phần mềm mã nguồn mở cho GIS cũng không nằm ngoài xu hƣớng đó và ngày nay đã có thể đáp ứng đƣợc nhu cầu của dân chuyên nghiệp GIS trên toàn thế giới.

12 GIS ngày càng phát triển và đƣợc ứng dụng vào nhiều lĩnh vực của đời sống kinh tế - xã hội, kéo theo là sự ra đời của các phần mềm GIS. Hiện nay có rất nhiều phần mềm GIS đƣợc xây dựng cả trên nền desktop và nền web. Một số phần mềm GIS gồm có: 1.2.1 MapInfo MapInfo là một giải pháp phần mềm GIS thân thiện với ngƣời sử dụng. Ngay từ đầu, hãng đã chủ trƣơng xây dựng các phần mềm GIS có hiệu quả, với các chức năng phân tích không gian hữu ích cho các hoạt động kinh doanh, quản lý nhƣng không cồng kềnh và không phức tạp hóa bởi những chức năng không cần thiết, giao diện đơn giản và dễ hiểu, đồng thời giá cả phải phù hợp với đại đa số ngƣời sử dụng. Phiên bản gần đây là MapInfo Professional 11 cũng vẫn duy trì truyền thống này - có thể chạy trên các hệ điều hành thông thƣờng nhƣ Windows XP, Windows 2000, Windows NT+SP6, Windows 98 SE, Windows 2003 Server với Terminal Services và Citrix. Các chức năng cơ bản của Mapinfo Nhập dữ liệu: MapInfo cho phép nhập dữ liệu thuộc các khuôn dạng khác nhau nhƣ AutoCAD DWG/DXF 2004, MicroStation DGN v8, Open ESRI Grid data, Open CSV, Open Shape files...; Hỗ trợ liên kết với CSDL: Oracle 10G & 9iR2, MS SQL, Server 2000, MS Access, IBM Informix 9.4; Hỗ trợ CSDL không gian: Oracle 10G Spatial & Locator, MS SQL Server and Informix thông quan SpatialWare; Xuất dữ liệu sang các khuôn dạng khác: Cho phép xuất dữ liệu sang các khuôn dạng GIF, LZW TIFF và TIFF CCITT Group 4; Biên tập bản đồ / chỉnh sửa dữ liệu: Tạo lập các đối tƣợng đồ họa, hiển thị chúng theo các kiểu ký hiệu có trong thƣ viện ký hiệu mặc định hoặc trong thƣ viện tự tạo, hiển thị các đối tƣợng theo lớp trong Layer Control... Tạo bảng chú giải, cho phép hiển thị dữ liệu theo 2 biến số khác nhau trong cùng một thời điểm, tạo các vùng đệm bằng công cụ buffer...; Xác định cơ sở toán học cho bộ dữ liệu: số lƣợng lƣới chiếu bản đồ có mặc định trong MapInfo rất phong phú, đủ để đáp ứng cho việc xác định cơ sở toán học cho các bộ dữ liệu đƣợc thu thập từ các nguồn khác nhau. Các lƣới chiếu theo các thông số riêng biệt cho từng vùng cũng có thể đƣợc tạo lập mới bằng cách biên tập tệp tin MAPINFOW.PRJ của phần mềm;

13 Chuyển đổi khuôn dạng dữ liệu bằng công cụ Universal Translator: cho phép chuyển đổi dữ liệu từ khuôn dạng của MapInfo *.TAB sang các khuôn dạng *.shp của ArcView, DGN của Microstation, DXF và DWG của AutoCAD và ngƣợc lại. Trong quá trình chuyển đổi, công cụ này còn cho phép xác định và chuyển đổi cơ sở toán học của dữ liệu; Phân tích không gian:  Cung cấp các công cụ mạnh và logic đáp ứng việc thực hiện những bài toán phân tích không gian phức tạp;  Thể hiện những đặc điểm và xu hƣớng của các đối tƣợng địa lý đƣợc lƣu trong CSDL, từ đó thể hiện những ảnh hƣởng qua lại giữa các hiện tƣợng, đối tƣợng trong không gian;  Cho phép thành lập bản đồ có mức độ chi tiết cao nhằm phục vụ cho mục đích hiển thị dữ liệu không gian và hỗ trợ cho hoạch định chính sách;  Hỗ trợ cho các doanh nghiệp giải các bài toán về tìm hiểu khách hàng và thị trƣờng.

Hình 1.2. Bản đồ hiện trạng sử dụng đất thị trấn Yên Thanh, huyện Yên Thành, tỉnh Nghệ An MapInfo có rất nhiều ƣu điểm với khả năng hiển thị và lập bản đồ tốt và có những chức năng GIS cơ bản và đƣợc nhiều ngƣời sử dụng ƣa chuộng trong các dự

14 án GIS quy mô nhỏ, CSDL cỡ nhỏ. Tuy nhiên, do nhƣợc điểm là quản lý topology không đƣợc chặt chẽ, cấu trúc dữ liệu không đầy đủ nên khả năng phân tích cũng hạn chế - MapInfo thƣờng không đƣợc sử dụng để xây dựng các CSDL lớn. Hơn nữa, MapInfo cũng còn hạn chế khi cần đƣa ra một giải pháp mạng chuyên nghiệp và kết nối trao đổi số liệu với các hệ thống GIS khác. 1.2.2 ArcGIS ArcGIS là hệ thống GIS hàng đầu hiện nay, cung cấp một giải pháp toàn diện từ thu thập / nhập số liệu, chỉnh lý, phân tích và phân phối thông tin trên mạng Internet tới các cấp độ khác nhau nhƣ CSDL địa lý cá nhân hay CSDL của các doanh nghiệp. Về mặt công nghệ, hiện nay các chuyên gia GIS coi công nghệ ESRI là một giải pháp mang tính chất mở, tổng thể và hoàn chỉnh, có khả năng khai thác hết các chức năng của GIS trên các ứng dụng khác nhau nhƣ: desktop (ArcGIS Desktop), máy chủ (ArcGIS Server), các ứng dụng Web (ArcIMS, ArcGIS Online), hoặc hệ thống thiết bị di động (ArcPAD)... và có khả năng tƣơng tích cao đối với nhiều loại sản phẩm của nhiều hãng khác nhau.

Hình 1.3. Bộ phần mềm ứng dụng ArcGIS (Nguồn: ESRI) ArcGIS Desktop (với phiên bản mới nhất là ArcGIS 10) bao gồm những công cụ rất mạnh để quản lý, cập nhật, phân tích thông tin và xuất bản tạo nên một hệ thống thông tin địa lý (GIS) hoàn chỉnh, cho phép:

15 – Tạo và chỉnh sửa dữ liệu tích hợp (dữ liệu không gian tích hợp với dữ liệu thuộc tính) - cho phép sử dụng nhiều loại định dạng dữ liệu khác nhau thậm chí cả những dữ liệu lấy từ Internet; – Truy vấn dữ liệu không gian và dữ liệu thuộc tính từ nhiều nguồn và bằng nhiều cách khác nhau; – Hiển thị, truy vấn và phân tích dữ liệu không gian kết hợp với dữ liệu thuộc tính; – Thành lập bản đồ chuyên đề và các bản in có chất lƣợng trình bày chuyên nghiệp. ArcGIS Destop là một bộ phần mềm ứng dụng gồm: ArcMap, ArcCatalog, ArcToolbox, ModelBuilder, ArcScene và ArcGlobe. Khi sử dụng các ứng dụng này đồng thời, ngƣời sử dụng có thể thực hiện đƣợc các bài toán ứng dụng GIS bất kỳ, từ đơn giản đến phức tạp, bao gồm cả thành lập bản đồ, phân tích địa lý, chỉnh sửa và biên tập dữ liệu, quản lý dữ liệu, hiển thị và xử lý dữ liệu. Phần mềm ArcGIS Desktop đƣợc cung cấp cho ngƣời dùng ở 1 trong 3 cấp bậc với mức độ chuyên sâu khác nhau là ArcView, ArcEditor, ArcInfo: ArcView: Cung cấp đầy đủ chức năng cho phép biểu diễn, quản lý, xây dựng và phân tích dữ liệu địa lý, các công cụ phân tích không gian cùng với việc biên tập và phân tích thông tin từ các lớp bản đồ khác nhau đồng thời thể hiện các mối quan hệ và nhận dạng các mô hình. Với ArcView, cho phép: – Ra các quyết định chuẩn xác hơn dựa trên các dữ liệu địa lý; – Xem và phân tích các dữ liệu không gian bằng nhiều phƣơng pháp; – Xây dựng đơn giản và dễ dàng các dữ liệu địa lý; – Tạo ra các bản đồ có chất lƣợng cao; – Quản lý tất cả các file, CSDL và các nguồn dữ liệu; – Tùy biến giao diện ngƣời dùng theo yêu cầu. ArcEditor: Là bộ sản phẩm có nhiều chức năng hơn, dùng để chỉnh sửa và quản lý dữ liệu địa lý. ArcEditor bao gồm các tính năng của ArcView và thêm vào đó là một số các công cụ chỉnh sửa, biên tập. Với ArcEditor, cho phép: – Dùng các công cụ CAD để tạo và chỉnh sửa các đặc tính GIS; – Tạo ra các CSDL địa lý thông minh; – Tạo quy trình công việc một cách chuyên nghiệp cho 1 nhóm và cho phép nhiều ngƣời biên tập; – Xây dựng và giữ đƣợc tính toàn vẹn của không gian bao gồm các quan hệ hình học topo giữa các đặc tính địa lý;

16 – Quản lý và mở rộng mạng lƣới hình học; – Làm tăng năng suất biên tập; – Quản lý môi trƣờng thiết kế đa ngƣời dùng với versioning; – Duy trì tính toàn vẹn giữa các lớp chủ đề và thúc đẩy tƣ duy logic của ngƣời dùng; – Cho phép chỉnh sửa dữ liệu độc lập (khi tạm ngừng kết nối với CSDL). ArcInfo: Là bộ sản phẩm ArcGIS đầy đủ nhất. ArcInfo bao gồm tất cả các chức năng của ArcView lẫn ArcEditor. Cung cấp các chức năng tạo và quản lý một hệ GIS, xử lý dữ liệu không gian và khả năng chuyển đổi dữ liệu, xây dựng dữ liệu, mô hình hóa, phân tích, hiển thị bản đồ trên màn hình máy tính và xuất bản bản đồ ra các phƣơng tiện khác nhau. Với ArcInfo, cho phép: – Xây dựng một mô hình xử lý không gian rất hữu dụng cho việc tìm ra các mối quan hệ, phân tích dữ liệu và tích hợp dữ liệu; – Thực hiện chồng lớp các lớp vector, nội suy và phân tích thống kê; – Tạo ra các đặc tính cho sự kiện và chồng xếp các đặc tính của các sự kiện đó; – Chuyển đổi dữ liệu và các định dạng của dữ liệu theo rất nhiều loại định dạng; – Xây dựng những bộ dữ liệu phức tạp, các mô hình phân tích và các đoạn mã để tự động hóa các quá trình GIS; – Sử dụng các phƣơng pháp trình diễn, thiết kế, in ấn và quản lý bản đồ để xuất bản bản đồ. 1.2.3 QGIS 1.2.3.1 Giới thiệu QGIS (tên gọi trƣớc đây là Quantum GIS) là một phần mềm GIS mã nguồn mở đƣợc bắt đầu xây dựng từ năm 2002 và đƣợc phát triển nhanh chóng với một cộng đồng phát triển lớn trên cơ sở tự nguyện. Đây là phần mềm tƣơng đối mạnh và dễ sử dụng, chạy đƣợc trên các hệ điều hành:Windows, Mac OS X, Linux, BSD và Android và bao gồm các ứng dụng cho: QGIS Desktop: Tạo lập, chỉnh sửa, hiển thị, phân tích và xuất bản thông tin địa không gian; QGIS Browser: Duyệt và xem nhanh dữ liệu và siêu dữ liệu cũng nhƣ kéo và thả dữ liệu từ kho dữ liệu này sang kho dữ liệu khác;

17 QGIS Server: Xuất bản QGIS project với các lớp dữ liệu thông qua các dịch vụ WMS và WFS theo chuẩn OGC. Có khả năng kiểm soát lựa chọn các thuộc tính hoặc cách bố trí bản đồ và hệ tọa độ của những lớp dữ liệu khi xuất bản; QGIS Web Client: Cho phép dễ dàng xuất bản QGIS project lên Web với thƣ viện các kí hiệu, nhãn phong phú cũng các cách kết hợp các đối tƣợng để tạo bản đồ Web ấn tƣợng; QGIS on Android (beta!): Phiên bản thử nghiệm đang đƣợc hoàn thiện để sử dụng QGIS trên các thiết bị chạy Android. 1.2.3.2 Các chức năng cơ bản trong QGIS QGIS hỗ trợ hầu hết các chức năng cơ bản của một phần mềm GIS gồm: Quản lý dữ liệu, đọc đƣợc nhiều định dạng dữ liệu, biên tập và xuất bản bản đồ, xuất-nhập dữ liệu và các chức năng phân tích không gian… QGIS hỗ trợ xử lý dữ liệu vector: Dữ liệu không gian dựa trên PostGIS mà chủ yếu là PostgreSQL. QGIS có khả năng đọc đƣợc hầu hết dữ liệu vector đƣợc cung cấp bởi thƣ viện OGR, bao gồm ESRI shapefiles, MapInfo, SDTS and GML… QGIS hỗ trợ xử lý dữ liệu vector: Dữ liệu không gian dựa trên PostGIS mà chủ yếu là PostgreSQL. QGIS có khả năng đọc đƣợc hầu hết dữ liệu vector đƣợc cung cấp bởi thƣ viện OGR, bao gồm ESRI shapefiles, MapInfo, SDTS and GML… QGIS có khả năng đọc đƣợc dữ liệu raster đƣợc cung cấp bởi thƣ viện GDAL, bao gồm DEM, ArcGrid, ERDAS, SDTS và GeoTIFF… QGIS cung cấp định dạng dữ liệu trên cả ảnh vector và raster. Dữ liệu không gian trực tuyến đƣợc hỗ trợ trong thƣ viện OGC-dựa trên WMS hoặc WFS. QGIS trình bày và chồng xếp các dữ liệu ảnh raster và vector mà không cần quan tâm các định dạng dữ liệu. Tạo bản đồ và thao tác dữ liệu không gian dựa trên giao diện thân thiện. GUI có sẵn nhiều tool hỗ trợ. Tạo, chỉnh sửa và xuất dữ liệu cho ngƣời dùng: digitizing tools for GRASS and shapefile formats, the georeferencer plugin, GPS tools to import and export GPX format, convert other GPS formats to GPX, or down/upload directly to a GPS unit. Xuất bản đồ dựa trên UMN Mapserver... 1.2.3.3 Plugins QGIS có rất nhiều các Plugins hỗ trợ các thao tác mở rộng cho các dạng dữ liệu khác nhau và phân tích không gian nhờ vào một cộng đồng phát triển rất lớn.

18 Ngoài ra, ngƣời dùng cũng có thể tự xây dựng các Plugins theo yêu cầu. Một số Plugins thông dụng gồm: Analysis tools - Các công cụ phân tích: giải quyết các vấn đề phân tích, thống kê dựa trên mối quan hệ không gian; Data management tools – Các công cụ quản lý dữ liệu và xử lý dữ liệu Geometry tools - Các công cụ hình học: xử lý, chuyển đổi đối tƣợng dựa trên nguyên tắc hình học: polygon to line, line to polygon…. Geoprocessing tools - Các công cụ xử lý địa lý: thao tác trên các đối tƣợng địa lý nhƣ: Clip, Union, Buffer… Là phần mềm miễn phí, nhƣng các tính năng luôn đƣợc thƣờng xuyên bổ sung và hoàn thiện, QGIS có thể là lựa chọn thay thế đối với các ứng dụng GIS ở quy mô vừa và nhỏ hoặc là giải pháp bổ trợ sử dụng kết hợp với các phần mềm thƣơng mại nhƣ ArcGIS… 1.2.3.4 Một số hệ GIS khác GRASS: phần mềm GIS mã nguồn mở đƣợc biết đến sớm nhất, từ những na m 1980. Với thiên hƣớng là phần mềm GIS chuyên xử lý dữ liẹ u raster, GRASS có chức na ng biên tạ p dữ liẹ u vectơ rất hạn chế nên khó có thể sử dụng đƣợc trong hẹ thống thông tin liên quan đến CSDL bản đồ quản lý đất đai. uDIG: đƣợc phát triển bởi Refractions Research (nhà sản xuất PostGIS đã nói ởtrên), vì thế uDIG có mọ t lợi thế lớn là hỗ trợ rất tốt cơ sở dữ liẹ u PostgreSQL/PostGIS. Tuy nhiên, những phiên bản đầu tiên của uDIG các chức na ng biên tạ p dữ liẹ u vectơ rất hạn chế. Với các phiên bản sau này, nhƣợc điểm này dần dần đang đƣợc khắc phục. gvSIG: đƣợc phát triển bởi hãng IVER Technologías (Tây Ban Nha). Các ƣu điểm của gvSIG là kết nối tốt với PostgreSQL / PostGIS, chức na ng hiển thị và biên tạ p dữ liẹ u vectơ khá mạnh, hỗ trợ nhiều ngôn ngữ, có giao diẹ n gần giống với ArcView / ArcGIS là các phần mềm GIS thƣơng mại phổ biến nhất hiẹ n nay. Nhƣợc điểm là bản gốc (bản chính) của gvSIG viết bằng tiếng Tây Ban Nha nên các tài liẹ u trợ giúp tiếng Anh thƣờng đƣợc công bố chạ m và hiẹ n tại chƣa có phiên bản tiếng Viẹ t. OpenJUMP: đƣợc phát triển từ na m 2002 bởi Vivid Solutions Inc. OpenJUMP có khả na ng biên tạ p dữ liẹ u vectơ khá mạnh, tuy nhiên nó cũng có nhƣợc điểm khá lớn là hỗtrợ các hẹ tọa đọ rất kém, và có mọ t số lỗi khi mở các cơ sở dữ liẹ u lớn từ PostgreSQL / PostGIS.

19 KOSMO: đƣợc phát triển tiếp từ JUMP bởi hãng SAIG (Tây Ban Nha) từ năm 2006. KOSMO có chức năng gần tƣơng đƣơng với gvSIG nhƣng nhƣợc điểm lớn của nó là các tài liệu hƣớng dẫn hiện chỉ có bằng tiếng Tây Ban Nha. Ilwis: ban đầu là phần mềm thƣơng mại phát triển bởi ITC (Hà Lan), gần đây đã trở thành phần mềm mã nguồn mở. Với bản chất là một phần mềm thƣơng mại nên Ilwis có khá nhiều chức năng mạnh, tuy nhiên có một vấn đề lớn là đến thời điểm năm 2010, khả năng kết nối với CSDL PostgreSQL / PostGIS mới chỉ đƣợc tuyên bố chứ chƣa thực thi đƣợc. 1.3 Các chuẩn và định dạng dữ liệu CAD, GIS và sự liên quan 1.3.1 CAD là gì CAD là viết tắt của Computer Aided Design or Drafting (thiết kế hay vẽ có trợ giúp bởi máy tính). Công nghệ CAD đã ra đời và phát triển từ đầu những năm 1960 ở Viện Công nghệ Massachusetts, Hoa Kỳ. CAD là một sự thay đổi mang tính cách mạng trong ngành công nghiệp kỹ thuật, thiết kế không bị giới hạn trong từng cá nhân, nhóm mà cho phép phối hợp giữa các đơn vị thiết kế, phát huy năng lực thiết kế từ phác thảo đến hoàn thiện ý tƣởng đồng thời cho phép phối hợp các kiến trúc sƣ và các kỹ sƣ kỹ thuật. CAD trở thành một hệ thống các công cụ đƣợc các nhà thiết kế, kỹ sƣ, và các chuyên gia trong nhiều lĩnh vực phát triển với nhiều sản phẩm, công cụ chuyên ngành nhƣ: – Computer-aided engineering (CAE) and Finite element analysis (FEA) – Computer-aided manufacturing (CAM) – Computer numerical control (CNC) – Photo realistic rendering and Motion Simulation – Product Data Management (PDM) 1.3.2 Một số định dạng trong CAD 1.3.2.1 Định dạng ảnh DWG DWG là định dạng tập tin bản vẽ AutoCAD chuẩn. DWG là một định dạng tập tin ảnh (dƣới dạng nhị phân) đƣợc sử dụng để lƣu trữ dữ liệu ảnh vector hai chiều, ba chiều và dữ liệu đặc tả. Đó là định dạng gốc của CAD và đƣợc sử dụng cho nhiều phần mềm DraftSight, AutoCAD, IntelliCAD (và các biến thể của nó), Caddie và Open Design Alliance. Ngoài ra, DWG đƣợc hỗ trợ bởi nhiều phần mềm ứng dụng khác không phải CAD. DWG chứa các mẫu thông tin ngƣời dùng nhập vào, chẳng hạn nhƣ:

20 – Designs (Các mẫu thiết kế) – Dữ liệu hình học – Maps – Hình ảnh… 1.3.2.2 Định dạng DWF, DWFx DWF là một định dạng khá mới chứa các tính năng cho phép ngƣời dùng kiểm tra, góp ý bản vẽ trên web mà không cần chƣơng trình soạn thảo AutoCAD DWF là định dạng đƣợc thiết kế với chức năng để hiển thị bản vẽ thiết kế DWF để thể hiện các bản vẽ theo cách độc lập với bản gốc, phần mềm thiết kế, phần cứng và hệ điều hành. DWF cho phép chỉ thể hiện những nội dung cần xuất bản trong các dữ liệu thiết kế. Nó giới hạn các nội dung của tệp thiết kế CAD trong tệp tin đơn DWF. Nó cũng có thể dùng xuất bản các mô hình 3D từ hầu hết các ứng dụng thiết kế Autodesk. DWF không phải là một thay thế cho các định dạng CAD nhƣ bản vẽ AutoCAD (DWG) DWF cho phép các kiến trúc sƣ, kỹ sƣ, nhà quản lý dự án, và các đồng nghiệp, khách hang trao đổi nội dung thiết kế mà không cần phần mềm AutoCAD hoặc phần mềm thiết kế khác. DWF có thế mạnh so với các định dạng thay thế khác là chúng có độ chính xác rất cao, có chứa các đối tƣợng và dữ liệu đặc tả, các liên kết… Các định dạng tập tin (.dwfx) AutoCAD dựa trên tiêu chuẩn ISO/IEC 29.500-2 1.3.2.3 Định dạng DXF Là một định dạng chuẩn công nghiệp. Đây là một định dạng chuẩn đƣợc nhiều phần mềm đồ hoạ sử dụng nhƣ AutoCAD. Nó sử dụng để trao đổi bản vẽ giữa các phần mềm soạn thảo đồ hoạ. DXF là định dạng ảnh vector thƣờng đƣợc sử dụng với phần mềm AutoCAD. DXF dùng để lƣu trữ và trao đổi thông tin các bản vẽ CAD. Kể từ khi phát hành lần đầu năm 1982, đã có nhiều thay đổi đặc tả định dạng tập tin DXF. Vì lý do đó, AutoDesk duy trì một danh sách quy định dạng tập tin DXF. DFX đƣợc phát triển để đại diện cho dữ liệu đƣợc sử dụng trong các phần mềm CAD, tuy nhiên nó đƣợc sử dụng bởi nhiều chƣơng trình khác nhƣ là một định

21 dạng chung tối ƣu cho việc trao đổi dữ liệu ảnh vector 2D, 3D. Nhƣ một định dạng CAD, nó cũng có thể đƣợc thể hiện đầy đủ các nội dung nhƣ DWG. DXF đƣợc sử dụng rộng rãi cho việc trao đổi dữ liệu đơn giản giữa các phần mềm CAD, Coreldraw, 3D max. Đôi khi việc giải thích đúng đắn về một tập tin DXF có thể rất khó khăn. (Sự xuất hiện đƣờng và vùng có thể phụ thuộc và rất nhiều thông số trong những tiêu đề cua các tập tin DXF rất khó để giải thích một cách trung thực, nhiều nhà thiết kế ứng dụng quyết định chỉ dung DXF cho export dữ liệu. Với mỗi phiên bản mới của AutoCAD, DXF bị thay đổi. AutoCAD phát hành 13 định dạng mở rộng cho các định dạng DXF đại diện cho dữ liệu chuyên ngành. Những bổ sung này đang lƣu trữ các bề mặt phức tạp và thông tin tốt hơn cho công cụ hình học không gian.

1.3.3 Dữ liệu địa lý trong GIS 1.3.3.1 Dữ liệu địa lý là gì Dữ liệu địa lý là dữ liệu về các sự vật hiện tƣợng trên trái đất, gồm cả vị trí không gian và dữ liệu thuộc tính (các dữ liệu chữ - số, dữ liệu ảnh, dữ liệu đa phƣơng tiện nói chung) Dữ liệu không gian là những mô tả số của các đối tƣợng thực tế trên trái đất. Đó có thể là thửa đất, con đƣờng, sông ngòi, hồ ao, rừng núi, tòa nhà, sân bay, bến cảng,…Chúng bao gồm toạ độ, quy luật và các ký hiệu dùng để thể hiện thành một hình ảnh cụ thể trên bản đồ. Hệ thống thông tin địa lý dùng các dữ liệu không gian để tạo ra một bản đồ trên màn hình hay thiết bị ngoại vi khác. Theo nghĩa rộng, dữ liệu không gian còn bao gồm cả những thuộc tính gắn liền với phạm vi không gian của đối tƣợng nhƣ chiều dài đoạn đƣờng, diện tích thửa đất, diện tích mặt hồ nƣớc hoặc về quan hệ không gian (xem phần sau) giữa các đối tƣợng với nhau. Dữ liệu thuộc tínhdiễn tả các đặc tính phi không gian của các đối tƣợng thực tế đƣợc thể hiện trên bản đồ. Dữ liệu thuộc tính có thể là định tính (qualitative) mô tả chất lƣợng hay định lƣợng, là con số cụ thể. Dữ liệu định lƣợng ví dụ nhƣ mật độ cây trồng, sản lƣợng, … của thửa đất; dân số của một đơn vị hành chính (xã, huyện, tỉnh,…). Dữ liệu định tính ví dụ nhƣ xếp hạng độ màu mỡ của thửa đất, mức độ phát triển kinh tế một tỉnh, v.v… Về nguyên tắc, số lƣợng các thuộc tính của một đối tƣợng là không có giới hạn. Để quản lý dữ liệu thuộc tính của các đối tƣợng địa lý trong CSDL, hệ thống

22 thông tin địa lý (GIS) dùng phƣơng pháp gán các giá trị thuộc tính cho các đối tƣợng thông qua các bảng trong CSDL. Mỗi hàng trong bảng là một bản ghi đại diện cho một đối tƣợng địa lý, mỗi cột của bảng tƣơng ứng với một kiểu thuộc tính của đối tƣợng đó. Trong GIS có hai mô hình biểu diễn (hai dạng) dữ liệu địa lý. Mô hình vector và mô hình raster.Mỗi mô hình có những ƣu điểm và nhƣợc điểm riêng. 1.3.3.2 Dữ liệu vector Mô hình vectormô tả vị trí và phạm vi của các đối tƣợng không gian bằng tọa độ cùng các kết hợp hình học gồm các điểm nút, các cung trên đƣờng biên, các vùng mặt phẳng và quan hệ giữa chúng. Về mặt hình học, các đối tƣợng đƣợc phân biệt thành 3 dạng: đối tƣợng dạng điểm (point), đối tƣợng dạng đƣờng (line) và đối tƣợng dạng vùng (region hay polygon). Điểm đƣợc xác định bằng một cặp tọa độ X,Y. Đƣờng là một chuỗi các cặp tọa độ X,Y liên tục. Vùng là khoảng không gian đƣợc giới hạn bởi một tập hợp các cặp tọa độ X,Y trong đó điểm đầu và điểm cuối trùng nhau. Với đối tƣợng vùng, mô hình vector phản ảnh đƣờng bao. Dữ liệu vector có ƣu điểm là vị trí của các đối tƣợng đƣợc định vị chính xác (nhất là các đối tƣợng điểm, đƣờng và đƣờng bao). Điều này giúp cho ngƣời sử dụng dễ dàng biên tập bản đồ, chỉnh sửa, in ấn. Tuy nhiên mô hình dữ liệu vector có nhƣợc điểm là phức tạp khi thực hiện các phép chồng xếp bản đồ. Dữ liệu vector có thể đƣợc lƣu trữ trong máy tính theo các khuôn dạng tệp khác nhau và các hệ thông tin địa lý có thể hỗ trợ/ không hỗ trợ một số khuôn dạng dữ liệu không gian nhất định. Tuy nhiên, khuôn dạng shape (*.shp) đƣợc coi nhƣ chuẩn thực tế và mọi hệ thông tin địa lý đều hỗ trợ khuôn dạng này. 1.3.3.3 Dữ liệu raster Mô hình raster có thể hiểu đơn giản là một “ảnh” chứa các thông tin về một chuyên đề. Nó mô hình hóa bề mặt trái đất và các đối tƣợng trên đó bằng một lƣới (đều hoặc không đều) gồm các hàng và cột. Những phần tử nhỏ này gọi là những pixel hay cell. Giá trị của pixel là thuộc tính của đối tƣợng. Kích thƣớc pixel càng nhỏ thì đối tƣợng càng đƣợc mô tả chính xác. Một mặt phẳng chứa đầy các pixel tạo thành raster. Mô hình này thƣờng đƣợc áp dụng để mô tả các sự vật, hiện tƣợng phân bố liên tục trong không gian, dùng để lƣu giữ thông tin dạng ảnh (ảnh mặt đất, hàng không, vũ trụ...). Một số dạng mô hình biểu diễn bề mặt nhƣ DEM (Digital Elevation Model), DTM (Digital Terrain Model), TIN (Triangulated Irregular Network) trong CSDL cũng thuộc dạng raster .

23 Ƣu điểm của dữ liệu dạng raster là dễ thực hiện các chức năng xử lý và phân tích. Tốc độ tính toán nhanh, thực hiện các phép toán bản đồ dễ dàng. Dễ dàng liên kết với dữ liệu viễn thám. Mô hình raster có nhƣợc điểm là kém chính xác về vị trí không gian của đối tƣợng. Khi độ phân giải càng thấp (kích thƣớc pixel lớn) thì sự sai lệch này càng tăng 1.3.3.4 Định dạng shapefile Một định dạng tiêu chuẩn cho tệp dữ liệu địa lý mà mọi GIS đều chấp nhận là định dạng shapefile. Định dạng shafile là đơn giản bởi vì nó có thể lƣu trữ các kiểu dữ liệu hình học nguyên thuỷ của các điểm, đƣờng và vùng. Shapes (điểm, đƣờng, đa giác) cùng với các thuộc tính dữ liệu có thể tạo ra nhiều đối tƣợng về dữ liệu địa lý. Đối tƣợng này có khả năng tính toán mạnh và chính xác. Thuật ngữ shapefile là khá phổ biến, nhƣng đôi khi bị nhầm lẫn khi định dạng này bao gồm một bộ sƣu tập các tập tin với một tiền tố tên tập tin phổ biến, đƣợc lƣu trữ trong cùng một thƣ mục. Ba tập tin bắt buộc có phần mở rộng tên tập tin .shp, .shx và .Ddf. Các tập tin bắt buộc: – .shp – hình dạng – .shx – chỉ số – .dbf – thuộc tính Những tập tin khác: (.prj, .sbn, .sbx, .fbn và .fbx, .ain và .aih, .ixs, .shp…) Định dạng hình học Shapefile (.shp) – Các tập tin chính (.shp) chứa các dữ liệu hình học. – Hệ trục toạ độ phối hợp dữ liệu 2D là một hệ toạ độ Descarter, có thể nắn chỉnh lại phù hợp với toạ độ hệ thống thông tin địa lý – Các đối tƣợng hình học cũng có thể có toạ độ 3 hoặc 4 chiều (Z và M), cho độ cao và tham chiếu tƣơng ứng. Z lƣu trữ độ cao của mỗi phần tử trong không gian 3 chiều. M chiều ngƣời dùng định nghĩa có thể đƣợc sử dụng cho một trong nhiều chức năng, chẳng hạn nhƣ lƣu trữ tham chiếu tuyến tính thời gian của một thuộc tính trong không gian 4D. Định dạng chỉ số hình dạng Shapefile (.shx) sử dụng chỉ số này, có thể để tìm kiếm ngƣợc trong shapefile (tìm kiếm ngƣợc trong chỉ số hình dạng sau đó đọc các bản ghi để tìm đến đúng vị trí trong .shp file) Định dạng thuộc tính Shapefile (.dbf) lƣu các thuộc tính cho mỗi hình dạng.

24 Các hạn chế của Shapefile: – Shapefile không có khả năng lƣu trữ thông tin topo – Các kích thƣớc của .shp và .dbf file thành phần không thể vƣợt quá 2GB (khoảng 70 triệu điểm) – Các định dạng cơ sở dữ liệu thuộc tính cho tập tin .dbf thành phần đƣợc dựa trên một tiêu chuẩn dBase cũ. Do đó hỗ trợ không tốt cho Unicode (tên trƣờng lƣu trữ). Chiều dài tối đa của tên trƣờng là 10 ký tự. Tôi đa số các trƣờng là 255… 1.3.3.5 Cơ sở dữ liệu địa lý (Geodatabase) Khái niệm Cơ sở dữ liệu địa lý là một kho chứa dữ liệu không gian và thuộc tính trong một hệ quản trị cơ sở dữ liệu (Database Management System - DBMS). Các thành phần của Cơ sở dữ liệu địa lý đƣợc lƣu trữ trong hệ quản trị cơ sở dữ liệu DBMS. Cơ sở dữ liệu địa lý tổ chức dữ liệu theo mô hình dữ liệu hƣớng đối tƣợng. Dữ liệu đƣợc lƣu trữ theo mô hình này mang tính toàn vẹn dữ liệu cao.

Cấu tr c cơ sở dữ liệu địa lý

Hình 1.4. hứ ơ s ữ iệu – Geodatabase Trong cơ sở dữ liệu địa lý, mỗi đối tƣợng địa lý hay đối tƣơng không gian (spatial object), đƣợc gọi là một feature. Một đối tƣợng địa lý có vị trí địa lý (có tọa độ xác định), có quan hệ không gian (liền kề, nằm trong, bao chứa, cách biệt …) với các đối tƣợng khác. Ví dụ: tòa nhà, thửa đất, cây cầu, hồ ao, … là các đối tƣợng địa lý.

25 Bảng thuộc tính (Attribute Table): chứa dữ liệu thuộc tính của từng lớp đối tƣợng địa lý, đƣợc lƣu giữ dƣới dạng các bảng. Trong đó, các thuộc tính đƣợc thể hiện trong từng cột, mỗi đối tƣợng địa lý ở trong mỗi hàng. Lớp đối tƣợng địa lý (Feature class): Một lớp đối tƣợng địa lý là tập hợp nhiều đối tƣợng địa lý nhƣng có cùng kiểu hình học point, line, polygon) và có cùng tập hợp các thuộc tính. Một lớp đối tƣợng địa lý (feature class) tƣơng đƣơng với một tầng bản đồ. Tập dữ liệu đối tƣợng địa lý (Feature dataset): Là một tập hợp nhiều lớp đối tƣợng địa lý nhất định trong một cơ sở dữ liệu địa lý, nhƣng trên cùng một vùng địa lý (một khu vực trên bề mặt trái đất) và có cùng hệ tọa độ quy chiếu. Một Feature dataset tƣơng đƣơng với một bản đồ. Mô hình Geodatabase:

– Mô hình Cơ sở dữ liệu địa lý một ngƣời dùng (Personal Geodatabase). – Mô hình Cơ sở dữ liệu địa lý nhiều ngƣời dùng (Enterprise Geodatabase). Cơ sở dữ liệu địa lý cá nhân chỉ hỗ trợ một ngƣời dùng và đƣợc cài đặt trên máy đơn. Dung lƣợng lƣu trữ của mô hình này giới hạn do sự hạn chế về dung lƣợng lƣu trữ của hệ quản trị cơ sở dữ liệu trên máy cá nhân. Cơ sở dữ liệu địa lý nhiều ngƣời dùng sử dụng hệ quản trị cơ sở dữ liệu mạnh, cỡ lớn, phục vụ nhiều ngƣời dùng nhƣ Oracle, SQL Server, DB2, Postgres... để lƣu trữ dữ liệu. Dung lƣợng lƣu trữ của mô hình này thƣờng không giới hạn do hệ quản trị mà nó sử dụng không giới hạn dung lƣợng lƣu trữ. Phƣơng pháp chọn lựa mô hình Geodatabase – Sử dụng mô hình Personal Geodatabase khi: o Hệ thống chạy trên máy đơn. o Dữ liệu đơn giản. o Dung lƣợng lƣu trữ dữ liệu giới hạn. – Sử dụng mô hình Enterprise Geodatabase (Multiuser Geodatabase) khi: o Nhiều ngƣời dùng truy vấn, hiệu chỉnh trên cùng một Geodatabase. o Hệ thống dùng mô hình client/server. o Dung lƣợng lƣu trữ dữ liệu không giới hạn.

26 o Dữ liệu đƣợc truy cập qua Internet,... 1.3.4 CAD và GIS Giữa CAD và GIS có sự giống nhau về tổ chức dữ liệu. Dữ liệu GIS thƣờng đƣợc giữ theo lớp chuyên đề (đƣờng, hạ tầng, lô đất v.v. ) nhƣ là các đối tƣợng điểm, đƣờng và vùng, Dữ liệu CAD cũng đƣợc cất giữ nhƣ là các lớp chuyên đề nhƣ là các đối tƣợng điểm, đƣờng, cung, vùng. Sự khác biệt chính giữa CAD và GIS đƣợc thể hiện ở chỗ CAD là công nghệ máy tính có định hƣớng vẽ, thiết kế trong khi GIS là công nghệ máy tính có định hƣớng địa lý. Phần mềm CAD nhìn chung không tạo tô pô. Thiếu tô pô, phân tích không gian là rất hạn chế. Cho đến gần đây nhiều hệ thống CAD đã không có khả năng thay đổi phép chiếu và khả năng kết nối dữ liệu thuộc tính với các thực thể đồ hoạ. GIS đƣợc thiết kế để kết nối trực tiếp mỗi thực thế đồ hoạ với một bản ghi trong bảng dữ liệu thuộc tính. Ngoài ra phải kể đến một số khác biệt nhỏ giữa CAD và GIS. CAD làm việc ở mức chính xác kỹ thuật, trong khi GIS sử dụng mức chính xác lập bản đồ. Một bản vẽ CAD đƣợc chứa trong một file, song một bản đồ GIS thƣờng đƣợc chứa trong một hay nhiều thƣ mục con với nhiều file. Khi làm việc với GIS, nhiều file dữ liệu đƣợc tạo ra và cái đƣợc hiển thị trên màn hình thƣờng chỉ là một biểu diễn tạm thời của CSDL GIS, đôi khi đƣợc vẽ từ nhiều nguồn file. Theo ESRI (2002), thoạt nhìn hai công nghệ CAD và GIS có vẻ giống nhau – cả hai sử dụng máy tính để số hoá và lập bản đồ. Sự khác biệt chính nằm ở gốc rễ của hai công nghệ . CAD có gốc rễ ở vẽ - CAD có sự dễ dàng lớn đối với việc tạo ra và biểu diễn các đối tƣợng địa lý nhƣ là các bản vẽ trong máy tính. GIS của ESRI có gốc rễ ở quản lý dữ liệu – nó có sự dễ dàng lớn đối với các đối tƣợng địa lý và các thuộc tính liên quan của chúng trong CSDL máy tính. Sự khác biệt cơ bản này dẫn đến sự khác biệt sâu sắc về cách mỗi công nghệ lƣu trữ dữ liệu bản đồ trong máy tính. Hiểu sự khác biệt này về mô hình dữ liệu cơ bản đi xa hƣớng tới hiểu cách mỗi công nghệ vƣợt trội ở các tác vụ khác nhau. CAD dựa vào bản vẽ và quản lý dữ liệu nhƣ là các file bản vẽ hay một tập hợp các file bản vẽ. Tập hợp các file bản vẽ có thể là tập hợp các mảnh bản đồ có hệ toạ đô chung. Các lớp CAD là tính chất thực thể, nhƣ màu hay kiểu đƣờng, đôi khi đƣợc tôn lên với sử dụng nhãn lớp. Các chuẩn CAD không luôn tách các hệ thống đối tƣợng theo lớp, các đối tƣợng có thể phân biệt đƣợc chỉ bằng màu hay kiểu đƣờng. Các công cụ CAD có nhƣợc điểm khi áp dụng vào các công việc mà chúng không phù hợp nhƣ dùng CAD để quản lý dữ liệu địa lý bao trùm một quy mô địa lý rộng, dùng CAD để lập bản đồ nâng cao, dùng CAD làm công cụ nhập dữ liệu

27 cho một cộng đồng ngƣời dùng rộng hơn trong một doanh nghiệp, dùng CAD trong môi trƣờng biên tập đa ngƣời dùng và dùng CAD để xử lý, mô hình hoá và phân tích dữ liệu không gian tinh xảo. CAD là phù hợp đối với các bản vẽ thiết kế. Nó không phải là một hệ thông tin. Mặc dù công nghệ CAD đã đƣợc mở rộng với một số hạn chế các đặc điểm giống GIS, nó vẫn có gốc rễ sâu ở bản vẽ. GIS có định hƣớng cơ sở dữ liệu (CSDL) và vì vậy có xu hƣớng xử lý dữ liệu trong một CSDL thông suốt. Do GIS có khả năng quản lý dữ liệu trên phạm vi địa lý rộng, nó bao gồm nhiều công cụ cho phép chiếu bản đồ và xử lý khối lƣợng lớn dữ liệu. GIS sử dụng khái niệm phân lớp, phân tách các loại đối tƣợng khác nhau thành các lớp dễ quản lý hơn, thƣờng một lớp đối với mỗi kiểu đối tƣợng. Các lớp có thể có các yêu cầu dữ liệu và hành vi khác nhau. Năng lực của GIS bao gồm hiển thị và in các bản vẽ, thể hiện quan hệ giữa các đối tƣợng, cung cấp hỏi đáp CSDL lấy thông tin để làm quyết định có thông tin, chấp nhận dữ liệu bổ sung dễ dàng và duy trì dữ liệu dự án một khi thi công hoàn thành, xử lý nhiều kiểu dữ liệu kể cả ảnh, video clip, và âm thanh. GIS kết nối dữ liệu không gian và thuộc tính. GIS cho phép ngƣời dùng trả lời các câu hỏi không gian về vị trí, sự gần gũi, và phân bổ địa lý. GIS biểu diễn nhiều thuộc tính của không gian địa lý nhƣ một tập hợp các lớp dữ liệu. Các lớp có thể đƣợc bật hay tắt, và các quan hệ mới giữa các lớp có thể đƣợc khám phá, cả qua quan sát đơn giản và qua áp dụng các kỹ thuật phân tích không gian nâng cao. CSDL GIS có ƣu điểm nổi trội nhƣ dễ cập nhật, có thể hỏi đáp theo thuộc tính hay vị trí. GIS cung cấp năng lực để hỏi đáp, phân tích, hiển thị thông tin và biểu diễn dễ hiểu hơn. GIS nắm giữ và sử dụng CSDL để giúp đƣa ra các quyết định quy hoạch và quản lý không gian đô thị. Trong khi các chƣơng trình CAD không thể thực hiện phân tích kỳ vọng của GIS, các bản vẽ tạo ra bằng CAD thƣờng cung cấp cơ sở dữ liệu GIS, đặc biệt trong các ứng dụng nhƣ lập bản đồ đƣờng phố và bản đồ thửa. CAD cũng có thể đƣợc dùng hiệu quả để biên tập dữ liệu đồ hoạ, nhiều khi hiệu quả hơn GIS trong đó khả năng xử lý các thực thể đồ hoạ là thứ yếu đối với phân tích. Các bản vẽ CAD khá phổ biến trong các lĩnh vực kiến trúc, quy hoạch, kỹ thuật và thiết kế sản phẩm. Từ các file bản vẽ CAD nhiều khi có thể thu đƣợc thông tin hữu ít trong môi trƣờng GIS. Thông tin này bao gồm vị trí và thuộc tính. Việc sử dụng thông tin từ CAD có thể đòi hỏi chuyển đổi nó sang khuôn dạng có thể xử lý bằng phần mềm GIS.

28 Chuyển đổi dữ liệu hai chiều từ bản vẽ CAD sang môi trƣờng GIS và ngƣợc lại trong một môi trƣờng làm việc tổng hợp là một trong những thách thức đối với GIS. Thách thức này trở nên lớn hơn đối với các dự án GIS liên quan đến quản lý hệ thống hạ tầng. Các dự án này đƣợc thực hiện chủ yếu bởi các cơ quan chính phủ trong đó thông tin từ các nhà thiết kế cần đƣợc đặt trong một khung cảnh địa lý. Thiết kế các hạ tầng lớn (đô thị, đƣờng bộ, đƣờng sắt, cầu, đƣờng hầm, v.v.) cần cả thông tin CAD và GIS: phần mềm CAD đƣợc ứng dụng cho kỹ thuât và xây dựng trong khi dữ liệu GIS là thiết yếu đối với quy hoạch và quản lý. GIS đồng thời là hệ quản trị cơ sở dữ liệu, hệ thống lập bản đồ tự động và hệ thống phân tích không gian. Vì lẽ đó, GIS đã đƣợc ứng dụng rộng rãi trong quy hoạch và quản lý đô thị ở nhiều nƣớc trên thế giới. Tuy nhiên, ở Việt Nam việc sử dụng GIS trong quy hoạch và quản lý đô thị vì sự phát triển bền vững ở Việt Nam, cần đẩy mạnh ứng dụng GIS trong xây dựng, bảo trì, cập nhật và khai thác cơ sở dữ liệu không gian và thuộc tính một cách hiệu quả. Điều đó đòi hỏi sự quan tâm đặc biệt từ các nhà khoa học và quản lý. 1.4 Xây dựng CSDL địa lý phục vụ quy hoạch hạ tầng và bài toán chuyển đổi dữ liệu địa lý ở Việt Nam 1.4.1 Nhu cầu xây dựng CSDL địa lý Kể từ 1986 đến nay, Việt Nam đã đạt đƣợc nhiều thành tích trong phát triển kinh tế xã hội, công nghiệp hóa và đô thị hoá. Đô thị hoá là quá trình địa lý đã và đang diễn ra trên khắp các vùng miền của Việt Nam. Không gian đô thị Việt Nam đã phát triển theo cả chiều rộng, chiều cao và chiều sâu. Tuy nhiên, các đô thị ở Việt Nam vẫn còn nhỏ bé và có nhiều vấn đề bức xúc cần giải quyết nhƣ thiếu quy hoạch vùng, quy hoạch chung, quy hoạch chi tiết, dịch vụ đô thị, nghèo đói và ô nhiễm môi trƣờng. Để phát triển bền vững, công tác quy hoạch và quản lý xây dựng đô thị ở Việt Nam trong những năm tới cần phải đƣợc cải thiện với sự hỗ trợ của các công nghệ CAD và GIS, của các nhà khoa học, các cơ quan ban ngành ở trung ƣơng, tỉnh, huyện, của khu vực tƣ nhân và của cả cộng đồng. Thực tế cho thấy nhu cầu quy hoạch, rà soát, điều chỉnh quy hoạch, quy hoạch lại và quản lý xây dựng đô thì theo quy hoạch ở Việt Nam là rất lớn do tốc độ đô thị hoá và công nghiệp hoá nhanh. Riêng thủ đô hà Nội đã trải qua nhiều lần quy hoạch. Đặc biệt, từ 1/8/2008 Hà Nội đã đƣợc mở rộng về địa giới trở thành một trong những thủ đô có diện tích lớn nhất thế giới. Quy hoạch chung Hà Nội mở rộng đang đƣợc triển khai bởi các công ty tƣ vấn nƣớc ngoài, đòi hỏi phải rà soát, điều chỉnh một loạt đồ án quy hoạch trƣớc đây sao cho phù hợp với tình hình mới.

29 Khó khăn lớn trong quy hoạch và quản lý xây dựng đô thị ở Việt Nam là thiếu kinh phí để lập quy hoạch vùng, quy hoạch chung, quy hoạch chi tiết, đặc biệt ở các thị trấn. Các khó khăn khác liên quan đến thiếu nhân sự, năng lực thu thập, quản lý và phân tích dữ liệu, hồ sơ quy hoạch bằng máy tính nói chung và hệ thông tin địa lý nói riêng. Trong quy hoạch đô thị, các chƣơng trình CAD đã đƣợc sử dụng ở Việt Nam để tạo ra các bản vẽ điện tử về hiện trạng và quy hoạch. Vấn đề đặt ra là các bản vẽ nó cần đƣợc lƣu trữ, cập nhật, phân tích và hiển thị tốt hơn dƣới dạng các lớp dữ liệu GIS phục vụ quy hoạch và quản lý đô thị. Kết quả điều tra thực trạng ứng dụng công nghệ máy tính trong quy hoạch và quản lý đô thị ở Việt Nam, cụ thế là ở các tỉnh mục tiêu đại diện cho các cảnh quan và quy mô đô thị nhƣ ở thủ đô, các tỉnh miền núi, đồng bằng và ven biển: Phú Thọ, Hà Nam và Nghệ An, cho thấy rõ sự hiện diện của các bản vẽ CAD và nhu cầu khai thác, tạo giá trị gia tang cho các bản vẽ đó phục vụ quy hoạch và quản lý đô thị ở cả trung ƣơng và địa phƣơng trên cơ sở chuyển đổi sang GIS thong qua đầu tƣ nghiên cứu và đào tạo sử dụng hiệu quả nguông nhân lực GIS. CSDL là trung tâm của GIS. Việc xây dựng mới, bổ sung và cập nhật CSDL GIS sẵn có đòi hỏi sử dụng nhiều công nghệ thu thập dữ liệu khác nhau. Chuyển đổi dữ liệu là một trong các công nghệ đó, cho phép tận dụng các nguồn dữ liệu số sẵn có nhƣ dữ liệu CAD. Tuy nhiên, với sự phát triển nhanh của các đô thị, sự gia tang các bản vẽ CAD, và nhu cầu ứng dụng GIS trong quy hoạch và quản lý đô thị, việc chuyển đổi dữ liệu CAD sang GIS sao cho hiệu quả vẫn là một thách thức không nhỏ đối với nhiều tổ chức quy hoạch và quản lý xây dựng đô thị trên thế giới cũng nhƣ ở Việt Nam. Để giải quyết vấn đề này cần nghiên cứu thử nghiệm các phƣơng pháp thích hợp cho việc chuyển các bản vẽ CAD sang các lớp dữ liệu GIS dễ hỏi đáp, phân tích và hiển thị dựa vào sự phát triển của các bộ phần mềm GIS. 1.4.2 Các phƣơng pháp chuyển đổi hiện tại Có ba phƣơng pháp chung sử dụng dữ liệu CAD với các chƣơng trình GIS. Thứ nhất là dùng chƣơng trình GIS có thể đọc dữ liệu CAD trực tiếp, nhƣ ArcView’CAD Reader extension. Phƣơng pháp thứ hai là dùng các quy trình dịch thƣờng dựa trên các file Drawing Exchange Format (DXF). Phƣơng pháp cuối cùng là dùng một chƣơng trình làm việc bên trong CAD để tạo topo và kết nối các thuộc tính với các đối tƣợng không gian. Các ví dụ về điều này là chƣơng trình lai ArcCAD của ESRI và AutoCAD MAP2 của AutoDesk.

30 Chƣơng trình lai CAD/GIS thƣờng chồng các chức năng GIS trên chƣơng trình CAD, cho ngƣời dùng cái tốt nhất của cả hai thế giới. Ví dụ, chƣơng trình ESRI’s ArcCAD làm việc bên trong giao diện của AutoCAD sẵn có trong khi cung cấp phần lớn các chức năng tô pô, hỏi đáp và phân tích của ARC/INFO trong các thực đơn và hộp thoại kiểu autoCAD. Do AutoCAD dễ tuỳ biến/hợp khách hoá, cung cấp nhiều công cụ tuỳ biến, điều đó nghĩa là hầu hết các chức năng ArcCAD có thể tuỳ biến vì năng suất tốt hơn. Các lớp phủ GIS tạo ra trong ArcCAD có thể đƣợc xuất ở khuân dạng “E00”, hay nhƣ là các ArcView Shapefiles, hay chúng có thể đƣợc đọc trực tiếp bởi ArcView. Các đối tƣợng mới tạo ra nhƣ kết quả của các thao tác ArcCAD nhƣ Buffer, có thể hiển thị đƣợc nhƣ các thực thể AutoCAD và nhƣ vậy đƣợc dung với các bản vẽ AutoCAD chính quy bởi ngƣời dung không có ArcCAD. Nhìn chung, chƣơng trình lai CAD/GIS nhƣ ArcCAD là cách hiệu quả nhất đƣa dữ liệu CAD vào trong GIS, vì các chức năng CAD và GIS sẵn có trong cùng một chƣơng trình. Điều này cho phép thao tác viên sửa các vấn đề sinh ra lỗi CAD dung các công cụ CAD và kiểm tra tô pô và sửa chữa các dữ liệu GIS trong cùng chƣơng trình. Hai phƣơng pháp khác có thể đòi hỏi công việc “lùi và tiến” giữa các chƣơng trình CAD và GIS để tạo ra dữ liệu GIS ở dạng dùng đƣợc và ở một số trƣờng hợp ngƣời dùng có thể không có khả năng có đƣợc đúng kết quả cần thiết. Song trong hầu hết các trƣờng hợp việc dịch chuyển từ CAD sang GIS sẽ là suôn sẻ, đặc biệt nếu bản vẽ CAD đƣợc tạo ra chính xác hệ toạ độ thích hợp, đƣợc tổ chức tốt sử dụng các lớp, và nếu hiểu đƣợc quan hệ giữa các thực thể CAD và đối tƣợng GIS của các chƣơng trình đó. Trong GIS, phần tốn thời gian nhất là chuẩn bị dữ liệu. Dữ liệu có ở các khuôn dạng khác nhau. Quan trọng là chuyển đổi các dữ liệu này sang thành khuôn dạng GIS trƣớc khi có thể làm phân tích phức tạp với chúng. Việc chuyển dữ liệu để dùng trong GIS có thể là một quá trình tƣơng đối đơn giản và nhanh hay có thể đòi hỏi nhiều thời gian và công sức. Nó có thể sánh với việc dịch từ tiếng này sang tiếng khác. Chuyển đổi dữ liệu là quá trình chuyển dữ liệu từ khuôn dạng này sang khuôn dạng khác. Với nhiều khuôn dạng dữ liệu GIS sẵn có điều này có thể là một tác vụ khó đòi hỏi phần mềm chuyên biệt hoá. Chuyển đổi dữ liệu CAD sang môi trƣờng GIS là quá trình tạo dữ liệu GIS từ các bản vẽ. Chuyển đổi dữ liệu có thể đƣợc xem xét theo hai dạng: chuyển đổi cấu trúc và chuyển đổi khuôn dạng. Chuyển đổi cấu trúc từ vector sang raster đƣợc gọi là raster hoá. Chuyển đổi từ cấu trúc raster sang vector đƣợc gọi là vector hoá. Chuyển

31 đổi cũng có thể đƣợc dung để chỉ quá trình thay đổi các đối tƣợng của một cấu trúc đã cho từ một kiểu file sang kiểu khác. Quá trình này đôi khi đƣợc thƣc hiện bằng nhập một khuôn dạng file ngoài vào trong một khuôn dạng GIS. Chuyển các đối tƣợng từ khuôn dạng CAD sang GIS là một ví dụ phổ biến về kiểu chuyển đổi khuôn dạng file. Quá trình chuyển đổi dữ liệu CAD để dùng nhƣ một lớp đối tƣợng trong GIS là một quá trình nhiều bƣớc. Quá trình bắt đầu với việc xem xét kỹ lƣỡng dữ liệu CAD để có đƣợc hiểu biết về cách nó đƣợc cấu trúc liên quan đến các lớp và ký hiệu. Hệ toạ độ của dữ liệu CAD cần phải đƣợc biết, nếu nó cần phải biến đổi sang một hệ thống chung đối với các lớp đối tƣợng khác. Sau khi chạy một quá trình để đọc và nhập các yếu tố CAD và các tính chất của chúng sang môi trƣờng GIS, các bƣớc bổ sung là cần thiết để tái kết hợp các tính chất với các đối tƣợng. Một khi việc này đƣợc làm, hình học và tính chất của bản vẽ cũ là sẵn dùng trong phần mềm GIS nhƣ các lớp đối tƣợng khuôn dạng gốc. 1.4.3 Các GIS xử lý dữ liệu CAD nhƣ thế nào Với sự phát triển mạnh của công nghệ GIS và quá trình hội nhập quốc tế của Việt Nam, nhiều phần mềm raster và vector GIS đã đƣợc đƣa vào Việt Nam nhƣ MapInfo, ArcView, ArcGIS, QGIS… Tuy nhiên, không phải phần mềm GIS nào cũng có khả năng đọc và chuyển đổi dữ liệu CAD sang GIS. Do dữ liệu CAD là dữ liệu vector, để chuyển đổi dữ liệu CAD sang GIS cần xem xét các phần mềm vector GIS. 1.4.3.1 Tiếp cận MapInfo MapInfo là phần mềm vector GIS của hãng MapInfo. Trong MapInfo có trình phổ dịch (Universal Translator-UT) có thể dịch các file ở khuôn dạng MapInfo sang nhiều khuôn dạng dữ liệu không gian khác nhau và dịch các file từ nhiều khuôn dạng nhƣ ArcInfo Export (E00), ESRI Shapefile, AutoCAD.DWG/DXF, MicroStation .DNG sang các file MapInfo, nhƣng cũng có thể đƣợc chạy thủ công trong cửa sổ MapBase. Để sử dụng UT từ bên trong MapInfo, trƣớc tiên phải nạp nó vào trong trình quản lý công cụ (Tool Manager). Thông thƣờng, UT đƣợc nạp vào khi cài đặt MapInfo, nhƣng có thể nạp nó thủ công từ thực đơn công cụ. Do các file CAD có thể có toạ độ, tỷ lệ và phép quay tuỳ tiện, cần phải chuẩn bị các file CAD trƣớc khi sử dụng UT để chuyển đổi dữ liệu. UT sẽ không chỉnh sửa file CAD không đúng về địa lý.

32 1.4.3.2 Tiếp cận ESRI GIS ESRI (Enviromental Systems Research Institute) là hãng phần mềm GIS hàng đầu thế giới. Cho đến nay, ESRI đã phát triển nhiều bộ phần mềm GIS nhƣ PC Arc/Info, ArcView và ArcGIS. Phần mềm ESRI GIS có các đặc tính cho phép tích hợp dữ liệu CAD, bất chấp sự khác biệt mô hình dữ liệu. GIS có thể sử dụng dữ liệu CAD không có chuyển đổi. ArcGIS, chẳng hạn có thể hiển thị dữ liệu CAD ở các file DGN, DWF, và DWG trực tiếp và ở cùng hiển thị bản đồ nhƣ các lớp GIS layers. ArcGIS ký hiệu hoá dữ liệu CAD theo định nghĩa file CAD. GIS có thể kiểm soát cách dữ liệu đƣợc ký hiệu hoá và sử dụng dữ liệu CAD trong phân tích GIS khi dữ liệu CAD đƣợc thêm nhƣ là các đối tƣợng điểm, đƣờng và vùng đơn giản vào một lớp GIS. Nếu bạn tạo một file lớp từ lớp đối tƣợng CAD, bạn có thể thay đổi ký hiệu dùng để vẽ các đối tƣợng của nó, kết nối các thuộc tính lƣu trữ trong các bảng riêng rẽ với lớp, và chọn đối tƣợng nào cần hiển thị theo các giá trị thuộc tính của chúng. GIS cho phép chọn các lớp CAD trong CAD file và cho phép điều chỉnh các đối tƣợng gì cần hiển thị. Khi chuyển đổi dữ liệu từ các file CAD, GIS có thể áp đặt thêm chất lƣợng dữ liệu bằng kiểm tra các thuộc tính CAD so với các quy tắc công việc đối với lớp GIS. Một khi đã chuyển đổi, các công cụ tự động hoá dữ liệu GIS có thể làm sạch tiếp dữ liệu, sửa lỗi hình học nhƣ các vùng không khép kín, các đƣờng không kết nối. 1.4.3.3 Tiếp cận ArcView GIS ArcView GIS là phần mềm GIS để bàn của ESRI. Phần mềm này bao gồm một tập hợp các công cụ để thâu tóm, lƣu trữ, phân tích và hiển thị dữ liệu không gian và thuộc tính. ArcView GIS đƣợc dùng rộng rãi trên thế giới và ở Việt Nam. Phần mềm này sẵn dùng cho tất cả các hệ điều hành và các bộ vi xử lý, có ngôn ngữ lập trình hƣớng đối tƣợng, và các phần mở rộng của nó có thể đƣợc tải và dỡ bỏ dễ dàng. Các ứng dụng mở rộng cung cấp them các chức năng GIS chuyên biệt cho ArcView nhƣ hỗ trợ các dữ liệu dạng CAD (CAD Reader), hỗ trợ các thao tác với bàn số hoá (Digitizer), hỗ trợ hiển thị các tệp ảnh dạng JPEG. ArcView GIS hỗ trợ các khuôn dạng dữ liệu vector và raster. Khuôn dạng dữ liệu chuẩn của ArcView là Shapefile (.shp). Trong ArcView GIS không thể tự động đọc đƣợc CAD file. Để làm việc này, cần phải nạp phần mở rộng đọc CAD file (CAD Reader). Trong ArcView có thể xem, xử lý và hỏi đáp một CAD file đúng nhƣ một chuyên đề khác. Tuy nhiên không thể trực tiếp biên tập hay thay đổi các CAD file trong ArcView. Để làm việc này cần chuyển đổi các file CAD sang shapefile. Trong ArcView có

33 thể xuất điểm, đƣờng và vùng chứa trong file CAD, song không thể xuất chú giải (văn bản) nhƣ một shapefile. 1.4.3.4 Tiếp cận ArcGIS ArcGIS là thế hệ phần mềm GIS mới và hoàn chỉnh của ESRI, bao gồm 3 ứng dụng là ArcMap, ArcCatalog và ArcToolbox. Ƣu điểm của ArcGIS là hỗ trợ tất cả các khuôn dạng dữ liệu của ESRI nhƣ shapefile, coverage, grid, và geodatabase. Thêm và đó ArcGIS còn hỗ trợ cả ba khuôn dạng file CAD phổ biến nhất (DXF, DWG và DGN), cũng nhƣ đa dạng các khuôn dạng ảnh phổ biến. Các phiên bản file CAD có hỗ trợ bao gồm DWG/DXF: AutoCAD Release 12 đến AutoCAD 2007; DGN: MicroStation 5.x – MicroStation V8. Trong ArcGIS, dữ liệu CAD là dữ liệu đối tƣợng có thể hiển thị, hỏi đáp, phân tích và chuyển đổi. ArcGIS có công cụ chuyển đổi cho cả hai hƣớng nhƣ từ CAD sang GIS và từ GIS sang CAD. Khác với ArcView, ArcGIS cho phép nhập trực tiếp các file AutoCAD vào trong ArcGIS. Tài liệu CAD, theo mặc định tổ hợp tất cả các lớp, chú giải,… vào trong một lớp nhóm trong ArcGIS. Có thể mở rộng lớp nhóm này để hiển thị 5 lớp bên trong theo mặc định. ArcGIS cho phép tách các lớp AutoCAD và chuyển đổi file CAD sang GIS nhƣ sử dụng công cụ xuất dữ liệu trong ArcMap hay ArcCatalog cũng nhƣ công cụ nhập từ CAD trong ArcToolbox. Nói chung các phần mềm GIS nói trên có hỗ trợ chuyển đổi dữ liệu CAD sang GIS nhƣng quy trình phức tạp, ngƣời dùng phải thao tác thủ công nhiều do đó quá trình chuyển đổi tốn thời gian mà độ chính xác không cao.

34

CHƢƠNG 2: PHÁT TRIỂN CÔNG CỤ HỖ TRỢ CHUYỂN ĐỔI DỮ LIỆU ĐỊA LÝ Chƣơng này tác giả sẽ trình bày quy trình xây dựng phần mềm chuyển đổi dữ liệu CAD sang GIS đƣợc ứng dụng cho dữ liệu đô thị tại Viện Quy Hoạch Xây Dựng Hà Nội. Tác giả đã tiến hành khảo sát dữ liệu tại Viện Quy Hoạch Xây Dựng Hà Nội để có thể xây dựng đƣợc phần mềm có ứng dụng thực tế nhất. 2.1 Phân tích hiện trạng dữ liệu và đề xuất cách giải quyết 2.1.1 Kết quả hảo sát các bản v Qua việc khảo sát với số lƣợng 100 bản vẽ thuộc hồ sơ Chỉ giới đƣờng đỏ và HTKT và 100 bản vẽ thuộc hồ sơ quy hoạch của Viện Quy Hoạch và Xây dựng Hà Nội, đối chiếu với các quy định thể hiện, cách thức quản lý đối tƣợng trong bản vẽ, các bản vẽ AutoCAD thƣờng xuất hiện các vấn đề chính với tần suất xuất hiện và ảnh hƣởng lỗi đến khả năng sử dụng lại dữ liệu nhƣ sau:

STT Lỗi bản v Tỷ lệ (%) Mức độ ảnh hƣởng tới khả năng Bản v QH Bản v chuyển đổi CGDD sang định dạng GIS 1 Không tuân thủ theo 0% 4% Ít ảnh hƣởng Quyết định 21/2015/QĐ-BXD, Quyết định số 03/2008/QĐ-BXD hoặc hƣớng dẫn của Viện 2 Không vẽ đúng toạ độ 3% 0% Ảnh hƣởng (move tới vị trí khác) nhiều 3 Các đối tƣợng trong bản 37% 19% Ảnh hƣởng vẽ bị nhầm lẫn nhiều

4 Các vùng bao (ranh giới, 0% 21% Ảnh hƣởng sử dụng đất…) không nhiều

35 khép kín 5 Các đối tƣợng bị chồng 4% 23% Ảnh hƣởng đè, đứt đoạn trung bình 6 Đặt tham số độ cao khác 0% 8% Ảnh hƣởng 0 cho các đối tƣợng (trừ trung bình đƣờng đồng mức) 7 Phân lớp (layer) không Chƣa có quy Chƣa có quy Ảnh hƣởng tuân thủ quy định chung định định nhiều có nhiều layer rác

Một số ví dụ: – Lớp Chỉ giới đƣờng đỏ: tồn tại 2 layer “Duongdo” và “DUONG DO...”

Hình 2.1. Bản đồ quy hoạch giao thông-QHPK N2 – Cách đặt tên layer không thống nhất

Hình 2.2 SDD Phân Khu N8 và SDD Phân Khu N1

36 – Các đối tƣợng đƣờng bao bị hở, đứt đoạn.

37 2.1.2 Phƣơng hƣớng giải quyết

STT Lỗi bản v Phƣơng án hắc phục 1 Không tuân thủ theo Quyết định Sao chép đối tƣợng giữa các bản vẽ 21/2015/QĐ-BXD, Quyết định số thiết kế và bản vẽ mẫu để kế thừa 03/2008/QĐ-BXD hoặc hƣớng dẫn các thông số mà không cần chỉnh của Viện sửa thủ công (lỗi gây ra sự không thống nhất giữa các bản vẽ).

2 Sai toạ độ (vị trí) Do dùng công cụ move đối tƣợng trong bản vẽ. Cần kiểm tra sự chính xác của các đối tƣợng không gian với nhau và với các bản vẽ khác. 3 Các đối tƣợng trong bản vẽ bị Lỗi do tính chủ quan của ngƣời nhầm layer thiết kế. Dùng các công cụ bật tắt layer để kiểm tra các đối tƣợng cùng loại có cùng layer không.

4 Các vùng bao (ranh giới, sử dụng Lỗi do bắt điểm sai hoặc do vẽ đất…) không khép kín nhầm layer. Sử dụng lệnh vẽ Polyline và đóng vùng (close) khi kết thúc. 5 Các đối tƣợng bị chồng đè, đứt Lỗi này không ảnh hƣởng tới chất đoạn lƣợng bản vẽ sau in, tuy nhiên khi sử dụng thƣờng gây khó khan trong quản lý đối tƣợng. Cần chú ý trong quá trình vẽ. 6 Đặt tham số độ cao khác 0 cho các Đối với các đối tƣợng không cần đối tƣợng (trừ đƣờng đồng mức…) đặt tham số độ cao cần đƣa giá trị cao độ về 0. 7 Phân lớp (layer) không tuân thủ Tiêu chuẩn hóa cách tổ chức các quy định chung, có nhiều layer rác tầng trong bản vẽ CAD phục vụ mục đích chuyển đổi sang dữ liệu GIS.

38 2.2 Đề xuất tiêu chuẩn cho bản v CAD để chuyển đổi tự động vào CSDL địa lý 2.2.1 Các yêu cầu kỹ thuật Để thuận tiện cho công tác chuyển đổi dữ liệu, các bản vẽ AutoCAD ngoài việc tuân thủ các quy định thể hiện còn cần phải đáp ứng các yêu cầu sau: – Bản vẽ đƣợc vẽ trên Hệ tọa độ VN2000, kinh tuyến trục 105, múi o chiếu 3 , đơn vị mét; – Vẽ đúng tọa độ (không đƣợc “move” tới vị trí khác); – Vẽ đúng layer (không đƣợc vẽ đối tƣợng của layer này sang layer khác,1 lớp đối tƣợng vẽ ở nhiều layer vv…); – Đặt tên cho layer cần thống nhất theo quy định chung; – Quan hệ không gian giữa các đối tƣợng phải đảm bảo: không bị hở, đứt đoạn... ; – Tất cả các đối tƣợng đều phải đăt tham số elevation bằng 0 (trừ các đối tƣợng là đƣờng đồng mức hoăc các đối tƣợng khác có cao độ trong thực tế); – Các vùng hatch phải có đƣờng bao kín (boundary); 2.2.2 Các khuyến cáo về tổ chức dữ liệu Qua khảo sát hiện trạng sử dụng các bản vẽ AutoCAD cho thấy hiện nay phần lớn việc đặt tên các layer không theo một quy tắc chung. Điều này dẫn tới nhiều khó khăn trong việc quản lý nội dung, trao đổi thông tin giữa các bản vẽ và đặc biệt trong quá trình chuyển đổi dữ liệu sang GIS. Do đó, cần thiết xây dựng một quy cách đặt tên layer thống nhất. Quy cách đặt tên 1 layer nhƣ sau: “Feature dataset”_ “Feature class”_ “ u Feature class”_ “ u d liệu” Trong đó: – Feature dataset : là tên chủ đề trong Cấu trúc cơ sở dữ liệu GIS. Ví dụ: QuyHoachSuDungDat, QuyHoachGiaoThong... – Feature class: tên của lớp đối tƣợng. Ví dụ: ChucNangSuDungDat, BoVia, MangLuoiCapNuoc... – Sub Feature class: tên của lớp đối tƣợng mà muốn gộp (merge) vào Feature class. Ví dụ: DatHonHop, DatTruongHoc, DatCayXanh đƣợc gộp vào Feature Class là ChucNangSuDungDat. Trong trƣờng

39 hợp Feature class chỉ chứa 1 loại đối tƣợng thì Sub Feature Class chính là Feature Class. – u d l ệu: là giá trị quy ƣớc tƣơng ứng với từng kiểu dữ liệu của feature class theo yêu cầu chuyển đổi dữ liệu:

M iểu iểu dữ liệu dữ liệu

0 Polyline

1 Polygon

2 Point

01 Polyline và Polygon

02 Polyline và point

12 Polygon và Point

Ví dụ: + Layer thể hiện “Đất quân sự” trong bản vẽ AutoCad sẽ đƣợc đặt tên là: QuyHoachSuDungDat_ChucNangSuDungDat_DatQuanSu_1 + Layer thể hiện “Bó vỉa” trong bản vẽ AutoCad sẽ đƣợc đặt tên là: QuyHoachGiaoThong_BoVia_BoVia_0 2.3 Phát triển công cụ chuyển đổi dữ liệu địa lý 2.3.1 Cách tiếp cận, lựa chọn công nghệ và môi trƣờng phát triển 2.3.1.1 Python Python là ngôn ngữ kịch bản hƣớng đối tƣơng (object-oriented scripting language). Không chỉ vậy, nó còn là một ngôn ngữ cấp cao có khả na ng thông dịch (interpreted language) và có tính tƣơng tác (interactive language) cao. Nhờ chức na ng thông dịch mà trình thông dịch (Interpreter) của Python có thể xử lý lẹ nh tại thời điểm chạy chƣơng trình (runtime). Nhờ đó mà ta không cần biên dịch chƣơng trình trƣớc khi thực hiẹ n nó (tƣơng tự nhƣ Perl và PHP). Tính na ng tƣơng tác của Python giúp ta có thể tƣơng tác trực tiếp với trình thông dịch của nó ngay tại dấu nhắc lẹ nh. Cụ thể: Ta có thể thực hiẹ n lẹ nh mọ t cách

40 trực tiếp tại dấu nhắc của Python. Python hỗ trợ mạnh cho phong cách lạ p trình hƣớng đối tƣợng và kỹ thuạ t lạ p trình gói mã trong đối tƣợng. Mạ c dầu Python đƣợc xem là ngôn ngữ lạ p trình dành cho những ai mới làm quen với viẹ c lạ p trình trên máy tính, nhƣng nó hỗ trợ mạnh cho viẹ c phát triển nhiều loại ứng dụng khác nhau, từ các chƣơng trình xử lý va n bản đơn giản đến các ứng dụng web, đến các chƣơng trình game, v.v. - Python đƣợc phát triển tại Viẹ n Nghiên cứu Quốc gia về Toán học và Khoa học Máy tính Hà Lan bởi Guido van Rossum vào những na n 80-90 của thế kỷ trƣớc. Hiẹ n nay Python đƣợc duy trì và phát triển bởi nhóm phát triển core của viẹ n này. - Python đƣợc phát triển từ nhiều ngôm ngữ khác nhau: ABC, Modula-3, C, C++, Algol-68, SmallTalk, Unix Shell và các ngôn ngữ script khác. Tƣơng tự nhƣ Perl, Python là ngôn ngữ có bản quyền, hiẹ n nay mã nguồn của nó đƣợc phát hành theo GNU - General Public License (GPL). - Python có điểm chạ t chẽ rất giống với ngôn ngữ tiếng Anh, sử dụng những từ nhƣ 'not' và 'in' nên khi bạn đọc mọ t chƣơng trình, script, hoạ c khi đọc to cho ngƣời khác nghe mà không cảm thấy giống nhƣ bạn đang nói mọ t thứ ngôn ngữ bí mạ t nào đó. Điều này cũng đƣợc hỗ tr bởi các quy tắc chấm phẩy câu rất nghiêm ngạ t của Python, có nghĩa là bạn không có những dấu ngoạ c nhọn ( ) trong code của bạn. - Ngoài ra, Python có mọ t tạ p hợp các quy tắc, đƣợc gọi là PEP 8, để hƣớng dẫn mọi lạ p trình viên Python làm thế nào để định dạng code của họ. Điều này có nghĩa là bán luôn biết đƣợc nơi để đạ t những dòng mới, và quan trọng hơn, đó là mọi script Python mà bạn tham khảo, cho dù nó đƣợc viết bởi mọ t lính mới hay bởi mọ t chuyên gia dày dặn kinh nghiẹ m, sẽ nhìn rất giống nhau và rất dễ đọc. - Python đã tồn tại khoảng hơn 20 na m, vì vạ y có rất nhiều code viết bằng Python đƣợc xây dựng qua nhiều thạ p kỷ, và là mọ t ngôn ngữ mã nguồn mở, rất nhiều trong số này đƣợc phát hành cho ngƣời khác sử dụng. Hầu nhƣ tất cả chúng đƣợc tạ p hợp lại trên trang web https://pypi.python.org, bạn phát âm nó là "pie-pee- eye", hoạ c còn đƣợc gọi bằng mọ t cái tên phổ biến hơn là "the CheeseShop". Bạn có thể cài đặt phần thể mềm này lên hẹ thống của bạn để sử dụng bởi cácdựáncủariêng bạn.Vídụ,nếu bạnmuốnsửdụngPythonđểxây dựng những script với các đối số dòng lẹ nh, bạn nên cài đạ t thƣ viẹ n click và sau đó import nó vào trong các script của bạn rồi sử dụng nó. Có những thƣ viẹ n sử dụng đƣợc cho khá nhiều

41 trƣờng hợp từ thao tác với hình ảnh, cho tới tính toán khoa học, và tự đọ ng hóa máy chủ. - Python có nhiều nhóm ngƣời sử dụng ở khắp mọi nơi, thƣờng đƣợc gọi là các PUG, và họ tiến hành những cuọ c họ i thảo lớn trên tất cả mọi châu lục ngoại trừ Nam Cực. PyCon NA, họ i nghị về Python lớn nhất ở Bắc Mỹ, đã bán ra 2.500 vé trong na m nay. Họ i nghị này phản ánh cam kết đa dạng hóa của Python, vì có trên 30 diễn giả là phụ nữ. 2.3.1.2 Arcpy ArcPy là bọ thƣ viẹ n của ArcGIS sử dụng ngôn ngữ lạ p trình Python. Arcpy mang lại sự tiẹ n lợi và hiẹ u quả trong viẹ c phân tích dữ liẹ u địa lý, chuyển đổi dữ liẹ u, quản lý dữ liẹ u và tự đọ ng hóa bản đồ với Python. Nó dễ hiểu, rõ ràng, tƣơng tác tốt và xây dựng nhanh chóng các Scripts cho mọ t công cụ hay mọ t ứng dụng lớn trong ArcGIS. Nhƣ chúng ta đã biết, ArcGIS là mọ t bọ phần mềm GIS đến từ ESRI cho phép ngƣời dùng có thể chỉnh sửa, hiển thị hay đƣa ra các phép phân tích phức tạp các dữ liẹ u không gian mọ t cách đơn giản và tiẹ n lợi hơn nhiều so với các phần mềm GIS khác nhƣ QGIS, TatukGIS, v.v. Đồng thời ArcGIS cũng cho phép các nhà phát triển phần mềm dễ dàng xây dựng các ứng dụng từ bên thứ 3 dƣới dạng Toolbox hay Add-In để tích hợp vào sản phẩm của họ sử dụng các bọ thƣ viẹ n có sẵn. ArcPy là mọ t bọ thƣ viẹ n nhƣ vạ y, nó cung cấp các chức na ng mạnh mẽ trong viẹ c xử lý và chuyển đỗi dữ liẹ u không gian. Từ phiên bản 10.2, ArcGIS cho phép xây dựng trực tiếp các Toolbox trên sản phẩm của mình. Thay vì phải định nghĩa Toolbox và viết mã nguồn riêng rẽ ở bên ngoài trƣớc khi đƣa vào ArcGIS, các nhà phát triển chỉ cần định nghĩa toàn bọ các thành phần trong ứng dụng của mình trong tẹ p *.pyt duy nhất.Chính vì sự mạnh mẽ và tiẹ n lợi mà ArcPy và ArcGIS đem lại, em đã lựa chọn công nghẹ này để sử dụng cho viẹ c phát triển ứng dụng chuyển đổi dữ liẹ u từ CAD sang GIS. Để có thể sử dụng đƣợc phần mềm này, ngƣời dùng cần cài cài đạ t bọ phần mềm ArcGIS trên máy tính của mình. Và để ta ng hiẹ u na ng xử lý dữ liẹ u, máy tính của ngƣời dùng cần tối thiểu 2GB RAM, hẹ điều hành Windows XP trở lên có bọ xử lý 32 bit hoạ c 64 bit cùng với trình biên dịch Python 2.7 để có thể thực thi đƣợc mã nguồn của phần mềm. 2.3.2 Khung phát triển plug-in cho hệ thống GIS Các bƣớc thực hiẹ n chuyển đổi dữ liẹ u đƣợc thể hiẹ n ở hình vẽ dƣới đây:

42

Hình 2.3. Sơ đồ quy tr nh huy n đ i ữ iẹ u CAD sang GIS Bƣớc 1: Ngƣời dùng chọn dữ liẹ u CAD cần chuyển đổi để đƣa vào phần mềm. Chú ý dữ liẹ u CAD đƣợc sử dụng có phần mở rọ ng là *.dwg. Tiếp đến ngƣời dùng chọn lƣới chiếu không gian đƣợc sử dụng cho dữ liẹ u GIS và phần mềm sẽ tiến hành chuyển đổi dữ liẹ u CAD sang dữ liẹ u GIS dạng thô. Bƣớc2: Từ dữ liẹ u GIS dạng thô phần mềm sẽ tiến hành lọc và loại bỏ các thông tin dƣ thừa trong dữ liẹ u GIS dạng thô để dữ liẹ u sạch hơn. Bƣớc 3: Sau khi loại bỏ các thông tin dƣ thừa, phần mềm sẽ tiến hành phân lớp các dữ liẹ u dựa trên thông tin đƣợc chiết xuất sau khi chuyển đổi từ dữ liẹ u CAD sử dụng chuẩn. Bƣớc 4: Các dữ liẹ u đƣợc phân lớp sẽ đƣợc phần mềm lƣu trong 1 tẹ p *.gdb đƣợc định nghĩa trƣớc để tạo thành cơ sở dữ liẹ u GIS hoàn chỉnh cho ngƣời dùng sử dụng.

43 2.4 Phân tích thiết kế công cụ hỗ trợ chuyển đổi dữ liệu địa lý 2.4.1 Mô hình ca sử dụng

Hình 2.4. Mô hình ca sử dụng của phần mềm 2.4.2 Mô tả ca sử dụng Tải dữ liệu CAD Use case này cho phép ngƣời dùng chọn dữ liệu CAD cần chuyển đổi để đƣa vào phần mềm. Ngƣời dùng lựa chọn file dạng *.dwg Chọn lƣới chiếu Cho phép ngƣời sử dụng chọn lƣới chiếu Nhập địa chỉ lƣu trữ Ngƣời sử dụng chọn địa chỉ lƣu trữ, dữ liệu sau khi chuyển đổi sẽ đƣợc lƣu trữ trong địa chỉ đã chọn.

44 2.4.3 Biểu đồ lớp

Hình 2.5. Bi u đồ lớp của phần mềm 2.4.4 Thiết kế lớp Dựa vào biểu đồ phân tích trên, phần mềm đƣợc thiết kế gồm các lớp giao diện và các lớp điều khiển sau: 2.4.4.1 Lớp giao diện Lớp giao diện chính của phần mềm

Hình 2.6. Lớp giao diện chính của phần mềm

45 Lớp này thiết kế giao diện chính của phần mềm. Tại form này ngƣời sử dụng sẽ thực hiện việc tải tệp dữ liệu CAD, lựa chọn phép chiếu, nhập địa chỉ lƣu trữ cho tệp tin sau khi chuyển đổi và chạy phần mềm. Lớp giao diện tải dữ liệu CAD

Hình 2.7. Lớp giao diện tải dữ liệu CAD Lớp này thiết kế giao diện cho phép ngƣời dùng tìm và lựa chọn tệp dữ liệu CAD đƣợc lƣu trữ trong bộ nhớ và đọc nội dung của tệp CAD. Lớp giao diện nhập địa chỉ lƣu trữ

Hình 2.8. Lớp giao diện nhập địa chỉ ưu trữ Lớp này thiết kế giao diện cho phép ngƣời dùng nhập địa chỉ lƣu trữ cho dữ liệu sau khi chuyển đổi thành công.

46 2.4.4.2 Lớp điều khiển

Hình 2.9. Lớp điều khi n Lớp này làm nhiệm vụ lấy thông tin tệp CAD, lƣới chiếu, địa chỉ lƣu trữ và tiến hành các bƣớc chuyển đổi dữ liệu, sau khi chuyển đổi thành công thì tiến hành lƣu trữ dữ liệu.

47

CHƢƠNG 3: KẾT QUẢ CÀI ĐẶT VÀ THỬ NGHIỆM Trong chƣơng 2 tác giả đã trình bày chi tiết việc xây dựng plug-in chuyển đổi dữ liệu địa lý vào phần mềm ArcGIS. Chƣơng này, tác giả sẽ trình bày kết quả thực nghiệm khi chuyển đổi các bộ dữ liệu thuộc các nhóm nội dung khác nhau của Viện Quy Hoạch xây dựng Hà Nội. 3.1 Tổ chức thực nghiệm 3.1.1 Môi trƣờng thực nghiệm Sử dụng máy tính hệ điều hành Window 8, Ram 4GB Phần mềm ArcGIS phiên bản 10.4.1 3.1.2 Dữ liệu thực nghiệm Dữ liệu sử dụng chạy thử là dữ liệu CAD của Viện Quy hoạch xây dựng Hà Nội ở trên nhóm nội dung Hồ sơ quy hoạch:

- Hiẹ n Trạng (05 nhóm thông tin)

− Sơ đồ vị trí và giới hạn khu đất

− Hiẹ n trạng sử ụng đất

− Hiẹ n trạng i n tr ảnh qu n và đánh giá đất y ng

− Hiẹ n trạng hạ tầng ỹ thuạ t

– Hiẹ n trạng môi trư ng

- Quy hoạch (13 nhóm thông tin )

− Cơ ấu quy hoạ h

− uy hoạ h sử ụng đất,

− uy hoạ h h ng gi n i n tr ảnh qu n

− uy hoạ h gi o th ng

48 − uy hoạ h hu n ị ỹ thuạ t;

− uy hoạ h thoát nước mưa;

− uy hoạ h ấp nướ

− uy hoạ h thoát nướ thải và vẹ sinh môi trư ng

− uy hoạ h ấp điẹ n;

− uy hoạ h th ng tin i n ạ

− uy hoạ h ng tr nh ngầm

− ng h p đư ng y đư ng ng ỹ thuạ t

− Đánh giá m i trư ng hi n ư c

Hồ sơ Chỉ giới đƣờng đỏ và hạ tầng ỹ thuạ t

− á định hỉ giới đư ng đ

− iới thiẹ u hướng tuy n hạ tầng ỹ thuạ t

− Sơ đồ vị trí

− m m tuy n đư ng

− hạm vi n ng ấp ải tạo đư ng

− iới hạn hành ng ảo vẹ á tuy n hạ tầng ỹ thuạ t

Tổng số dữ liệu chạy thử là 70Mb. 3.2 Kết quả thử nghiệm chƣơng trình 3.2.1 Một số giao diện chƣơng trình và hƣớng dẫn thao tác Giao diện chƣơng trình khi bật Toolbox:

49

Hình 3.1. Giao diẹ n phần mềm huy n đ i ữ iẹ u CAD sang GIS Đây là giao diện chính của phần mềm, các chức năng của button nhƣ sau: Button CAD Dataset: Mở giao diện chọn tệp giữ liệu CAD.

Hình 3.2. Giao diện chọn dữ liệu CAD Button Projection: Mở giao diện chọn lƣới chiếu

50

Hình 3.3. Giao diện chọn ưới chi u Button Output Fordel: Mở giao diện chọn vùng lƣu trữ cho dữ liệu sau khi chuyển đổi thành công.

51

Hình 3.4. Giao diện chọn vùng ưu trữ cho dữ liệu sau khi chuy n đ i Khi đã chọn đầy đủ các thông tin cho các mục, ấn button OK để bắt đầu chuyển đổi, ấn button Cancel để thoát chƣơng trình. 3.2.2 Hiển thị kết quả Một số kết quả chuyển đổi dữ liệu CAD sang GIS. Kết quả chuyển đổi bản vẽ quy hoạch.

52

Hình 3.5. Bản vẽ quy hoạ h ạng s u hi đư huy n đ i

Hình 3.6. Dữ liệu thuộc tính của CSDL Quy hoạch Kết quả chuyển đổi bản vẽ Chỉ giới đƣờng đỏ

53

Hình 3.7. Bản vẽ chỉ giới đư ng đ dạng GIS sau khi chuy n đ i

Hình 3.8. Dữ liệu thuộc tính của CSDL Chỉ giới đư ng đ 3.3 Nhận xét và đánh giá Luận văn đã tiến hành chạy phần mềm chuyển đổi với các dữ liệu CAD thuộc các nhóm khác nhau và nhận thấy để chuyển đổi nhanh chóng và chính xác thì các bản vẽ AutoCAD ngoài viẹ c tuân thủ các quy định thể hiẹ n còn cần phải đáp ứng các yêu cầu sau:

54 – Bản vẽ đƣợc vẽ trên Hệ toạ độ VN2000, kinh tuyến trục 105, múi o chiếu 3 , đơn vị mét;

– Vẽ đúng tọa độ (không đƣợc “move” tới vị trí khác);

– Vẽ đúng layer (không đƣợc vẽ đối tƣợng của layer này sang layer khác, 1 lớp đối tƣợng vẽ ở nhiều layer vv..);

– Đạ t tên cho layer cần thống nhất theo quy định chung;

– Quan hẹ không gian giữa các đối tƣợng phải đảm bảo: không bị hở, đứt đoạn... ;

– Tất cả các đối tƣợng đều phải đạ t tham số elevation bằng 0 (trừ các đối tƣợng là đƣờng đồng mức hoạ c các đối tƣợng khác có cao đọ trong thực tế);

– Các vùng hatch phải có đƣờng bao kín (boundary);

55

ẾT LUẬN Nội dung luận văn trình bày một số kết quả nghiên cứu đạt đƣợc sau đây:  Các kiến thức cơ bản về GIS và dữ liệu địa lý, bao gồm các định nghĩa về GIS, thành phần, ứng dụng, một số hệ GIS thông dụng, các chuẩn và định dạng dữ liệu CAD, GIS và sự liên quan, nhu cầu chuyển đổi dữ liệu địa lý ở Việt Nam và các phƣơng pháp hiện tại.  Khảo sát các bản vẽ CAD tìm ra các lỗi tồn tại trên bản vẽ, đƣa ra cách khắc phục để thuận lợi cho công tác chuyển đổi, sử dụng lại dữ liệu.  Xây dựng công cụ chuyển đổi tự động dữ liệu địa lý từ các bản vẽ CAD và tích hợp vào ArcGIS. Nội dung luận văn là một phần thuộc đề tài “Nghiên cứu, xây dựng quy trình chuyển đổi dữ liệu từ các bản vẽ AutoCAD vào GIS; Xây dựng ứng dụng hỗ trợ công tác lập quy hoạch trong AutoCAD” của Viện Quy Hoạch Xây dựng Hà Nội mà tác giả tham gia nghiên cứu.

56

TÀI LIỆU THAM HẢO Tiếng Việt [1] Nguyễn Hồng Phƣơng, Đinh Văn Ƣu (2006), Hệ th ng th ng tin địa lý và một s ứng dụng trong hải ương học. NXB Đại Học Quốc Gia Hà Nội. [2] Phạm Văn Cự, Lƣơng Anh Tuấn, Hoàng Kim Hƣơng (2005), Giáo trình về hệ th ng th ng tin địa lý GIS và bản đồ. NXB Đại Học Quốc Gia Hà Nội. [3] Trần Hùng (2011), Ứng dụng GIS trong quản lý hạ tầng kỹ thuật đ thị tại Việt Nam. Công ty tƣ vấn GeoViet Hội thảo ứng dụng GIS toàn quốc. [4] Nguyễn Khắc Thời, Phạm Vọng Thành, Trần Quốc Vinh, Nguyễn Thị Thu Hiền (2011), Giáo trình viễn thám. NXB Đại Học Nông Nghiệp. [5] Phạm Hữu Đức (2011), ơ s dữ liệu và hệ th ng th ng tin địa lý GIS, NXB Xây Dựng. [6] Trần Thị Băng Tâm (2006), Giáo trình hệ th ng th ng tin địa lý, NXB Đại Học Nông Nghiệp. Tiếng Anh [7] Autodesk, Inc (2011), DXF Reference. [8] ESRI Technical paper (2008), Mapping Specification for DWG/DXF (MSD). [9] Environmental Systems Research Institute, Inc (1998), ESRI Shapefile Technical Description. [10] R.Zaiane, Dr.Osmar (2001), Principles of knowledge discovery in databases. University of Alberta. [11] Silas Toms (2015), “ArcPy and ArcGIS Geospatial Analysis with Python”. Packt Publishing. [12] Husheng-hua, He Zong-yi, Tao Li-jia (2007), “Research on Data Conversion between AutoCAD and GIS”. Bulletin of Surveying and Mapping. [13] Paul A. Zandbergen (2013), “Python Scripting for ArcGIS”. ESRI Press. Internet [14] https://en.wikipedia.org/wiki/Computer-aided_design [15] https://en.wikipedia.org/wiki/Geographic_information_system

57 [16] http://help.arcgis.com/en/arcgisdesktop/10.0/help/index.html - /Shapefile_file_extensions/005600000003000000/ [17] http://www.esri.com/news/arcuser/0401/topo.html [18] https://www.gisconvert.com/ [19] https://www.safe.com/convert/dwg-to-shp/

58