當前位置:首頁 » 參考文獻 » 資料庫示意圖

資料庫示意圖

發布時間: 2021-03-21 14:51:08

資料庫邏輯模型

資料庫關系模型(資料庫邏輯模型)是將數據概念模型轉換為所使用的資料庫管理系統(DBMS)支持的資料庫邏輯結構,即將E-R圖表示成關系資料庫模式。資料庫邏輯設計的結果不是唯一的,需利用規范化理論對資料庫結構進行優化。

在關系模型中,資料庫的邏輯結構是一張二維表。在資料庫中,滿足下列條件的二維表稱為關系模型:

1)每列中的分量是類型相同的數據;

2)列的順序可以是任意的;

3)行的順序可以是任意的;

4)表中的分量是不可再分割的最小數據項,即表中不允許有子表;

5)表中的任意兩行不能完全相同。

由此可見,有序的航空物探測量剖面數據不滿足資料庫關系模型條件第3條「行的順序可以是任意的」,因此,不能簡單地直接利用關系資料庫(如Oracle,SQL Server,Sybase等)來管理剖面數據,需將數據在資料庫中的存儲方式改為大欄位存儲,確保不因資料庫數據的增加和刪除等操作改變剖面數據有序特性。

一、大欄位存儲

(一)大欄位存儲技術

大欄位LOB(Large Object)技術是Oracle專門用於存放處理大對象類型數據(如多媒體材料、影像資料、文檔資料等)的數據管理技術。LOB包括內部的和外部的兩種類型。內部LOB又分CLOB(字元型)、BLOB(二進制型)等3種數據類型,其數據存儲在資料庫中,並且支持事務操作;外部LOB只有BFILE類型,其數據存儲在操作系統中,並且不支持事務操作。LOB存放數據的長度最大可以達到4G位元組,並且空值列(沒有存放數據)不佔空間(圖2-6)。

圖2-6 大欄位存儲示意圖

由於外部LOB存放在操作系統文件中,其安全性比內部LOB差一些。此外,大欄位的存儲支持事務操作(批量提交和回滾等),而外部LOB不支持事務操作。所以,航空物探測量剖面數據採用BLOB來存儲。對於BLOB類型,如果數據量小於4000位元組,資料庫通常採用行內存儲,而數據量大於4000位元組採用行外存儲。分析航空物探測量剖面數據,每個場值數據佔4個位元組(單精度),目前航磁數據采樣率為10次/s,4000位元組只能存儲100s數據;一般情況下航空物探測量每條測線飛行時間至少在10min以上,每條測線數據量遠遠大於4000位元組。所以,航空物探測量剖面數據採用行外存儲方式,即大欄位列指定「Disable Storage In Row」的存儲參數。

由於大欄位類型長度可變,最大可到4G。假設測線飛行時間為T,場值采樣率為n次/s,測線場值數據量為4Tn,所以有4Tn≤4G。單條測線飛行時間T不會超過10h(36000s,航空物探測量1架次至少飛行1個往返2條測線),則場值的采樣率n≤4G/4T=4×1024×1024×1024/4×36000次/s=29826次/s。採用大欄位來存儲測量數據,不僅能夠減少數據表的記錄數,提高查詢效率,而且使得采樣率的擴展不受限制。

(二)大欄位存儲技術應用

由於航空物探數據的數據量較大,現有的航磁測量數據按基準點方式(點存儲)存儲可達幾億個數據記錄。若按磁場數據采樣點存儲方式(簡稱「場值存儲方式」),則記錄條數=(磁場數據采樣率/坐標采樣率)點存儲方式的記錄數,達幾十億條數據記錄,且隨著數據采樣率的擴展、測點的加密,航空物探測量數據量隨著時間的推移呈現快速增長之勢。顯然,如果採用常規的表結構來存儲,勢必造成數據的存儲、管理、檢索、瀏覽和提取都非常困難。另一方面,從航空物探專業應用需求來說,很少對單個測點的場值數據進行運算、分析等操作,一般至少是對一條測線或以上測線,多數時候是需要對整個測區的場值數據進行化極、上延、正反演擬合等。

因此,在航空物探資料庫表結構設計時,改變過去將基準點或場值點數據記錄作為資料庫最小管理對象的理念,採用了大欄位存儲技術,將測線作為資料庫最小管理對象,將測線上的測量數據,如坐標數據和磁場、重力場數據分別存儲在相應大欄位中。在航空物探資料庫建設中,大量採用資料庫的大欄位存儲技術(詳見《航空物探信息系統資料庫結構設計》)。

(三)大欄位存儲效率

以航磁測量數據為例分析大欄位存儲技術優勢。如果以場值存儲方式存儲測線數據,則每條記錄包含架次號、測線號、基準號、地理坐標、投影坐標、磁場數據等,由於坐標數據采樣率2次/s,磁場數據采樣率10次/s,每5個磁場數據中,只有第1個磁場數據有坐標數據,其他4個坐標數據是內插出來,因此在測線記錄中會產生大量冗餘的數據坐標數據。採用點存儲方式存儲的測線數據記錄數等於線上基準點數,若採用大欄位存儲方式,一條測線數據只存儲為1條數據記錄(圖2-7),一般一條測線的測點數近萬個,甚至更多,可見採用大欄位存儲大大減少測線數據存儲記錄數,提高數據的存取效率。

以某測區的兩條航跡線為例,分別採用3種方式測試資料庫的數據存儲效率。磁場數據的采樣率10次/s,坐標數據采樣率2次/s,兩條測線上共有基準點8801個。以場值方式存儲先內插坐標信息,使得每個場值數據都擁有自己的坐標,然後存入資料庫,共有數據記錄44005條,寫入資料庫時間為57.22s,讀取時間為1.03s。第二種方式是以采樣點的方式進行存儲,共有8801條記錄,寫入資料庫時間為9.47s,讀取需要0.91s。第三種方式是以大欄位的形式存儲,只有2條記錄,寫入資料庫1.03s,讀取時間為0.44s(表2-2)。大欄位數據存儲記錄數最少,存取效率最高。用整個測區數據測試效果更加明顯。

表2-2 三種數據存儲方法的存取效率比較

圖2-7 大欄位存儲方式示意圖

二、聯合主鍵

主外鍵是關系型資料庫建立表間關系的核心。在航空物探空間資料庫建設過程中,要素類與要素類之間、要素類與對象類之間,以及對象類與對象類之間的關系的描述有3種形式,即拓撲關系——描述要素類與要素類之間結點、鄰接和聯通關系;疊加關系——描述要素類與要素類之間的相交、包含與分類關系;隸屬關系——描述對象類與對象類之間的派生關系。前兩種關系是採用空間數據模型建立的關系,而隸屬關系是通過主鍵建立的對象類與對象類之間的關系。在建立一對一、一對多的表間關系時,需要在整個資料庫表中確定具有唯一性的一個欄位作為主鍵(主關鍵字)。

按照傳統的航空物探數據的檔案管理模式,每個項目分配一個自然數作為檔案號,項目的所有資料均與此檔案號相聯系。勘查項目和科研項目的檔案號是獨立編號的,且均從001開始。加之人工管理的原因,存在1個項目2個檔案號和2個項目1個檔案號的情況,因此現行的檔案號與項目之間的對應關系不具備唯一性,不能作為項目的唯一標識,即不能作為資料庫表的主鍵。項目編號也不能作為資料庫表的主鍵,項目編號也只是近十年的事,以前的項目沒有項目編號。

綜合考慮上述因素和項目具有分級、分類的特點,提出了構造項目唯一標識碼(簡稱「項目標識」)的方法,並以此碼作為資料庫表的主鍵。

項目標識(主鍵):AGS+項目類別(2位)+項目起始年份(4位)+檔案號(6位)

標識含義:AGS——航空物探的縮位代碼;

項目類別——2位代碼,01代表勘查項目、02代表科研項目;

起始年份—4位代碼,項目開始年號;

檔案號—6位代碼,為了與傳統的項目管理方式相銜接,後面3~4位是

項目檔案管理模式下的檔案號,不足部分補零。

以上15位編碼是一級項目的項目標識,二級及其以下級別的項目標識是在上一級項目標識基礎上擴展2位數字代碼,中間用「.」號隔開,數字為該級項目的序號。項目標識定義為30位編碼,適用於六級以內的項目。例如:AGS022004000576.08.04.02,表示該項目為2004年開展的檔案號為576的航空物探科研項目(一級項目)的第8課題(二級項目)第4子課題(三級項目)的第2專題。由此可見,該項目標識不僅僅是一個建立表間關系的關鍵字,同時還表達了不同級別項目間的隸屬關系。在系統軟體開發時,利用此關系生成了項目的分級樹形目錄,用戶對項目的層次關系一目瞭然,便於項目查詢。

資料庫的主鍵一經確定,相應地需要確定聯合主鍵的組成及其表達方式。所謂聯合主鍵就是數據資料的唯一標識,在一個資料庫表中選擇2個或者2個以上的欄位作為主鍵。由於航空物探數據絕大部分與項目標識有關,加之數據的種類較多,分類復雜,單憑主鍵確定資料庫表中記錄的唯一性,勢必需要構建極其復雜的主鍵,這種方法既不利於主鍵的數據操作,又會造成大量的數據冗餘,合理地使用聯合主鍵技術可以很好地解決資料唯一問題。以項目提交資料為例,提交的資料分為文字類資料、圖件類資料和媒體類資料,我們對資料進行分類和編號,例如100代表文字資料(110——World文檔,120——PDF文檔),200代表圖件資料(210——基礎地理資料、220——基礎地質資料,230——航跡線圖,240——剖面圖,250——等值線圖等),300代表媒體資料(310——PPT文檔,320——照片等),第1位(百位)表示該資料的類型,第2~3位表示該類資料的序號。

在資料庫管理和項目資料查詢時,採用項目標識與資料分類編號作為聯合主鍵(圖2-8),可以高效地實現復雜數據的查詢。在整個資料庫系統中多處(項目查詢、數據提取等模塊)使用聯合主鍵技術。

圖2-8 聯合主鍵實例

三、信息標准化

為了實現數據共享,在航空物探資料庫建模過程中,參考引用了近百個國家信息化標准,編制了4個中心信息化標准和1個圖件信息化工作指南。

(一)引用的國家信息化標准

1)地質礦產術語分類代碼:地球物理勘查,地球化學勘查,大地構造學,工程地質學,結晶學及礦物學,礦床學,水文地質學,岩石學,地質學等。

2)國家基礎信息數據分類與代碼,國土基礎信息數據分類與代碼,地球物理勘查技術符號,地面重力測量規范,地面磁勘查技術規程,地面高精度磁測技術規程,大比例尺重力勘查規范,地理信息技術基本術語,地理點位置的緯度、經度和高程的標准表示法,地名分類與類別代碼編制規則。

3)地球空間數據交換格式;數學數字地理底圖數據交換格式;數字化地質圖圖層及屬性文件格式。

(二)本系統建立的信息化標准

編寫了「航空物探空間數據要素類和對象類劃分標准」,「航空物探項目管理和資料管理分類代碼標准」,「航空物探勘查分類代碼標准」,「航空物探信息系統元數據標准」,「航空物探圖件信息化工作指南」,以便與其他應用系統進行信息交換,實現資料庫資料共享。

航空物探空間數據要素類和對象類劃分標准:根據物探方法、數據處理過程以及推斷解釋方法和過程,把與GIS有關的數據劃分為不同類型的要素類-對象類數據,按專業、比例尺、數據內容對要素類和對象類進行統一命名,使空間資料庫中的每個要素類和對象類的命名具有唯一性,防止重名出現。規定要素類-對象類資料庫表結構及數據項數值類型。

航空物探項目管理和資料管理分類代碼標准:規定了航空物探項目管理和資料管理的相關內容,包括航空物探勘查項目和科研項目的項目立項、設計、實施、成果、評審、資料匯交等項目管理的全過程中的內容,以及項目成果資料和收集資料的歸檔、發送、銷毀、借閱等資料管理與服務過程中的內容和數據項代碼。

航空物探勘查分類代碼標准:在「地質礦產術語分類代碼地球物理勘查」(國家標准GB/T9649.28—1998)增加了航磁、航重專業方面所涉及的數據採集、物性參數、方法手段、儀器設備、資料數據解釋及成圖圖件等內容和數據項代碼。

航空物探信息系統元數據標准:規定了航空物探空間數據管理與服務的元數據(數據的標識、內容、質量、狀況及其他有關特徵)的內容。

四、航跡線數據模型

(一)航跡線模型的結構

航空物探測量是依據測量比例尺在測區內布置測網(測線和切割線)。當飛機沿著設計的測線飛行測量時,航空物探數據收錄系統按照一定的采樣率採集采樣點的地理位置、高度和各種地球物理場信息。採用屬性數據分置的方法,將測線地理位置信息從航空物探測量數據中分離出來,形成航跡線要素類表,在此表中只存儲與航跡線要素類有關的數據,如項目標識、測區編號、測線號、測線類型(用於區分測線、切割線、不同高度線、重復線等)、坐標、高度值等;將航跡線的對象類數據(磁場、重力場基礎數據)分別以大欄位形式存儲在各自的二維表中,它們共享航跡線,解決了多源有序不同采樣率的航空物探測量數據的數據存儲問題,在滿足要素類空間查詢的同時,統一數據的存儲方式(圖2-9)。航跡線要素類隸屬於測區要素類,它們之間為空間拓撲(包含)關系。測區從屬於勘查項目,每個勘查項目至少有一個測區,它們之間為1對多關系。有關項目信息存放在項目概況信息對象類表中,各種表之間通過項目標識進行聯接。

圖2-9 航跡線數據模型結構

(二)航跡線的UML模型

統一建模語言UML(Unified Modeling Language)是一種定義良好、易於表達、功能強大且普遍適用的建模語言。它溶入了軟體工程領域的新思想、新方法和新技術。UML是面向對象技術領域內佔主導地位的標准建模語言,成為可視化建模語言的工業標准。在UML基礎上,ESRI定義了空間資料庫建模的ArcGIS包、類庫和擴展原則。

圖2-10 與航跡線有關的資料庫表邏輯模型結構圖

在確定航跡線數據模型後,以它為基礎,使用UML完成與航跡的有關的項目概況信息、測區信息、原始數據等資料庫表邏輯模型設計(圖2-10)。

由UML模型生成Geodatabase模式時,模型中的每個類都對應生成一個要素類或對象類。類的屬性映射為要素類或對象類的欄位。基類屬性中包含的欄位,在繼承類中不需重復創建。例如,每個類都包括項目標識等欄位,可以創建一個包含公共屬性的基類,其他類從該類繼承公共的屬性,而無需重復建基類中包含的屬性。因為基類沒有對應的要素類或對象類,所以將基類設置為抽象類型。要素類之間的關系採用依賴關系表示。

五、資料庫邏輯模型

關系資料庫的邏輯結構由一組關系模式組成,因而從概念結構到關系資料庫邏輯結構的轉換就是將概念設計中所得到的概念結構(ER圖)轉換成等價的UML關系模式(圖2-11)。在UML模型圖中,要素數據集用Geodatabase工作空間下的靜態包表示。要素集包不能互相嵌套,為了容易組織,在生成物理模型後,在要素數據集包中自定義嵌套。要素數據集與空間參考有關,但是空間參考不能在UML中表達。要素類和二維表都是以類的形式創建的,區別是要素類繼承Feature Class的屬性,而二維表繼承Object屬性。為了表達每種元素的額外屬性,比如設置字元型屬性欄位的字元串長度,設置要素類的幾何類型(點、線或面)需要使用Geodatabase預定義的元素標記值。

圖2-11 邏輯設計關系轉換

基於航空物探數據的內在邏輯關系進行分析,使用統一建模語言(UML)構建數據實體對象間的關系類,定義了航空物探資料庫的邏輯模型(圖2-12)。

Ⅱ 資料庫物理模型

資料庫物理模型設計的目標是根據選定的Oracle資料庫系統特點和航空物探數據管理與服務的業務處理需求,確定航空物探資料庫最優的物理環境、存取方法和存儲結構。即通過資料庫物理設計,以便達到物理資料庫結構的優化,使得在資料庫上運行的各種事務響應時間少、存儲空間利用率高、事務吞吐率大。

一、資料庫布局

航空物探信息系統的維護數據(部門、崗位、人員、人員許可權、數據入庫檢查規則及數據字典等)相對比較穩定。入庫前數據需經過各種檢查校對,確認數據正確後才能歸檔,存入航空物探資料資料庫,所以存入資料庫前的數據可能經常需要修改和刪除,相對變化較大;而存入資料資料庫中的數據一般不允許修改和刪除,以免誤操作破壞資料庫數據造成損失。

圖2-12 航空物探資料庫邏輯模型

圖2-13 航空物探資料庫布局與數據採集流程圖

據此,我們採用圖2-13所示的資料庫數據採集流程,並將航空物探資料庫分為資料採集資料庫、資料資料庫、系統維護資料庫分別進行存儲和管理,實現數據的統一管理和統一使用,便於數據入庫和易於維護等。

航空物探資料資料庫是航空物探所有數據最終存儲的場所。資料採集資料庫是數據歸檔存入資料資料庫前的臨時「集散地」,在此接收各項檢查,在確認數據無誤後歸檔到資料資料庫,然後刪除資料採集資料庫中已歸檔的數據。此外,資料採集資料庫中還保存數據入庫、維護、檢查日誌及歸檔記錄。

系統維護資料庫,存儲系統維護信息(如系統功能、資料庫表清單等)、安全信息(如信息系統用戶的角色、許可權、授權的系統功能等),數據字典、入庫數據檢查規則等。將其與航空物探數據分開,有利於系統維護和管理。

二、資料庫空間設置

資料庫空間設置包括磁碟空間設置、應用系統表空間設置、撤銷表空間、臨時表空間、日誌空間和索引空間設置。

(一)磁碟空間設置

磁碟空間設置的目標:磁碟性能不能阻礙實現資料庫性能,資料庫磁碟必須專用於資料庫文件,否則非資料庫將會影響到資料庫性能,且磁碟空間必須滿足恢復和性能的要求。

航空物探資料庫伺服器為IBM P620小型機,8塊硬碟,每塊硬碟36GB空間,每塊物理磁碟建立一個文件系統。為了提高磁碟的反應時間和尋道時間,提高I/O的存取效率,除了一塊硬碟用於UNIX操作系統外,其餘7塊磁碟分別存放資料採集資料庫、系統維護資料庫-日誌文件,資料資料庫及資料資料庫的大欄位數據、索引、回滾段和數據日誌文件。

(二)應用系統表空間設置

信息系統數據採集過程對數據的事務操作比較頻繁,經常進行數據插入(新數據入庫)、修改(入庫數據有誤)和刪除操作(數據重新導入或歸檔入庫),因此航空物探資料採集資料庫所在的表空間會很活躍。為了不影響其他I/O的競爭,同時也可以提高數據入庫的操作效率(50多年的歷史數據需要集中入庫),分配一個磁碟空間(36GB)為採集庫的表空間。由於採集數據歸檔入資料庫後被刪除,同時進行數據入庫的項目也不是很多,雖仍保留所有的採集日誌數據,一個磁碟空間也足夠使用。

航空物探資料資料庫的二維表和Oracle大欄位(BLOB)分別存放在不同的物理磁碟(每個磁碟36GB)上,對同時存在有表格數據和大欄位數據的資料庫表(如航跡線數據)時,可以提高磁碟I/O效率。隨著數據入庫的項目越來越多,需要增加相應的物理磁碟或磁碟陣列。

系統維護資料庫相對穩定,佔用磁碟空間約500 M左右。由於系統磁碟有限,把日誌文件存放該磁碟中。

(三)撤銷表和臨時表空間的設置

在Oracle資料庫中,撤銷的目的是確保事務的回退和恢復。撤銷參數有UNDO_MANAGEMENT、UNDO_TABLESPACE和UNDO_RETENTION。

UNDO_MANAGEMENT參數用於資料庫中管理撤銷數據的方式,航空物探資料庫設置為自動模式(auto)。

UNDO_TABLESPACE參數用於指定資料庫中保存撤銷數據的撤銷表空間名稱,航空物探資料庫撤銷表空間名稱為UNDO_ARGS_TBSPACE,空間大小設置為20GB,以確保在保留時間內進行恢復。

UNDO_RETENTION參數用於指定已經提交事務的撤銷數據在能夠覆蓋之前應該保留多長時間,本資料庫系統設置為60 min。

臨時表空間是用以存儲大量的排序,與撤銷表空間存放在一個物理磁碟上,本資料庫系統臨時表空間設置為500 M。

(四)日誌空間設置

日誌的主要功能是記錄對資料庫已做過的全部操作。在系統出現故障時,如果不能將修改數據永久地寫入數據文件,則可利用日誌得到該修改,所以不會丟失已有操作結果。

日誌文件主要是保護資料庫以防止故障。為了防止日誌文件本身的故障,航空物探資料庫系統分別在一個獨立磁碟和系統維護庫磁碟中存放日誌文件。若系統出現故障,在下次打開資料庫時Oracle資料庫系統自動用日誌文件中的信息來恢復資料庫文件。

根據航空物探資料庫信息系統同時登錄的用戶數及使用的功能,將日誌文件大小設置為10GB。

(五)索引表空間設置

為了提高航空物探信息系統的查詢和統計速度,把所有索引空間與應用表空間完全分開,從而提高I/O存取效率。航空物探索引表空間大小設置為10GB。

聚集是表的一種存儲方法,一般每個基本表是單獨組織的,但對邏輯上經常在一起查詢的表,在物理上也鄰近存放,這樣可減少數據的搜索時間,提高性能。

當幾個關系(表)以聚集方式組織時,是通過公共屬性的值為表聚集的依據。航空物探資料庫系統是以項目標識(PROJ_ID)建立聚集的,所有涉及項目標識的資料庫表直接引用項目標識聚集。航空物探聚集表空間與索引表空間相同。

三、資料庫參數設置

在資料庫創建前需要對如下資料庫參數進行設置,航空物探參數文件名為Initoraargs.ora,各種參數設置如下:

航空物探信息系統建設

四、內存設置

航空物探資料庫伺服器物理內存為4GB,除部分用於系統開銷外,其餘全部用於資料庫。

Oracle使用共享系統全局區(System Global Area,SGA)內存來管理內存和文件結構,包含DB_block_Buffers、DB_cache_size、Shared_pool_size、Log_Buffer參數。航空物探資料庫系統的全局區內存參數設置如下。

DB_block_Buffers參數為SGA中存儲區高速緩存的緩沖區數目,每個緩沖區的大小等於參數DB_block_size的大小,DB_block_Buffers=19200(約300 MB)。

Shared_pool_size參數為分配給共享SQL區的位元組數,是SGA大小的主要影響者,Shared_pool_size=1228800000(1.2GB)。

DB_cache_size參數是SGA大小和資料庫性能的最重要的決定因素。該值較高,可以提高系統的命中率,減少I/O,DB_cache_size=1024000000(1GB)。

Log_Buffer參數為重做日誌高速緩存大小,主要進行插入、刪除和修改回退操作,Log_buffer=5120000(5MB)。

五、優化設置

由於航空物探信息系統的採集軟體和應用軟體是採用MS.NET C#進行開發的,應用程序與資料庫之間的連接有傳統的ODBC和OLE DB兩種方式。為了支持ODBC在OLE DB技術上建立了相應的OLE DB到ODBC的調用轉換,而使用直接的OLE DB方式則不需轉換,從而提高處理速度。

在建立資料庫表時,參數Pctfree和Pctused設置不正確可能會導致數據出現行鏈接和行遷移現象,即同一行的數據被保存在不同的數據塊中。在進行數據查詢時,為了讀出這些數據,磁頭必須重新定位,這樣勢必會大大降低資料庫的執行速度。因此,在創建表時應充分估計到將來可能出現的數據變化,正確地設置這兩個參數,盡量減少資料庫中出現的行鏈接和行遷移現象。

航空物探資料採集資料庫表的插入、修改和刪除的頻率較高,Pctfree設置為20,Pctused設置為40;系統維護資料庫表相對穩定,Pctfree設置為10,Pctused設置為15;資料資料庫表除了增加數據外基本不進行修改和刪除操作,Pctfree設置為10,Pctused設置為5。

六、擴展性設置

多CPU和並行查詢PQO(Parallel Query Option)方式的利用:CPU的快速發展使得Oracle越來越重視對多CPU的並行技術的應用,一個資料庫的訪問工作可以用多個CPU相互配合來完成。對於多CPU系統盡量採用並行查詢選項方式進行資料庫操作。航空物探資料庫伺服器為2個CPU,在程序查詢中採用了並行查詢的方式。

在航空物探工作量統計、飛行小時統計、測量面積統計和岩石物性統計中,為了加快統計效率,在相應的查詢語句中增加了並行查詢語句。

隨著航空物探高精度測量程度的不斷提高,測量數據將越來越大。為了滿足航空物探查詢效率及發展,將航磁測量數據與校正後航磁測量數據按比例尺分1∶20 萬以下、20萬~50萬、1∶50萬以上分別存放3張不同的資料庫表。

七、創建資料庫

在完成資料庫布局、空間設置、內存設置、資料庫參數設置、擴展性設置和優化設置後,進行航空物探資料庫物理模型設計,即航空物探資料庫實體創建。由於航空物探空間資料庫邏輯模型是採用ESRI提供的ArcGIS UML構建的Geodatabase模型,因此,使用ESRI公司提供的CaseTools將航空物探數據UML模型圖轉成空間資料庫(Geodatabase)實體(圖2-14)。

航空物探屬性資料庫表(二維表)是採用Power Designer資料庫設計平台直接把資料庫關系模型生成資料庫腳本來創建的。

經過資料庫的概念設計、邏輯設計和物理設計,最終生成航空物探資料庫。

圖2-14 航空物探資料庫物理模型實現

八、空間數據的索引機制

對於海量的空間資料庫而言,資料庫的操作效率是關繫到資料庫成敗的關鍵問題。為了提高數據的訪問、檢索和顯示速度,數據在載入到資料庫時,要素類數據建立了空間索引,柵格數據構建了金字塔結構,對象類數據採用與資料庫直接聯接的訪問機制。

(一)空間索引

為了提高要素類數據的查詢性能,在建立航空物探空間資料庫時,創建了空間索引機制。常用的空間索引有格網索引、R樹索引、四叉樹索引等。Geodatabase採用格網索引方式。所謂格網索引是將空間區域劃分成適合大小的正方形格網,記錄每一個格網內所包含的空間實體(對象)以及每一個實體的封裝邊界范圍,即包圍空間實體的左下角和右上角坐標。當用戶進行空間查詢時,首先計算出用戶查詢對象所在格網,然後通過格網編號,就可以快速檢索到所需的空間實體。

確定適合的格網級數、單元大小是建立空間格網索引的關鍵。格網太大,在一個格網內有多個空間實體,查詢檢索的准確度降低。格網太小,則索引數據量成倍增長和冗餘,檢索的速度和效率較低。資料庫的每一數據層採用不同大小、不同級數的空間索引格網單元,但每層最多級數不能超過三級。格網單元的大小不是一個確定性的值,需要根據對象的大小確定。空間索引格網的大小與檢索准確度之間的關系如圖2-15所示。

選擇格網單元的大小遵循下列基本原則:

1)對於簡單要素的數據層,盡可能選擇單級索引格網。減少RDBMS搜索格網單元索引的級數,縮短空間索引搜索的過程,例如航跡線要素類。

圖2-15 索引格網大小與檢索准確度的關系

2)如果數據層中的要素封裝邊界大小變化比較大,應選擇2或3級索引格網。Geodatabase最多提供三級格網單元。每一要素封裝邊界在適合的級內,減少了每一封裝邊界有多個格網的可能性。在空間索引搜索過程中,RDBMS則必須搜索所有3個格網單元級,這將消耗大量的時間。

3)若用戶經常對圖層執行相同的查詢,最佳格網的大小應是平均查尋空間范圍的1.5倍。

4)格網的大小不能小於要素封裝邊界的平均大小,為了減少每個格網單元有多個要素封裝邊界的可能性,格網單元的大小應取平均格網單元的3倍。最佳格網單元的大小可能受圖層平均查詢的影響。

空間域是按照要素數據集定義的,空間索引格網是按照要素類設置的。它們都是在創建Geodatabase資料庫時設置,並一經設置,中間不許改變;所以一定要在充分分析數據的情況下確定它們的值。航空物探數據主要是簡單要素類,空間跨度為70°。根據上述原則,航空物探數據選擇單級索引格網,格網大小為20°。

(二)金字塔結構

金字塔結構的核心是將柵格數據逐級進行抽稀,形成多級解析度的重采樣數據,並將其分割成塊,按一定的文件格式(金字塔文件格式)存儲成磁碟文件;在以後進行圖像顯示處理時,只需將要顯示的部分所覆蓋的塊從磁碟文件直接讀進內存緩沖區顯示即可。從金字塔的所有層中尋找與所要求顯示的比例相近或匹配的一層,並將該層的從某一點起的一定范圍的圖像所覆蓋的所有塊載入到內存緩沖區,提取所需部分並形成圖像。

金字塔演算法(圖2-16)是通過獲取顯示時所需要的一定解析度的數據來提高顯示速度。使用金字塔數據格式後,在顯示全圖時僅需要顯示一個較低解析度的數據,這樣既能加快顯示速度,又不會影響顯示效果。放大圖像,盡管顯示圖像解析度提高,由於顯示區域減小,所以顯示速度不會下降。如果沒有為柵格數據建立金字塔數據,則每次顯示都會讀取整個數據,然後進行重采樣得到顯示所需要的解析度,明顯地降低了顯示速度。

圖2-16 金字塔壓縮示意圖

金字塔數據重采樣方式有:最近鄰法、雙線性內插和立方卷積。其中最近鄰法適用於離散數據,而雙線性內插法和立方卷積法適合於連續數據。

在ArcGIS Engine中提供了IRasterPyramid和IRasterPyramid2介面來實現金字塔數據的建立,而建立的數據保存在*.rrd格式的文件中。

(三)空間域定義

空間域是指數據的有效空間范圍,即Geodatabase資料庫的最大等效坐標的值域范圍,其定義主要是指比例系數和Min X、Min Y的計算。

因為使用整數比浮點數有更高的壓縮率,並且對整數進行二進制搜索比較快,所以多用戶Geodatabase以4位元組正整數存儲坐標,其最大值為32位正整數所能表示的范圍是21.4億(2147483647),整數的范圍稱為空間域。在創建Geodatabase資料庫時需要定義合適的比例系數。大的整數值將消耗大量的計算機物理內存,所以選定的比例系數最好不要大於必須的比例系數。空間域隨坐標系的單位變化而變化。

比例系數和空間域之間成反比例關系,比例系數越大(存儲單位越小),表達的空間域也越小。為了使目標數據都存儲在系統中,需要謹慎地設置比例系數。將目標數據的寬度和高度較適中的數值乘以比例系數,如果結果小於21.4億,則比例系數是合適的。

航空物探數據模型是為我國的航空物探行業數據建庫設計的,它支持的空間數據的坐標范圍為我國領土覆蓋的海陸空間,最低緯度為赤道。根據概念設計的分析,航空物探數據模型採用的是地理坐標系,坐標系單位是度,基準是Beijing_1954,要求存儲的坐標數據精度達到0.01 m。在赤道處,赤道圓周長為40075694.6 m,則每度弧長=40075694.6×100/360 cm=11132137.389 cm,即1 cm對應8.983000883E-8°。所以,航空物探數據模型的比例系數取為8.98E-8,即存儲單位為8.98E-8°,可滿足1 cm精度要求。

將空間域移動到目標數據范圍之前,首先找到空間域在存儲單位的中心位置,目的是在必要時向各個方向擴展。4位元組正整數可表示的坐標范圍:2147483647×8.98E-8=192.84°。我國的領土范圍是東經70°~140°,北緯0°~60°。所以,選取的比例系數是合適的。把空間域坐標系中心定為90°,然後,計算空間域的Min X、Min Y。

航空物探信息系統建設

航空物探信息系統建設

所以坐標的存儲數據是:

航空物探信息系統建設

航空物探信息系統建設

Ⅲ 什麼是資料庫對象

什麼是資料庫對象
資料庫對象是資料庫的組成部分,常見的有以下幾種:
1 表( )
資料庫中的表與我們日常生活中使用的表格類似,它也是由行(Row) 和列(Column)組成的。列由同類的信息組成,每列又稱為一個欄位,每列的標題稱為欄位名。行包括了若干列信息項。一行數據稱為一個或一條記錄,它表達有一定意義的信息組合。一個資料庫表由一條或多條記錄組成,沒有記錄的表稱為空表。每個表中通常都有一個主關鍵字,用於惟一地確定一條記錄。
2 索引(Index)
索引是根據指定的資料庫表列建立起來的順序。它提供了快速訪問數據的途徑,並且可監督表的數據,使其索引所指向的列中的數據不重復。
3 視圖(View)
視圖看上去同表似乎一模一樣,具有一組命名的欄位和數據項,但它其實是一個虛擬的表,在資料庫中並不實際存。在視圖是由查詢資料庫表產生的,它限制了用戶能看到和修改的數據。由此可見,視圖可以用來控制用戶對數據的訪問,並能簡化數據的顯示,即通過視圖只顯示那些需要的數據信息。
4 圖表(Diagram)
圖表其實就是資料庫表之間的關系示意圖。利用它可以編輯表與表之間的關系。
5 預設值(Default)
預設值是當在表中創建列或插入數據時,對沒有指定其具體值的列或列數據項賦予事先設定好的值。
6 規則(Rule)
規則是對資料庫表中數據信息的限制。它限定的是表的列。
7 觸發器(Trigger)
觸發器是一個用戶定義的SQL事務命令的集合。當對一個表進行插入、更改、刪除時,這組命令就會自動執行。
8 存儲過程(Stored Procere)
存儲過程是為完成特定的功能而匯集在一起的一組SQL 程序語句,經編譯後存儲在資料庫中的SQL 程序。
9 用戶(User)
所謂用戶就是有許可權訪問資料庫的人。

Ⅳ 數據字典

數據字典是存儲「關於數據項的數據」,它記錄有關數據的來源、說明、與其他數據的關系、用途和格式等信息。數據字典的組成主要包括三部分內容:數據表信息,數據字典管理信息和數據項(欄位)信息(圖4-1)。

圖4-1 數據字典組成示意圖

數據字典管理信息是唯一不重復的部分,數據表和數據項信息是可重復使用的部分。

數據字典的使用對象主要是數據管理人員和系統開發人員。系統開發人員在開發階段必須依據數據字典完成各部分內容的開發,因為本系統較為龐大復雜,涉及的數據項很多,系統又分成了4個子系統,各子系統下又有許多分系統或功能模塊,要保證眾多的開發人員完成各自模塊後的順利集成,就需要依據數據字典進行數據操作的有關開發。通過數據字典,也便於數據管理人員對數據進行歸納整理,提高用戶輸入速度,使系統更加容易維護,管理人員對數據字典的操作具有口令認證、數據的添加、刪除、編輯修改和檢索功能。

本系統主要建立以下數據字典:

(1)資料庫名字典:描述基礎資料庫、主題資料庫和成果資料庫中各個資料庫表空間的庫名定義、庫名描述、表名定義、表名描述等內容。

(2)數據表名字典:定義基礎資料庫、主題資料庫和成果資料庫中各個表中欄位的定義,包括表名、欄位名、欄位描述、備注等內容。

(3)資料庫表結構字典:描述綜合資料庫中各個用戶定義表的具體結構描述,包括表名、欄位代碼、中文內容、類型、長度、小數位數、主鍵、非空欄位等內容。

Ⅳ 資料庫關系圖

對於任何資料庫,都可以創建任意多個資料庫關系圖;每個資料庫表都可以出現在任意數量的關系圖中。這樣,便可以創建不同的關系圖使資料庫的不同部分可視化,或強調設計的不同方面。例如,可以創建一個大型關系圖來顯示所有表和列,並且可以創建一個較小的關系圖來顯示所有表但不顯示列。

所創建的每個資料庫關系圖都存儲在相關聯的資料庫中。

Ⅵ 安卓程序開發,在程序裡面如何使用SQLite資料庫。求操作流程示意圖

http://m.blog.csdn.net/article/details?id=30237597
你看看這篇文章

Ⅶ 求SQL資料庫安裝步驟教程

在使用 SQL Server 的過程中,用戶遇到的最多的問題莫過於連接失敗了。一般而言
,有以下兩種連接 SQL Server 的方式,一是利用 SQL Server 自帶的客戶端工具,如企業管
理器、查詢分析器、事務探查器等;二是利用用戶自己開發的客戶端程序,如ASP 腳本、VB程
序等,客戶端程序中又是利用 ODBC 或者 OLE DB 等連接 SQL Server。下面,我們將就這兩
一、客戶端工具連接失敗
在使用 SQL Server 自帶的客戶端工具(以企業管理器為例)連接 SQL Server時,
1、SQL Server 不存在或訪問被拒絕
ConnectionOpen (Connect())

2、用戶'sa'登錄失敗。原因:未與信任 SQL Server 連接相關聯。

3、超時已過期。

下面我們依次介紹如何來解決這三個最常見的連接錯誤。
第一個錯誤"SQL Server 不存在或訪問被拒絕"通常是最復雜的,錯誤發生的原因比
較多,需要檢查的方面也比較多。一般說來,有以下幾種可能性:
1、SQL Server名稱或IP地址拼寫有誤;
2、伺服器端網路配置有誤;
3、客戶端網路配置有誤。
要解決這個問題,我們一般要遵循以下的步驟來一步步找出導致錯誤的原因。
首先,檢查網路物理連接:
ping <伺服器IP地址>

或者
ping <伺服器名稱>
如果 ping <伺服器IP地址> 失敗,說明物理連接有問題,這時候要檢查硬體設備
,如網卡、HUB、路由器等。還有一種可能是由於客戶端和伺服器之間安裝有防火牆軟體造成
的,比如 ISA Server。防火牆軟體可能會屏蔽對 ping、telnet 等的響應,因此在檢查連接
問題的時候,我們要先把防火牆軟體暫時關閉,或者打開所有被封閉的埠。
如果ping <伺服器IP地址> 成功而 ping <伺服器名稱> 失敗,則說明名字解析
有問題,這時候要檢查 DNS 服務是否正常。有時候客戶端和伺服器不在同一個區域網裡面,
這時候很可能無法直接使用伺服器名稱來標識該伺服器,這時候我們可以使用HOSTS文件來進
1、使用記事本打開HOSTS文件(一般情況下位於C:WINNTsystem32driversetc)
2、添加一條IP地址與伺服器名稱的對應記錄,如:
172.168.10.24 myserver
也可以在 SQL Server 的客戶端網路實用工具裡面進行配置,後面會有詳細說明。
其次,使用 telnet 命令檢查SQL Server伺服器工作狀態:
telnet <伺服器IP地址> 1433
如果命令執行成功,可以看到屏幕一閃之後游標在左上角不停閃動,這說明 SQL
Server 伺服器工作正常,並且正在監聽1433埠的 TCP/IP 連接;如果命令返回"無法打開
連接"的錯誤信息,則說明伺服器端沒有啟動 SQL Server 服務,也可能伺服器端沒啟用
TCP/IP 協議,或者伺服器端沒有在 SQL Server 默認的埠1433上監聽。
接著,我們要到伺服器上檢查伺服器端的網路配置,檢查是否啟用了命名管道,是否
啟用了 TCP/IP 協議等等。我們可以利用 SQL Server 自帶的伺服器網路使用工具來進行檢查
點擊:程序 -> Microsoft SQL Server -> 伺服器網路使用工具,打開該工具後看
到的畫面如下圖所示:

從這里我們可以看到伺服器啟用了哪些協議。一般而言,我們啟用命名管道以及
點中 TCP/IP 協議,選擇"屬性",我們可以來檢查 SQK Server 服務默認埠的設置
,如下圖所示:

一般而言,我們使用 SQL Server 默認的1433埠。如果選中"隱藏伺服器",則意味
著客戶端無法通過枚舉伺服器來看到這台伺服器,起到了保護的作用,但不影響連接。
檢查完了伺服器端的網路配置,接下來我們要到客戶端檢查客戶端的網路配置。我們
同樣可以利用 SQL Server 自帶的客戶端網路使用工具來進行檢查,所不同的是這次是在客戶
點擊:程序 -> Microsoft SQL Server -> 客戶端網路使用工具, 打開該工具後
看到的畫面如下圖所示:

從這里我們可以看到客戶端啟用了哪些協議。一般而言,我們同樣需要啟用命名管道
點擊 TCP/IP 協議,選擇"屬性",可以檢查客戶端默認連接埠的設置,如下圖所示


該埠必須與伺服器一致。
單擊"別名"選項卡,還可以為伺服器配置別名。伺服器的別名是用來連接的名稱,連
接參數中的伺服器是真正的伺服器名稱,兩者可以相同或不同。如下圖中,我們可以使用
myserver來代替真正的伺服器名稱sql2kcn-02,並且使用網路庫 Named Pipes。別名的設置與
使用HOSTS文件有相似之處。

通過以上幾個方面的檢查,錯誤 1 發生的原因基本上可以被排除。下面我們再詳細
當用戶嘗試在查詢分析器裡面使用sa來連接SQL Server,或者在企業管理器裡面使用
sa來新建一個SQL Server注冊時,經常會遇到如圖 2 所示的錯誤信息。該錯誤產生的原因是
由於SQL Server使用了"僅 Windows"的身份驗證方式,因此用戶無法使用SQL Server的登錄帳
戶(如 sa )進行連接。解決方法如下所示:
1、 在伺服器端使用企業管理器,並且選擇"使用 Windows 身份驗證"連接上 SQL
2、 展開"SQL Server組",滑鼠右鍵點擊SQL Server伺服器的名稱,選擇"屬性",再
3、 在"身份驗證"下,選擇"SQL Server和 Windows "。
4、 重新啟動SQL Server服務。
在以上解決方法中,如果在第 1 步中使用"使用 Windows 身份驗證"連接 SQL
Server 失敗,那麼我們將遇到一個兩難的境地:首先,伺服器只允許了 Windows 的身份驗
證;其次,即使使用了 Windows 身份驗證仍然無法連接上伺服器。這種情形被形象地稱之為
"自己把自己鎖在了門外",因為無論用何種方式,用戶均無法使用進行連接。實際上,我們可
以通過修改一個注冊表鍵值來將身份驗證方式改為 SQL Server 和 Windows 混合驗證,步驟
1、點擊"開始"-"運行",輸入regedit,回車進入注冊表編輯器;
2、依次展開注冊表項,瀏覽到以下注冊表鍵:
[HKEY_LOCAL_]
3、在屏幕右方找到名稱"LoginMode",雙擊編輯雙位元組值;
4、將原值從1改為2,點擊"確定";
5、關閉注冊表編輯器;
6、重新啟動SQL Server服務。
此時,用戶可以成功地使用sa在企業管理器中新建SQL Server注冊,但是仍然無法使
用Windows身份驗證模式來連接SQL Server。這是因為在 SQL Server 中有兩個預設的登錄帳
戶:BUILTINAdministrators 以及 <機器名>Administrator 被刪除。要恢復這兩個帳戶
1、打開企業管理器,展開伺服器組,然後展開伺服器;
2、展開"安全性",右擊"登錄",然後單擊"新建登錄";
3、在"名稱"框中,輸入 BUILTINAdministrators;
4、在"伺服器角色"選項卡中,選擇"System Administrators" ;
5、點擊"確定"退出;
6、使用同樣方法添加 <機器名>Administrator 登錄。
以下注冊表鍵
HKEY_LOCAL_LoginMode
的值決定了SQL Server將採取何種身份驗證模式。該值為1,表示使用Windows 身份
驗證模式;該值為2,表示使用混合模式(Windows 身份驗證和 SQL Server 身份驗證)。
看完如何解決前兩個錯誤的方法之後,讓我們來看一下如圖 3 所示的第三個錯誤。
如果遇到第三個錯誤,一般而言表示客戶端已經找到了這台伺服器,並且可以進行連
接,不過是由於連接的時間大於允許的時間而導致出錯。這種情況一般會發生在當用戶在
Internet上運行企業管理器來注冊另外一台同樣在Internet上的伺服器,並且是慢速連接時,
有可能會導致以上的超時錯誤。有些情況下,由於區域網的網路問題,也會導致這樣的錯誤。
要解決這樣的錯誤,可以修改客戶端的連接超時設置。默認情況下,通過企業管理器
注冊另外一台SQL Server的超時設置是 4 秒,而查詢分析器是 15 秒(這也是為什麼在企業
1、在企業管理器中,選擇菜單上的"工具",再選擇"選項";
2、在彈出的"SQL Server企業管理器屬性"窗口中,點擊"高級"選項卡;
3、在"連接設置"下的"登錄超時(秒)"右邊的框中輸入一個比較大的數字,如 20
查詢分析器中也可以在同樣位置進行設置。
二、應用程序連接失敗
以上的三種錯誤信息都是發生在 SQL Server 自帶的客戶端工具中,在應用程序中我
Microsoft OLE DB Provider for SQL Server (0x80004005)
[DBNETLIB][ConnectionOpen (Connect()).]Specified SQL server not found.
Microsoft OLE DB Provider for SQL Server (0x80004005)
用戶 'sa' 登錄失敗。原因: 未與信任 SQL Server 連接相關聯。
Microsoft OLE DB Provider for ODBC Drivers 錯誤 '80004005'.
[Microsoft][ODBC SQL Server Driver]超時已過期.
首先,讓我們來詳細看以下的示意圖來了解一下使用 ODBC 和使用 OLE DB 連接
SQL Server 有什麼不同之處。

從上圖中,我們可以看出在實際使用中,應用程序創建和使用各種 ADO 對象,ADO
對象框架調用享用的 OLE DB 提供者。為了訪問 SQL Server 資料庫,OLE DB 提供了兩種不
同的方法:用於 SQL Server 的 OLE DB 提供者以及用於 ODBC 的 OLE DB 提供者。這兩種不
同的方法對應於兩種不同的連接字元串,標準的連接字元串寫法如下所示:
1、使用用於 SQL Server 的 OLE DB 提供者:
使用 SQL Server 身份驗證:
oConn.Open "Provider=sqloledb;" & _
"Data Source=myServerName;" & _
"Initial Catalog=myDatabaseName;" & _
"User Id=myUsername;" & _
"Password=myPassword"
使用 Windows 身份驗證(信任連接):
oConn.Open "Provider=sqloledb;" & _
"Data Source=myServerName;" & _
"Initial Catalog=myDatabaseName;" & _
"Integrated Security=SSPI"
2、使用用於 ODBC 的 OLE DB 提供者(不使用 ODBC 數據源):
使用 SQL Server 身份驗證:
oConn.Open "Driver={SQL Server};" & _
"Server=MyServerName;" & _
"Database=myDatabaseName;" & _
"Uid=myUsername;" & _
"Pwd=myPassword"
使用 Windows 身份驗證(信任連接):
oConn.Open "Driver={SQL Server};" & _
"Server=MyServerName;" & _
"Database=myDatabaseName;" & _
"Trusted_Connection=yes"
3、使用用於 ODBC 的 OLE DB 提供者(使用 ODBC 數據源):
oConn.Open "DSN=mySystemDSN;" & _
"Uid=myUsername;" & _
"Pwd=myPassword"
如果遇到連接失敗的情況,我們只要按照一中所示的方法,結合程序中的連接字元串
進行檢查,基本都能得到解決。另外,還有以下幾個要注意的地方:
1、配置 ODBC 數據源時,點擊"客戶端"配置選項可以讓我們指定連接使用的網路庫
、埠號等屬性,如下圖所示:

2、如果遇到連接超時的錯誤,我們可以在程序中修改 Connection 對象的超時設置
<%
Set Conn = Server.CreateObject("ADODB.Connection")
DSNtest="DRIVER={SQL Server};SERVER=ServerName;UID=USER;PWD=pass
Conn. Properties("Connect Timeout") = 15 '以秒為單位
Conn.open DSNtest
%>
3、如果遇到查詢超時的錯誤,我們可以在程序中修改 Recordset 對象的超時設置
Dim cn As New ADODB.Connection
Dim rs As ADODB.Recordset
. . .
cmd1 = txtQuery.Text
Set rs = New ADODB.Recordset
rs.Properties("Command Time Out") = 300
'同樣以秒為單位,如果設置為 0 表示無限制
rs.Open cmd1, cn
rs.MoveFirst
. . .
三、小結
本文針對大部分用戶在使用 SQL Server 過程中常見的連接失敗的錯誤,重點討論了
在使用 SQL Server 客戶端工具以及用戶開發的應用程序兩種情況下,如何診斷並解決連接失
敗的錯誤。看過本文以後,相信每一個讀者都會對 SQL Server 的連接工作原理、身份驗證方
式以及應用程序開發等有一個較為全面而深入的連接。本文中所有的測試或者示例均在
Windows 2000 Advanced Server + SQL Server 2000 企業版上通過

Ⅷ 資料庫概念模型

一、航空物探資料庫定位

資料庫是信息系統的基礎和核心,把大量的數據信息按一定的模型組織起來存儲在資料庫中,提供數據維護、數據檢索等功能,使信息系統能方便、及時、准確地從資料庫中獲得所需的信息。因此,資料庫結構設計是信息系統開發的重中之重。

經分析航空物探數據具有空間性、海量性、多源性和多尺度的特點,這說明航空物探數據具有典型的空間數據的特點,可以採用空間數據管理方式進行管理。

ESRI公司的Geodatabase(空間資料庫)是採用標准關系資料庫技術來表現地理信息的面向對象的高級GIS數據模型,是建立在DBMS之上的統一的、智能化的空間數據模型,是以一組相關聯的表來表達地理要素之間關系、有效性規則和值域。對於多源、海量的航空物探數據,Geodatabase能在一個統一的模型框架下很好地解決多源數據一體化存儲的問題,和採用標准關系資料庫技術來表現海量航空物探數據的地理信息特性。Geodatabase引入了地理空間實體的行為、有效性規則和關系,在處理Geodatabase中對象時,對象的基本行為和必須滿足的規則無需通過程序編碼實現,只需根據需要擴展其有效性規則(Geodatabase面向對象的智能化特性),即可支持航空物探數據模型擴展的需要。

因此,航空物探資料庫是空間資料庫,在航空物探資料庫建模過程中,以空間數據建模為主導,統領屬性數據建模。

二、統一空間坐標框架

為了用數學語言描述地球,人們用規則的幾何形體來替代地球表面,從地球自然表面、大地水準面、旋轉橢球面直到用簡單數學函數表達的參考橢球體,以便通過地圖投影將三維曲面轉化成二維平面。由於地球表面不同地區的地形起伏差異很大,採用單一橢球體勢必會造成某地區的誤差小而其他地區誤差很大的結果。因此,在20世紀初不同國家或地區先後採用了逼近本國或本地區地球表面的橢球體,如中國的克拉索夫斯基橢球體,美國的海福特橢球體、英國的克拉克橢球體等。這又造成了目前世界各國的地理信息空間坐標框架不統一,空間數據信息難以共享被動局面。為此,在實現數字地球計劃中,必須規范和統一世界上不同國家和地區的地球參考橢球體。

在小區域表達地球表面時,通常採用平面的方式,即投影坐標系統。如何科學地選擇投影坐標,一般要根據具體的地學應用、地理區域和范圍、比例尺條件等因素來確定,不同的國家有著不同的規定。

通過對航空物探數據的坐標系統進行分析可知,航空物探圖件的坐標框架與國家對基本比例尺制圖的規定相一致,即小比例尺編圖採用Lambert雙標准緯線等角圓錐投影;中比例尺採用Gauss 6°帶的分帶投影;大比例尺採用Gauss 3°帶的分帶投影(表2-1);對於低緯度的海上作業區通常採用Mecator等角圓柱投影。地球橢球體分別採用1954北京坐標系的Krassovsky橢球參數、WGS84橢球參數和未來的國家2000坐標系的橢球參數。

表2-1 航空物探地理坐標數據的投影方式

傳統的航空物探數據是按測區管理的,根據測區的測量比例尺來確定相應的坐標框架;因此,勘探目標不同的測區測量比例尺是不一致的,地坐標框架也不同。航空物探資料庫要將不同測區、不同比例尺、不同坐標框架的數據集中管理和可視表達,若沒有統一的空間坐標框架,就不可能正確地表達全國航空物探數據。所以,面對如此復雜的多坐標框架的航空物探數據,如何確定科學合理的空間坐標框架,將全國的航空物探數據整合到統一的空間參考框架下,實現數據的統一存儲和數據間無縫拼接,是航空物探資料庫建設的關鍵所在,是組織和管理多維、多格式、大跨度、跨平台的航空物探數據和多目標數字制圖的數學基礎。

統一的空間坐標框架必須支持我國領土覆蓋的海域和陸域航空物探數據的存儲和表達。我國領土東西跨度達70°,南北達55°,顯然採用任何投影坐標系都是不合適的。Gauss 6°投影適合6°帶內空間數據表達,若全國航物探數據採用6°分帶表達,在高緯度地區會造成6°帶間數據裂縫問題;Lambert投影可滿足數據的無縫表達,但對大比例尺數據變形較大,無法滿足數據制圖的精度要求;Mecator投影也可滿足數據的無縫表達,低緯度地區也能滿足大比例尺數據制圖的精度要求,但在我國中高緯度區存在著嚴重變形問題。所以,航空物探數據模型採用地理坐標(無投影,圖2-1)格式存放,可根據實際應用的需要將航空物探數據變換到任何方式的投影坐標系統。

航空物探資料庫模型採用Beijing_1954地理坐標系,相關參數如下:

角度單位:°(0.017453292519943299rad)

零經線:格林尼治(0.000000000000000000)

基準:D_Beijing_1954

橢球:Krasovsky_1940

長軸半徑:6378245.000 m

短軸半徑:6356863.019 m

建立統一坐標框架是空間資料庫建設的一項基礎性工作,採用Beijing_1954 地理坐標系作為航空物探資料庫統一空間坐標框架具有以下優點。

圖2-1 統一空間坐標框架示意圖

(一)無縫空間數據存儲

統一空間坐標框架解決了復雜的航空物探數據的坐標系統、投影、比例尺等不統一的問題,實現同一性質的物探數據在同一個主題中進行管理。如全國的航磁異常數據可放在一個圖層上進行管理。

(二)適合多尺度表達

按測區管理的多尺度、多框架的航空物探數據是處於一個相對坐標系統中,各個測區間相對位置關系會發生錯位。採用統一的Beijing_1954地理坐標框架,恢復了各測區間正確的位置關系,實現不同尺度數據的集成和正確表達,易於多源異構空間數據的融合。

(三)大區域數據集成

我國海陸面積近1300×104km2,地域跨度較大。在進行小比例尺的航空物探編圖時,需要選用與之相適應的投影坐標;在陸地和海域進行大比例尺制圖時,同樣需要選用合適投影系統。航空物探制圖的實踐也證明了這一點。1995 年6 月由中國、加拿大、美國、愛爾蘭和俄羅斯等國科學家共同編制的1∶1000萬歐亞東北地區磁異常與大地構造圖,採用橫軸Mercator投影。中心編制的1∶500 萬全國航磁圖採用Lambert投影。2008 年,由中國和吉爾吉斯斯坦科學家編制的1∶100萬中吉天山金屬礦產成礦規律圖,採用Lambert投影,將兩個國家不同時期、不同尺度的數據進行了有效的集成,是地質、地球物理等綜合應用的典範。

隨著航空物探數據應用領域的不斷擴展,陸地、海域,甚至於洲際和全球航空物探數據的整體表達都需對坐標投影提出要求。採用統一的地理坐標框架的航空物探數據非常容易變換到指定的投影坐標框架,滿足多樣化的制圖要求。

三、要素類和對象類的劃分

Geodatabase空間資料庫模型結構(圖2-2)分為空間資料庫、要素數據集(Feature dataset)、要素類(Feature classes)、要素(Feature)4個層次。為了建立航空物探Geodatabase空間數據模型,我們依據Geodatabase模型關於要素類和對象類的劃分原則,結合相關的國家標准和地球物理行業標准,制定了《航空物探數據要素類和對象類劃分標准》,對航空物探數據進行數據分類。

圖2-2 空間資料庫模型結構

1)按照航空物探數據的空間特徵,將其劃分為5個要素數據集,即勘查項目概況要素數據集、基礎數據要素數據集、異常要素數據集、解釋要素數據集和評價要素數據集。

2)根據航空物探測量方法、數據處理過程以及推斷解釋方法和過程,進一步把航空物探數據劃分為若干要素類和對象類,定義了要素類的主題特徵和表達方式,確定子類和屬性域;定義對象類的結構和聯接欄位,建立了關系類。

3)定義要素類的內容、欄位名稱和存儲結構。在航空物探數據採集過程中,不同類型的數據采樣率不同,坐標數據采樣2次/s,重力場數據采樣2次/s,磁場數據采樣10次/s,這就造成了場值數據與坐標數據無法一一對應問題。若按場值數據采樣率內插坐標數據,將導致數據量成倍增長;若按坐標數據采樣率抽稀場值數據,將降低航空物探測量對地質體的分辨能力,影響測量效果。在綜合分析航空物探數據應用基礎上,提出了採用要素數據與屬性數據分置的方式,將測線坐標數據與地球物理場數據分離,分別建立獨立共享的航跡線數據要素類模型,磁場、重力場等數據對象類模型(圖2-3),很好地解決了航空物探數據的存儲問題。

圖2-3 要素數據與屬性數據分置示意圖

採用要素數據與屬性數據分置方式,不僅是基於航空物探數據屬性數據的多源性、不同采樣頻率等特點的考慮,還考慮到數據的綜合查詢和檢索的速度,特別是通過ArcSDE訪問空間資料庫的效率的問題。再者,對於大部分用戶來說,需求是屬性數據的綜合應用,因此在資料庫建模過程中,將屬性數據採用對象類的方式進行管理,不但提高了空間數據的操作能力,同時在ArcSDE的配置上採用直接訪問資料庫(對象類)方式,並且加快了數據查詢和統計的速度。

四、資料庫概念模型

用戶需求是資料庫建設的約束條件之一。航空物探數據的空間特性決定航空物探資料庫必須是空間資料庫,採用資料庫管理數據,利用GIS技術提供可視化服務,這是各個層次用戶的一致要求。因此,我們從現實世界出發,對航空物探數據的多源性、多尺度和不同采樣等問題進行了描述,提出了解決方案。此方案是不依賴於任何具體的硬體環境和資料庫管理系統(DBMS),建立了客觀反映現實世界的航空物探資料庫概念模型,把用戶需要管理的信息統一到整體概念結構中,表達了用戶需要。

在全面分析航空物探業務流程和數據流程,以及航空物探數據特性的基礎上,按照《航空物探數據要素類和對象類劃分標准》,以及空間實體點、線、面要素特徵的基本原則,對航空物探資料庫所涉及的實體進行歸類,劃分成12個主題。根據空間數據分主題表達的特點和航空物探空間數據坐標框架的定義,確定航空物探資料庫空間數據概念模型,明確各個主題的用途、數據來源、表達方式、空間參考、比例尺和精度等內容,按照ArcGIS定義空間資料庫的數據分層表達方式(圖2-4),完成航空物探資料庫概念模型設計(圖2-5)。

圖2-4 航空物探資料庫空間數據分層模型

圖2-5 航空物探資料庫空間數據概念模型

Ⅸ mysql資料庫怎麼配置

一、概述

MySQL版本:5.7.17

客戶端工具:NavicatforMySQL

二、MySQL安裝

安裝條件:

1).net framework4.0(下載地址:

如果Windows Server 2003 在安裝.net framework4.0安裝過程中報錯:net framework 4.0安裝時提示產生阻滯問題:運行安裝程序前,必須安裝 32 位 Windows 映像處理組件WIC

1、MySQL下載後的文件名為:mysql_installer_community_V5.6.21.1_setup.1418020972.msi,示意圖如下:

20、完成配置

Ⅹ 資料庫結構

新一輪油氣資源評價資料庫是建立在國家層面上的資料庫,資料庫設計首先立足於國家能源政策和戰略制定的宏觀要求,還要結合油氣資源評價的工作特徵和各個評價項目及資源的具體情況。使用當前最流行和最成熟的資料庫技術進行資料庫的總體結構設計。

資料庫的設計以《石油工業資料庫設計規范》為指導標准,以《石油勘探開發數據》為設計基礎,借鑒前人的優秀設計理念和思路,參考國內外優秀的資源評價資料庫和油氣資源資料庫的設計技術優勢,結合本輪資源評價的具體特點,按照面向對象的設計和面向過程的設計相結合的設計方法,進行資料庫的數據劃分設計。

油氣資源評價資料庫要滿足新一輪全國油氣資源評價工作的常規油氣資源評價、煤層氣資源評價、油砂資源評價、油頁岩資源評價四個油氣資源評價的數據需求。進行資料庫具體數據內容設計。

並且,資料庫的設計要為油氣資源評價的快速、動態評價和遠程評價工作的需求保留足夠數據擴展介面,資料庫具有良好開放性、兼容性和可擴充性。

(一)數據劃分

資料庫內存放的數據將支持資源評價的整個過程。為了能更好地管理庫中數據,需要對整個過程中將用到的數據進行分類管理。具體分類方式如下(圖4-11):

圖4-11 數據分類示意圖

1.按照應用類型劃分

按照數據在資源評價過程中的應用類型劃分,可以劃分為基礎數據、參數數據和評價結果數據。

基礎數據是指從勘探生產活動及認識中直接獲取的原始數據,這些數據一般沒有經過復雜的處理和計算過程。如分析化驗數據、鑽井地質數據、盆地基礎數據等。這些數據是整個評價工作的基礎。

參數數據是指在評價過程中各種評價方法和軟體直接使用的參數數據。

評價結果數據是指資源評價中產生的各種評價結果數據,如資源量結果數據、地質評價結果數據等。

2.按照評價對象劃分

本次評價共分為大區、評價單元、計算單元三個層次,在研究中又使用了盆地、一級構造單元,在評價對象總體考慮中按照評價對象將數據劃分為大區、評價單元、計算單元等類型。

3.按照獲取方式劃分

按照獲取方式可以將數據分為直接獲取、研究獲取、間接獲取幾類。

4.按照存儲類型劃分

按照存儲類型可以將數據劃分為結構化數據和非結構化數據。

結構化數據是指能夠用現有的關系資料庫系統直接管理的數據,進一步又可以分為定量數據和定性數據兩類。

非結構化數據是指不能用現有的關系資料庫系統直接管理和操作的數據,它必須藉助於另外的工具管理和操作。如圖件數據、文檔數據等。

庫中數據類型的劃分共分六個層次逐次劃分,包括:數據存儲類型→資源類型→評價對象→應用→獲取方式→數據特徵。

對於結構化存儲的數據在應用層分為三類:基礎數據、中間數據和結果數據,基礎數據中包含用於類比的基礎數據、用於統計分析的基礎數據和直接用於公式運算的基礎數據;結構化存儲的數據在獲取方式上可以繼續劃分,其中,用於公式運算的數據可以細化為專家直接錄入、由地質類比獲取、通過生產過程獲取、通過地質研究過程獲取及其他方式。中間數據可以從以下方式獲取:標准、統計、類比、參數的關聯。結果數據的獲取有兩種方式:公式運算結果和通過鑽井、地質、綜合研究等提交的文字報告。

對於非結構化存儲的數據在應用層分為兩類:圖形數據和文檔數據。

圖形數據在獲取方式上可以繼續劃分成四種方式:通過工程測量數據獲取(如地理圖件、井位坐標數據等)、通過地質研究過程獲取(如沉積相圖、構造區劃圖等)、由綜合研究獲取(如綜合評價圖等)、其他方式。

圖形數據在表現方式上又可以進一步分為有坐標意義的圖形(如構造單元劃分圖、地理圖、井點陣圖等)、數值圖(如產烴率曲線圖、酐洛根熱降解圖等)和無坐標含義圖(如剖面圖)等。

文檔數據是指評價過程中產生的各種報告、項目運行記錄等。

(二)資料庫結構

從業務需求上,根據數據用途、數據類型和數據來源,可將本次的油氣資源評價資料庫分為三級:基礎庫、參數庫、成果庫(圖4-12)。其結構如下:

圖4-12 資料庫結構示意圖

1.基礎庫

基礎庫是油氣資源評價工作的最基礎的原始數據,有實測數據(物探數據、測井數據、鑽井數據、開發數據等)、實驗數據和經驗數據等。

確定基礎數據實際上是一項涉及油田勘探、開發等領域的多學科的復雜工作,是油氣資源評價工作的研究過程和研究成果在資料庫中的具體表現方式。在設計資料庫的過程中,需要與參數研究專家經過多次反復,才能最終確定基礎資料庫,確保基礎資料庫能滿足目前所有評價工作中計算的需要。

2.參數庫

參數庫用於存儲油氣資源評價工作所用到的參數數據,評價軟體,直接從參數庫中提取參數數據,用於計算。參數數據由基礎數據匯總而來,也可以由專家根據經驗直接得到。

本次評價中所涉及的參數大致可以分為以下幾類:①直接應用的參數;②通過標准或類比借用的參數;③通過研究過程或復雜的預處理得到的參數。

3.成果庫

成果庫用於存儲資源評價結果,包括各種計算結果、各種文檔、電子表格、圖片、圖冊等數據。

資料庫的體系結構採用分布式多層資料庫結構,包括三個組成部分:應用服務層、應用邏輯層和數據服務層。

資料庫體系結構如圖4-13所示。

圖4-13 體系結構結構圖

(1)應用服務層:應用服務層包含復雜的事務處理邏輯,應用服務層主要由中間件組件構成。中間件是位於上層應用和下層服務之間的一個軟體層,提供更簡單、可靠和增值服務。並且能夠實現跨庫檢索的關鍵技術。它能夠使應用軟體相對獨立於計算機硬體和操作系統平台,把分散的資料庫系統有機地組合在一起,為應用軟體系統的集成提供技術基礎,中間件具有標准程序介面和協議,可以實現不同硬體和操作系統平台上的數據共享和應用互操作。而在具體實現上,中間件是一個用API定義的分布式軟體管理框架,具有潛在的通信能力和良好的可擴展性能。中間件包含系統功能處理邏輯,位於應用伺服器端。它的任務是接受用戶的請求,以特定的方式向應用伺服器提出數據處理申請,通過執行相應的擴展應用程序與應用服務層進行連接,當得到應用伺服器返回的處理結果後提交給應用伺服器,再由應用伺服器傳送回客戶端。根據國內各大石油公司具體的需求開發相應的地質、油藏、生產等應用軟體功能程序模塊和各種演算法模塊。

(2)應用邏輯層:邏輯數據層是擴展數據服務層邏輯處理層,針對當前的底層資料庫的數據結構,根據具體的需求,應用各種資料庫技術,包括臨時表、視圖、存儲過程、游標、復制和快照等技術手段從底層資料庫中提取相關的數據,構建面向具體應用的邏輯資料庫或者形成一個虛擬的資料庫平台。邏輯數據層包含底層資料庫的部分或全部數據處理邏輯,並處理來自應用服務層的數據請求和訪問,將處理結果返回給邏輯數據層。

形成一個虛擬的資料庫平台我們可以應用資料庫系統中的多個技術來實現。如果系統中的一個節點中的場地或分片數據能夠滿足當前虛擬資料庫,可以在應用服務層中使用大量的查詢,生成一個以數據集結果為主的虛擬資料庫平台,並且由數據集附帶部分資料庫的管理應用策略。或者對節點上的資料庫進行復制方法進行虛擬資料庫的建立。對與需要對多個節點上的資料庫進行綜合篩選,則要對各個節點上的資料庫進行復制,合並各個復制形成一個應用邏輯層,從而建立一個虛擬數據平台。

(3)數據服務層:即資料庫伺服器層,其中包含系統的數據處理邏輯,位於不同的操作系統平台上,不同資料庫平台(異構資料庫),具體完成數據的存儲、數據的完整性約束。也可以直接處理來自應用服務層的數據請求和訪問,將處理結果返回給邏輯數據層或根據邏輯數據層通過提交的請求,返回數據信息和數據處理邏輯方法。

(三)數據建設標准

1.評價數據標准

系統資料庫中的數據格式、大小、類型遵從國家及行業標准,參考的標准如表4-23。

表4-23 資料庫設計參考標准

續表

系統中數據的格式及單位參考《常規油氣資源評價實施方案》、《煤層氣資源評價實施方案》、《油砂資源評價實施方案》、《油頁岩資源評價實施方案》及數據字典。

2.圖形圖件標准

對於地質研究來說,地質類圖件是比較重要的。各種地質評價圖形遵循以下標准(表4-24)。

表4-24 系統圖形遵循的相關標准

系統對圖形的要求為必須為帶有地理坐標意義的、滿足上述標准體系要求的矢量圖形,且採用統一的地理底圖。圖形格式採用:MapGIS圖形交換格式、GeoInfo圖形格式、ArcInfo圖形交換格式、MapInfo圖形交換格式和GeoMap圖形交換格式。

圖件的比例尺要求:

全國性圖件:1∶400萬或1:600萬

大區圖件:1:200萬

盆地圖件:1:40萬或1:50萬

評價單元圖件:1:10萬或1:20萬

圖件的內容要求符合《常規油氣資源評價實施方案》、《煤層氣資源評價實施方案》、《油砂資源評價實施方案》和《油頁岩資源評價實施方案》的規定。

(四)數據內容

資料庫中存儲的數據包括常規油氣相關數據、煤層氣相關數據、油砂相關數據和油頁岩相關數據;還有可采系數研究涉及的數據,包括研究所需基礎數據和研究成果數據;以及趨勢預測相關數據。

熱點內容
塗鴉論文 發布:2021-03-31 13:04:48 瀏覽:698
手機資料庫應用 發布:2021-03-31 13:04:28 瀏覽:353
版面217 發布:2021-03-31 13:04:18 瀏覽:587
知網不查的資源 發布:2021-03-31 13:03:43 瀏覽:713
基金贖回參考 發布:2021-03-31 13:02:08 瀏覽:489
懸疑故事範文 發布:2021-03-31 13:02:07 瀏覽:87
做簡單的自我介紹範文 發布:2021-03-31 13:01:48 瀏覽:537
戰略地圖參考 發布:2021-03-31 13:01:09 瀏覽:463
收支模板 發布:2021-03-31 13:00:43 瀏覽:17
電氣學術會議 發布:2021-03-31 13:00:32 瀏覽:731