數(shù)據(jù)字典是存儲(chǔ)“關(guān)于數(shù)據(jù)項(xiàng)的數(shù)據(jù)”,它記錄有關(guān)數(shù)據(jù)的來源、說明、與其他數(shù)據(jù)的關(guān)系、用途和格式等信息。數(shù)據(jù)字典的組成主要包括三部分內(nèi)容:數(shù)據(jù)表信息,數(shù)據(jù)字典管理信息和數(shù)據(jù)項(xiàng)(字段)信息(圖4-1)。
“只有客戶發(fā)展了,才有我們的生存與發(fā)展!”這是成都創(chuàng)新互聯(lián)的服務(wù)宗旨!把網(wǎng)站當(dāng)作互聯(lián)網(wǎng)產(chǎn)品,產(chǎn)品思維更注重全局思維、需求分析和迭代思維,在網(wǎng)站建設(shè)中就是為了建設(shè)一個(gè)不僅審美在線,而且實(shí)用性極高的網(wǎng)站。創(chuàng)新互聯(lián)對(duì)成都網(wǎng)站建設(shè)、成都網(wǎng)站制作、網(wǎng)站制作、網(wǎng)站開發(fā)、網(wǎng)頁(yè)設(shè)計(jì)、網(wǎng)站優(yōu)化、網(wǎng)絡(luò)推廣、探索永無止境。
圖4-1 數(shù)據(jù)字典組成示意圖
數(shù)據(jù)字典管理信息是唯一不重復(fù)的部分,數(shù)據(jù)表和數(shù)據(jù)項(xiàng)信息是可重復(fù)使用的部分。
數(shù)據(jù)字典的使用對(duì)象主要是數(shù)據(jù)管理人員和系統(tǒng)開發(fā)人員。系統(tǒng)開發(fā)人員在開發(fā)階段必須依據(jù)數(shù)據(jù)字典完成各部分內(nèi)容的開發(fā),因?yàn)楸鞠到y(tǒng)較為龐大復(fù)雜,涉及的數(shù)據(jù)項(xiàng)很多,系統(tǒng)又分成了4個(gè)子系統(tǒng),各子系統(tǒng)下又有許多分系統(tǒng)或功能模塊,要保證眾多的開發(fā)人員完成各自模塊后的順利集成,就需要依據(jù)數(shù)據(jù)字典進(jìn)行數(shù)據(jù)操作的有關(guān)開發(fā)。通過數(shù)據(jù)字典,也便于數(shù)據(jù)管理人員對(duì)數(shù)據(jù)進(jìn)行歸納整理,提高用戶輸入速度,使系統(tǒng)更加容易維護(hù),管理人員對(duì)數(shù)據(jù)字典的操作具有口令認(rèn)證、數(shù)據(jù)的添加、刪除、編輯修改和檢索功能。
本系統(tǒng)主要建立以下數(shù)據(jù)字典:
(1)數(shù)據(jù)庫(kù)名字典:描述基礎(chǔ)數(shù)據(jù)庫(kù)、主題數(shù)據(jù)庫(kù)和成果數(shù)據(jù)庫(kù)中各個(gè)數(shù)據(jù)庫(kù)表空間的庫(kù)名定義、庫(kù)名描述、表名定義、表名描述等內(nèi)容。
(2)數(shù)據(jù)表名字典:定義基礎(chǔ)數(shù)據(jù)庫(kù)、主題數(shù)據(jù)庫(kù)和成果數(shù)據(jù)庫(kù)中各個(gè)表中字段的定義,包括表名、字段名、字段描述、備注等內(nèi)容。
(3)數(shù)據(jù)庫(kù)表結(jié)構(gòu)字典:描述綜合數(shù)據(jù)庫(kù)中各個(gè)用戶定義表的具體結(jié)構(gòu)描述,包括表名、字段代碼、中文內(nèi)容、類型、長(zhǎng)度、小數(shù)位數(shù)、主鍵、非空字段等內(nèi)容。
數(shù)據(jù)字典則是系統(tǒng)中各類數(shù)據(jù)描述的集合,是進(jìn)行詳細(xì)的數(shù)據(jù)收集和數(shù)據(jù)分析所獲得的主要成果.
數(shù)據(jù)字典通常包括數(shù)據(jù)項(xiàng)\數(shù)據(jù)結(jié)構(gòu)\數(shù)據(jù)流\數(shù)據(jù)存儲(chǔ)和處理過程五個(gè)部分.
數(shù)據(jù)字典是關(guān)于數(shù)據(jù)的信息的集合,也就是對(duì)數(shù)據(jù)流圖中包含的所有元素的定義的集合.
組成
1數(shù)據(jù)流
2數(shù)據(jù)流分量,即數(shù)據(jù)元素
3數(shù)據(jù)存儲(chǔ)
4處理
數(shù)據(jù)字典
數(shù)據(jù)庫(kù)的重要部分是數(shù)據(jù)字典。它存放有數(shù)據(jù)庫(kù)所用的有關(guān)信息,對(duì)用戶來說是一組只讀的表。數(shù)據(jù)字典內(nèi)容包括:
數(shù)據(jù)庫(kù)中所有模式對(duì)象的信息,如表、視圖、簇、及索引等。
分配多少空間,當(dāng)前使用了多少空間等。
列的缺省值。
約束信息的完整性。
用戶的名字。
用戶及角色被授予的權(quán)限。
用戶訪問或使用的審計(jì)信息。
其它產(chǎn)生的數(shù)據(jù)庫(kù)信息。
數(shù)據(jù)庫(kù)數(shù)據(jù)字典是一組表和視圖結(jié)構(gòu)。它們存放在SYSTEM表空間中。
數(shù)據(jù)庫(kù)數(shù)據(jù)字典不僅是每個(gè)數(shù)據(jù)庫(kù)的中心。而且對(duì)每個(gè)用戶也是非常重要的信息。用戶可以用SQL語(yǔ)句訪問數(shù)據(jù)庫(kù)數(shù)據(jù)字典
數(shù)據(jù)庫(kù)設(shè)計(jì)方法、規(guī)范與技巧
一、數(shù)據(jù)庫(kù)設(shè)計(jì)過程
數(shù)據(jù)庫(kù)技術(shù)是信息資源管理最有效的手段。數(shù)據(jù)庫(kù)設(shè)計(jì)是指對(duì)于一個(gè)給定的應(yīng)用環(huán)境,構(gòu)造最優(yōu)的數(shù)據(jù)庫(kù)模式,建立數(shù)據(jù)庫(kù)及其應(yīng)用系統(tǒng),有效存儲(chǔ)數(shù)據(jù),滿足用戶信息要求和處理要求。
數(shù)據(jù)庫(kù)設(shè)計(jì)中需求分析階段綜合各個(gè)用戶的應(yīng)用需求(現(xiàn)實(shí)世界的需求),在概念設(shè)計(jì)階段形成獨(dú)立于機(jī)器特點(diǎn)、獨(dú)立于各個(gè)DBMS產(chǎn)品的概念模式(信息世界模型),用E-R圖來描述。在邏輯設(shè)計(jì)階段將E-R圖轉(zhuǎn)換成具體的數(shù)據(jù)庫(kù)產(chǎn)品支持的數(shù)據(jù)模型如關(guān)系模型,形成數(shù)據(jù)庫(kù)邏輯模式。然后根據(jù)用戶處理的要求,安全性的考慮,在基本表的基礎(chǔ)上再建立必要的視圖(VIEW)形成數(shù)據(jù)的外模式。在物理設(shè)計(jì)階段根據(jù)DBMS特點(diǎn)和處理的需要,進(jìn)行物理存儲(chǔ)安排,設(shè)計(jì)索引,形成數(shù)據(jù)庫(kù)內(nèi)模式。
1. 需求分析階段
需求收集和分析,結(jié)果得到數(shù)據(jù)字典描述的數(shù)據(jù)需求(和數(shù)據(jù)流圖描述的處理需求)。
需求分析的重點(diǎn)是調(diào)查、收集與分析用戶在數(shù)據(jù)管理中的信息要求、處理要求、安全性與完整性要求。
需求分析的方法:調(diào)查組織機(jī)構(gòu)情況、調(diào)查各部門的業(yè)務(wù)活動(dòng)情況、協(xié)助用戶明確對(duì)新系統(tǒng)的各種要求、確定新系統(tǒng)的邊界。
常用的調(diào)查方法有: 跟班作業(yè)、開調(diào)查會(huì)、請(qǐng)專人介紹、詢問、設(shè)計(jì)調(diào)查表請(qǐng)用戶填寫、查閱記錄。
分析和表達(dá)用戶需求的方法主要包括自頂向下和自底向上兩類方法。自頂向下的結(jié)構(gòu)化分析方法(Structured Analysis,簡(jiǎn)稱SA方法)從最上層的系統(tǒng)組織機(jī)構(gòu)入手,采用逐層分解的方式分析系統(tǒng),并把每一層用數(shù)據(jù)流圖和數(shù)據(jù)字典描述。
數(shù)據(jù)流圖表達(dá)了數(shù)據(jù)和處理過程的關(guān)系。系統(tǒng)中的數(shù)據(jù)則借助數(shù)據(jù)字典(Data Dictionary,簡(jiǎn)稱DD)來描述。
數(shù)據(jù)字典是各類數(shù)據(jù)描述的集合,它是關(guān)于數(shù)據(jù)庫(kù)中數(shù)據(jù)的描述,即元數(shù)據(jù),而不是數(shù)據(jù)本身。數(shù)據(jù)字典通常包括數(shù)據(jù)項(xiàng)、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)流、數(shù)據(jù)存儲(chǔ)和處理過程五個(gè)部分(至少應(yīng)該包含每個(gè)字段的數(shù)據(jù)類型和在每個(gè)表內(nèi)的主外鍵)。
數(shù)據(jù)項(xiàng)描述={數(shù)據(jù)項(xiàng)名,數(shù)據(jù)項(xiàng)含義說明,別名,數(shù)據(jù)類型,長(zhǎng)度,
取值范圍,取值含義,與其他數(shù)據(jù)項(xiàng)的邏輯關(guān)系}
數(shù)據(jù)結(jié)構(gòu)描述={數(shù)據(jù)結(jié)構(gòu)名,含義說明,組成:{數(shù)據(jù)項(xiàng)或數(shù)據(jù)結(jié)構(gòu)}}
數(shù)據(jù)流描述={數(shù)據(jù)流名,說明,數(shù)據(jù)流來源,數(shù)據(jù)流去向,
組成:{數(shù)據(jù)結(jié)構(gòu)},平均流量,高峰期流量}
數(shù)據(jù)存儲(chǔ)描述={數(shù)據(jù)存儲(chǔ)名,說明,編號(hào),流入的數(shù)據(jù)流,流出的數(shù)據(jù)流,
組成:{數(shù)據(jù)結(jié)構(gòu)},數(shù)據(jù)量,存取方式}
處理過程描述={處理過程名,說明,輸入:{數(shù)據(jù)流},輸出:{數(shù)據(jù)流},
處理:{簡(jiǎn)要說明}}
2. 概念結(jié)構(gòu)設(shè)計(jì)階段
通過對(duì)用戶需求進(jìn)行綜合、歸納與抽象,形成一個(gè)獨(dú)立于具體DBMS的概念模型,可以用E-R圖表示。
概念模型用于信息世界的建模。概念模型不依賴于某一個(gè)DBMS支持的數(shù)據(jù)模型。概念模型可以轉(zhuǎn)換為計(jì)算機(jī)上某一DBMS支持的特定數(shù)據(jù)模型。
概念模型特點(diǎn):
(1) 具有較強(qiáng)的語(yǔ)義表達(dá)能力,能夠方便、直接地表達(dá)應(yīng)用中的各種語(yǔ)義知識(shí)。
(2) 應(yīng)該簡(jiǎn)單、清晰、易于用戶理解,是用戶與數(shù)據(jù)庫(kù)設(shè)計(jì)人員之間進(jìn)行交流的語(yǔ)言。
概念模型設(shè)計(jì)的一種常用方法為IDEF1X方法,它就是把實(shí)體-聯(lián)系方法應(yīng)用到語(yǔ)義數(shù)據(jù)模型中的一種語(yǔ)義模型化技術(shù),用于建立系統(tǒng)信息模型。
使用IDEF1X方法創(chuàng)建E-R模型的步驟如下所示:
2.1 第零步——初始化工程
這個(gè)階段的任務(wù)是從目的描述和范圍描述開始,確定建模目標(biāo),開發(fā)建模計(jì)劃,組織建模隊(duì)伍,收集源材料,制定約束和規(guī)范。收集源材料是這階段的重點(diǎn)。通過調(diào)查和觀察結(jié)果,業(yè)務(wù)流程,原有系統(tǒng)的輸入輸出,各種報(bào)表,收集原始數(shù)據(jù),形成了基本數(shù)據(jù)資料表。
2.2 第一步——定義實(shí)體
實(shí)體集成員都有一個(gè)共同的特征和屬性集,可以從收集的源材料——基本數(shù)據(jù)資料表中直接或間接標(biāo)識(shí)出大部分實(shí)體。根據(jù)源材料名字表中表示物的術(shù)語(yǔ)以及具有“代碼”結(jié)尾的術(shù)語(yǔ),如客戶代碼、代理商代碼、產(chǎn)品代碼等將其名詞部分代表的實(shí)體標(biāo)識(shí)出來,從而初步找出潛在的實(shí)體,形成初步實(shí)體表。
2.3 第二步——定義聯(lián)系
IDEF1X模型中只允許二元聯(lián)系,n元聯(lián)系必須定義為n個(gè)二元聯(lián)系。根據(jù)實(shí)際的業(yè)務(wù)需求和規(guī)則,使用實(shí)體聯(lián)系矩陣來標(biāo)識(shí)實(shí)體間的二元關(guān)系,然后根據(jù)實(shí)際情況確定出連接關(guān)系的勢(shì)、關(guān)系名和說明,確定關(guān)系類型,是標(biāo)識(shí)關(guān)系、非標(biāo)識(shí)關(guān)系(強(qiáng)制的或可選的)還是非確定關(guān)系、分類關(guān)系。如果子實(shí)體的每個(gè)實(shí)例都需要通過和父實(shí)體的關(guān)系來標(biāo)識(shí),則為標(biāo)識(shí)關(guān)系,否則為非標(biāo)識(shí)關(guān)系。非標(biāo)識(shí)關(guān)系中,如果每個(gè)子實(shí)體的實(shí)例都與而且只與一個(gè)父實(shí)體關(guān)聯(lián),則為強(qiáng)制的,否則為非強(qiáng)制的。如果父實(shí)體與子實(shí)體代表的是同一現(xiàn)實(shí)對(duì)象,那么它們?yōu)榉诸愱P(guān)系。
2.4 第三步——定義碼
通過引入交叉實(shí)體除去上一階段產(chǎn)生的非確定關(guān)系,然后從非交叉實(shí)體和獨(dú)立實(shí)體開始標(biāo)識(shí)侯選碼屬性,以便唯一識(shí)別每個(gè)實(shí)體的實(shí)例,再?gòu)暮钸x碼中確定主碼。為了確定主碼和關(guān)系的有效性,通過非空規(guī)則和非多值規(guī)則來保證,即一個(gè)實(shí)體實(shí)例的一個(gè)屬性不能是空值,也不能在同一個(gè)時(shí)刻有一個(gè)以上的值。找出誤認(rèn)的確定關(guān)系,將實(shí)體進(jìn)一步分解,最后構(gòu)造出IDEF1X模型的鍵基視圖(KB圖)。
2.5 第四步——定義屬性
從源數(shù)據(jù)表中抽取說明性的名詞開發(fā)出屬性表,確定屬性的所有者。定義非主碼屬性,檢查屬性的非空及非多值規(guī)則。此外,還要檢查完全依賴函數(shù)規(guī)則和非傳遞依賴規(guī)則,保證一個(gè)非主碼屬性必須依賴于主碼、整個(gè)主碼、僅僅是主碼。以此得到了至少符合關(guān)系理論第三范式的改進(jìn)的IDEF1X模型的全屬性視圖。
2.6 第五步——定義其他對(duì)象和規(guī)則
定義屬性的數(shù)據(jù)類型、長(zhǎng)度、精度、非空、缺省值、約束規(guī)則等。定義觸發(fā)器、存儲(chǔ)過程、視圖、角色、同義詞、序列等對(duì)象信息。
3. 邏輯結(jié)構(gòu)設(shè)計(jì)階段
將概念結(jié)構(gòu)轉(zhuǎn)換為某個(gè)DBMS所支持的數(shù)據(jù)模型(例如關(guān)系模型),并對(duì)其進(jìn)行優(yōu)化。設(shè)計(jì)邏輯結(jié)構(gòu)應(yīng)該選擇最適于描述與表達(dá)相應(yīng)概念結(jié)構(gòu)的數(shù)據(jù)模型,然后選擇最合適的DBMS。
將E-R圖轉(zhuǎn)換為關(guān)系模型實(shí)際上就是要將實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系轉(zhuǎn)化為關(guān)系模式,這種轉(zhuǎn)換一般遵循如下原則:
1)一個(gè)實(shí)體型轉(zhuǎn)換為一個(gè)關(guān)系模式。實(shí)體的屬性就是關(guān)系的屬性。實(shí)體的碼就是關(guān)系的碼。
2)一個(gè)m:n聯(lián)系轉(zhuǎn)換為一個(gè)關(guān)系模式。與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性。而關(guān)系的碼為各實(shí)體碼的組合。
3)一個(gè)1:n聯(lián)系可以轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式,也可以與n端對(duì)應(yīng)的關(guān)系模式合并。如果轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式,則與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性,而關(guān)系的碼為n端實(shí)體的碼。
4)一個(gè)1:1聯(lián)系可以轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式,也可以與任意一端對(duì)應(yīng)的關(guān)系模式合并。
5)三個(gè)或三個(gè)以上實(shí)體間的一個(gè)多元聯(lián)系轉(zhuǎn)換為一個(gè)關(guān)系模式。與該多元聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性。而關(guān)系的碼為各實(shí)體碼的組合。
6)同一實(shí)體集的實(shí)體間的聯(lián)系,即自聯(lián)系,也可按上述1:1、1:n和m:n三種情況分別處理。
7)具有相同碼的關(guān)系模式可合并。
為了進(jìn)一步提高數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的性能,通常以規(guī)范化理論為指導(dǎo),還應(yīng)該適當(dāng)?shù)匦薷?、調(diào)整數(shù)據(jù)模型的結(jié)構(gòu),這就是數(shù)據(jù)模型的優(yōu)化。確定數(shù)據(jù)依賴。消除冗余的聯(lián)系。確定各關(guān)系模式分別屬于第幾范式。確定是否要對(duì)它們進(jìn)行合并或分解。一般來說將關(guān)系分解為3NF的標(biāo)準(zhǔn),即:
表內(nèi)的每一個(gè)值都只能被表達(dá)一次。
??表內(nèi)的每一行都應(yīng)該被唯一的標(biāo)識(shí)(有唯一鍵)。
表內(nèi)不應(yīng)該存儲(chǔ)依賴于其他鍵的非鍵信息。
4. 數(shù)據(jù)庫(kù)物理設(shè)計(jì)階段
為邏輯數(shù)據(jù)模型選取一個(gè)最適合應(yīng)用環(huán)境的物理結(jié)構(gòu)(包括存儲(chǔ)結(jié)構(gòu)和存取方法)。根據(jù)DBMS特點(diǎn)和處理的需要,進(jìn)行物理存儲(chǔ)安排,設(shè)計(jì)索引,形成數(shù)據(jù)庫(kù)內(nèi)模式。
5. 數(shù)據(jù)庫(kù)實(shí)施階段
運(yùn)用DBMS提供的數(shù)據(jù)語(yǔ)言(例如SQL)及其宿主語(yǔ)言(例如C),根據(jù)邏輯設(shè)計(jì)和物理設(shè)計(jì)的結(jié)果建立數(shù)據(jù)庫(kù),編制與調(diào)試應(yīng)用程序,組織數(shù)據(jù)入庫(kù),并進(jìn)行試運(yùn)行。 數(shù)據(jù)庫(kù)實(shí)施主要包括以下工作:用DDL定義數(shù)據(jù)庫(kù)結(jié)構(gòu)、組織數(shù)據(jù)入庫(kù) 、編制與調(diào)試應(yīng)用程序、數(shù)據(jù)庫(kù)試運(yùn)行 6. 數(shù)據(jù)庫(kù)運(yùn)行和維護(hù)階段
數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)經(jīng)過試運(yùn)行后即可投入正式運(yùn)行。在數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)行過程中必須不斷地對(duì)其進(jìn)行評(píng)價(jià)、調(diào)整與修改。包括:數(shù)據(jù)庫(kù)的轉(zhuǎn)儲(chǔ)和恢復(fù)、數(shù)據(jù)庫(kù)的安全性、完整性控制、數(shù)據(jù)庫(kù)性能的監(jiān)督、分析和改進(jìn)、數(shù)據(jù)庫(kù)的重組織和重構(gòu)造。
建模工具的使用
為加快數(shù)據(jù)庫(kù)設(shè)計(jì)速度,目前有很多數(shù)據(jù)庫(kù)輔助工具(CASE工具),如Rational公司的Rational Rose,CA公司的Erwin和Bpwin,Sybase公司的PowerDesigner以及Oracle公司的Oracle Designer等。
ERwin主要用來建立數(shù)據(jù)庫(kù)的概念模型和物理模型。它能用圖形化的方式,描述出實(shí)體、聯(lián)系及實(shí)體的屬性。ERwin支持IDEF1X方法。通過使用ERwin建模工具自動(dòng)生成、更改和分析IDEF1X模型,不僅能得到優(yōu)秀的業(yè)務(wù)功能和數(shù)據(jù)需求模型,而且可以實(shí)現(xiàn)從IDEF1X模型到數(shù)據(jù)庫(kù)物理設(shè)計(jì)的轉(zhuǎn)變。ERwin工具繪制的模型對(duì)應(yīng)于邏輯模型和物理模型兩種。在邏輯模型中,IDEF1X工具箱可以方便地用圖形化的方式構(gòu)建和繪制實(shí)體聯(lián)系及實(shí)體的屬性。在物理模型中,ERwin可以定義對(duì)應(yīng)的表、列,并可針對(duì)各種數(shù)據(jù)庫(kù)管理系統(tǒng)自動(dòng)轉(zhuǎn)換為適當(dāng)?shù)念愋汀?/p>
設(shè)計(jì)人員可根據(jù)需要選用相應(yīng)的數(shù)據(jù)庫(kù)設(shè)計(jì)建模工具。例如需求分析完成之后,設(shè)計(jì)人員可以使用Erwin畫ER圖,將ER圖轉(zhuǎn)換為關(guān)系數(shù)據(jù)模型,生成數(shù)據(jù)庫(kù)結(jié)構(gòu);畫數(shù)據(jù)流圖,生成應(yīng)用程序。
二、數(shù)據(jù)庫(kù)設(shè)計(jì)技巧
1. 設(shè)計(jì)數(shù)據(jù)庫(kù)之前(需求分析階段)
1) 理解客戶需求,詢問用戶如何看待未來需求變化。讓客戶解釋其需求,而且隨著開發(fā)的繼續(xù),還要經(jīng)常詢問客戶保證其需求仍然在開發(fā)的目的之中。
2) 了解企業(yè)業(yè)務(wù)可以在以后的開發(fā)階段節(jié)約大量的時(shí)間。
3) 重視輸入輸出。
在定義數(shù)據(jù)庫(kù)表和字段需求(輸入)時(shí),首先應(yīng)檢查現(xiàn)有的或者已經(jīng)設(shè)計(jì)出的報(bào)表、查詢和視圖(輸出)以決定為了支持這些輸出哪些是必要的表和字段。
舉例:假如客戶需要一個(gè)報(bào)表按照郵政編碼排序、分段和求和,你要保證其中包括了單獨(dú)的郵政編碼字段而不要把郵政編碼糅進(jìn)地址字段里。
4) 創(chuàng)建數(shù)據(jù)字典和ER 圖表
ER 圖表和數(shù)據(jù)字典可以讓任何了解數(shù)據(jù)庫(kù)的人都明確如何從數(shù)據(jù)庫(kù)中獲得數(shù)據(jù)。ER圖對(duì)表明表之間關(guān)系很有用,而數(shù)據(jù)字典則說明了每個(gè)字段的用途以及任何可能存在的別名。對(duì)SQL 表達(dá)式的文檔化來說這是完全必要的。
5) 定義標(biāo)準(zhǔn)的對(duì)象命名規(guī)范
數(shù)據(jù)庫(kù)各種對(duì)象的命名必須規(guī)范。
2. 表和字段的設(shè)計(jì)(數(shù)據(jù)庫(kù)邏輯設(shè)計(jì))
表設(shè)計(jì)原則
1) 標(biāo)準(zhǔn)化和規(guī)范化
數(shù)據(jù)的標(biāo)準(zhǔn)化有助于消除數(shù)據(jù)庫(kù)中的數(shù)據(jù)冗余。標(biāo)準(zhǔn)化有好幾種形式,但Third Normal Form(3NF)通常被認(rèn)為在性能、擴(kuò)展性和數(shù)據(jù)完整性方面達(dá)到了最好平衡。簡(jiǎn)單來說,遵守3NF 標(biāo)準(zhǔn)的數(shù)據(jù)庫(kù)的表設(shè)計(jì)原則是:“One Fact in One Place”即某個(gè)表只包括其本身基本的屬性,當(dāng)不是它們本身所具有的屬性時(shí)需進(jìn)行分解。表之間的關(guān)系通過外鍵相連接。它具有以下特點(diǎn):有一組表專門存放通過鍵連接起來的關(guān)聯(lián)數(shù)據(jù)。
舉例:某個(gè)存放客戶及其有關(guān)定單的3NF 數(shù)據(jù)庫(kù)就可能有兩個(gè)表:Customer 和Order。Order 表不包含定單關(guān)聯(lián)客戶的任何信息,但表內(nèi)會(huì)存放一個(gè)鍵值,該鍵指向Customer 表里包含該客戶信息的那一行。
事實(shí)上,為了效率的緣故,對(duì)表不進(jìn)行標(biāo)準(zhǔn)化有時(shí)也是必要的。
2) 數(shù)據(jù)驅(qū)動(dòng)
采用數(shù)據(jù)驅(qū)動(dòng)而非硬編碼的方式,許多策略變更和維護(hù)都會(huì)方便得多,大大增強(qiáng)系統(tǒng)的靈活性和擴(kuò)展性。
舉例,假如用戶界面要訪問外部數(shù)據(jù)源(文件、XML 文檔、其他數(shù)據(jù)庫(kù)等),不妨把相應(yīng)的連接和路徑信息存儲(chǔ)在用戶界面支持表里。還有,如果用戶界面執(zhí)行工作流之類的任務(wù)(發(fā)送郵件、打印信箋、修改記錄狀態(tài)等),那么產(chǎn)生工作流的數(shù)據(jù)也可以存放在數(shù)據(jù)庫(kù)里。角色權(quán)限管理也可以通過數(shù)據(jù)驅(qū)動(dòng)來完成。事實(shí)上,如果過程是數(shù)據(jù)驅(qū)動(dòng)的,你就可以把相當(dāng)大的責(zé)任推給用戶,由用戶來維護(hù)自己的工作流過程。
3) 考慮各種變化
在設(shè)計(jì)數(shù)據(jù)庫(kù)的時(shí)候考慮到哪些數(shù)據(jù)字段將來可能會(huì)發(fā)生變更。 舉例,姓氏就是如此(注意是西方人的姓氏,比如女性結(jié)婚后從夫姓等)。所以,在建立系統(tǒng)存儲(chǔ)客戶信息時(shí),在單獨(dú)的一個(gè)數(shù)據(jù)表里存儲(chǔ)姓氏字段,而且還附加起始日和終止日等字段,這樣就可以跟蹤這一數(shù)據(jù)條目的變化。
字段設(shè)計(jì)原則
4) 每個(gè)表中都應(yīng)該添加的3 個(gè)有用的字段
??dRecordCreationDate,在VB 下默認(rèn)是Now(),而在SQL Server 下默認(rèn)為GETDATE()
??sRecordCreator,在SQL Server 下默認(rèn)為NOT NULL DEFAULT USER
??nRecordVersion,記錄的版本標(biāo)記;有助于準(zhǔn)確說明記錄中出現(xiàn)null 數(shù)據(jù)或者丟失數(shù)據(jù)的原因
5) 對(duì)地址和電話采用多個(gè)字段
描述街道地址就短短一行記錄是不夠的。Address_Line1、Address_Line2 和Address_Line3 可以提供更大的靈活性。還有,電話號(hào)碼和郵件地址最好擁有自己的數(shù)據(jù)表,其間具有自身的類型和標(biāo)記類別。
6) 使用角色實(shí)體定義屬于某類別的列
在需要對(duì)屬于特定類別或者具有特定角色的事物做定義時(shí),可以用角色實(shí)體來創(chuàng)建特定的時(shí)間關(guān)聯(lián)關(guān)系,從而可以實(shí)現(xiàn)自我文檔化。
舉例:用PERSON 實(shí)體和PERSON_TYPE 實(shí)體來描述人員。比方說,當(dāng)John Smith, Engineer 提升為John Smith, Director 乃至最后爬到John Smith, CIO 的高位,而所有你要做的不過是改變兩個(gè)表PERSON 和PERSON_TYPE 之間關(guān)系的鍵值,同時(shí)增加一個(gè)日期/時(shí)間字段來知道變化是何時(shí)發(fā)生的。這樣,你的PERSON_TYPE 表就包含了所有PERSON 的可能類型,比如Associate、Engineer、Director、CIO 或者CEO 等。還有個(gè)替代辦法就是改變PERSON 記錄來反映新頭銜的變化,不過這樣一來在時(shí)間上無法跟蹤個(gè)人所處位置的具體時(shí)間。
7) 選擇數(shù)字類型和文本類型盡量充足
在SQL 中使用smallint 和tinyint 類型要特別小心。比如,假如想看看月銷售總額,總額字段類型是smallint,那么,如果總額超過了$32,767 就不能進(jìn)行計(jì)算操作了。
而ID 類型的文本字段,比如客戶ID 或定單號(hào)等等都應(yīng)該設(shè)置得比一般想象更大。假設(shè)客戶ID 為10 位數(shù)長(zhǎng)。那你應(yīng)該把數(shù)據(jù)庫(kù)表字段的長(zhǎng)度設(shè)為12 或者13 個(gè)字符長(zhǎng)。但這額外占據(jù)的空間卻無需將來重構(gòu)整個(gè)數(shù)據(jù)庫(kù)就可以實(shí)現(xiàn)數(shù)據(jù)庫(kù)規(guī)模的增長(zhǎng)了。
8) 增加刪除標(biāo)記字段
在表中包含一個(gè)“刪除標(biāo)記”字段,這樣就可以把行標(biāo)記為刪除。在關(guān)系數(shù)據(jù)庫(kù)里不要單獨(dú)刪除某一行;最好采用清除數(shù)據(jù)程序而且要仔細(xì)維護(hù)索引整體性。
3. 選擇鍵和索引(數(shù)據(jù)庫(kù)邏輯設(shè)計(jì))
鍵選擇原則:
1) 鍵設(shè)計(jì)4 原則
??為關(guān)聯(lián)字段創(chuàng)建外鍵。
??所有的鍵都必須唯一。
??避免使用復(fù)合鍵。
??外鍵總是關(guān)聯(lián)唯一的鍵字段。
2) 使用系統(tǒng)生成的主鍵
設(shè)計(jì)數(shù)據(jù)庫(kù)的時(shí)候采用系統(tǒng)生成的鍵作為主鍵,那么實(shí)際控制了數(shù)據(jù)庫(kù)的索引完整性。這樣,數(shù)據(jù)庫(kù)和非人工機(jī)制就有效地控制了對(duì)存儲(chǔ)數(shù)據(jù)中每一行的訪問。采用系統(tǒng)生成鍵作為主鍵還有一個(gè)優(yōu)點(diǎn):當(dāng)擁有一致的鍵結(jié)構(gòu)時(shí),找到邏輯缺陷很容易。
3) 不要用用戶的鍵(不讓主鍵具有可更新性)
在確定采用什么字段作為表的鍵的時(shí)候,可一定要小心用戶將要編輯的字段。通常的情況下不要選擇用戶可編輯的字段作為鍵。
4) 可選鍵有時(shí)可做主鍵
把可選鍵進(jìn)一步用做主鍵,可以擁有建立強(qiáng)大索引的能力。
索引使用原則:
索引是從數(shù)據(jù)庫(kù)中獲取數(shù)據(jù)的最高效方式之一。95%的數(shù)據(jù)庫(kù)性能問題都可以采用索引技術(shù)得到解決。
1) 邏輯主鍵使用唯一的成組索引,對(duì)系統(tǒng)鍵(作為存儲(chǔ)過程)采用唯一的非成組索引,對(duì)任何外鍵列采用非成組索引??紤]數(shù)據(jù)庫(kù)的空間有多大,表如何進(jìn)行訪問,還有這些訪問是否主要用作讀寫。
2) 大多數(shù)數(shù)據(jù)庫(kù)都索引自動(dòng)創(chuàng)建的主鍵字段,但是可別忘了索引外鍵,它們也是經(jīng)常使用的鍵,比如運(yùn)行查詢顯示主表和所有關(guān)聯(lián)表的某條記錄就用得上。
3) 不要索引memo/note 字段,不要索引大型字段(有很多字符),這樣作會(huì)讓索引占用太多的存儲(chǔ)空間。
4) 不要索引常用的小型表
不要為小型數(shù)據(jù)表設(shè)置任何鍵,假如它們經(jīng)常有插入和刪除操作就更別這樣作了。對(duì)這些插入和刪除操作的索引維護(hù)可能比掃描表空間消耗更多的時(shí)間。
4. 數(shù)據(jù)完整性設(shè)計(jì)(數(shù)據(jù)庫(kù)邏輯設(shè)計(jì))
1) 完整性實(shí)現(xiàn)機(jī)制:
實(shí)體完整性:主鍵
參照完整性:
父表中刪除數(shù)據(jù):級(jí)聯(lián)刪除;受限刪除;置空值
父表中插入數(shù)據(jù):受限插入;遞歸插入
父表中更新數(shù)據(jù):級(jí)聯(lián)更新;受限更新;置空值
DBMS對(duì)參照完整性可以有兩種方法實(shí)現(xiàn):外鍵實(shí)現(xiàn)機(jī)制(約束規(guī)則)和觸發(fā)器實(shí)現(xiàn)機(jī)制
用戶定義完整性:
NOT NULL;CHECK;觸發(fā)器
2) 用約束而非商務(wù)規(guī)則強(qiáng)制數(shù)據(jù)完整性
采用數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)的完整性。這不但包括通過標(biāo)準(zhǔn)化實(shí)現(xiàn)的完整性而且還包括數(shù)據(jù)的功能性。在寫數(shù)據(jù)的時(shí)候還可以增加觸發(fā)器來保證數(shù)據(jù)的正確性。不要依賴于商務(wù)層保證數(shù)據(jù)完整性;它不能保證表之間(外鍵)的完整性所以不能強(qiáng)加于其他完整性規(guī)則之上。
3) 強(qiáng)制指示完整性
在有害數(shù)據(jù)進(jìn)入數(shù)據(jù)庫(kù)之前將其剔除。激活數(shù)據(jù)庫(kù)系統(tǒng)的指示完整性特性。這樣可以保持?jǐn)?shù)據(jù)的清潔而能迫使開發(fā)人員投入更多的時(shí)間處理錯(cuò)誤條件。
4) 使用查找控制數(shù)據(jù)完整性
控制數(shù)據(jù)完整性的最佳方式就是限制用戶的選擇。只要有可能都應(yīng)該提供給用戶一個(gè)清晰的價(jià)值列表供其選擇。這樣將減少鍵入代碼的錯(cuò)誤和誤解同時(shí)提供數(shù)據(jù)的一致性。某些公共數(shù)據(jù)特別適合查找:國(guó)家代碼、狀態(tài)代碼等。
5) 采用視圖
為了在數(shù)據(jù)庫(kù)和應(yīng)用程序代碼之間提供另一層抽象,可以為應(yīng)用程序建立專門的視圖而不必非要應(yīng)用程序直接訪問數(shù)據(jù)表。這樣做還等于在處理數(shù)據(jù)庫(kù)變更時(shí)給你提供了更多的自由。
5. 其他設(shè)計(jì)技巧
1) 避免使用觸發(fā)器
觸發(fā)器的功能通??梢杂闷渌绞綄?shí)現(xiàn)。在調(diào)試程序時(shí)觸發(fā)器可能成為干擾。假如你確實(shí)需要采用觸發(fā)器,你最好集中對(duì)它文檔化。
2) 使用常用英語(yǔ)(或者其他任何語(yǔ)言)而不要使用編碼
在創(chuàng)建下拉菜單、列表、報(bào)表時(shí)最好按照英語(yǔ)名排序。假如需要編碼,可以在編碼旁附上用戶知道的英語(yǔ)。
3) 保存常用信息
讓一個(gè)表專門存放一般數(shù)據(jù)庫(kù)信息非常有用。在這個(gè)表里存放數(shù)據(jù)庫(kù)當(dāng)前版本、最近檢查/修復(fù)(對(duì)Access)、關(guān)聯(lián)設(shè)計(jì)文檔的名稱、客戶等信息。這樣可以實(shí)現(xiàn)一種簡(jiǎn)單機(jī)制跟蹤數(shù)據(jù)庫(kù),當(dāng)客戶抱怨他們的數(shù)據(jù)庫(kù)沒有達(dá)到希望的要求而與你聯(lián)系時(shí),這樣做對(duì)非客戶機(jī)/服務(wù)器環(huán)境特別有用。
4) 包含版本機(jī)制
在數(shù)據(jù)庫(kù)中引入版本控制機(jī)制來確定使用中的數(shù)據(jù)庫(kù)的版本。時(shí)間一長(zhǎng),用戶的需求總是會(huì)改變的。最終可能會(huì)要求修改數(shù)據(jù)庫(kù)結(jié)構(gòu)。把版本信息直接存放到數(shù)據(jù)庫(kù)中更為方便。
5) 編制文檔
對(duì)所有的快捷方式、命名規(guī)范、限制和函數(shù)都要編制文檔。
采用給表、列、觸發(fā)器等加注釋的數(shù)據(jù)庫(kù)工具。對(duì)開發(fā)、支持和跟蹤修改非常有用。
對(duì)數(shù)據(jù)庫(kù)文檔化,或者在數(shù)據(jù)庫(kù)自身的內(nèi)部或者單獨(dú)建立文檔。這樣,當(dāng)過了一年多時(shí)間后再回過頭來做第2 個(gè)版本,犯錯(cuò)的機(jī)會(huì)將大大減少。
6) 測(cè)試、測(cè)試、反復(fù)測(cè)試
建立或者修訂數(shù)據(jù)庫(kù)之后,必須用用戶新輸入的數(shù)據(jù)測(cè)試數(shù)據(jù)字段。最重要的是,讓用戶進(jìn)行測(cè)試并且同用戶一道保證選擇的數(shù)據(jù)類型滿足商業(yè)要求。測(cè)試需要在把新數(shù)據(jù)庫(kù)投入實(shí)際服務(wù)之前完成。
7) 檢查設(shè)計(jì)
在開發(fā)期間檢查數(shù)據(jù)庫(kù)設(shè)計(jì)的常用技術(shù)是通過其所支持的應(yīng)用程序原型檢查數(shù)據(jù)庫(kù)。換句話說,針對(duì)每一種最終表達(dá)數(shù)據(jù)的原型應(yīng)用,保證你檢查了數(shù)據(jù)模型并且查看如何取出數(shù)據(jù)。
三、數(shù)據(jù)庫(kù)命名規(guī)范
1. 實(shí)體(表)的命名
1) 表以名詞或名詞短語(yǔ)命名,確定表名是采用復(fù)數(shù)還是單數(shù)形式,此外給表的別名定義簡(jiǎn)單規(guī)則(比方說,如果表名是一個(gè)單詞,別名就取單詞的前4 個(gè)字母;如果表名是兩個(gè)單詞,就各取兩個(gè)單詞的前兩個(gè)字母組成4 個(gè)字母長(zhǎng)的別名;如果表的名字由3 個(gè)單詞組成,從頭兩個(gè)單詞中各取一個(gè)然后從最后一個(gè)單詞中再取出兩個(gè)字母,結(jié)果還是組成4 字母長(zhǎng)的別名,其余依次類推)
對(duì)工作用表來說,表名可以加上前綴WORK_ 后面附上采用該表的應(yīng)用程序的名字。在命名過程當(dāng)中,根據(jù)語(yǔ)義拼湊縮寫即可。注意,由于ORCLE會(huì)將字段名稱統(tǒng)一成大寫或者小寫中的一種,所以要求加上下劃線。
舉例:
定義的縮寫 Sales: Sal 銷售;
Order: Ord 訂單;
Detail: Dtl 明細(xì);
則銷售訂單明細(xì)表命名為:Sal_Ord_Dtl;
2) 如果表或者是字段的名稱僅有一個(gè)單詞,那么建議不使用縮寫,而是用完整的單詞。
舉例:
定義的縮寫 Material Ma 物品;
物品表名為:Material, 而不是 Ma.
但是字段物品編碼則是:Ma_ID;而不是Material_ID
3) 所有的存儲(chǔ)值列表的表前面加上前綴Z
目的是將這些值列表類排序在數(shù)據(jù)庫(kù)最后。
4) 所有的冗余類的命名(主要是累計(jì)表)前面加上前綴X
冗余類是為了提高數(shù)據(jù)庫(kù)效率,非規(guī)范化數(shù)據(jù)庫(kù)的時(shí)候加入的字段或者表
5) 關(guān)聯(lián)類通過用下劃線連接兩個(gè)基本類之后,再加前綴R的方式命名,后面按照字母順序羅列兩個(gè)表名或者表名的縮寫。
關(guān)聯(lián)表用于保存多對(duì)多關(guān)系。
如果被關(guān)聯(lián)的表名大于10個(gè)字母,必須將原來的表名的進(jìn)行縮寫。如果沒有其他原因,建議都使用縮寫。
舉例:表Object與自身存在多對(duì)多的關(guān)系,則保存多對(duì)多關(guān)系的表命名為:R_Object;
表 Depart和Employee;存在多對(duì)多的關(guān)系;則關(guān)聯(lián)表命名為R_Dept_Emp
2. 屬性(列)的命名
1) 采用有意義的列名,表內(nèi)的列要針對(duì)鍵采用一整套設(shè)計(jì)規(guī)則。每一個(gè)表都將有一個(gè)自動(dòng)ID作為主健,邏輯上的主健作為第一組候選主健來定義,如果是數(shù)據(jù)庫(kù)自動(dòng)生成的編碼,統(tǒng)一命名為:ID;如果是自定義的邏輯上的編碼則用縮寫加“ID”的方法命名。如果鍵是數(shù)字類型,你可以用_NO 作為后綴;如果是字符類型則可以采用_CODE 后綴。對(duì)列名應(yīng)該采用標(biāo)準(zhǔn)的前綴和后綴。
舉例:銷售訂單的編號(hào)字段命名:Sal_Ord_ID;如果還存在一個(gè)數(shù)據(jù)庫(kù)生成的自動(dòng)編號(hào),則命名為:ID。
2) 所有的屬性加上有關(guān)類型的后綴,注意,如果還需要其它的后綴,都放在類型后綴之前。
注: 數(shù)據(jù)類型是文本的字段,類型后綴TX可以不寫。有些類型比較明顯的字段,可以不寫類型后綴。
3) 采用前綴命名
給每個(gè)表的列名都采用統(tǒng)一的前綴,那么在編寫SQL表達(dá)式的時(shí)候會(huì)得到大大的簡(jiǎn)化。這樣做也確實(shí)有缺點(diǎn),比如破壞了自動(dòng)表連接工具的作用,后者把公共列名同某些數(shù)據(jù)庫(kù)聯(lián)系起來。
3. 視圖的命名
1) 視圖以V作為前綴,其他命名規(guī)則和表的命名類似;
2) 命名應(yīng)盡量體現(xiàn)各視圖的功能。
4. 觸發(fā)器的命名
觸發(fā)器以TR作為前綴,觸發(fā)器名為相應(yīng)的表名加上后綴,Insert觸發(fā)器加'_I',Delete觸發(fā)器加'_D',Update觸發(fā)器加'_U',如:TR_Customer_I,TR_Customer_D,TR_Customer_U。
5. 存儲(chǔ)過程名
存儲(chǔ)過程應(yīng)以'UP_'開頭,和系統(tǒng)的存儲(chǔ)過程區(qū)分,后續(xù)部分主要以動(dòng)賓形式構(gòu)成,并用下劃線分割各個(gè)組成部分。如增加代理商的帳戶的存儲(chǔ)過程為'UP_Ins_Agent_Account'。
6. 變量名
變量名采用小寫,若屬于詞組形式,用下劃線分隔每個(gè)單詞,如@my_err_no。
7. 命名中其他注意事項(xiàng)
1) 以上命名都不得超過30個(gè)字符的系統(tǒng)限制。變量名的長(zhǎng)度限制為29(不包括標(biāo)識(shí)字符@)。
2) 數(shù)據(jù)對(duì)象、變量的命名都采用英文字符,禁止使用中文命名。絕對(duì)不要在對(duì)象名的字符之間留空格。
3) 小心保留詞,要保證你的字段名沒有和保留詞、數(shù)據(jù)庫(kù)系統(tǒng)或者常用訪問方法沖突
5) 保持字段名和類型的一致性,在命名字段并為其指定數(shù)據(jù)類型的時(shí)候一定要保證一致性。假如數(shù)據(jù)類型在一個(gè)表里是整數(shù),那在另一個(gè)表里可就別變成字符型了。
當(dāng)前文章:php用戶系統(tǒng)數(shù)據(jù)字典 php數(shù)據(jù)處理
本文地址:http://www.rwnh.cn/article30/doohjpo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、App設(shè)計(jì)、服務(wù)器托管、微信公眾號(hào)、做網(wǎng)站、定制開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)