SQL Server 数据库设计
一、数据库设计的必要性在实际的软件项目中如果系统中需要存储的数据量比较大需要设计的表比较多表与表之间的关系比较复杂那我们就需要进行规范的数据库设置。如果不经过数据库的设计我们构建的数据库不合理、不恰当那么数据库的维护、运行效率会有很大的问题。这将直接影响到项目的运行性和可靠性。二、什么是数据库设计数据库设计实际上就是规划和结构化数据库中的数据对象以及这些数据对象之间的关系过程。三、数据库设计的重要性Ø 不经过设计的数据库或是设计糟糕的数据库很可能导致1、 数据库运行效率地下2、 更新、删除、添加数据出现问题Ø 良好设计的数据库1、 执行效率高2、 使应用程序更便于开发3、 扩展性好4、 维护性好四、数据模型数据模型就像是数据间联系的一个轮廓图整个模型就像一个框架。如果按照记录间联系的表示方式对数据模型进行分类可以分为层次模型、网状模型、关系模型。前两种又称为格式化数据模型。数据模型的好坏直接影响到数据库的性能所以数据模型的选择是数据库设计的首要任务。Ø 实体-关系E-R数据模型E-R数据模型Entity-Relationship data model即实体-关系数据模型。E-R数据模型不同于传统的关系数据模型它不是面向实现而是面向现实物体的。Ø 实体Entity数据是用来描述现实中的物体的而描述的对象都是形形色色的有具体的、也有抽象的有物理上存在的、也有概念性的。凡是可以互相区别而且可以被人们认识的事、物、概念等统统抽象为实体。多个相同的类型的实体可以称为实体集Entity set。因此在E-R数据模型中也有型与值之分实体可以作为型来定义每个实体可以是它的实例和值。Ø 属性Attribute实体一般具体若干特征这些特征称为实体的属性。而每个属性都有自己的取值范围在E-R数据模型中称为值集value set。在同一实体集中每个实体的属性及其值集都是相同的但可能取不同的值。属性对应数据库表的列。Ø 关系Relationship实体之间会有各种关系这些关系抽象为联系。不但实体可以有属性关系也可以有属性。五、数据库设计步骤Ø 数据库设计可以分为以下几个阶段1、 需求分析阶段分析客户的业务需求特别是数据方面的需求2、 概要设计阶段绘制数据库的E-R图并确认需求文档的正确性和完整性E-R图是项目的设计人员、开发人员、测试人员以及和客户进行沟通的重要凭据3、 详细设计阶段将概要设计阶段的E-R图转换为数据库表进行逻辑设计确定各个表之间的主外键关系运用数据库的三范式进行审核并进行技术评审。最后决定选哪种数据库Oracle、SQLServer、MySQL来建库、建表。Ø 需求分析阶段数据库系统分析秀气分析阶段的重点是调查、收集、分析客户的业务数据需求以及数据的安全性、完整性需求等。需求分析步骤1、 确认业务需求2、 标识关系实体3、 标识每个实体的具有的属性4、 确认实体之间的关系Ø 概要设计阶段绘制E-R图作为数据库设计者你需要和项目组内其他成员分享你的设计思路共同研讨数据库设计的合理性、安全性、完整性并确认是否符合客户的业务需求。那么使用E-R图这种图形化的表示方式最为直观。* E-R图中的实体、属性和关系上面的简单E-R图可以看出用户和收支之间的关系。在上图中可以看出用矩形表示实体实体是一般名词椭圆表示属性一般也是名词菱形表示关系一般是动词。* 映射基数映射基数表示可以通过关系与该实体的个数。对于实体集A和B之间的二元关系可能的映射基数有1、 一对一也就是A实体中最多只有一个B实体的关联而B实体的最多只有一个A实体的关联。用E-R图表示2、 一对多A实体可以与B实体任意数量的进行关联B中的实体最多与A中的一个实体关联。E-R图表示3、 多对一A实体最多与一个B实体进行关联而B实体可以和任意多个A实体进行关联。E-R图表示4、 多对多A实体可以有多个B实体而B实体也可以有任意多个A实体。E-R图表示* E-R图E-R图可以以图形化的方式将数据库的整个逻辑结构表示出来组成部分有1、 矩形表示实体集2、 椭圆表示属性3、 菱形表示关系、4、 直线用来连接实体集与属性、实体集和关系5、 直线箭头表示实体集之间映射基数Ø 详细设计阶段将E-R图转换为表步骤如下1、 将各个实体转换为对应的表将各属性转换为对应的列2、 标识每张表的主键3、 将实体之间的关系转换为表与表之间的主外键关系六、数据库设计规范化Ø 数据库设计中经常出现的问题1、 数据冗余大2、 插入数据异常3、 删除异常4、 更新异常Ø 规范设计一个较好的关系数据库模型它的每个关系中的属性一定要满足某种内在的语义条件即要按一定的规范设计关系模型这就是设计的规范化。在数据库设计时有一些专门的规则称为数据库的设计范式遵循这些规则就可以创建出良好的数据库数据库著名的三大范式理论1、 第一范式1NF第一范式是满足关系数据库模型所要遵循的最基本的条件范式几关系中的每个属性必须是不可再分的简单项不能是属性组合即属性的取值是不可拆分的原子值。2、 第二范式2NF第二范式是在第一范式的基础上确保表中的每列都和主键相关。其定义是如果一个关系满足1NF并且除了主键关系外的其他列都依赖于该主键则满足第二范式。3、 第三范式(3NF)第三范式是在第二范式的基础上进行的第三范式的目标是确保每列都和主键列直接相关而不是间接相关的。其定义是如果一个关系满足2NF并且除主键外的其他列都不传递依赖于该主键。Ø 规范化和性能关系为了满足三大范式数据库的性能可能会有一定程度的降低。所以在实际数据库设计中我们既要尽量满足三大范式从而避免数据冗余和各种数据库的操作异常同时也要考虑数据的访问性能。有时候为了提高数据库的访问效率适当的允许少量数据冗余咧存在才是最适合的数据库设计方案。