设计数据库时,需要遵循的一些规范。要遵循后边的范式要求,必须先遵循前边的所有范式要求设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。
函数依赖:A-->B,如果通过A属性(属性组)的值,可以确定唯一B属性的值。则称B依赖于A
例如:学号-->姓名。 (学号,课程名称) --> 分数
完全函数依赖:A-->B, 如果A是一个属性组,则B属性值得确定需要依赖于A属性组中所有的属性值。
例如:(学号,课程名称) --> 分数
部分函数依赖:A-->B, 如果A是一个属性组,则B属性值得确定只需要依赖于A属性组中某一些值即可。
例如:(学号,课程名称) -- > 姓名
传递函数依赖:A-->B, B -- >C . 如果通过A属性(属性组)的值,可以确定唯一B属性的值,在通过B属性(属性组)的值可以确定唯一C属性的值,则称 C 传递函数依赖于A
例如:学号-->系名,系名-->系主任
码:如果在一张表中,一个属性或属性组,被其他所有属性所完全依赖,则称这个属性(属性组)为该表的码
例如:该表中码为:(学号,课程名称)
主属性:码属性组中的所有属性
非主属性:除过码属性组的属性
第一范式(1NF)
每一列都是不可分割的原子数据项
| 学号 | 姓名 | 系名 | 系主任 | 课程名称 | 分数 |
| 1 | 喜羊羊 | 计算机 | 灰太狼 | 高等数学 | 90 |
| 1 | 喜羊羊 | 计算机 | 灰太狼 | 大学英语 | 91 |
| 1 | 喜羊羊 | 计算机 | 灰太狼 | 计算机基础 | 92 |
| 2 | 美羊羊 | 电子 | 红太狼 | 大学物理 | 93 |
| 2 | 美羊羊 | 电子 | 红太狼 | 大学英语 | 94 |
| 2 | 美羊羊 | 电子 | 红太狼 | 数据库 | 95 |
| 3 | 懒洋洋 | 通信 | 蕉太狼 | 数据库 | 96 |
| 3 | 懒洋洋 | 通信 | 蕉太狼 | 大学物理 | 97 |
| 3 | 懒洋洋 | 通信 | 蕉太狼 | 大学英语 | 98 |
问题:
数据冗余过大
数据增删会出现错误(删除学生会连系同时删除)
第二范式(2NF)
在1NF的基础上,非码属性必须完全依赖于码(在1NF基础上消除非主属性对主码的部分函数依赖)
分数依赖于学号与课程,而其他属性都仅仅依赖于学号,可拆表
学生表:
| 学号 | 姓名 | 系名 | 系主任 |
| 1 | 喜羊羊 | 计算机 | 灰太狼 |
| 2 | 美羊羊 | 电子 | 红太狼 |
| 3 | 懒洋洋 | 通信 | 蕉太狼 |
成绩表:
| 学号 | 课程名称 | 分数 |
| 1 | 高等数学 | 90 |
| 1 | 大学英语 | 91 |
| 1 | 计算机基础 | 92 |
| 2 | 大学物理 | 93 |
| 2 | 大学英语 | 94 |
| 2 | 数据库 | 95 |
| 3 | 数据库 | 96 |
| 3 | 大学物理 | 97 |
| 3 | 大学英语 | 98 |
问题:
数据增删会出现错误(删除学生会连系同时删除)
第三范式(3NF)
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
系主任依赖于学号,同时也依赖于系名,可拆表
学生表:
| 学号 | 姓名 | 系名 |
| 1 | 喜羊羊 | 计算机 |
| 2 | 美羊羊 | 电子 |
| 3 | 懒洋洋 | 通信 |
院系表:
| 系名 | 系主任 |
| 计算机 | 灰太狼 |
| 电子 | 红太狼 |
| 通信 | 蕉太狼 |
成绩表:
| 学号 | 课程名称 | 分数 |
| 1 | 高等数学 | 90 |
| 1 | 大学英语 | 91 |
| 1 | 计算机基础 | 92 |
| 2 | 大学物理 | 93 |
| 2 | 大学英语 | 94 |
| 2 | 数据库 | 95 |
| 3 | 数据库 | 96 |
| 3 | 大学物理 | 97 |
| 3 | 大学英语 | 98 |
问题基本解决




