数据库是什么?
数据库,顾名思义包含大量数据的集合。这些数据可以是(关于某单位、机构、部门,或是某领域、业务、主题,或是某对象的信息、互相关联的大量数据)。例如:科研论文和项目数据、学生选课系统、习题集等等。
数据的类型可以包括:数值、文本、图形、图像、音频、视频等数据。
而数据库的形式也是广义的,包括以下几种形式:打印或写在纸上,保存在txt文件、word文件、excel或其他文件中,用postgreSQL、DB2、Oracle等软件系统管理起来的。
大学所教授的数据库是指:用专门通盈软件管理,长期储存在计算机内、有组织、可共享的大量数据的集合。亦成为数据库管理系统(Database Management System),DBMS,是位于用户与操作系统之间的一层软件,著名的DBMS有:PostgreSQL、IBM DB2、Oracle、Microsoft SQL Server等。以数据的增删改查为基础,简单安全,高效的实现各自的关键功能,抽取应用需求的共性实现为通用的数据库管理系统,可以有效简化应用开发,DBMS从应用与数据管理系统的共性特征出发,能有效支持安全方便的数据管理,推动了各行各业的信息化发展。
数据库的术语及定义
术语:
- 目标:DBMS的目标是简单、安全、高效地共享数据。为此,DBMS基于特定数据模型来组织管理数据。
- 模型:数据模型是结构和语义的概括,比如树结构的为层次模型,表结构的为关系模型,
- 模式:而面向特定数据模型,针对特定应用的数据库结构称为数据库模式。例如:关系型数据库的表结构就称为关系模式或表模式。而xx表则表示该表所包括的属性所组成的属性集合。
- 实例:特定数据库中特性时刻存储的数据集合称为该数据的一个实例。
数据库模型一般随具体情况的变化也发生相应的调整,而数据库模式相对稳定,实例是对应模式的一个具体值,反映某一时刻数据库的状态。同一个模式可以有很多实例,实例的值岁数据库中的数据的更新而不断变化。
现实世界的事物到数据库存储的数据,以及用户使用的数据是一个逐步抽象的过程,首先,对现实世界的事物的状态进行选择、加工、组织而形成人对全部用户数据需求在大脑中的认知,为概念层。
概念层的数据模型通常使用实体,联系模型(E-R模型),一般用E-R图来表示。
逻辑层:通过便于人理解的相对简单的结构来描述数据库当中储存的数据。以及这些数据间的联系。描述全部用户数据的整体结构
视图层:从某个或某类用户出发,只描述与其相关的那一份数据
物理层:描述数据实际上是怎样在磁盘设备上组织的,典型物理层为B+树。
基本功能:DBMS允许用户逻辑的使用数据而无需关注这些数据在计算机中如何存放、如何处理的。
目前绝大多数DBMS是关系型的。
针对特定应用,数据库管理系统支持逻辑层,视图层和物理层数据模式的建立。以及三层模式之间的两级映射。
逻辑层的数据模式也称为模式。视图层称为外模式,物理层为内模式。有外模式后,应用程序不必关心逻辑模式,只与外模式发生联系。按照外模式访问数据。
三层模式的数据结构可以不一样,比如:属性命名和组成可以不同,通常通过三层模式之间的映射来说明外模式 和模式,模式和内模式之间的对应性。
当模式改变时,由收据管理员DBA对外模式,模式映射作相应改变外模式可以保持不变。用于应用模式是更加外模式进行编写的,所以应用可以无需修改。称为数据逻辑独立性。如果数据内模式需要改变,只需要对模式/内模式的映射做相应的修改,可以使模式尽可能保持不变,避免外模式和应用的影响。称为数据的物理独立性。
DBMS的三层模式,两级映射,即为简单,安全的共享数据提供支持,又为应用系统易于拓展来适应应用需求的变化奠定基础。
为支持用户简单,安全,高效的共享磁盘数据,DBMS包括:查询处理,存储管理,和保护管理三大模块。数据库管理系统在磁盘上不仅保存数据文件本身,还保存数据字典、索引、统计数据、日志。
数据字典中存放元数据,比如数据模式,外模和内模式的定义。数据索引帮忙快速定位 特定数据项。统计数据反应数据库数据分布特征。日志,依次登记对数据的修改。
DBMS提供访问数据库的语言,一般包括三个部分:定义数据库结构的语言成为数据定义语言,操纵数据库的语言称为数据操纵语言,数据保护相关的语言称为数据保护语言。
关系数据库的标准语言为SQL,是一种声明性语言,SQl包括数据定义、数据操作和数据保护三个部分。用户提交的数据定义语言和数据保护语言的执行结果保存在数据字典中。用户提交数据操纵语句时查询处理模块首先对该语句分析,并依据数据字典中外模式/模式的映射关系,将查询转换为模式上的查询形式,然后在统计数据的帮助下找出尽可能好的执行计划,最后翻译成存储管理模块能够执行的形式。存储管理模块利用数据字典,数据索引从磁盘上取到查询的目标数据并返回。查询处理模块,存储管理模块总是在保护管理模块协调下运行,保护管理模块负责检查用户权限,数据合法性。并以一种 称为“事务”的方式,在日志信息的帮助下维护多用户并发访问以及故障情况下的数据一致性。
数据库系统是指面向数据管理应用,在计算机系统中引入DBMS后的整个系统,一般有硬件系统,操作系统,数据库,数据库管理系统,开发工具,应用系统常规用户,数据库管理员。
数据库系统包括数据库分析,设计,实施和维护设计的硬件, 软件,人员。当系统数据库规模持续增大达到当前技术无法获得满意效果的时候,比如:数据量太大,内存不足等等
大数据技术的目标是:简单、安全、高效共享大规模数据的关键技术。数据库系统已然成为几乎所有企业不可或缺的重要部分。是人们日常生活中最普遍使用的技术之一。