Post

MySQL Base

MySQL

MySQL 是一个开源的关系型数据库管理系统,广泛应用于 Web 应用程序的开发中。它提供了一个强大的、稳定的、高效的、可扩展的数据库解决方案,能够满足从小型网站到大型企业级应用的各种需求。

  • 特点
  1. 关系型数据库管理系统(RDBMS):MySQL 是一种关系型数据库管理系统,它采用了关系模型来组织数据。数据存储在表中,表之间通过外键关联,形成了数据之间的关系。
  2. 开源性:MySQL 是开源软件,可以免费获取和使用。这使得它成为许多开发者和企业的首选数据库解决方案之一。
  3. 跨平台性:MySQL 可以在多种操作系统上运行,包括 Windows、Linux、Mac 等,因此具有很好的跨平台性。
  4. 多用户支持:MySQL 支持多用户同时访问数据库,可以设置不同的权限和访问级别,确保数据的安全性和完整性。
  5. SQL(Structured Query Language)支持:MySQL 使用 SQL 作为操作数据库的标准语言。通过 SQL,用户可以执行各种操作,包括数据的查询、插入、更新、删除等。
  6. 性能优化:MySQL 在设计和实现上对性能进行了优化,可以处理大规模的数据和高并发访问。它支持多种存储引擎,如 InnoDB、MyISAM 等,用户可以根据实际需求选择合适的存储引擎来优化性能。
  7. 事务支持:MySQL 支持事务,保证了数据的一致性和可靠性。用户可以使用事务来批量执行操作,并在需要时进行回滚或提交。
  8. 数据备份和恢复:MySQL 提供了备份和恢复数据库的工具和机制,可以定期备份数据库,以防止数据丢失或损坏,并在需要时进行数据恢复。
  9. 可扩展性:MySQL 是一个可扩展的数据库系统,可以通过添加更多的服务器节点来扩展数据库的性能和容量。它支持主从复制、分区、分片等技术来实现数据库的水平和垂直扩展。
  10. 社区支持和生态系统:MySQL 拥有庞大的用户社区和开发者社区,用户可以在社区中获取到丰富的资源、文档和支持。此外,MySQL 生态系统也非常丰富,有许多第三方工具和插件可以与 MySQL 集成,扩展其功能和应用场景。

事务

特性 描述
原子性(Atomicity) 事务是一个不可分割的工作单位,要么全部执行成功,要么全部失败回滚。
一致性(Consistency) 事务执行前后数据库的完整性约束不会被破坏,即使事务执行失败也不会导致数据处于不一致的状态。
隔离性(Isolation) 多个事务同时执行时,各个事务之间是相互隔离的,一个事务的执行不会受到其他事务的影响。
持久性(Durability) 事务一旦提交,其结果将会被永久保存在数据库中,并且不会被回滚。即使发生系统崩溃,数据库系统也能够通过日志等方式恢复数据,保证事务的持久性。

关系型数据库

关系型数据库是一种结构化的数据库,它使用了关系模型来组织和管理数据。关系型数据库的核心概念是表、行和列,数据以表的形式存储,每个表由多行(记录)组成,每行包含了多个列(字段)。这种组织方式使得数据之间的关系变得清晰和易于管理。

  1. 表(Table):表是关系型数据库中的基本单位,用于存储特定类型的数据。每个表由一系列行和列组成,行代表记录,列代表字段。表可以有不同的列,每列具有特定的数据类型,如整数、字符、日期等。
  2. 行(Row):行也称为记录或元组,代表表中的一个实体或数据项。每行包含了一组相关的数据,每个字段对应一个数据值。行之间的顺序一般没有特定意义,可以通过主键来唯一标识和区分各行。
  3. 列(Column):列是表的结构化部分,用于定义每个记录的属性。每列具有特定的数据类型和约束,如整数、字符、日期、唯一性约束、非空约束等。列名通常用于标识和访问特定的数据项。
  4. 主键(Primary Key):主键是表中用于唯一标识每行记录的一列或一组列。主键必须是唯一的,且不能为空。通过主键可以快速定位和访问表中的特定记录,保证数据的完整性和一致性。
  5. 外键(Foreign Key):外键是表中的一列,它建立了与其他表之间的关联关系。外键用于指定一个表中的数据与另一个表中的数据之间的关系,通过外键可以实现表之间的引用完整性约束。
  6. 关系(Relationship):关系是指表之间的联系和连接。通过外键建立的关联关系可以帮助我们在多个表之间进行数据查询和操作,实现数据的关联和一致性。
  7. SQL(Structured Query Language):SQL 是关系型数据库管理系统用于操作数据的标准语言。通过 SQL,用户可以执行各种操作,包括数据的查询、插入、更新、删除等,以及表的创建、修改、删除等管理操作。
  8. 事务(Transaction):事务是一系列数据库操作的集合,它要么全部执行成功,要么全部失败,具有原子性、一致性、隔离性和持久性(ACID 特性)。
  9. 范式(Normalization):范式是用于设计关系型数据库模式的一组规范化原则,旨在减少数据冗余和提高数据的存储效率。通过范式化设计,可以确保数据库的数据结构合理和标准化。

数据引擎

存储引擎 特点 优点 缺点 适用场景
InnoDB 支持事务、行级锁、外键约束 数据完整性强,支持高并发 内存消耗较大,性能相对较低 事务处理型应用,如电子商务平台、金融系统等
MyISAM 不支持事务、支持全表锁、查询性能较快 查询性能好,适用于读操作较多的场景 不支持事务、容易出现表级锁、不适合高并发写入 读操作较多、写操作较少的应用,如博客、新闻网站等
Memory 将数据存储在内存中,快速的数据访问速度 读写速度极快,适用于临时表和缓存数据 数据不持久化,服务器重启后数据丢失 临时表、缓存数据等需要快速访问的临时性数据存储
CSV 将数据存储在 CSV 文件中 适用于导入/导出数据到 CSV 文件 不支持事务、不支持索引、不适合大规模数据操作 导入/导出数据到 CSV 文件
Archive 高压缩比,适用于数据归档和备份等场景 压缩比高,适用于归档和备份数据 不支持事务、不支持索引、不适合频繁读写操作 数据归档、备份等场景
Blackhole 写入的数据被丢弃,适用于数据复制和转发 用于数据复制和转发 不保存数据,仅用于数据转发 数据复制、数据转发等场景
NDB Cluster 分布式存储和高可用性特性 提供高可用性和水平扩展能力,适用于分布式存储 配置和管理复杂,性能相对较低 需要高可用性和水平扩展能力的分布式存储场景

SQL 语言

分类 简称 描述
DDL (Data Definition Language) 定义 用于定义、修改和删除数据库对象(表、索引等)的语言。包括 CREATEALTERDROP 等命令。
DML (Data Manipulation Language) 操作 用于对数据库中的数据进行操作的语言。包括 INSERTUPDATEDELETE 等命令。
DQL (Data Query Language) 查询 用于从数据库中检索数据的语言。主要命令是 SELECT
DCL (Data Control Language) 控制 用于控制数据库访问权限和用户管理的语言。包括 GRANTREVOKE 等命令。
TCL (Transaction Control Language) 事务 用于管理数据库事务的语言。包括 COMMITROLLBACKSAVEPOINT 等命令。

索引

索引类型 特点 优势 劣势 适用场景
B-Tree 索引 支持精确查找和范围查找,适用于大多数查询 支持范围查询、排序和分组等操作 查询的效率受数据量和索引列的数据分布影响 WHERE 子句中的条件查询,等值查询、范围查询等操作
哈希索引 适用于等值查询,具有快速的查找速度 查找速度快 不支持范围查询、排序和分组等操作 内存中的临时表和内存表
全文索引 用于全文搜索,支持文本内容的快速检索 支持对文本内容进行全文搜索和相关性排序 不适用于精确匹配和排序 需要进行全文搜索的场景,如博客、论坛等包含大量文本内容的应用
空间索引 用于对空间数据进行查询,支持空间对象的查询 支持距离查询、相交查询等空间操作 不适用于非空间数据 地图应用、位置服务等需要处理空间数据的应用场景

字符集

字符集 描述 优点 缺点
UTF-8 可变长度的 Unicode 编码方式,支持多种语言字符集合 支持多国语言字符集,适用于国际化应用 部分字符占用多个字节存储空间,可能导致存储空间浪费
GBK 国家标准 GB 2312-80 的扩展,支持简体中文字符集 支持中文字符集,存储效率高 不支持多国语言字符集,无法满足国际化应用需求
Latin1 西欧字符集,支持西欧语言的字符集合 存储效率高,适用于只需要支持西欧语言的应用 不支持多国语言字符集,无法满足国际化应用需求
UTF8MB4 UTF-8 的超集,支持四字节的 Unicode 字符,包括 emoji 表情符号等 支持更广泛的字符集,适用于需要存储 emoji 表情符号等四字节 Unicode 字符的应用 相比 UTF-8,存储空间消耗较大
UTF16 Unicode 编码方式,每个字符占用 16 位(两个字节) 支持较多的字符集,存储效率较高 相比 UTF-8,存储空间消耗较大

数据类型

数据类型 描述 存储范围 大小 Go
INT 整数类型,通常用于存储整数值 -2147483648 到 2147483647 4 字节 int32
BIGINT 大整数类型,用于存储较大的整数值 -9223372036854775808 到 9223372036854775807 8 字节 int64
FLOAT 单精度浮点数类型,用于存储小数值 精度为大约 7 位小数 4 字节 float32
DOUBLE 双精度浮点数类型,用于存储双精度小数值 精度为大约 15 位小数 8 字节 float64
DECIMAL(M, D) 定点数类型,用于存储精确的小数值 小数位数最大为 M,总位数最大为 M+2 依赖于 M 和 D Decimal
CHAR(N) 定长字符串类型,用于存储固定长度的字符串 最大长度为 N 最大为 N 字节 string
VARCHAR(N) 变长字符串类型,用于存储可变长度的字符串 最大长度为 N 最大为 N 字节 string
TEXT 变长字符串类型,用于存储较长的文本数据 最大长度为 65,535 字节 最大为 65,535 字节 string
DATE 日期类型,用于存储日期值 ‘1000-01-01’ 到 ‘9999-12-31’ 3 字节 time.Time
TIME 时间类型,用于存储时间值 ‘-838:59:59’ 到 ‘838:59:59’ 3 字节 time.Time
DATETIME 日期时间类型,用于存储日期和时间值 ‘1000-01-01 00:00:00’ 到 ‘9999-12-31 23:59:59’ 8 字节 time.Time
TIMESTAMP 时间戳类型,用于存储日期和时间值 ‘1970-01-01 00:00:01’ 到 ‘2038-01-19 03:14:07’ 4 字节 time.Time
BOOLEAN 布尔类型,用于存储逻辑值 TRUE 或 FALSE 1 字节 bool

主键&外键

特点 主键 外键
定义 用于唯一标识表中的每一行数据的字段,每张表只能有一个主键 用于建立表与表之间的关联关系,指向另一张表的主键或唯一键
唯一性 主键值在表中必须唯一,不允许为空 外键值可以为空,可以重复,但必须与关联表的主键值相对应
数据类型 通常为数值类型或字符串类型,与业务无关 与关联表的主键数据类型一致
作用 保证表中每一行数据的唯一性,可以用于快速定位数据 建立表与表之间的关联关系,确保数据的一致性和完整性
定义方式 可以在表的创建过程中使用 PRIMARY KEY 关键字来定义主键 通常在表的创建过程中使用 FOREIGN KEY 关键字来定义外键
示例 用户表中的用户 ID 字段可以作为主键,保证每个用户 ID 的唯一性 订单表中的用户 ID 字段可以作为外键,与用户表中的用户 ID 建立关联

其他类似的数据库

在数据处理方案中,有几种与 MySQL 类似的关系型数据库管理系统。这些系统在某些方面可能与 MySQL 有相似的特性和功能,但也可能在某些方面有所不同。以下是几种常见的与 MySQL 类似的数据处理方案:

  1. MariaDB:MariaDB 是 MySQL 的一个分支,它由 MySQL 的原始开发者创建,旨在保持与 MySQL 的兼容性,并提供一些新的功能和改进。因此,MariaDB 在很多方面与 MySQL 非常相似,用户可以轻松地迁移和使用 MariaDB。
  2. PostgreSQL:PostgreSQL 是另一个流行的开源关系型数据库管理系统,与 MySQL 相比,它在一些方面提供了更丰富和更高级的功能,如支持更复杂的数据类型、更强大的事务支持、更灵活的权限管理等。尤其在处理复杂数据结构和需要高级特性的应用场景下,PostgreSQL 往往是一个很好的选择。
  3. SQLite:SQLite 是一个轻量级的嵌入式关系型数据库管理系统,与 MySQL 不同,它不是一个独立的数据库服务器,而是直接嵌入到应用程序中,以库的形式提供。SQLite 适用于一些轻量级的应用场景,如移动应用、桌面应用等,它的特点是简单、易于使用,并且不需要单独的服务器进程。
  4. Microsoft SQL Server:Microsoft SQL Server 是微软开发的关系型数据库管理系统,它与 MySQL 相比在某些方面有所不同,比如更紧密地集成到 Microsoft 的生态系统中、提供更多的企业级特性和服务等。Microsoft SQL Server 通常用于 Windows 平台上的企业应用程序。
This post is licensed under CC BY 4.0 by the author.