Doris
Doris
简介
Apache Doris 是一个现代化的 MPP 分析型数据库产品。 仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。 Apache Doris 的分布式架构非常简洁,易于运维,并且可以支持 10 PB 以上的超大数据集。
Doris 的组成架构如下所示:
关键概念
- FE(Frontend):前端进程,负责如下工作
- 存储,维护元数据
- 接收解析查询请求
- 规划查询计划
- 调度查询执行
- 返回查询结果
- BE(Backend):后端进程,负责如下工作
- 依据物理计划,分布执行查询
- 存储数据,保证可靠性
- Broker:无状态进程,主要用于访问外部数据源
- Tablet:表的实际存储单元。在由 BE 组成的分布式存储层中,经过分区和分桶后,会以 Tablet 为基本单元存储一张表。每个 Tablet 包括元信息和几个连续的 RowSet。
- Rowset:Rowset 是 Tablet 中某次数据变化的数据集合,数据变化包括数据的导入、删除、更新。按版本信息记录的行集。每次更改都会生成一个版本。
- Version:由 Start 和 End 两个属性组成,维护数据变化的记录信息。通常用于表示 Rowset 的版本范围,在新导入后会生成 Start 和 End 相等的 Rowset,Compaction 后会生成具有范围的 Rowset 版本。
- Segment:表示 Rowset 中的数据段。多个 Segment 形成一个 Rowset。
- Compaction:合并连续版本的 Rowset 的过程称为 Compaction,合并过程中数据会被压缩。
FE 中还具有 Leader,Follower 和 Observer 角色的不同进程:
- Leader 和 Follower 角色使用 Paxos 协议保证了高可用。
- Observer 角色则是作为扩展的查询节点,可以增强集群在查询方面的能力。(Observer 不参与任何写入,只参与读取)。
安装
- 编辑最大打开的句柄数
1 |
|
新增如下内容
1 |
|
注:此处内容需要重启才能生效
- 下载软件包,并解压至指定目录
1 |
|
- 编辑 FE 配置
1 |
|
修改如下内容
1 |
|
- 编辑 BE 配置
1 |
|
修改如下内容
1 |
|
- 编辑环境变量
1 |
|
填入如下内容
1 |
|
1 |
|
- 启动服务
1 |
|
- 检查服务启动情况
请根据返回内容进行判断
1 |
|
注:
fe_http_port 为 8030,WebUI 默认账号为 root,密码为空。
be_http_port 为 8040,
- 安装 MySQL 客户端
1 |
|
- 注册 BE 至 FE
登陆 Doris
1 |
|
注册 BE
1 |
|
参考资料
Doris
https://wangqian0306.github.io/2022/doris/