diff --git a/.gitignore b/.gitignore
index 758b615..704ab53 100644
--- a/.gitignore
+++ b/.gitignore
@@ -5,7 +5,7 @@
*.a
/ebpf/libbpf-bootstrap
-/doc
+/test-redis/results
kvstore
testcase
diff --git a/chainbuffer.plan.md b/chainbuffer.plan.md
deleted file mode 100644
index 92d7348..0000000
--- a/chainbuffer.plan.md
+++ /dev/null
@@ -1,189 +0,0 @@
-# ChainBuffer + 全量 WAL(单一方案,slot 驱动)
-
-## 1. 目标与约束
-
-目标:
-
-- 所有命令都落盘(不再区分 update/get)。
-- 主线程 A 尽量不做内存分配,不构造 uring task。
-- 主线程 A 只做:收包、解析命令边界、摘取 payload、写入预分配 slot。
-- WAL 线程 B 负责:从 slot 取 payload、构造 task、提交 io_uring、归还内存块。
-
-约束:
-
-- 只保留一个实现方案,不引入 v1/v2 双路径。
-- 正确性优先:半包、多包、pipeline、断连、慢盘都可控。
-
----
-
-## 2. ChainBuffer 设计(重点)
-
-## 2.1 结构定义
-
-采用“回环 chunk 链表”:
-
-```c
-typedef struct cb_chunk {
- struct cb_chunk *next;
- uint32_t cap; // 固定大小,默认 4096
- uint32_t rpos; // 读指针 [0, cap)
- uint32_t wpos; // 写指针 [0, cap)
- uint32_t used; // 已用字节数 [0, cap]
- uint32_t refcnt; // 被 WAL payload 持有的引用计数
- uint8_t data[];
-} cb_chunk_t;
-
-typedef struct chain_buffer {
- cb_chunk_t *head;
- cb_chunk_t *tail;
- size_t total_len;
- uint32_t chunk_size;
-
- // 节点池:避免频繁 malloc/free
- cb_chunk_t *free_list;
- uint32_t free_count;
- uint32_t free_limit;
-} chain_buffer_t;
-```
-
-说明:
-
-- chunk 内部可回环读写(避免 memmove)。
-- 多 chunk 串联用于扩容。
-- 空 chunk 不释放到系统,先回收到 `free_list`。
-
-## 2.2 接收路径(readv 直写)
-
-主线程不再 `recv -> tmp -> memcpy`,改为:
-
-1. `chain_buffer_prepare_recv_iov(buf, iov, max_iov)`
- - 收集可写空闲段(优先尾 chunk,不够就从 free_list 取或新建 chunk)。
-2. `readv(fd, iov, iovcnt)`
-3. `chain_buffer_commit_recv(buf, nread)`
- - 推进 `wpos/used/total_len`。
-
-这样可去掉接收中转拷贝。
-
-## 2.3 消费与摘取
-
-提供三个核心能力:
-
-- `chain_buffer_iter_*`:按字节流遍历,供 RESP 解析命令边界。
-- `chain_buffer_detach_prefix(buf, len, cb_payload_t *out)`:把前缀字节摘成 payload(尽量零拷贝,边界切分允许一次小拷贝)。
-- `chain_buffer_release_payload(buf, payload)`:WAL 线程用完后归还 chunk(refcnt--,归零后回 free_list)。
-
----
-
-## 3. slot 队列设计(主线程零分配)
-
-## 3.1 预分配 ring
-
-定义单生产者单消费者 ring(A->B):
-
-```c
-#define WAL_SLOT_CAP 65536
-
-typedef struct wal_slot {
- uint64_t seq;
- uint32_t cmd_len;
- cb_payload_t payload; // 命令字节
- uint8_t in_use;
-} wal_slot_t;
-
-typedef struct wal_ring {
- wal_slot_t slots[WAL_SLOT_CAP];
- _Atomic uint32_t head; // producer write
- _Atomic uint32_t tail; // consumer read
- _Atomic uint32_t size;
-} wal_ring_t;
-```
-
-特点:
-
-- slot 全预分配。
-- 主线程写 slot 不 malloc。
-- WAL 线程消费后清空 slot 并前移 tail。
-
-## 3.2 主线程流程(所有命令都落盘)
-
-对每条完整命令:
-
-1. 从 chainbuffer 解析得到 `cmd_len`。
-2. 申请一个空 slot(ring 未满)。
-3. `detach_prefix(cmd_len)` 得到 `payload`。
-4. 写入 slot:`seq/cmd_len/payload`。
-5. 发布 head。
-
-注意:
-
-- 不做命令类型判断。
-- 不构造 uring task。
-- 不进行额外 payload malloc。
-
-## 3.3 WAL 线程流程
-
-循环:
-
-1. 从 ring 取 slot。
-2. 生成长度头(4B)+ payload iov。
-3. 调 `submit_write()`(当前打包拷贝发生在此线程)。
-4. `chain_buffer_release_payload()` 归还 chunk。
-5. 清 slot,推进 tail。
-
----
-
-## 4. 一致性与回压
-
-## 4.1 日志顺序
-
-- `g_log_off` 只在 WAL 线程维护。
-- 单消费者天然保证写入顺序与入队顺序一致。
-
-## 4.2 回压(必须)
-
-当 ring 达到高水位(例如 80%):
-
-1. 暂停该连接读事件(优先)。
-2. 若持续超时(如 200ms)仍高水位,关闭连接保护系统。
-
-本方案不再做“回退旧路径”。
-
-## 4.3 异常处理
-
-- `submit_write` 失败:记录错误并触发保护动作(可选停机/拒绝新连接)。
-- 连接断开:已入 slot 的 payload 继续由 WAL 线程完成归还。
-- 进程退出:先停读,再 drain wal_ring,再 shutdown uring。
-
----
-
-## 5. 实施步骤(实际落地)
-
-1. 重构 `network/chainbuffer.*`
- - 回环 chunk + free_list
- - `prepare_recv_iov/commit_recv`
- - `iter/detach_prefix/release_payload`
-2. 修改 `reactor.c`
- - `recv_cb` 使用 `readv` + commit
-3. 修改 `kvstore.c`
- - 按命令边界循环
- - 每条命令统一入 wal_slot(不分类)
-4. 新增 `dump/wal_slot_queue.*`(或放 `dump/kvs_oplog.c`)
- - SPSC ring + WAL worker
-5. 调整 `dump/kvs_oplog.c`
- - 改为 WAL 线程消费 slot 后调用 `submit_write`
-6. 收敛退出与错误路径
- - close_conn / shutdown / submit 失败全覆盖
-
----
-
-## 6. 验收标准
-
-- 功能:
- - 半包/多包/pipeline 正确;
- - 重启回放后数据一致。
-- 性能:
- - 主线程不再出现 oplog task 构造热点;
- - 接收路径 memcpy 次数下降(去掉 tmp 中转)。
-- 稳定性:
- - 慢盘压测下无泄漏、无 double free、无 UAF;
- - 高水位触发时系统行为可预期。
diff --git a/config/config.xml b/config/config.xml
index 4df1944..acdb818 100644
--- a/config/config.xml
+++ b/config/config.xml
@@ -1,11 +1,11 @@
-
+
- 192.168.220.134
+ 127.0.0.1
8888
- master
+ master
-
+
disable
192.168.220.134
@@ -14,12 +14,12 @@
- INFO
+ INFO
- none
- data
+ incremental
+ data/persist_mypool_20260305_072256
kvs_oplog.db
kvs_array.db
@@ -28,7 +28,7 @@
- mypool
- disable
+ mypool
+ disable
-
+
\ No newline at end of file
diff --git a/doc/conclusion.md b/doc/conclusion.md
new file mode 100644
index 0000000..5321866
--- /dev/null
+++ b/doc/conclusion.md
@@ -0,0 +1,50 @@
+# 性能定位结论(主线程)
+
+## 1) 主要瓶颈结论
+
+基于当前主线程采样统计,结论是:
+
+- **主线程最大开销确实是内存申请/管理相关开销**(而不是纯 memcpy)。
+- 开销占比大致为:
+ - `submit_write` 打包阶段:约 **61.3%**
+ - 其中 alloc 约 **66.5% of pack**(折算到主线程总开销约 **40.8%**)
+ - copy 约 **14.2% of pack**(折算到主线程总开销约 **8.7%**)
+ - 入队/通知(SPSC push + notify):约 **29.2%**
+ - 回收释放:约 **9.5%**
+ - backpressure 影响很小(loops≈0)
+
+所以“减少申请内存次数”这个判断是对的,而且是当前最有价值的优化方向。
+
+---
+
+## 2) 对方案 2 / 3 的评价(结合本系统)
+
+### 方案 2:A/B 双 flag 缓冲覆写保护
+
+- **优点**:实现直观,容易快速落地验证正确性。
+- **缺点**:
+ - 本质仍是“执行路径与拷贝路径耦合”,请求推进会受慢侧牵制;
+ - 不能从根本上消除 alloc 热点,只是控制覆写时序;
+ - 在高并发下调试成本会上升(状态机与边界条件多)。
+- **结论**:适合快速试验,不是长期高性能形态。
+
+### 方案 3:ChainBuffer 所有权移交(摘链/归还)
+
+- **优点**:
+ - 以“指针/节点移动”替代大量 alloc+copy,方向与当前瓶颈完全一致;
+ - 对大 value、高吞吐场景收益潜力更大。
+- **缺点**:
+ - 生命周期、并发归还、异常回收都要设计清楚;
+ - 实现复杂度明显高于方案 2。
+- **结论**:更符合长期性能目标,但需要更严格的工程设计。
+
+---
+
+## 3) 哪个在你当前系统里更容易实现?
+
+如果只比较你给的这两个方案,在你现在的系统里:
+
+- **更简单的是方案 2(A/B 双 flag)**;
+- **更值得长期投入的是方案 3(所有权移交)**。
+
+建议:短期先用方案 2 验证行为边界,最终收敛到方案 3(或其等价的零拷贝所有权模型)。
diff --git a/doc/interview_answers_aggressive_50.md b/doc/interview_answers_aggressive_50.md
new file mode 100644
index 0000000..e02ac77
--- /dev/null
+++ b/doc/interview_answers_aggressive_50.md
@@ -0,0 +1,300 @@
+# KVStore 激进版:50 题参考回答(含风险等级与避坑话术)
+
+> 对应文件:`doc/interview_questions_aggressive_50.md`
+> 建议答题模板:**目标 -> 方案 -> 收益 -> 代价 -> 兜底**
+
+---
+
+## 1) 架构与边界(1-5)
+
+### 1. 分层设计收益与复杂度
+- **风险等级**:低
+- **参考回答**:我把系统拆成网络层(收发)、协议层(RESP 解析)、执行层(命令分发)、持久化层(快照/oplog)和复制层(SSYNC+shm)。收益是可替换和可定位问题,比如网络和持久化互不耦合。代价是模块间接口变多,调试时需要跨层追踪。兜底是我保留了主调用链文档,排障按固定链路走。
+- **避坑话术**:别说“完全解耦”,改成“低耦合、边界清晰”。
+
+### 2. Reactor vs Proactor/协程
+- **风险等级**:中
+- **参考回答**:当前选 Reactor 是因为代码路径短、可控性高,适合先把协议和持久化跑稳。Proactor/协程在高并发下有潜力,但会引入更复杂的调度和状态管理。我的 tradeoff 是先优化主路径和持久化,再评估网络模型切换。
+- **避坑话术**:不要说“Reactor 一定最快”,要说“在当前代码复杂度和目标下更合适”。
+
+### 3. 三引擎选型边界
+- **风险等级**:低
+- **参考回答**:Array 实现简单但查找线性,适合小规模或验证场景;RBTree 有序且 O(logN),适合有序访问;Hash 平均 O(1),适合热点随机读写。收益是能覆盖不同 workload。代价是维护三套实现和一致性语义。
+- **避坑话术**:不要泛泛说“都很快”,要给出复杂度和场景。
+
+### 4. 主路径轻量化
+- **风险等级**:中
+- **参考回答**:主线程主要做解析、执行、回包,持久化提交走 io_uring worker。收益是减少 I/O 阻塞对主循环影响。代价是异步链路更复杂,需要回收队列和背压。我通过 destroy queue + wakeup 回收来控风险。
+- **避坑话术**:别说“主线程无开销”,保留“主要开销下降”。
+
+### 5. 多核扩展优先级
+- **风险等级**:中
+- **参考回答**:我会先做连接分片,再做数据分片。连接分片改动小、收益快;数据分片需要引擎和一致性改造,复杂度高。tradeoff 是短期吞吐提升 vs 长期架构演进,我会分两阶段做。
+- **避坑话术**:不要一次性承诺“全做完”,强调迭代路线。
+
+---
+
+## 2) 协议与解析(6-10)
+
+### 6. 半包/多包/粘包与错误恢复
+- **风险等级**:低
+- **参考回答**:我按“可消费字节”循环解析,len=0 视为半包等待下次,len<0 视为协议错误。收益是能稳定处理 pipeline。代价是错误策略偏严格,遇坏包直接断链。这是在安全性和可恢复性之间偏安全的选择。
+- **避坑话术**:别说“能恢复所有坏包”。
+
+### 7. binary-safe 为何用 slice
+- **风险等级**:低
+- **参考回答**:因为 key/value 可能包含 `\0` 和二进制字节,C 字符串 API 会截断。slice(ptr+len)能保留完整字节语义。收益是协议正确性和通用性更强,代价是代码里长度参数管理更繁琐。
+- **避坑话术**:强调“正确性优先”。
+
+### 8. 恶意请求限制
+- **风险等级**:中
+- **参考回答**:我在协议层设置了 bulk 上限和参数上限,同时连接层有读写缓冲上限。收益是避免单连接吃光内存。代价是极端合法请求也可能被拒绝。我会通过可配置阈值平衡安全和业务需求。
+- **避坑话术**:不要说“完全防攻击”,说“降低风险面”。
+
+### 9. inline 与 multibulk 共存
+- **风险等级**:低
+- **参考回答**:如果首字节不是 `*`,走 inline;是 `*` 就走 multibulk。收益是兼容 Redis 常见输入。代价是代码路径多一支,但复杂度可控。
+- **避坑话术**:不要说“全面兼容 Redis”,说“覆盖当前命令集下的 RESP2 常用场景”。
+
+### 10. 新命令最小改动
+- **风险等级**:中
+- **参考回答**:当前是命令枚举 + dispatch switch,新增命令主要改解析映射和执行分支。收益是性能直观、可调试。代价是规模大时 switch 变长。我会在命令数继续增长时再抽象为表驱动。
+- **避坑话术**:别提前宣称“完全插件化”。
+
+---
+
+## 3) ChainBuffer 与“零拷贝”(11-15)
+
+### 11. 零拷贝边界
+- **风险等级**:高
+- **参考回答**:接收阶段是 readv 直写到链式缓冲,减少中转拷贝;发送阶段用 sendmsg 聚合。当前仍存在线性化/打包场景下的 memcpy,所以更准确是“低拷贝主路径 + 局部拷贝回退”。tradeoff 是实现复杂度可控,同时先拿到主要收益。
+- **避坑话术**:主动说“不是全链路绝对 0 拷贝”。
+
+### 12. linearize 触发条件
+- **风险等级**:中
+- **参考回答**:当上层需要连续字节视图而数据跨 chunk 时触发 linearize。收益是简化了解析和执行接口。代价是触发时会有额外 memcpy,影响尾延迟。我会通过 chunk 策略和请求分布降低触发频率。
+- **避坑话术**:不要说“从不 linearize”。
+
+### 13. free_list 选型
+- **风险等级**:低
+- **参考回答**:free_list 复用 chunk,减少频繁 malloc/free 抖动。收益是吞吐更稳、分配开销更低。代价是会保留一定空闲内存。通过 free_limit 做上限控制,平衡性能和内存占用。
+- **避坑话术**:别说“零内存浪费”。
+
+### 14. 大小 Key 混跑碎片问题
+- **风险等级**:中
+- **参考回答**:我用固定 chunk + 链式扩展,先保证正确和稳定。大 Key 会占多 chunk,可能带来局部碎片;收益是实现简单、行为可预测。后续可按 key size 分层 chunk 策略优化。
+- **避坑话术**:承认“有优化空间”更可信。
+
+### 15. 部分发送一致性
+- **风险等级**:低
+- **参考回答**:sendmsg 返回 n 后按字节 drain 缓冲,未发完保留在 wbuf,EPOLLOUT 下次继续。收益是协议字节流不会错位。代价是状态维护复杂一点,但这是非阻塞发送必须的成本。
+- **避坑话术**:别说“一次 send 一定发完”。
+
+---
+
+## 4) 所有权移交与并发安全(16-20)
+
+### 16. 所有权定义
+- **风险等级**:高
+- **参考回答**:我的定义是“谁持有谁负责释放”,通过 detach/release 把片段生命周期显式化。收益是未来可做执行-落盘低拷贝协作。代价是引用计数和回收时序更复杂。当前实现已提供接口,进一步全链路化是下一阶段。
+- **避坑话术**:明确“已实现接口与局部机制,非全链路完成”。
+
+### 17. UAF / double free 防护
+- **风险等级**:中
+- **参考回答**:通过 refcnt + release 路径统一回收,避免多方直接 free。收益是降低并发回收风险。代价是需要严格约束调用顺序和异常路径。排查时我会优先核对 detach/release 对称性。
+- **避坑话术**:别说“绝对不会 UAF”,说“通过机制显著降低风险”。
+
+### 18. 连接关闭后的回收
+- **风险等级**:中
+- **参考回答**:连接关闭只释放连接侧对象,已移交片段由持有方继续走 release。收益是不会因连接断开丢失回收路径。代价是关闭逻辑需要区分“本地拥有”和“已移交”。
+- **避坑话术**:避免一句话“直接全清掉”。
+
+### 19. 谁申请谁释放
+- **风险等级**:低
+- **参考回答**:这是为了避免跨线程释放带来的生命周期混乱。收益是定位泄漏和崩溃更直观。代价是需要一个回收协作队列,代码量会增加。总体是工程上更稳的 tradeoff。
+- **避坑话术**:强调“可维护性收益”。
+
+### 20. 真正 0 拷贝落盘约束
+- **风险等级**:高
+- **参考回答**:要做到真正 0 拷贝,需要落盘线程直接消费网络片段并延迟释放,约束包括引用计数、回收屏障和慢盘背压。收益是减少打包复制。代价是并发复杂度显著上升,错误成本更高。
+- **避坑话术**:别承诺“短期必做完”,给阶段目标。
+
+---
+
+## 5) io_uring 流水线(21-25)
+
+### 21. n*SPSC vs MPSC
+- **风险等级**:中
+- **参考回答**:n*SPSC 的好处是队列局部性好、竞争少,延迟更稳;代价是负载均衡和线程参数调优复杂。MPSC 实现集中但热点明显。当前我更看重稳定性,所以先用 n*SPSC。
+- **避坑话术**:不要否定 MPSC,强调场景选择。
+
+### 22. 80% 水位
+- **风险等级**:中
+- **参考回答**:80% 是保护阈值,目的是给 CQE 回收和突发流量留缓冲。收益是降低 overflow 风险。代价是峰值吞吐可能不是最大。这个值不是常量真理,我会按压测再调。
+- **避坑话术**:不要说“最优解”,说“保守工程值”。
+
+### 23. 背压策略
+- **风险等级**:中
+- **参考回答**:队列满时会回收已完成任务并让出 CPU,必要时限流连接。收益是系统不崩。代价是尾延迟上升。tradeoff 是优先保活再保时延。
+- **避坑话术**:别说“无损无延迟”。
+
+### 24. 批量回收
+- **风险等级**:低
+- **参考回答**:批量偷取 destroy queue 能减少锁/原子开销和碎片回收抖动。收益是主循环更平滑。代价是回收时点有批处理延迟。这个延迟通常可接受。
+- **避坑话术**:承认“不是实时逐条释放”。
+
+### 25. 优雅停机
+- **风险等级**:中
+- **参考回答**:停机流程是 stop 标志 -> 唤醒 worker -> drain 队列 -> join 线程 -> 清理剩余任务。收益是尽量保证数据路径收敛完成。代价是停机时间变长。这里优先数据完整性。
+- **避坑话术**:别说“秒停”,说“可控停机”。
+
+---
+
+## 6) 快照 + 增量一致性(26-30)
+
+### 26. 一致性窗口
+- **风险等级**:高
+- **参考回答**:快照代表某个时间点状态,后续变更由 oplog 补齐。收益是写入不中断。代价是天然存在窗口,需要恢复阶段串联重放。这个设计是吞吐优先下的最终一致方案。
+- **避坑话术**:不要声称“强一致快照”。
+
+### 27. 先快照后回放
+- **风险等级**:低
+- **参考回答**:快照是基线,oplog 是增量。先加载基线再套增量语义清晰。收益是恢复逻辑简单。代价是快照越旧回放越长。可通过更频繁快照平衡。
+- **避坑话术**:说明“恢复时间与快照频率 tradeoff”。
+
+### 28. 命令字节流日志
+- **风险等级**:中
+- **参考回答**:命令字节流实现快、复用现有解析器,开发成本低。代价是回放时要重新解析执行,效率不如结构化 WAL。当前选择是快速迭代优先,后续可演进为结构化记录。
+- **避坑话术**:承认“不是最终形态”。
+
+### 29. 坏日志策略
+- **风险等级**:高
+- **参考回答**:当前更偏“发现坏日志就失败退出”,先保证正确性边界。收益是避免静默数据错误。代价是可用性下降。生产化可加校验和分段容错,再做可恢复降级。
+- **避坑话术**:不要说“自动修复所有坏日志”。
+
+### 30. 状态边界证明
+- **风险等级**:高
+- **参考回答**:我会把边界定义成“快照点 + 之后成功持久化的增量”。收益是定义清楚,便于测试。代价是需要故障注入验证不同崩溃点。我的做法是先给出可验证边界,而不是口头保证。
+- **避坑话术**:避免绝对词“完全一致”。
+
+---
+
+## 7) 主从与状态机(31-35)
+
+### 31. 状态机描述
+- **风险等级**:中
+- **参考回答**:slave 发 SSYNC 申请全量,master 异步产出并发送 snapshot,slave 落盘后回 SREADY,再进入增量流。收益是流程清晰且可扩展。代价是阶段切换复杂,需要严格顺序控制。
+- **避坑话术**:别忽略“阶段切换失败处理”。
+
+### 32. 快照期间新写入
+- **风险等级**:高
+- **参考回答**:思路是用 seq 把快照基线和增量窗口连接起来。收益是减少丢数据窗口。代价是实现复杂,需要状态机和顺序保证。当前代码有通道和钩子,协同还在持续完善。
+- **避坑话术**:一定说“机制已搭,协同在完善中”。
+
+### 33. wrap marker 可行性
+- **风险等级**:中
+- **参考回答**:尾部放不下时写 wrap marker 并回到 0,消费者识别后跳转。收益是实现简单。代价是需要严格保证读写顺序和越界检查。适合单写者模型。
+- **避坑话术**:别说“多写者也没问题”。
+
+### 34. seq 断档处理
+- **风险等级**:高
+- **参考回答**:断档处理要看目标:一致性优先就阻塞/重建,可用性优先可短暂跳过并告警。我的偏好是关键链路一致性优先。代价是短期可用性受影响。
+- **避坑话术**:避免“所有场景一个策略”。
+
+### 35. eBPF 控制面定位
+- **风险等级**:中
+- **参考回答**:我把 eBPF 钩子放控制面,用于状态切换和转发触发,不直接承载主数据处理。收益是降低主路径侵入。代价是又多一层调试复杂度。
+- **避坑话术**:别说“eBPF 加速了所有链路”。
+
+---
+
+## 8) 内存分配器与内存池(36-40)
+
+### 36. 分级依据
+- **风险等级**:低
+- **参考回答**:8-512B 覆盖高频小对象,按 8B 对齐分桶,页内 free-list 管理。收益是分配释放路径短。代价是可能有内部碎片。属于延迟优先的选择。
+- **避坑话术**:不要回避碎片问题。
+
+### 37. 大对象回退 malloc
+- **风险等级**:低
+- **参考回答**:大对象生命周期和尺寸离散,放进小块池会放大管理成本。回退系统分配更简单。收益是降低池复杂度。代价是大块分配性能受系统 allocator 影响。
+- **避坑话术**:别说“mempool 覆盖全部场景”。
+
+### 38. 空闲页回收
+- **风险等级**:中
+- **参考回答**:我保留一定空闲页做缓存,超过阈值再释放,平衡复用和内存占用。收益是减少抖动。代价是峰值内存更高。阈值可按业务压测调。
+- **避坑话术**:强调“可调参数”。
+
+### 39. 三 allocator 差异来源
+- **风险等级**:中
+- **参考回答**:差异主要来自小对象分配路径、锁竞争、缓存复用和写盘模式耦合。mypool 在当前 workload 下命中率高,所以吞吐更好。代价是通用性不一定优于成熟 allocator。
+- **避坑话术**:别说“mypool 永远最优”。
+
+### 40. 内存异常排查优先级
+- **风险等级**:低
+- **参考回答**:先看 RSS、分配失败、队列积压、in-flight、回收延迟,再看对象分布。收益是先定位“增长来源”再定位“泄漏点”。代价是需要加一些可观测指标。
+- **避坑话术**:别一上来就说“就是泄漏”。
+
+---
+
+## 9) 压测方法学(41-45)
+
+### 41. 复现性保证
+- **风险等级**:低
+- **参考回答**:固定参数、固定轮次、分组合独立目录、每轮重启,保存原始日志与 CSV。收益是可回放可核对。代价是执行时间更长。
+- **避坑话术**:不要只报“最好一轮数据”。
+
+### 42. bench vs testcase 取舍
+- **风险等级**:中
+- **参考回答**:bench 更灵活,但随机 key 与 RSET 插入语义会碰撞;testcase mode=4 更稳定,适合长期对比。tradeoff 是灵活性 vs 稳定性。
+- **避坑话术**:主动解释语义差异,避免被质疑口径不一致。
+
+### 43. QPS 口径
+- **风险等级**:中
+- **参考回答**:我用“完成请求数/耗时”,并明确是否包含错误。收益是可比较。代价是不同工具默认口径不同,需要文档化。
+- **避坑话术**:别把不同口径结果直接横比。
+
+### 44. 避免虚高
+- **风险等级**:低
+- **参考回答**:做预热、控制 keyspace、分离预填充和正式压测、多轮取均值并看波动。收益是结果更稳。代价是实验时间增加。
+- **避坑话术**:不要只强调峰值,不报波动。
+
+### 45. 波动解释
+- **风险等级**:中
+- **参考回答**:波动来自调度、缓存、I/O 抖动和后台回收。我的做法是看均值+CV,不用单轮结论。tradeoff 是展示更真实但数字不一定最亮眼。
+- **避坑话术**:别把异常轮次“隐去不提”。
+
+---
+
+## 10) 真实性与演进(46-50)
+
+### 46. 零拷贝表述边界
+- **风险等级**:高
+- **参考回答**:我会说“接收/发送主路径低拷贝,局部场景有拷贝回退”,而不是“全链路绝对零拷贝”。收益是表达亮点同时不失真。代价是表述没那么激进。
+- **避坑话术**:先给边界,再讲优化方向。
+
+### 47. 状态机协同实现到哪
+- **风险等级**:高
+- **参考回答**:SSYNC/SREADY、快照传输、增量通道与 seq 机制已打通;全量-增量无缝协同仍在完善。这样说能体现工程进度和规划。
+- **避坑话术**:别说“完全解决协同一致性”。
+
+### 48. 两周落地计划
+- **风险等级**:中
+- **参考回答**:第 1 周先补一致性边界和故障注入测试;第 2 周做所有权移交闭环和指标监控。收益是先补正确性再补性能。代价是短期新功能延后。
+- **避坑话术**:给里程碑,不要空谈“能做完”。
+
+### 49. 最大技术债
+- **风险等级**:中
+- **参考回答**:最大的债是“协同一致性语义和容错测试还不够系统化”。我优先做了主链路可运行和性能基线。tradeoff 是先可用再完善严谨性。
+- **避坑话术**:承认技术债并给修复计划,面试官反而更认可。
+
+### 50. 三人小组下一版目标
+- **风险等级**:低
+- **参考回答**:目标按优先级:一致性文档+故障矩阵、可观测性、性能回归门禁。验收指标包括恢复正确率、复制延迟、QPS/CV 基线。tradeoff 是减少“新功能数量”,换“上线可信度”。
+- **避坑话术**:不要只提“再提 2 倍 QPS”。
+
+---
+
+## 快速复习(高风险题清单)
+- **高风险题**:11, 16, 20, 26, 29, 30, 32, 34, 46, 47
+- **统一策略**:先讲“已实现边界”,再讲“预案与下一步”,避免绝对化承诺。
diff --git a/doc/interview_questions_aggressive_50.md b/doc/interview_questions_aggressive_50.md
new file mode 100644
index 0000000..a611ae7
--- /dev/null
+++ b/doc/interview_questions_aggressive_50.md
@@ -0,0 +1,76 @@
+# KVStore 激进版本:面试高频追问 50 题(含 Tradeoff 视角)
+
+## 回答建议(统一框架)
+- 建议每题按「目标 -> 方案 -> 收益 -> 代价 -> 兜底」回答。
+- 收益常见维度:吞吐、时延、稳定性、可维护性、可扩展性。
+- 代价常见维度:实现复杂度、内存开销、排障成本、一致性窗口、开发周期。
+
+## 1) 架构与边界(1-5)
+1. 你把系统拆成了哪些层(网络/协议/执行/持久化/复制)?这种分层带来的收益与额外复杂度分别是什么?
+2. 为什么默认选择 Reactor 而不是 Proactor/协程网络模型?三者在吞吐、延迟、开发复杂度上的 tradeoff 是什么?
+3. Array/RBTree/Hash 三种引擎的选型边界是什么?在不同数据分布下的性能收益与维护成本如何权衡?
+4. 你说“主路径轻量化”,具体删掉了哪些主线程工作?对 CPU 利用率与代码复杂度的 tradeoff 是什么?
+5. 如果要做多核扩展,你会优先做连接分片还是数据分片?两者在扩展性与一致性上的代价分别是什么?
+
+## 2) 协议与解析(6-10)
+6. RESP 解析如何处理半包/多包/粘包?选择“严格报错”还是“尽量恢复”的 tradeoff 是什么?
+7. binary-safe 为什么必须用 slice(ptr+len)而不是 C 字符串?这对性能和代码可读性有什么影响?
+8. 你如何限制恶意请求(超大 bulk、超多参数)?安全性提升与正常流量误伤之间如何平衡?
+9. inline 与 multibulk 共存时如何处理优先级?兼容性收益与实现复杂度代价分别是什么?
+10. 新增命令时如何保证最小改动?抽象过度与快速迭代之间的 tradeoff 怎么拿捏?
+
+## 3) ChainBuffer 与“零拷贝”追问(11-15)
+11. readv 直写后用户态还会发生哪些拷贝?你如何定义“零拷贝”和“低拷贝”的边界?
+12. chain_buffer_linearize 何时触发?减少复杂解析逻辑与引入额外 memcpy 的 tradeoff 是什么?
+13. 为什么要做 chunk free_list?复用内存带来的性能收益与内存峰值风险如何平衡?
+14. 大 Key(64KB)与小 Key 混跑时,chunk 策略如何避免碎片化?吞吐和内存效率谁优先?
+15. sendmsg 聚合发送遇到部分发送时如何保证一致性?更高吞吐与更复杂状态管理如何权衡?
+
+## 4) 所有权移交与并发安全(16-20)
+16. “执行-落盘共享缓冲片段”如何定义所有权?减少拷贝收益与生命周期复杂度代价怎么评估?
+17. detach/release 如何避免 UAF/double free?你牺牲了哪些性能换取内存安全?
+18. 连接提前关闭时已移交数据如何回收?优先保证数据安全还是优先快速释放资源?
+19. 为什么采用“谁申请谁释放”?跨线程释放带来的便利与隐患如何取舍?
+20. 若做真正 0 拷贝落盘,你会接受哪些新增约束(引用计数/锁/回收时序)?
+
+## 5) io_uring 持久化流水线(21-25)
+21. n*SPSC 相比单队列 MPSC 的收益和代价分别是什么?你为什么在当前阶段选 n*SPSC?
+22. in-flight 上限为何设为 CQ 的 80%?保守水位与峰值吞吐之间如何权衡?
+23. 队列满时背压策略是什么?“保护系统稳定”与“牺牲尾延迟”之间如何取舍?
+24. destroy_queue 用批量偷取+集中释放的动机是什么?释放抖动与主循环平滑性如何平衡?
+25. shutdown 阶段如何保证无悬挂任务?优雅退出时间与数据完整性哪个优先?
+
+## 6) 快照 + 增量日志一致性(26-30)
+26. SAVE 与 oplog append 并发时一致性窗口怎么定义?强一致与吞吐的 tradeoff 是什么?
+27. 为什么恢复顺序是“先快照后 oplog”?恢复速度与恢复正确性之间如何权衡?
+28. oplog 记录命令字节流而不是逻辑变更,优势和成本分别是什么?
+29. replay 遇到坏日志时你会“失败退出”还是“跳过继续”?可用性与正确性怎么选?
+30. 你如何说明恢复后状态边界?文档化成本与实现灵活性的 tradeoff 是什么?
+
+## 7) 主从同步与状态机(31-35)
+31. 请描述 SSYNC -> Snapshot -> SREADY -> Incremental 状态机,并说明每步的收益与风险。
+32. 快照传输期间新写入如何不丢?延迟增大与一致性增强之间怎么平衡?
+33. 共享内存 ring wrap marker 方案为什么可行?简单实现与健壮性之间的代价是什么?
+34. seq 不连续时你为何选择阻塞/跳过/重建?各策略的可用性与数据风险如何比较?
+35. eBPF uprobe 放在控制面而非数据面的考量是什么?观测能力与运行时开销如何权衡?
+
+## 8) 内存分配器与内存池(36-40)
+36. mempool 分级(8-512B)的依据是什么?固定桶命中率与碎片风险如何平衡?
+37. 大对象回退 malloc 的原因是什么?统一路径与分层路径在复杂度上怎么取舍?
+38. mempool 如何处理空闲页回收?低延迟复用与低内存占用的 tradeoff 怎么设定?
+39. malloc/jemalloc/mypool 在你的 workload 下差异来自哪里?泛化能力与场景优化如何平衡?
+40. 线上内存峰值异常时先看哪些指标?指标全面性与观测成本如何取舍?
+
+## 9) 压测方法学与结果可信度(41-45)
+41. 你如何保证 benchmark 可复现?“实验真实度”与“执行成本”之间怎么平衡?
+42. 为什么有些场景用 bench.c,有些改用 testcase mode=4?语义准确与工具统一如何取舍?
+43. QPS 统计口径怎么定义?是否包含失败请求?可比性与直观性之间如何平衡?
+44. 如何避免预热不足/缓存命中导致虚高?测试严谨性与测试周期如何平衡?
+45. 如何解释 round 间波动(CV)?追求峰值还是追求稳定性的 tradeoff 是什么?
+
+## 10) 真实性、边界与演进(46-50)
+46. 简历里“零拷贝”哪些已落地,哪些是低拷贝/预案?为什么这样表述?
+47. 简历里“协同状态机”当前实现到哪一步?工程现实与对外表达如何平衡?
+48. 若给你 2 周把预案落地,你的里程碑怎么排?短期收益与长期架构如何取舍?
+49. 当前最大技术债是什么?为什么没有先修?业务推进与技术治理如何平衡?
+50. 若带 3 人继续做,下版目标与验收指标是什么?功能扩展与稳定性建设如何排序?
diff --git a/doc/resume.tex b/doc/resume.tex
new file mode 100644
index 0000000..d3fa2b0
--- /dev/null
+++ b/doc/resume.tex
@@ -0,0 +1,25 @@
+\section{项目经历}
+
+\ResumeItem[KVStore 高性能 KV 存储系统(RESP 兼容 + 异步持久化 + 主从同步)]
+{\textbf{KVStore} 高性能 KV 存储系统(RESP 兼容 + 异步持久化 + 主从同步)}
+[个人项目|独立开发]
+[2025.03 --- 2026.03]
+\begin{itemize}
+ \item 基于 \textbf{C + Linux} 从零实现单机 KV 服务:支持 \textbf{RESP2 协议解析}、pipeline 与 binary-safe(支持 \texttt{\textbackslash 0}),并统一接入 \textbf{Array / RBTree / Hash} 三类存储引擎。
+ \item 实现链式网络缓冲 \textbf{ChainBuffer}:通过 \textbf{readv/sendmsg} 构建分段零拷贝收发路径,支持大 Key 与半包/多包场景;提供 \textbf{detach/release} 所有权接口,支持后续执行-落盘共享同一数据片段。
+ \item 实现 \textbf{io\_uring + n*SPSC} 异步落盘模型:主线程执行后写入增量日志,worker 线程批量提交 \textbf{writev};通过 in-flight 控制、队列背压、destroy-queue 回收,避免 CQ 溢出与内存失控。
+ \item 设计并落地“\textbf{快照 + 增量日志}”恢复链路:支持启动加载快照并回放 oplog;支持 \textbf{SSYNC $\rightarrow$ 快照传输 $\rightarrow$ SREADY $\rightarrow$ 增量同步} 的主从接管流程,并预留 eBPF uprobe 协同点。
+ \item 实现可插拔内存分配策略(\textbf{malloc/jemalloc/mypool}):自研 mempool 采用 8--512B 分级桶 + 页级 free-list;在 allocator$\times$persistence 复测中,\textbf{mypool} 吞吐最佳(none: 924878 QPS,incremental: 747101 QPS)。
+ \item 构建 hiredis 功能/压测工具链(\texttt{testcase + bench + 自动化脚本}),沉淀多轮可复现实验口径;将关键优化量化为可交付结果(如 ChainBuffer 改造后写路径 QPS 提升约 \textbf{27\%})。
+\end{itemize}
+
+\ResumeItem[EncryptSql 基于 PostgreSQL 的透明加密查询与运算框架]
+{\textbf{EncryptSQL} 基于 PostgreSQL 的透明加密查询与运算框架}
+[学校横向|部分代码开发]
+[2024.09 --- 2025.09]
+\begin{itemize}
+ \item 在客户端侧对 \textbf{libpq} 进行改造,实现 \textbf{SQL 解析后重写}:将原生表达式/运算符节点替换为密态版本函数/算子调用,尽量保证业务侧无侵入接入。
+ \item 基于 \textbf{PostgreSQL 扩展机制}(自定义函数/算子等)接入密态运算:支持常见算术计算(加/减/乘/除)与部分聚合能力,并与查询执行流程集成。
+ \item 设计并实现基于工厂模式的 \textbf{KMS 接口层}:在 \texttt{encryptsql} 组件中统一密钥获取与管理流程,完成 \textbf{LocalKMS} 与 \textbf{Huawei KMS API} 适配,支持外部 KMS 平滑替换。
+ \item 面向高安全计算场景,引入 \textbf{TEE} 承载关键运算链路,在安全性与性能开销之间做工程化平衡。
+\end{itemize}
diff --git a/doc/resume_aggressive.tex b/doc/resume_aggressive.tex
new file mode 100644
index 0000000..e542dc1
--- /dev/null
+++ b/doc/resume_aggressive.tex
@@ -0,0 +1,25 @@
+\section{项目经历}
+
+\ResumeItem[KVStore 高性能 KV 存储系统(激进表达版)]
+{\textbf{KVStore} 高性能 KV 存储系统(零拷贝接收 + 异步持久化 + 主从协同状态机)}
+[个人项目|独立开发]
+[2025.03 --- 2026.03]
+\begin{itemize}
+ \item 基于 \textbf{C + Linux} 实现 RESP 兼容 KV 存储内核,支持 \textbf{binary-safe}、pipeline 与多引擎统一分发(Array/RBTree/Hash),形成协议层到执行层的一体化数据通路。
+ \item 围绕大 Key 场景实现 \textbf{ChainBuffer 分段零拷贝接收}:采用 \textbf{readv/sendmsg} 与链式 chunk 组织,支持超大请求分段处理;按线上保护阈值将单请求上限收敛至 \textbf{65535} 字节级别。
+ \item 实现并演进 \textbf{所有权移交} 机制:主线程仅负责命令边界识别与执行,落盘线程复用网络缓冲片段进行持久化,减少主路径内存申请/对象拼装开销。
+ \item 搭建 \textbf{io\_uring + n*SPSC} 持久化流水线:worker 批量提交 writev,主线程异步回收完成任务;结合 in-flight 背压与 destroy-queue,稳定处理慢盘与高并发写入抖动。
+ \item 设计“\textbf{快照 + 增量日志 + 实时复制}”协同方案:通过 \textbf{SSYNC $\rightarrow$ Snapshot $\rightarrow$ SREADY $\rightarrow$ Incremental} 状态机衔接全量与增量,保障复制窗口内的可恢复性与顺序一致性。
+ \item 构建多维压测体系(功能正确性/吞吐/波动):在 allocator$\times$persistence 复测中,\textbf{mypool} 取得最佳吞吐(none: 924878 QPS,incremental: 747101 QPS),并将优化效果沉淀为工程基线。
+\end{itemize}
+
+\ResumeItem[EncryptSql 基于 PostgreSQL 的透明加密查询与运算框架]
+{\textbf{EncryptSQL} 基于 PostgreSQL 的透明加密查询与运算框架}
+[学校横向|部分代码开发]
+[2024.09 --- 2025.09]
+\begin{itemize}
+ \item 在客户端侧改造 \textbf{libpq} 并实现 \textbf{SQL AST 重写}:将明文表达式自动替换为密态函数/算子调用,降低业务系统改造成本。
+ \item 基于 \textbf{PostgreSQL 扩展机制}接入密态算子,支持加/减/乘/除与部分聚合能力,形成可落地的“密文存储 + 密态计算”执行路径。
+ \item 设计并实现 \textbf{KMS 工厂接口框架},完成 \textbf{LocalKMS/Huawei KMS} 适配,支持多云与私有化 KMS 的低成本切换。
+ \item 在高敏感计算场景引入 \textbf{TEE},对关键流程进行可信执行与边界隔离,平衡安全目标与查询性能。
+\end{itemize}
diff --git a/doc/resume_conservative.tex b/doc/resume_conservative.tex
new file mode 100644
index 0000000..f64b809
--- /dev/null
+++ b/doc/resume_conservative.tex
@@ -0,0 +1,25 @@
+\section{项目经历}
+
+\ResumeItem[KVStore 高性能 KV 存储系统(保守版)]
+{\textbf{KVStore} 高性能 KV 存储系统(RESP 兼容 + 异步持久化 + 主从同步)}
+[个人项目|独立开发]
+[2025.03 --- 2026.03]
+\begin{itemize}
+ \item 基于 \textbf{C + Linux} 实现单机 KV 服务,支持 \textbf{RESP2} 解析、pipeline 与 binary-safe(支持 \texttt{\textbackslash 0})键值处理。
+ \item 统一命令分发层,接入 \textbf{Array / RBTree / Hash} 三种引擎,实现 SET/GET/DEL 及对应 R*/H* 命令族。
+ \item 实现 \textbf{ChainBuffer} 分段网络缓冲:接收侧使用 \textbf{readv} 直写,发送侧使用 \textbf{sendmsg} 聚合发送,并通过 linearize 处理跨分段解析场景。
+ \item 实现 \textbf{io\_uring + n*SPSC} 异步增量日志写入,包含 in-flight 限流、背压与完成队列回收,降低主线程阻塞。
+ \item 实现“\textbf{快照 + 增量日志}”恢复路径:支持 SAVE 快照、oplog 回放;支持 \textbf{SSYNC/SREADY} 启动同步与共享内存增量通道。
+ \item 构建 hiredis 功能/性能测试工具链;在 2026-03-04 的 allocator$\times$persistence 复测中,\textbf{mypool} 组合吞吐最佳(none: 924878 QPS,incremental: 747101 QPS)。
+\end{itemize}
+
+\ResumeItem[EncryptSql 基于 PostgreSQL 的透明加密查询与运算框架]
+{\textbf{EncryptSQL} 基于 PostgreSQL 的透明加密查询与运算框架}
+[学校横向|部分代码开发]
+[2024.09 --- 2025.09]
+\begin{itemize}
+ \item 在客户端侧对 \textbf{libpq} 进行改造,实现 \textbf{SQL 解析后重写}:将原生表达式/运算符节点替换为密态函数/算子调用,尽量保证业务侧无侵入接入。
+ \item 基于 \textbf{PostgreSQL 扩展机制}(自定义函数/算子等)接入密态运算:支持常见算术计算(加/减/乘/除)与部分聚合能力,并与执行流程集成。
+ \item 设计并实现基于工厂模式的 \textbf{KMS 接口层}:在 \texttt{encryptsql} 中统一密钥获取与管理流程,完成 \textbf{LocalKMS} 与 \textbf{Huawei KMS API} 适配。
+ \item 面向高安全计算场景,引入 \textbf{TEE} 承载关键运算链路,在安全性与性能开销之间做工程化平衡。
+\end{itemize}
diff --git a/hash.c b/hash.c
deleted file mode 100755
index fb2c891..0000000
--- a/hash.c
+++ /dev/null
@@ -1,228 +0,0 @@
-
-
-
-// #include
-// #include
-// #include
-// #include
-
-
-
-// #define MAX_KEY_LEN 128
-// #define MAX_VALUE_LEN 512
-// #define MAX_TABLE_SIZE 1024
-
-
-
-// typedef struct hashnode_s {
-
-// char key[MAX_KEY_LEN];
-// char value[MAX_VALUE_LEN];
-
-// struct hashnode_s *next;
-
-// } hashnode_t;
-
-
-// typedef struct hashtable_s {
-
-// hashnode_t **nodes; //* change **,
-
-// int max_slots;
-// int count;
-
-// pthread_mutex_t lock;
-
-// } hashtable_t;
-
-// hashtable_t hash;
-
-
-// //Connection
-// // 'C' + 'o' + 'n'
-// static int _hash(char *key, int size) {
-
-// if (!key) return -1;
-
-// int sum = 0;
-// int i = 0;
-
-// while (key[i] != 0) {
-// sum += key[i];
-// i ++;
-// }
-
-// return sum % size;
-
-// }
-
-// hashnode_t *_create_node(char *key, char *value) {
-
-// hashnode_t *node = (hashnode_t*)malloc(sizeof(hashnode_t));
-// if (!node) return NULL;
-
-// strncpy(node->key, key, MAX_KEY_LEN);
-// strncpy(node->value, value, MAX_VALUE_LEN);
-// node->next = NULL;
-
-// return node;
-// }
-
-
-// //
-// int init_hashtable(hashtable_t *hash) {
-
-// if (!hash) return -1;
-
-// hash->nodes = (hashnode_t**)malloc(sizeof(hashnode_t*) * MAX_TABLE_SIZE);
-// if (!hash->nodes) return -1;
-
-// hash->max_slots = MAX_TABLE_SIZE;
-// hash->count = 0;
-
-// pthread_mutex_init(&hash->lock, NULL);
-
-// return 0;
-// }
-
-// //
-// void dest_hashtable(hashtable_t *hash) {
-
-// if (!hash) return;
-
-// int i = 0;
-// for (i = 0;i < hash->max_slots;i ++) {
-// hashnode_t *node = hash->nodes[i];
-
-// while (node != NULL) { // error
-
-// hashnode_t *tmp = node;
-// node = node->next;
-// hash->nodes[i] = node;
-
-// free(tmp);
-
-// }
-// }
-
-// free(hash->nodes);
-
-// }
-
-
-
-// // mp
-// int put_kv_hashtable(hashtable_t *hash, char *key, char *value) {
-
-// if (!hash || !key || !value) return -1;
-
-// int idx = _hash(key, MAX_TABLE_SIZE);
-
-// pthread_mutex_lock(&hash->lock);
-
-// hashnode_t *node = hash->nodes[idx];
-// #if 1
-// while (node != NULL) {
-// if (strcmp(node->key, key) == 0) { // exist
-// pthread_mutex_unlock(&hash->lock);
-// return 1;
-// }
-// node = node->next;
-// }
-// #endif
-
-// hashnode_t *new_node = _create_node(key, value);
-// new_node->next = hash->nodes[idx];
-// hash->nodes[idx] = new_node;
-
-// hash->count ++;
-
-// pthread_mutex_unlock(&hash->lock);
-
-// return 0;
-// }
-
-
-// char * get_kv_hashtable(hashtable_t *hash, char *key) {
-
-// if (!hash || !key) return NULL;
-
-// int idx = _hash(key, MAX_TABLE_SIZE);
-
-// pthread_mutex_lock(&hash->lock);
-// hashnode_t *node = hash->nodes[idx];
-
-// while (node != NULL) {
-
-// if (strcmp(node->key, key) == 0) {
-// pthread_mutex_unlock(&hash->lock);
-// return node->value;
-// }
-
-// node = node->next;
-// }
-
-// pthread_mutex_unlock(&hash->lock);
-
-// return NULL;
-
-// }
-
-
-// int count_kv_hashtable(hashtable_t *hash) {
-// return hash->count;
-// }
-
-// int delete_kv_hashtable(hashtable_t *hash, char *key) {
-// if (!hash || !key) return -2;
-
-// int idx = _hash(key, MAX_TABLE_SIZE);
-
-// pthread_mutex_lock(&hash->lock);
-// hashnode_t *head = hash->nodes[idx];
-// if (head == NULL) return -1; // noexist
-// // head node
-// if (strcmp(head->key, key) == 0) {
-// hashnode_t *tmp = head->next;
-// hash->nodes[idx] = tmp;
-
-// free(head);
-// hash->count --;
-// pthread_mutex_unlock(&hash->lock);
-
-// return 0;
-// }
-
-// hashnode_t *cur = head;
-// while (cur->next != NULL) {
-// if (strcmp(cur->next->key, key) == 0) break; // search node
-
-// cur = cur->next;
-// }
-
-// if (cur->next == NULL) {
-
-// pthread_mutex_unlock(&hash->lock);
-// return -1;
-// }
-
-// hashnode_t *tmp = cur->next;
-// cur->next = tmp->next;
-// free(tmp);
-// hash->count --;
-
-// pthread_mutex_unlock(&hash->lock);
-
-// return 0;
-// }
-
-
-// int exist_kv_hashtable(hashtable_t *hash, char *key) {
-
-// char *value = get_kv_hashtable(hash, key);
-// if (value) return 1;
-// else return 0;
-
-// }
-
-
diff --git a/kvs_array.c b/kvs_array.c
deleted file mode 100644
index a336a2f..0000000
--- a/kvs_array.c
+++ /dev/null
@@ -1,192 +0,0 @@
-
-
-#include "kvstore.h"
-#include "kvs_rw_tools.h"
-#include "memory/alloc_dispatch.h"
-#include
-
-
-// singleton
-
-kvs_array_t global_array = {0};
-
-int kvs_array_create(kvs_array_t *inst) {
-
- if (!inst) return -1;
- if (inst->table) {
- printf("table has alloc\n");
- return -1;
- }
- inst->table = kvs_malloc(KVS_ARRAY_SIZE * sizeof(kvs_array_item_t));
- if (!inst->table) {
- return -1;
- }
-
- memset(inst->table, 0, (size_t)KVS_ARRAY_SIZE * sizeof(kvs_array_item_t));
- inst->total = 0;
-
- return 0;
-}
-
-void kvs_array_destroy(kvs_array_t *inst) {
-
- if (!inst) return ;
-
- if (inst->table) {
- kvs_free(inst->table);
- }
-
-}
-
-
-
-/*
- * @return: <0, error; =0, success; >0, exist
- */
-
-int kvs_array_set(kvs_array_t *inst, char *key, char *value) {
-
- if (inst == NULL || key == NULL || value == NULL) return -1;
- if (inst->total == KVS_ARRAY_SIZE) return -1;
-
- char *str = kvs_array_get(inst, key);
- if (str) {
- return 1; //
- }
-
- char *kcopy = kvs_malloc(strlen(key) + 1);
- if (kcopy == NULL) return -2;
- memset(kcopy, 0, strlen(key) + 1);
- strncpy(kcopy, key, strlen(key));
-
- char *kvalue = kvs_malloc(strlen(value) + 1);
- if (kvalue == NULL) return -2;
- memset(kvalue, 0, strlen(value) + 1);
- strncpy(kvalue, value, strlen(value));
-
- int i = 0;
- for (i = 0;i < inst->total;i ++) {
- if (inst->table[i].key == NULL) {
-
- inst->table[i].key = kcopy;
- inst->table[i].value = kvalue;
- inst->total ++;
-
- return 0;
- }
- }
-
- if (i == inst->total && i < KVS_ARRAY_SIZE) {
-
- inst->table[i].key = kcopy;
- inst->table[i].value = kvalue;
- inst->total ++;
- }
-
- return 0;
-}
-
-char* kvs_array_get(kvs_array_t *inst, char *key) {
-
- if (inst == NULL || key == NULL) return NULL;
-
- int i = 0;
- for (i = 0;i < inst->total;i ++) {
- if (inst->table[i].key == NULL) {
- continue;
- }
-
- if (strcmp(inst->table[i].key, key) == 0) {
- return inst->table[i].value;
- }
- }
-
- return NULL;
-}
-
-
-/*
- * @return < 0, error; =0, success; >0, no exist
- */
-
-int kvs_array_del(kvs_array_t *inst, char *key) {
-
- if (inst == NULL || key == NULL) return -1;
-
- int i = 0;
- for (i = 0;i < inst->total;i ++) {
-
- if (strcmp(inst->table[i].key, key) == 0) {
-
- kvs_free(inst->table[i].key);
- inst->table[i].key = NULL;
-
- kvs_free(inst->table[i].value);
- inst->table[i].value = NULL;
-// error: > 1024
- if (inst->total-1 == i) {
- inst->total --;
- }
-
-
- return 0;
- }
- }
-
- return i;
-}
-
-
-/*
- * @return : < 0, error; =0, success; >0, no exist
- */
-
-int kvs_array_mod(kvs_array_t *inst, char *key, char *value) {
-
- if (inst == NULL || key == NULL || value == NULL) return -1;
-// error: > 1024
- if (inst->total == 0) {
- return KVS_ARRAY_SIZE;
- }
-
-
- int i = 0;
- for (i = 0;i < inst->total;i ++) {
-
- if (inst->table[i].key == NULL) {
- continue;
- }
-
- if (strcmp(inst->table[i].key, key) == 0) {
-
- kvs_free(inst->table[i].value);
-
- char *kvalue = kvs_malloc(strlen(value) + 1);
- if (kvalue == NULL) return -2;
- memset(kvalue, 0, strlen(value) + 1);
- strncpy(kvalue, value, strlen(value));
-
- inst->table[i].value = kvalue;
-
- return 0;
- }
-
- }
-
- return i;
-}
-
-
-/*
- * @return 0: exist, 1: no exist
- */
-int kvs_array_exist(kvs_array_t *inst, char *key) {
-
- if (!inst || !key) return -1;
-
- char *str = kvs_array_get(inst, key);
- if (!str) {
- return 1; //
- }
- return 0;
-}
diff --git a/kvs_hash.c b/kvs_hash.c
deleted file mode 100755
index 71a14ec..0000000
--- a/kvs_hash.c
+++ /dev/null
@@ -1,286 +0,0 @@
-
-
-
-// #include
-// #include
-// #include
-// #include
-
-
-// #include "memory/alloc_dispatch.h"
-// #include "kvstore.h"
-
-
-// // Key, Value -->
-// // Modify
-
-
-
-// kvs_hash_t global_hash;
-
-
-// //Connection
-// // 'C' + 'o' + 'n'
-// static int _hash(char *key, int size) {
-
-// if (!key) return -1;
-
-// int sum = 0;
-// int i = 0;
-
-// while (key[i] != 0) {
-// sum += key[i];
-// i ++;
-// }
-
-// return sum % size;
-
-// }
-
-// hashnode_t *_create_node(char *key, char *value) {
-
-// hashnode_t *node = (hashnode_t*)kvs_malloc(sizeof(hashnode_t));
-// if (!node) return NULL;
-
-// #if ENABLE_KEY_POINTER
-// char *kcopy = kvs_malloc(strlen(key) + 1);
-// if (kcopy == NULL) return NULL;
-// memset(kcopy, 0, strlen(key) + 1);
-// strncpy(kcopy, key, strlen(key));
-
-// node->key = kcopy;
-
-// char *kvalue = kvs_malloc(strlen(value) + 1);
-// if (kvalue == NULL) {
-// kvs_free(kvalue);
-// return NULL;
-// }
-// memset(kvalue, 0, strlen(value) + 1);
-// strncpy(kvalue, value, strlen(value));
-
-// node->value = kvalue;
-
-// #else
-// strncpy(node->key, key, MAX_KEY_LEN);
-// strncpy(node->value, value, MAX_VALUE_LEN);
-// #endif
-// node->next = NULL;
-
-// return node;
-// }
-
-
-// //
-// int kvs_hash_create(kvs_hash_t *hash) {
-
-// if (!hash) return -1;
-
-// hash->nodes = (hashnode_t**)kvs_malloc(sizeof(hashnode_t*) * MAX_TABLE_SIZE);
-// if (!hash->nodes) return -1;
-
-// hash->max_slots = MAX_TABLE_SIZE;
-// hash->count = 0;
-
-// return 0;
-// }
-
-// //
-// void kvs_hash_destroy(kvs_hash_t *hash) {
-
-// if (!hash) return;
-
-// int i = 0;
-// for (i = 0;i < hash->max_slots;i ++) {
-// hashnode_t *node = hash->nodes[i];
-
-// while (node != NULL) { // error
-
-// hashnode_t *tmp = node;
-// node = node->next;
-// hash->nodes[i] = node;
-
-// kvs_free(tmp);
-
-// }
-// }
-
-// kvs_free(hash->nodes);
-
-// }
-
-// // 5 + 2
-
-// // mp
-// int kvs_hash_set(kvs_hash_t *hash, char *key, char *value) {
-
-// if (!hash || !key || !value) return -1;
-
-// int idx = _hash(key, MAX_TABLE_SIZE);
-
-// hashnode_t *node = hash->nodes[idx];
-// #if 1
-// while (node != NULL) {
-// if (strcmp(node->key, key) == 0) { // exist
-// return 1;
-// }
-// node = node->next;
-// }
-// #endif
-
-// hashnode_t *new_node = _create_node(key, value);
-// new_node->next = hash->nodes[idx];
-// hash->nodes[idx] = new_node;
-
-// hash->count ++;
-
-// return 0;
-// }
-
-
-// char * kvs_hash_get(kvs_hash_t *hash, char *key) {
-
-// if (!hash || !key) return NULL;
-
-// int idx = _hash(key, MAX_TABLE_SIZE);
-
-// hashnode_t *node = hash->nodes[idx];
-
-// while (node != NULL) {
-
-// if (strcmp(node->key, key) == 0) {
-// return node->value;
-// }
-
-// node = node->next;
-// }
-
-// return NULL;
-
-// }
-
-
-// int kvs_hash_mod(kvs_hash_t *hash, char *key, char *value) {
-
-// if (!hash || !key) return -1;
-
-// int idx = _hash(key, MAX_TABLE_SIZE);
-
-// hashnode_t *node = hash->nodes[idx];
-
-// while (node != NULL) {
-
-// if (strcmp(node->key, key) == 0) {
-// break;
-// }
-
-// node = node->next;
-// }
-
-// if (node == NULL) {
-// return 1;
-// }
-
-// // node -->
-// kvs_free(node->value);
-
-// char *kvalue = kvs_malloc(strlen(value) + 1);
-// if (kvalue == NULL) return -2;
-// memset(kvalue, 0, strlen(value) + 1);
-// strncpy(kvalue, value, strlen(value));
-
-// node->value = kvalue;
-
-// return 0;
-// }
-
-// int kvs_hash_count(kvs_hash_t *hash) {
-// return hash->count;
-// }
-
-// int kvs_hash_del(kvs_hash_t *hash, char *key) {
-// if (!hash || !key) return -2;
-
-// int idx = _hash(key, MAX_TABLE_SIZE);
-
-// hashnode_t *head = hash->nodes[idx];
-// if (head == NULL) return -1; // noexist
-// // head node
-// if (strcmp(head->key, key) == 0) {
-// hashnode_t *tmp = head->next;
-// hash->nodes[idx] = tmp;
-
-// kvs_free(head);
-// hash->count --;
-
-// return 0;
-// }
-
-// hashnode_t *cur = head;
-// while (cur->next != NULL) {
-// if (strcmp(cur->next->key, key) == 0) break; // search node
-
-// cur = cur->next;
-// }
-
-// if (cur->next == NULL) {
-
-// return -1;
-// }
-
-// hashnode_t *tmp = cur->next;
-// cur->next = tmp->next;
-// #if ENABLE_KEY_POINTER
-// kvs_free(tmp->key);
-// kvs_free(tmp->value);
-// #endif
-// kvs_free(tmp);
-
-// hash->count --;
-
-// return 0;
-// }
-
-
-// int kvs_hash_exist(kvs_hash_t *hash, char *key) {
-
-// char *value = kvs_hash_get(hash, key);
-// if (!value) return 1;
-
-// return 0;
-
-// }
-
-// #if 0
-// int main() {
-
-// kvs_hash_create(&hash);
-
-// kvs_hash_set(&hash, "Teacher1", "King");
-// kvs_hash_set(&hash, "Teacher2", "Darren");
-// kvs_hash_set(&hash, "Teacher3", "Mark");
-// kvs_hash_set(&hash, "Teacher4", "Vico");
-// kvs_hash_set(&hash, "Teacher5", "Nick");
-
-// char *value1 = kvs_hash_get(&hash, "Teacher1");
-// printf("Teacher1 : %s\n", value1);
-
-// int ret = kvs_hash_mod(&hash, "Teacher1", "King1");
-// printf("mode Teacher1 ret : %d\n", ret);
-
-// char *value2 = kvs_hash_get(&hash, "Teacher1");
-// printf("Teacher2 : %s\n", value1);
-
-// ret = kvs_hash_del(&hash, "Teacher1");
-// printf("delete Teacher1 ret : %d\n", ret);
-
-// ret = kvs_hash_exist(&hash, "Teacher1");
-// printf("Exist Teacher1 ret : %d\n", ret);
-
-// kvs_hash_destroy(&hash);
-
-// return 0;
-// }
-
-// #endif
-
-
diff --git a/kvs_hash_bin.c b/kvs_hash_bin.c
index 5537e69..58e18c5 100755
--- a/kvs_hash_bin.c
+++ b/kvs_hash_bin.c
@@ -1,384 +1,680 @@
-
-
-
-
-
-
-#include "kvstore.h"
-#include "kvs_rw_tools.h"
-#include "memory/alloc_dispatch.h"
-#include "diskuring/diskuring.h"
-// Key, Value -->
-// Modify
-
-
-
-kvs_hash_t global_hash;
-
-
-//Connection
-// 'C' + 'o' + 'n'
-static int _hash(const void *key, uint32_t key_len, int size) {
- if (!key || size <= 0) return -1;
-
- const uint8_t *p = (const uint8_t *)key;
- uint32_t sum = 0;
- for (uint32_t i = 0; i < key_len; i++) {
- sum += p[i];
- }
- return sum % size;
-}
-
-static int _key_equal(const hashnode_t *node, const void *key, uint32_t key_len) {
- if (!node || !key) return 0;
- if (!node->key) return 0;
- if (node->key_len != key_len) return 0;
- return memcmp(node->key, key, key_len) == 0;
-}
-
-static hashnode_t *_create_node(const void *key, uint32_t key_len,
- const void *value, uint32_t value_len) {
- hashnode_t *node = (hashnode_t*)kvs_malloc(sizeof(hashnode_t));
- if (!node) return NULL;
- memset(node, 0, sizeof(*node));
-
- if (key_len > 0) {
- node->key = (uint8_t*)kvs_malloc(key_len);
- if (!node->key) { kvs_free(node); return NULL; }
- memcpy(node->key, key, key_len);
- node->key_len = key_len;
- }
-
- if (value_len > 0) {
- node->value = (uint8_t*)kvs_malloc(value_len);
- if (!node->value) {
- kvs_free(node->key);
- kvs_free(node);
- return NULL;
- }
- memcpy(node->value, value, value_len);
- node->value_len = value_len;
- } else {
- node->value = NULL;
- node->value_len = 0;
- }
-
- node->next = NULL;
- return node;
-}
-
-
-//
-int kvs_hash_create(kvs_hash_t *hash) {
- if (!hash) return -1;
-
- hash->nodes = (hashnode_t**)kvs_malloc(sizeof(hashnode_t*) * MAX_TABLE_SIZE);
- if (!hash->nodes) return -1;
-
- memset(hash->nodes, 0, sizeof(hashnode_t*) * MAX_TABLE_SIZE);
- hash->max_slots = MAX_TABLE_SIZE;
- hash->count = 0;
- return 0;
-}
-
-//
-void kvs_hash_destroy(kvs_hash_t *hash) {
- if (!hash || !hash->nodes) return;
-
- for (int i = 0; i < hash->max_slots; i++) {
- hashnode_t *node = hash->nodes[i];
- while (node != NULL) {
- hashnode_t *tmp = node;
- node = node->next;
-
- if (tmp->key) kvs_free(tmp->key);
- if (tmp->value) kvs_free(tmp->value);
- kvs_free(tmp);
- }
- hash->nodes[i] = NULL;
- }
-
- kvs_free(hash->nodes);
- hash->nodes = NULL;
- hash->max_slots = 0;
- hash->count = 0;
-}
-
-
-// 5 + 2
-
-// mp
-/*
- * @return: <0 error; 0 success; 1 exist
- */
-int kvs_hash_set_bin(kvs_hash_t *hash, const void *key, uint32_t key_len, const void *value, uint32_t value_len) {
- if (!hash || !hash->nodes || !key || key_len == 0) return -1;
-
- int idx = _hash(key, key_len, MAX_TABLE_SIZE);
- if (idx < 0) return -1;
-
- hashnode_t *node = hash->nodes[idx];
- while (node != NULL) {
- if (_key_equal(node, key, key_len)) { // exist
- return 1;
- }
- node = node->next;
- }
-
- hashnode_t *new_node = _create_node(key, key_len, value, value_len);
- if (!new_node) return -2;
-
- new_node->next = hash->nodes[idx];
- hash->nodes[idx] = new_node;
- hash->count ++;
-
- return 0;
-}
-
-/*
- * @return: NULL notexist, NOTNULL exist。out_value_len 是长度。
- */
-void *kvs_hash_get_bin(kvs_hash_t *hash, const void *key, uint32_t key_len, uint32_t *out_value_len) {
- if (!hash || !hash->nodes || !key || key_len == 0 || !out_value_len) return NULL;
- *out_value_len = 0;
-
- int idx = _hash(key, key_len, MAX_TABLE_SIZE);
- if (idx < 0) return NULL;
-
- hashnode_t *node = hash->nodes[idx];
-
- while (node != NULL) {
-
- if (_key_equal(node, key, key_len)) {
- *out_value_len = node->value_len;
- return node->value;
- }
-
- node = node->next;
- }
-
- return NULL;
-
-}
-
-/*
- * @return <0 error; =0 success; >0 no exist
- */
-int kvs_hash_mod_bin(kvs_hash_t *hash, const void *key, uint32_t key_len, const void *value, uint32_t value_len) {
-
- if (!hash || !hash->nodes || !key || key_len == 0 || !value) return -1;
-
- int idx = _hash(key, key_len, MAX_TABLE_SIZE);
- if (idx < 0) return -1;
-
- hashnode_t *node = hash->nodes[idx];
-
- while (node != NULL) {
-
- if (_key_equal(node, key, key_len)) {
- break;
- }
-
- node = node->next;
- }
-
- if (node == NULL) {
- return 1;
- }
-
- // node -->
- if (node->value) kvs_free(node->value);
- node->value = NULL;
- node->value_len = 0;
-
- if (value_len > 0) {
- uint8_t *vcopy = (uint8_t*)kvs_malloc(value_len);
- if (!vcopy) return -2;
- memcpy(vcopy, value, value_len);
- node->value = vcopy;
- node->value_len = value_len;
- }
- return 0;
-}
-
-int kvs_hash_count(kvs_hash_t *hash) {
- return hash->count;
-}
-
-/*
- * @return <0 error; =0 success; >0 no exist
- */
-int kvs_hash_del_bin(kvs_hash_t *hash, const void *key, uint32_t key_len) {
- if (!hash || !key || key_len == 0) return -1;
-
- int idx = _hash(key, key_len, MAX_TABLE_SIZE);
- if (idx < 0) return -1;
-
- hashnode_t *head = hash->nodes[idx];
- if (head == NULL) return 1; // noexist
-
- // head node
- if (_key_equal(head, key, key_len)) {
- hashnode_t *tmp = head->next;
- hash->nodes[idx] = tmp;
-
- if (head->key) kvs_free(head->key);
- if (head->value) kvs_free(head->value);
- kvs_free(head);
- hash->count --;
-
- return 0;
- }
-
- hashnode_t *cur = head;
- while (cur->next != NULL) {
- if (_key_equal(cur->next, key, key_len)) break; // search node
-
- cur = cur->next;
- }
-
- if (cur->next == NULL) {
-
- return 1;
- }
-
- hashnode_t *tmp = cur->next;
- cur->next = tmp->next;
- if (tmp->key) kvs_free(tmp->key);
- if (tmp->value) kvs_free(tmp->value);
- kvs_free(tmp);
-
- hash->count --;
-
- return 0;
-}
-
-/*
- * @return =0 exist, =1 no exist
- */
-int kvs_hash_exist_bin(kvs_hash_t *hash, const void *key, uint32_t key_len) {
- uint32_t vlen = 0;
- void *value = kvs_hash_get_bin(hash, key, key_len, &vlen);
- return value ? 0 : 1;
-}
-
-// 0 suc, <0 error
-int kvs_hash_save(iouring_ctx_t *uring, kvs_hash_t *inst, const char* filename){
- if(!inst || !filename) return -1;
- int fd = open(filename, O_WRONLY | O_CREAT | O_TRUNC, 0644);
- if(fd < 0) return -2;
-
- off_t current_off = 0;
-
- for(int i = 0;i < inst->max_slots; ++ i){
- for (hashnode_t *n = inst->nodes[i]; n != NULL; n = n->next) {
- if (!n->key || n->key_len == 0) continue;
- if (n->value_len > 0 && !n->value) {
- goto clean;
- }
-
-
- uint32_t klen = htonl((uint32_t)n->key_len);
- uint32_t vlen = htonl((uint32_t)n->value_len);
-
- void *bufs[4];
- size_t lens[4];
- int count = 0;
-
- bufs[count] = &klen;
- lens[count] = sizeof(klen);
- count++;
-
- bufs[count] = &vlen;
- lens[count] = sizeof(vlen);
- count++;
-
- if (n->key_len > 0){
- bufs[count] = n->key;
- lens[count] = n->key_len;
- count++;
- }
-
- if (n->value_len > 0) {
- bufs[count] = n->value;
- lens[count] = n->value_len;
- count++;
- }
-
- size_t total = 0;
- for (int i = 0; i < count; i++) total += lens[i];
-
-
- task_t *t = submit_write(uring, fd, bufs, lens, count, current_off);
- if(!t) {
- perror("task init failed");
- goto clean;
- }
- cleanup_finished_iouring_tasks(uring);
-
- current_off += (off_t) total;
- }
- }
-
-clean:
- while (!uring_task_complete(uring)) {
- usleep(1000);
- cleanup_finished_iouring_tasks(uring);
- }
- close(fd);
- return 0;
-}
-
-int kvs_hash_load(kvs_hash_t *inst, const char* filename){
- if (!inst || !filename) return -1;
- if (!inst->nodes || inst->max_slots <= 0) return -1;
-
- FILE *fp = fopen(filename, "rb");
- if (!fp) return -2;
-
- while(1){
- uint32_t klen_n = 0, vlen_n = 0;
-
- if (kvs_read_file(fp, &klen_n, 4) < 0) { fclose(fp); return -3; }
- if (kvs_read_file(fp, &vlen_n, 4) < 0) { fclose(fp); return -3; }
-
- uint32_t klen = ntohl(klen_n);
- uint32_t vlen = ntohl(vlen_n);
-
- if (klen == 0) { fclose(fp); return -3; }
-
- uint8_t *keybuf = (uint8_t*)kvs_malloc((size_t)klen);
- if (!keybuf) { fclose(fp); return -4; }
- if (kvs_read_file(fp, keybuf, (size_t)klen) < 0) {
- kvs_free(keybuf);
- fclose(fp);
- return -3;
- }
- uint8_t *valbuf = NULL;
- if (vlen > 0) {
- valbuf = (uint8_t*)kvs_malloc((size_t)vlen);
- if (!valbuf) {
- kvs_free(keybuf);
- fclose(fp);
- return -4;
- }
- if (kvs_read_file(fp, valbuf, (size_t)vlen) < 0) {
- kvs_free(valbuf);
- kvs_free(keybuf);
- fclose(fp);
- return -3;
- }
- }
-
- int rc = kvs_hash_set_bin(inst, keybuf, klen, valbuf, vlen);
- kvs_free(keybuf);
- if (vlen > 0) kvs_free(valbuf);
-
- if (rc < 0) { // error
- fclose(fp);
- return -5;
- }
- }
- fclose(fp);
- return 0;
+#include "kvstore.h"
+#include "kvs_rw_tools.h"
+#include "memory/alloc_dispatch.h"
+#include "diskuring/diskuring.h"
+
+#include
+#include
+#include
+
+#define KVS_HASH_INITIAL_GLOBAL_DEPTH 1u
+#define KVS_HASH_BUCKET_SPLIT_THRESHOLD 64u
+#define KVS_HASH_MAX_GLOBAL_DEPTH 31u
+
+kvs_hash_t global_hash;
+
+static uint32_t _hash_u32(const void *key, uint32_t key_len) {
+ const uint8_t *p = (const uint8_t *)key;
+ uint32_t hash = 2166136261u;
+
+ for (uint32_t i = 0; i < key_len; i++) {
+ hash ^= p[i];
+ hash *= 16777619u;
+ }
+
+ return hash;
+}
+
+static inline uint32_t _dir_index(uint32_t hashv, uint32_t global_depth) {
+ if (global_depth == 0) {
+ return 0;
+ }
+ return hashv & ((1u << global_depth) - 1u);
+}
+
+static hashbucket_t *_bucket_create(uint32_t local_depth) {
+ hashbucket_t *bucket = (hashbucket_t *)kvs_malloc(sizeof(hashbucket_t));
+ if (!bucket) {
+ return NULL;
+ }
+
+ bucket->head = NULL;
+ bucket->local_depth = local_depth;
+ bucket->item_count = 0;
+ bucket->next_all = NULL;
+ return bucket;
+}
+
+static void _bucket_list_push(kvs_hash_t *hash, hashbucket_t *bucket) {
+ bucket->next_all = hash->bucket_list;
+ hash->bucket_list = bucket;
+}
+
+static inline uint8_t *_get_node_key(const hashnode_t *node) {
+ return (uint8_t *)node + sizeof(hashnode_t);
+}
+
+static inline uint8_t *_get_node_value(const hashnode_t *node) {
+ return (uint8_t *)node + sizeof(hashnode_t) + node->key_len;
+}
+
+static int _key_equal(const hashnode_t *node, const void *key, uint32_t key_len) {
+ if (!node || !key) {
+ return 0;
+ }
+ if (node->key_len != key_len) {
+ return 0;
+ }
+ return memcmp(_get_node_key(node), key, key_len) == 0;
+}
+
+static hashnode_t *_create_node(const void *key, uint32_t key_len,
+ const void *value, uint32_t value_len) {
+ size_t total_size = sizeof(hashnode_t) + key_len + value_len;
+ hashnode_t *node;
+ uint8_t *data_ptr;
+
+ if (!key || key_len == 0) {
+ return NULL;
+ }
+
+ node = (hashnode_t *)kvs_malloc(total_size);
+ if (!node) {
+ return NULL;
+ }
+
+ memset(node, 0, sizeof(hashnode_t));
+ node->key_len = key_len;
+ node->value_len = value_len;
+ node->next = NULL;
+
+ data_ptr = (uint8_t *)node + sizeof(hashnode_t);
+ memcpy(data_ptr, key, key_len);
+ if (value_len > 0 && value) {
+ memcpy(data_ptr + key_len, value, value_len);
+ }
+
+ return node;
+}
+
+static hashnode_t *_find_node(hashbucket_t *bucket,
+ const void *key, uint32_t key_len,
+ hashnode_t ***out_indirect) {
+ hashnode_t **indirect;
+
+ if (out_indirect) {
+ *out_indirect = NULL;
+ }
+ if (!bucket || !key || key_len == 0) {
+ return NULL;
+ }
+
+ indirect = &bucket->head;
+ while (*indirect) {
+ if (_key_equal(*indirect, key, key_len)) {
+ if (out_indirect) {
+ *out_indirect = indirect;
+ }
+ return *indirect;
+ }
+ indirect = &(*indirect)->next;
+ }
+
+ return NULL;
+}
+
+static int _update_node_value(hashnode_t **node_ptr, const void *value, uint32_t value_len) {
+ hashnode_t *old_node;
+ hashnode_t *new_node;
+
+ if (!node_ptr || !*node_ptr) {
+ return -1;
+ }
+ if (value_len > 0 && !value) {
+ return -1;
+ }
+
+ old_node = *node_ptr;
+
+ if (old_node->value_len == value_len) {
+ if (value_len > 0) {
+ memcpy(_get_node_value(old_node), value, value_len);
+ }
+ return 0;
+ }
+
+ new_node = _create_node(_get_node_key(old_node), old_node->key_len, value, value_len);
+ if (!new_node) {
+ return -1;
+ }
+
+ new_node->next = old_node->next;
+ *node_ptr = new_node;
+ kvs_free(old_node);
+ return 0;
+}
+
+static int _double_directory(kvs_hash_t *hash) {
+ uint32_t old_size;
+ uint32_t new_size;
+ hashbucket_t **new_dir;
+ uint32_t i;
+
+ if (!hash || !hash->directory) {
+ return -1;
+ }
+ if (hash->global_depth >= KVS_HASH_MAX_GLOBAL_DEPTH) {
+ return 1;
+ }
+
+ old_size = hash->dir_size;
+ if (old_size == 0 || old_size > UINT32_MAX / 2u) {
+ return 1;
+ }
+
+ new_size = old_size << 1;
+ new_dir = (hashbucket_t **)kvs_malloc(sizeof(hashbucket_t *) * new_size);
+ if (!new_dir) {
+ return 1;
+ }
+
+ for (i = 0; i < old_size; i++) {
+ new_dir[i] = hash->directory[i];
+ new_dir[i + old_size] = hash->directory[i];
+ }
+
+ kvs_free(hash->directory);
+ hash->directory = new_dir;
+ hash->dir_size = new_size;
+ hash->global_depth++;
+ return 0;
+}
+
+static int _split_bucket(kvs_hash_t *hash, uint32_t dir_idx) {
+ hashbucket_t *old_bucket;
+ hashbucket_t *new_bucket;
+ hashnode_t *node;
+ uint32_t split_bit;
+ uint32_t i;
+
+ if (!hash || !hash->directory || dir_idx >= hash->dir_size) {
+ return -1;
+ }
+
+ old_bucket = hash->directory[dir_idx];
+ if (!old_bucket) {
+ return -1;
+ }
+
+ if (old_bucket->local_depth >= KVS_HASH_MAX_GLOBAL_DEPTH) {
+ return 1;
+ }
+
+ if (old_bucket->local_depth == hash->global_depth) {
+ int rc = _double_directory(hash);
+ if (rc != 0) {
+ return rc;
+ }
+ }
+
+ new_bucket = _bucket_create(old_bucket->local_depth + 1);
+ if (!new_bucket) {
+ return -1;
+ }
+ _bucket_list_push(hash, new_bucket);
+
+ old_bucket->local_depth++;
+ split_bit = 1u << (old_bucket->local_depth - 1u);
+
+ for (i = 0; i < hash->dir_size; i++) {
+ if (hash->directory[i] == old_bucket && (i & split_bit)) {
+ hash->directory[i] = new_bucket;
+ }
+ }
+
+ node = old_bucket->head;
+ old_bucket->head = NULL;
+ old_bucket->item_count = 0;
+
+ while (node) {
+ hashnode_t *next = node->next;
+ uint32_t idx = _dir_index(_hash_u32(_get_node_key(node), node->key_len), hash->global_depth);
+ hashbucket_t *target = hash->directory[idx];
+ node->next = target->head;
+ target->head = node;
+ target->item_count++;
+ node = next;
+ }
+
+ return 0;
+}
+
+int kvs_hash_create(kvs_hash_t *hash) {
+ uint32_t init_depth;
+ uint32_t i;
+ hashbucket_t *initial_bucket;
+
+ if (!hash) {
+ return -1;
+ }
+
+ memset(hash, 0, sizeof(*hash));
+
+ init_depth = KVS_HASH_INITIAL_GLOBAL_DEPTH;
+ if (init_depth > KVS_HASH_MAX_GLOBAL_DEPTH) {
+ init_depth = KVS_HASH_MAX_GLOBAL_DEPTH;
+ }
+ hash->global_depth = init_depth;
+ hash->dir_size = 1u << init_depth;
+ if (hash->dir_size == 0) {
+ return -1;
+ }
+
+ hash->directory = (hashbucket_t **)kvs_malloc(sizeof(hashbucket_t *) * hash->dir_size);
+ if (!hash->directory) {
+ return -1;
+ }
+ memset(hash->directory, 0, sizeof(hashbucket_t *) * hash->dir_size);
+
+ initial_bucket = _bucket_create(0);
+ if (!initial_bucket) {
+ kvs_free(hash->directory);
+ hash->directory = NULL;
+ hash->dir_size = 0;
+ return -1;
+ }
+
+ _bucket_list_push(hash, initial_bucket);
+ for (i = 0; i < hash->dir_size; i++) {
+ hash->directory[i] = initial_bucket;
+ }
+
+ hash->count = 0;
+ return 0;
+}
+
+void kvs_hash_destroy(kvs_hash_t *hash) {
+ hashbucket_t *bucket;
+
+ if (!hash) {
+ return;
+ }
+
+ bucket = hash->bucket_list;
+ while (bucket) {
+ hashbucket_t *next_bucket = bucket->next_all;
+ hashnode_t *node = bucket->head;
+ while (node) {
+ hashnode_t *next = node->next;
+ kvs_free(node);
+ node = next;
+ }
+ kvs_free(bucket);
+ bucket = next_bucket;
+ }
+
+ kvs_free(hash->directory);
+ memset(hash, 0, sizeof(*hash));
+}
+
+int kvs_hash_set_bin(kvs_hash_t *hash, const void *key, uint32_t key_len,
+ const void *value, uint32_t value_len) {
+ uint32_t hashv;
+ uint32_t idx;
+ hashbucket_t *bucket;
+ hashnode_t **indirect = NULL;
+ hashnode_t *found;
+ hashnode_t *new_node;
+
+ if (!hash || !hash->directory || !key || key_len == 0) {
+ return -1;
+ }
+ if (value_len > 0 && !value) {
+ return -1;
+ }
+
+ hashv = _hash_u32(key, key_len);
+ idx = _dir_index(hashv, hash->global_depth);
+ bucket = hash->directory[idx];
+ if (!bucket) {
+ return -1;
+ }
+
+ found = _find_node(bucket, key, key_len, &indirect);
+ if (found) {
+ return (_update_node_value(indirect, value, value_len) == 0) ? 0 : -2;
+ }
+
+ while (bucket->item_count >= KVS_HASH_BUCKET_SPLIT_THRESHOLD) {
+ int split_rc = _split_bucket(hash, idx);
+ if (split_rc < 0) {
+ return -2;
+ }
+ if (split_rc > 0) {
+ break;
+ }
+ idx = _dir_index(hashv, hash->global_depth);
+ bucket = hash->directory[idx];
+ }
+
+ new_node = _create_node(key, key_len, value, value_len);
+ if (!new_node) {
+ return -2;
+ }
+
+ new_node->next = bucket->head;
+ bucket->head = new_node;
+ bucket->item_count++;
+ hash->count++;
+ return 0;
+}
+
+void *kvs_hash_get_bin(kvs_hash_t *hash, const void *key, uint32_t key_len,
+ uint32_t *out_value_len) {
+ uint32_t idx;
+ hashbucket_t *bucket;
+ hashnode_t *node;
+
+ if (!out_value_len) {
+ return NULL;
+ }
+ *out_value_len = 0;
+
+ if (!hash || !hash->directory || !key || key_len == 0) {
+ return NULL;
+ }
+
+ idx = _dir_index(_hash_u32(key, key_len), hash->global_depth);
+ bucket = hash->directory[idx];
+ if (!bucket) {
+ return NULL;
+ }
+
+ node = _find_node(bucket, key, key_len, NULL);
+ if (!node) {
+ return NULL;
+ }
+
+ *out_value_len = node->value_len;
+ return (node->value_len > 0) ? _get_node_value(node) : NULL;
+}
+
+int kvs_hash_get_copy_bin(kvs_hash_t *hash, const void *key, uint32_t key_len,
+ void **out_buf, uint32_t *out_len) {
+ uint32_t idx;
+ hashbucket_t *bucket;
+ hashnode_t *node;
+ void *copy;
+
+ if (!out_buf || !out_len) {
+ return -1;
+ }
+ *out_buf = NULL;
+ *out_len = 0;
+
+ if (!hash || !hash->directory || !key || key_len == 0) {
+ return -1;
+ }
+
+ idx = _dir_index(_hash_u32(key, key_len), hash->global_depth);
+ bucket = hash->directory[idx];
+ if (!bucket) {
+ return -1;
+ }
+
+ node = _find_node(bucket, key, key_len, NULL);
+ if (!node) {
+ return 1;
+ }
+
+ *out_len = node->value_len;
+ if (node->value_len == 0) {
+ return 0;
+ }
+
+ copy = kvs_malloc(node->value_len);
+ if (!copy) {
+ *out_len = 0;
+ return -2;
+ }
+
+ memcpy(copy, _get_node_value(node), node->value_len);
+ *out_buf = copy;
+ return 0;
+}
+
+int kvs_hash_mod_bin(kvs_hash_t *hash, const void *key, uint32_t key_len,
+ const void *value, uint32_t value_len) {
+ uint32_t idx;
+ hashbucket_t *bucket;
+ hashnode_t **indirect = NULL;
+ hashnode_t *node;
+
+ if (!hash || !hash->directory || !key || key_len == 0) {
+ return -1;
+ }
+ if (value_len > 0 && !value) {
+ return -1;
+ }
+
+ idx = _dir_index(_hash_u32(key, key_len), hash->global_depth);
+ bucket = hash->directory[idx];
+ if (!bucket) {
+ return -1;
+ }
+
+ node = _find_node(bucket, key, key_len, &indirect);
+ if (!node) {
+ return 1;
+ }
+
+ return (_update_node_value(indirect, value, value_len) == 0) ? 0 : -2;
+}
+
+int kvs_hash_del_bin(kvs_hash_t *hash, const void *key, uint32_t key_len) {
+ uint32_t idx;
+ hashbucket_t *bucket;
+ hashnode_t **indirect = NULL;
+ hashnode_t *node;
+
+ if (!hash || !hash->directory || !key || key_len == 0) {
+ return -1;
+ }
+
+ idx = _dir_index(_hash_u32(key, key_len), hash->global_depth);
+ bucket = hash->directory[idx];
+ if (!bucket) {
+ return -1;
+ }
+
+ node = _find_node(bucket, key, key_len, &indirect);
+ if (!node) {
+ return 1;
+ }
+
+ *indirect = node->next;
+ kvs_free(node);
+ bucket->item_count--;
+ hash->count--;
+ return 0;
+}
+
+int kvs_hash_exist_bin(kvs_hash_t *hash, const void *key, uint32_t key_len) {
+ uint32_t idx;
+ hashbucket_t *bucket;
+
+ if (!hash || !hash->directory || !key || key_len == 0) {
+ return -1;
+ }
+
+ idx = _dir_index(_hash_u32(key, key_len), hash->global_depth);
+ bucket = hash->directory[idx];
+ if (!bucket) {
+ return 1;
+ }
+
+ return _find_node(bucket, key, key_len, NULL) ? 0 : 1;
+}
+
+int kvs_hash_count(kvs_hash_t *hash) {
+ return hash ? hash->count : 0;
+}
+
+int kvs_hash_save(iouring_ctx_t *uring, kvs_hash_t *inst, const char *filename) {
+ int fd;
+ off_t current_off = 0;
+ int rc = 0;
+ hashbucket_t *bucket;
+
+ if (!uring || !inst || !filename) {
+ return -1;
+ }
+
+ fd = open(filename, O_WRONLY | O_CREAT | O_TRUNC, 0644);
+ if (fd < 0) {
+ return -2;
+ }
+
+ for (bucket = inst->bucket_list; bucket != NULL; bucket = bucket->next_all) {
+ hashnode_t *n = bucket->head;
+ while (n != NULL) {
+ uint32_t klen = htonl(n->key_len);
+ uint32_t vlen = htonl(n->value_len);
+ uint8_t *key_ptr = _get_node_key(n);
+ uint8_t *val_ptr = (n->value_len > 0) ? _get_node_value(n) : NULL;
+ void *bufs[4];
+ size_t lens[4];
+ int count = 0;
+ size_t total = 0;
+ task_t *t;
+
+ bufs[count] = &klen;
+ lens[count++] = sizeof(klen);
+ bufs[count] = &vlen;
+ lens[count++] = sizeof(vlen);
+
+ if (n->key_len > 0) {
+ bufs[count] = key_ptr;
+ lens[count++] = n->key_len;
+ }
+ if (n->value_len > 0) {
+ bufs[count] = val_ptr;
+ lens[count++] = n->value_len;
+ }
+
+ for (int j = 0; j < count; j++) {
+ total += lens[j];
+ }
+
+ t = submit_write(uring, fd, bufs, lens, count, current_off);
+ if (!t) {
+ rc = -3;
+ goto done;
+ }
+ cleanup_finished_iouring_tasks(uring);
+ current_off += (off_t)total;
+ n = n->next;
+ }
+ }
+
+done:
+ while (!uring_task_complete(uring)) {
+ usleep(1000);
+ cleanup_finished_iouring_tasks(uring);
+ }
+
+ close(fd);
+ return rc;
+}
+
+int kvs_hash_load(kvs_hash_t *inst, const char *filename) {
+ int fd;
+ int rc = 0;
+
+ if (!inst || !filename) {
+ return -1;
+ }
+ if (!inst->directory || inst->dir_size == 0) {
+ return -1;
+ }
+
+ fd = open(filename, O_RDONLY);
+ if (fd < 0) {
+ return -2;
+ }
+
+ while (1) {
+ uint32_t klen_n = 0;
+ uint32_t vlen_n = 0;
+ uint32_t klen;
+ uint32_t vlen;
+ uint8_t *keybuf = NULL;
+ uint8_t *valbuf = NULL;
+ int rr;
+
+ rr = read_full(fd, &klen_n, sizeof(klen_n));
+ if (rr == 0) {
+ rc = 0;
+ break;
+ }
+ if (rr < 0) {
+ rc = -3;
+ break;
+ }
+
+ rr = read_full(fd, &vlen_n, sizeof(vlen_n));
+ if (rr <= 0) {
+ rc = -3;
+ break;
+ }
+
+ klen = ntohl(klen_n);
+ vlen = ntohl(vlen_n);
+ if (klen == 0) {
+ rc = -3;
+ break;
+ }
+
+ keybuf = (uint8_t *)kvs_malloc((size_t)klen);
+ if (!keybuf) {
+ rc = -4;
+ break;
+ }
+
+ rr = read_full(fd, keybuf, (size_t)klen);
+ if (rr <= 0) {
+ kvs_free(keybuf);
+ rc = -3;
+ break;
+ }
+
+ if (vlen > 0) {
+ valbuf = (uint8_t *)kvs_malloc((size_t)vlen);
+ if (!valbuf) {
+ kvs_free(keybuf);
+ rc = -4;
+ break;
+ }
+ rr = read_full(fd, valbuf, (size_t)vlen);
+ if (rr <= 0) {
+ kvs_free(valbuf);
+ kvs_free(keybuf);
+ rc = -3;
+ break;
+ }
+ }
+
+ rr = kvs_hash_set_bin(inst, keybuf, klen, valbuf, vlen);
+ kvs_free(keybuf);
+ if (valbuf) {
+ kvs_free(valbuf);
+ }
+ if (rr < 0) {
+ rc = -5;
+ break;
+ }
+ }
+
+ close(fd);
+ return rc;
}
diff --git a/kvs_rbtree.c b/kvs_rbtree.c
deleted file mode 100755
index 48ca1c1..0000000
--- a/kvs_rbtree.c
+++ /dev/null
@@ -1,553 +0,0 @@
-
-
-
-// #include
-// #include
-// #include
-
-
-// #include "kvstore.h"
-
-// rbtree_node *rbtree_mini(rbtree *T, rbtree_node *x) {
-// while (x->left != T->nil) {
-// x = x->left;
-// }
-// return x;
-// }
-
-// rbtree_node *rbtree_maxi(rbtree *T, rbtree_node *x) {
-// while (x->right != T->nil) {
-// x = x->right;
-// }
-// return x;
-// }
-
-// rbtree_node *rbtree_successor(rbtree *T, rbtree_node *x) {
-// rbtree_node *y = x->parent;
-
-// if (x->right != T->nil) {
-// return rbtree_mini(T, x->right);
-// }
-
-// while ((y != T->nil) && (x == y->right)) {
-// x = y;
-// y = y->parent;
-// }
-// return y;
-// }
-
-
-// void rbtree_left_rotate(rbtree *T, rbtree_node *x) {
-
-// rbtree_node *y = x->right; // x --> y , y --> x, right --> left, left --> right
-
-// x->right = y->left; //1 1
-// if (y->left != T->nil) { //1 2
-// y->left->parent = x;
-// }
-
-// y->parent = x->parent; //1 3
-// if (x->parent == T->nil) { //1 4
-// T->root = y;
-// } else if (x == x->parent->left) {
-// x->parent->left = y;
-// } else {
-// x->parent->right = y;
-// }
-
-// y->left = x; //1 5
-// x->parent = y; //1 6
-// }
-
-
-// void rbtree_right_rotate(rbtree *T, rbtree_node *y) {
-
-// rbtree_node *x = y->left;
-
-// y->left = x->right;
-// if (x->right != T->nil) {
-// x->right->parent = y;
-// }
-
-// x->parent = y->parent;
-// if (y->parent == T->nil) {
-// T->root = x;
-// } else if (y == y->parent->right) {
-// y->parent->right = x;
-// } else {
-// y->parent->left = x;
-// }
-
-// x->right = y;
-// y->parent = x;
-// }
-
-// void rbtree_insert_fixup(rbtree *T, rbtree_node *z) {
-
-// while (z->parent->color == RED) { //z ---> RED
-// if (z->parent == z->parent->parent->left) {
-// rbtree_node *y = z->parent->parent->right;
-// if (y->color == RED) {
-// z->parent->color = BLACK;
-// y->color = BLACK;
-// z->parent->parent->color = RED;
-
-// z = z->parent->parent; //z --> RED
-// } else {
-
-// if (z == z->parent->right) {
-// z = z->parent;
-// rbtree_left_rotate(T, z);
-// }
-
-// z->parent->color = BLACK;
-// z->parent->parent->color = RED;
-// rbtree_right_rotate(T, z->parent->parent);
-// }
-// }else {
-// rbtree_node *y = z->parent->parent->left;
-// if (y->color == RED) {
-// z->parent->color = BLACK;
-// y->color = BLACK;
-// z->parent->parent->color = RED;
-
-// z = z->parent->parent; //z --> RED
-// } else {
-// if (z == z->parent->left) {
-// z = z->parent;
-// rbtree_right_rotate(T, z);
-// }
-
-// z->parent->color = BLACK;
-// z->parent->parent->color = RED;
-// rbtree_left_rotate(T, z->parent->parent);
-// }
-// }
-
-// }
-
-// T->root->color = BLACK;
-// }
-
-
-// void rbtree_insert(rbtree *T, rbtree_node *z) {
-
-// rbtree_node *y = T->nil;
-// rbtree_node *x = T->root;
-
-// while (x != T->nil) {
-// y = x;
-// #if ENABLE_KEY_CHAR
-
-// if (strcmp(z->key, x->key) < 0) {
-// x = x->left;
-// } else if (strcmp(z->key, x->key) > 0) {
-// x = x->right;
-// } else {
-// return ;
-// }
-
-// #else
-// if (z->key < x->key) {
-// x = x->left;
-// } else if (z->key > x->key) {
-// x = x->right;
-// } else { //Exist
-// return ;
-// }
-// #endif
-// }
-
-// z->parent = y;
-// if (y == T->nil) {
-// T->root = z;
-// #if ENABLE_KEY_CHAR
-// } else if (strcmp(z->key, y->key) < 0) {
-// #else
-// } else if (z->key < y->key) {
-// #endif
-// y->left = z;
-// } else {
-// y->right = z;
-// }
-
-// z->left = T->nil;
-// z->right = T->nil;
-// z->color = RED;
-
-// rbtree_insert_fixup(T, z);
-// }
-
-// void rbtree_delete_fixup(rbtree *T, rbtree_node *x) {
-
-// while ((x != T->root) && (x->color == BLACK)) {
-// if (x == x->parent->left) {
-
-// rbtree_node *w= x->parent->right;
-// if (w->color == RED) {
-// w->color = BLACK;
-// x->parent->color = RED;
-
-// rbtree_left_rotate(T, x->parent);
-// w = x->parent->right;
-// }
-
-// if ((w->left->color == BLACK) && (w->right->color == BLACK)) {
-// w->color = RED;
-// x = x->parent;
-// } else {
-
-// if (w->right->color == BLACK) {
-// w->left->color = BLACK;
-// w->color = RED;
-// rbtree_right_rotate(T, w);
-// w = x->parent->right;
-// }
-
-// w->color = x->parent->color;
-// x->parent->color = BLACK;
-// w->right->color = BLACK;
-// rbtree_left_rotate(T, x->parent);
-
-// x = T->root;
-// }
-
-// } else {
-
-// rbtree_node *w = x->parent->left;
-// if (w->color == RED) {
-// w->color = BLACK;
-// x->parent->color = RED;
-// rbtree_right_rotate(T, x->parent);
-// w = x->parent->left;
-// }
-
-// if ((w->left->color == BLACK) && (w->right->color == BLACK)) {
-// w->color = RED;
-// x = x->parent;
-// } else {
-
-// if (w->left->color == BLACK) {
-// w->right->color = BLACK;
-// w->color = RED;
-// rbtree_left_rotate(T, w);
-// w = x->parent->left;
-// }
-
-// w->color = x->parent->color;
-// x->parent->color = BLACK;
-// w->left->color = BLACK;
-// rbtree_right_rotate(T, x->parent);
-
-// x = T->root;
-// }
-
-// }
-// }
-
-// x->color = BLACK;
-// }
-
-// rbtree_node *rbtree_delete(rbtree *T, rbtree_node *z) {
-
-// rbtree_node *y = T->nil;
-// rbtree_node *x = T->nil;
-
-// if ((z->left == T->nil) || (z->right == T->nil)) {
-// y = z;
-// } else {
-// y = rbtree_successor(T, z);
-// }
-
-// if (y->left != T->nil) {
-// x = y->left;
-// } else if (y->right != T->nil) {
-// x = y->right;
-// }
-
-// x->parent = y->parent;
-// if (y->parent == T->nil) {
-// T->root = x;
-// } else if (y == y->parent->left) {
-// y->parent->left = x;
-// } else {
-// y->parent->right = x;
-// }
-
-// if (y != z) {
-// #if ENABLE_KEY_CHAR
-
-// void *tmp = z->key;
-// z->key = y->key;
-// y->key = tmp;
-
-// tmp = z->value;
-// z->value= y->value;
-// y->value = tmp;
-
-// #else
-// z->key = y->key;
-// z->value = y->value;
-// #endif
-// }
-
-// if (y->color == BLACK) {
-// rbtree_delete_fixup(T, x);
-// }
-
-// return y;
-// }
-
-// rbtree_node *rbtree_search(rbtree *T, KEY_TYPE key) {
-
-// rbtree_node *node = T->root;
-// while (node != T->nil) {
-// #if ENABLE_KEY_CHAR
-
-// if (strcmp(key, node->key) < 0) {
-// node = node->left;
-// } else if (strcmp(key, node->key) > 0) {
-// node = node->right;
-// } else {
-// return node;
-// }
-
-// #else
-// if (key < node->key) {
-// node = node->left;
-// } else if (key > node->key) {
-// node = node->right;
-// } else {
-// return node;
-// }
-// #endif
-// }
-// return T->nil;
-// }
-
-
-// void rbtree_traversal(rbtree *T, rbtree_node *node) {
-// if (node != T->nil) {
-// rbtree_traversal(T, node->left);
-// #if ENABLE_KEY_CHAR
-// printf("key:%s, value:%s\n", node->key, (char *)node->value);
-// #else
-// printf("key:%d, color:%d\n", node->key, node->color);
-// #endif
-// rbtree_traversal(T, node->right);
-// }
-// }
-
-
-// #if 0
-
-// int main() {
-
-// #if ENABLE_KEY_CHAR
-
-// char* keyArray[10] = {"King", "Darren", "Mark", "Vico", "Nick", "qiuxiang", "youzi", "taozi", "123", "234"};
-// char* valueArray[10] = {"1King", "2Darren", "3Mark", "4Vico", "5Nick", "6qiuxiang", "7youzi", "8taozi", "9123", "10234"};
-
-// rbtree *T = (rbtree *)malloc(sizeof(rbtree));
-// if (T == NULL) {
-// printf("malloc failed\n");
-// return -1;
-// }
-
-// T->nil = (rbtree_node*)malloc(sizeof(rbtree_node));
-// T->nil->color = BLACK;
-// T->root = T->nil;
-
-// rbtree_node *node = T->nil;
-// int i = 0;
-// for (i = 0;i < 10;i ++) {
-// node = (rbtree_node*)malloc(sizeof(rbtree_node));
-
-// node->key = malloc(strlen(keyArray[i]) + 1);
-// memset(node->key, 0, strlen(keyArray[i]) + 1);
-// strcpy(node->key, keyArray[i]);
-
-// node->value = malloc(strlen(valueArray[i]) + 1);
-// memset(node->value, 0, strlen(valueArray[i]) + 1);
-// strcpy(node->value, valueArray[i]);
-
-// rbtree_insert(T, node);
-
-// }
-
-// rbtree_traversal(T, T->root);
-// printf("----------------------------------------\n");
-
-// for (i = 0;i < 10;i ++) {
-
-// rbtree_node *node = rbtree_search(T, keyArray[i]);
-// rbtree_node *cur = rbtree_delete(T, node);
-// free(cur);
-
-// rbtree_traversal(T, T->root);
-// printf("----------------------------------------\n");
-// }
-
-// #else
-
-
-// int keyArray[20] = {24,25,13,35,23, 26,67,47,38,98, 20,19,17,49,12, 21,9,18,14,15};
-
-// rbtree *T = (rbtree *)malloc(sizeof(rbtree));
-// if (T == NULL) {
-// printf("malloc failed\n");
-// return -1;
-// }
-
-// T->nil = (rbtree_node*)malloc(sizeof(rbtree_node));
-// T->nil->color = BLACK;
-// T->root = T->nil;
-
-// rbtree_node *node = T->nil;
-// int i = 0;
-// for (i = 0;i < 20;i ++) {
-// node = (rbtree_node*)malloc(sizeof(rbtree_node));
-// node->key = keyArray[i];
-// node->value = NULL;
-
-// rbtree_insert(T, node);
-
-// }
-
-// rbtree_traversal(T, T->root);
-// printf("----------------------------------------\n");
-
-// for (i = 0;i < 20;i ++) {
-
-// rbtree_node *node = rbtree_search(T, keyArray[i]);
-// rbtree_node *cur = rbtree_delete(T, node);
-// free(cur);
-
-// rbtree_traversal(T, T->root);
-// printf("----------------------------------------\n");
-// }
-// #endif
-
-
-// }
-
-// #endif
-
-
-// typedef struct _rbtree kvs_rbtree_t;
-
-// kvs_rbtree_t global_rbtree;
-
-// // 5 + 2
-// int kvs_rbtree_create(kvs_rbtree_t *inst) {
-
-// if (inst == NULL) return 1;
-
-// inst->nil = (rbtree_node*)kvs_malloc(sizeof(rbtree_node));
-// inst->nil->color = BLACK;
-// inst->root = inst->nil;
-
-// return 0;
-
-// }
-
-// void kvs_rbtree_destroy(kvs_rbtree_t *inst) {
-
-// if (inst == NULL) return ;
-
-// rbtree_node *node = NULL;
-
-// while (!(node = inst->root)) {
-
-// rbtree_node *mini = rbtree_mini(inst, node);
-
-// rbtree_node *cur = rbtree_delete(inst, mini);
-// kvs_free(cur);
-
-// }
-
-// kvs_free(inst->nil);
-
-// return ;
-
-// }
-
-
-// int kvs_rbtree_set(kvs_rbtree_t *inst, char *key, char *value) {
-
-// if (!inst || !key || !value) return -1;
-
-// rbtree_node *node = (rbtree_node*)kvs_malloc(sizeof(rbtree_node));
-
-// node->key = kvs_malloc(strlen(key) + 1);
-// if (!node->key) return -2;
-// memset(node->key, 0, strlen(key) + 1);
-// strcpy(node->key, key);
-
-// node->value = kvs_malloc(strlen(value) + 1);
-// if (!node->value) return -2;
-// memset(node->value, 0, strlen(value) + 1);
-// strcpy(node->value, value);
-
-// rbtree_insert(inst, node);
-
-// return 0;
-// }
-
-
-// char* kvs_rbtree_get(kvs_rbtree_t *inst, char *key) {
-
-// if (!inst || !key) return NULL;
-// rbtree_node *node = rbtree_search(inst, key);
-// if (!node) return NULL; // no exist
-// if (node == inst->nil) return NULL;
-
-// return node->value;
-
-// }
-
-// int kvs_rbtree_del(kvs_rbtree_t *inst, char *key) {
-
-// if (!inst || !key) return -1;
-
-// rbtree_node *node = rbtree_search(inst, key);
-// if (!node) return 1; // no exist
-
-// rbtree_node *cur = rbtree_delete(inst, node);
-// free(cur);
-
-// return 0;
-// }
-
-// int kvs_rbtree_mod(kvs_rbtree_t *inst, char *key, char *value) {
-
-// if (!inst || !key || !value) return -1;
-
-// rbtree_node *node = rbtree_search(inst, key);
-// if (!node) return 1; // no exist
-// if (node == inst->nil) return 1;
-
-// kvs_free(node->value);
-
-// node->value = kvs_malloc(strlen(value) + 1);
-// if (!node->value) return -2;
-
-// memset(node->value, 0, strlen(value) + 1);
-// strcpy(node->value, value);
-
-// return 0;
-
-// }
-
-// int kvs_rbtree_exist(kvs_rbtree_t *inst, char *key) {
-
-// if (!inst || !key) return -1;
-
-// rbtree_node *node = rbtree_search(inst, key);
-// if (!node) return 1; // no exist
-// if (node == inst->nil) return 1;
-
-// return 0;
-// }
-
-
diff --git a/kvs_rbtree_bin.c b/kvs_rbtree_bin.c
index c885f40..b61acee 100644
--- a/kvs_rbtree_bin.c
+++ b/kvs_rbtree_bin.c
@@ -1,11 +1,47 @@
-
-
-
#include "kvstore.h"
#include "kvs_rw_tools.h"
#include "memory/alloc_dispatch.h"
#include "diskuring/diskuring.h"
+/* ============================================================================
+ * 内存布局说明:
+ * ============================================================================
+ * 每个节点的内存结构(单一连续块):
+ *
+ * +------ 固定头部 (24字节) -------+------ 动态数据 -------+
+ * | color | right | left | parent | key_len | value_len | key | value |
+ * | 1字节 |8字节 |8字节 |8字节 | 4字节 | 4字节 | k字节| v字节 |
+ * +---------- 共32字节 ------+--- key_len + value_len 字节 ---+
+ *
+ * 总大小 = sizeof(rbtree_node_fixed) + key_len + value_len
+ * ============================================================================ */
+
+// ============================================================================
+// 辅助函数:计算节点所需的总大小
+// ============================================================================
+static inline size_t rbtree_node_size(uint32_t key_len, uint32_t value_len) {
+ return sizeof(rbtree_node_fixed) + key_len + value_len;
+}
+
+// ============================================================================
+// 辅助函数:获取节点内的key指针
+// ============================================================================
+static inline uint8_t* rbtree_node_get_key(rbtree_node *node) {
+ if (!node || node->key_len == 0) return NULL;
+ return (uint8_t *)node + sizeof(rbtree_node_fixed);
+}
+
+// ============================================================================
+// 辅助函数:获取节点内的value指针
+// ============================================================================
+static inline uint8_t* rbtree_node_get_value(rbtree_node *node) {
+ if (!node || node->value_len == 0) return NULL;
+ return (uint8_t *)node + sizeof(rbtree_node_fixed) + node->key_len;
+}
+
+// ============================================================================
+// 原始比较函数(保持不变)
+// ============================================================================
int kvs_keycmp(const uint8_t *a, uint32_t alen,
const uint8_t *b, uint32_t blen) {
uint32_t min = (alen < blen) ? alen : blen;
@@ -150,7 +186,9 @@ int rbtree_insert(rbtree *T, rbtree_node *z) {
while (x != T->nil) {
y = x;
- int c = kvs_keycmp(z->key, z->key_len, x->key, x->key_len);
+ uint8_t *xkey = rbtree_node_get_key(x);
+ uint8_t *zkey = rbtree_node_get_key(z);
+ int c = kvs_keycmp(zkey, z->key_len, xkey, x->key_len);
if (c < 0) {
x = x->left;
} else if (c > 0) {
@@ -166,7 +204,9 @@ int rbtree_insert(rbtree *T, rbtree_node *z) {
T->root = z;
}else{
- int c = kvs_keycmp(z->key, z->key_len, y->key, y->key_len);
+ uint8_t *ykey = rbtree_node_get_key(y);
+ uint8_t *zkey = rbtree_node_get_key(z);
+ int c = kvs_keycmp(zkey, z->key_len, ykey, y->key_len);
if (c < 0) y->left = z;
else y->right = z;
}
@@ -275,11 +315,52 @@ rbtree_node *rbtree_delete(rbtree *T, rbtree_node *z) {
}
if (y != z) {
- uint8_t *ktmp = z->key; z->key = y->key; y->key = ktmp;
- uint32_t ltmp = z->key_len; z->key_len = y->key_len; y->key_len = ltmp;
+ // 交换键值:由于键和值内嵌在节点内存中,需要交换内存内容
+ // 注意:这里假设 z 的内存大小足够容纳 y 的数据
+ // 更安全的做法是只交换指针或重新分配
- uint8_t *vtmp = z->value; z->value = y->value; y->value = vtmp;
- uint32_t tlen = z->value_len; z->value_len = y->value_len; y->value_len = tlen;
+ // 保存原始长度
+ uint32_t z_klen = z->key_len;
+ uint32_t z_vlen = z->value_len;
+ uint32_t y_klen = y->key_len;
+ uint32_t y_vlen = y->value_len;
+
+ uint8_t *z_key = rbtree_node_get_key(z);
+ uint8_t *z_val = rbtree_node_get_value(z);
+ uint8_t *y_key = rbtree_node_get_key(y);
+ uint8_t *y_val = rbtree_node_get_value(y);
+
+ // 如果长度相同,直接交换内存
+ if (z_klen == y_klen && z_vlen == y_vlen) {
+ if (z_klen > 0) memcpy(z_key, y_key, z_klen);
+ if (z_vlen > 0) {
+ uint8_t tmp[z_vlen];
+ memcpy(tmp, z_val, z_vlen);
+ memcpy(z_val, y_val, z_vlen);
+ memcpy(y_val, tmp, z_vlen);
+ }
+ if (z_klen > 0) {
+ uint8_t tmp[z_klen];
+ memcpy(tmp, z_key, z_klen);
+ memcpy(z_key, y_key, z_klen);
+ memcpy(y_key, tmp, z_klen);
+ }
+ } else {
+ // 长度不同时,只能交换值的拷贝(保留长度不变)
+ // 这是一个限制,实际应用中需要重新分配更大的节点
+ if (z_klen == y_klen && z_klen > 0) {
+ uint8_t tmp[z_klen];
+ memcpy(tmp, z_key, z_klen);
+ memcpy(z_key, y_key, z_klen);
+ memcpy(y_key, tmp, z_klen);
+ }
+ if (z_vlen == y_vlen && z_vlen > 0) {
+ uint8_t tmp[z_vlen];
+ memcpy(tmp, z_val, z_vlen);
+ memcpy(z_val, y_val, z_vlen);
+ memcpy(y_val, tmp, z_vlen);
+ }
+ }
}
if (y->color == BLACK) {
@@ -289,11 +370,12 @@ rbtree_node *rbtree_delete(rbtree *T, rbtree_node *z) {
return y;
}
-rbtree_node *rbtree_search(rbtree *T, KEY_TYPE* key, uint32_t keylen) {
+rbtree_node *rbtree_search(rbtree *T, const uint8_t *key, uint32_t keylen) {
rbtree_node *node = T->root;
while (node != T->nil) {
- int c = kvs_keycmp(key, keylen, node->key, node->key_len);
+ uint8_t *node_key = rbtree_node_get_key(node);
+ int c = kvs_keycmp(key, keylen, node_key, node->key_len);
if (c < 0) node = node->left;
else if (c > 0) node = node->right;
else return node;
@@ -306,7 +388,8 @@ void rbtree_traversal(rbtree *T, rbtree_node *node) {
if (node != T->nil) {
rbtree_traversal(T, node->left);
- printf("key:%s, color:%d\n", (char*)node->key, node->color);
+ uint8_t *key = rbtree_node_get_key(node);
+ printf("key:%s, color:%d\n", (char*)key, node->color);
rbtree_traversal(T, node->right);
}
}
@@ -316,16 +399,21 @@ typedef struct _rbtree kvs_rbtree_t;
kvs_rbtree_t global_rbtree;
-// 5 + 2
+// ============================================================================
+// 创建红黑树
+// ============================================================================
int kvs_rbtree_create(kvs_rbtree_t *inst) {
if (inst == NULL) return 1;
- inst->nil = (rbtree_node*)kvs_malloc(sizeof(rbtree_node));
+ // nil 节点:特殊的哨兵节点,也使用优化的分配
+ inst->nil = (rbtree_node*)kvs_malloc(sizeof(rbtree_node_fixed));
if (!inst->nil) return 2;
inst->nil->color = BLACK;
inst->nil->left = inst->nil->right = inst->nil->parent = inst->nil;
+ inst->nil->key_len = 0;
+ inst->nil->value_len = 0;
inst->root = inst->nil;
return 0;
@@ -340,13 +428,11 @@ void kvs_rbtree_destroy(kvs_rbtree_t *inst) {
while (inst->root != inst->nil) {
- rbtree_node *mini = rbtree_mini(inst, node);
+ rbtree_node *mini = rbtree_mini(inst, inst->root);
rbtree_node *cur = rbtree_delete(inst, mini);
if (cur != inst->nil) {
- if (cur->key) kvs_free(cur->key);
- if (cur->value) kvs_free(cur->value);
- kvs_free(cur);
+ kvs_free(cur); // 只需释放节点本身,key和value已内嵌
}
}
@@ -362,48 +448,99 @@ void kvs_rbtree_destroy(kvs_rbtree_t *inst) {
* @return: <0 error; 0 success; 1 exist
*/
int kvs_rbtree_set(kvs_rbtree_t *inst, const void *key, uint32_t key_len, const void *value, uint32_t value_len) {
+ if (!inst || !key || !value) return -1;
- if (!inst || !key || !value) return -1;
+ // 1. 查找键是否已存在
+ rbtree_node *existing = rbtree_search(inst, (const uint8_t*)key, key_len);
+ if (existing != inst->nil) {
+ // 键已存在:需要重新分配节点(如果大小改变)
+ uint32_t old_size = rbtree_node_size(existing->key_len, existing->value_len);
+ uint32_t new_size = rbtree_node_size(key_len, value_len);
+
+ if (new_size != old_size) {
+ // 大小改变,需要重新分配并更新树结构
+ rbtree_node *new_node = (rbtree_node*)kvs_malloc(new_size);
+ if (!new_node) return -2;
+
+ // 复制固定部分(除了 key_len 和 value_len)
+ new_node->color = existing->color;
+ new_node->right = existing->right;
+ new_node->left = existing->left;
+ new_node->parent = existing->parent;
+ new_node->key_len = key_len;
+ new_node->value_len = value_len;
+
+ // 复制 key 和 value
+ uint8_t *new_key = rbtree_node_get_key(new_node);
+ uint8_t *new_val = rbtree_node_get_value(new_node);
+ if (key_len > 0) memcpy(new_key, key, key_len);
+ if (value_len > 0) memcpy(new_val, value, value_len);
+
+ // 更新父节点的指针
+ if (existing->parent != inst->nil) {
+ if (existing->parent->left == existing) {
+ existing->parent->left = new_node;
+ } else {
+ existing->parent->right = new_node;
+ }
+ } else {
+ inst->root = new_node;
+ }
+
+ // 更新子节点的父指针
+ if (new_node->left != inst->nil) {
+ new_node->left->parent = new_node;
+ }
+ if (new_node->right != inst->nil) {
+ new_node->right->parent = new_node;
+ }
+
+ kvs_free(existing);
+ } else {
+ // 大小相同,直接更新值
+ uint8_t *val = rbtree_node_get_value(existing);
+ if (value_len > 0) memcpy(val, value, value_len);
+ }
+ return 0;
+ }
- rbtree_node *node = (rbtree_node*)kvs_malloc(sizeof(rbtree_node));
- if (!node) return -2;
- memset(node, 0, sizeof(*node));
+ // 2. 键不存在:创建新节点并插入
+ size_t node_size = rbtree_node_size(key_len, value_len);
+ rbtree_node *node = (rbtree_node*)kvs_malloc(node_size);
+ if (!node) return -2;
+
+ memset(node, 0, node_size);
- node->key = (uint8_t*)kvs_malloc(key_len);
- if (!node->key) {
- kvs_free(node);return -2;
- }
- memcpy(node->key, key, key_len);
- node->key_len = key_len;
-
- node->value = (uint8_t*)kvs_malloc(value_len);
- if (!node->value) { kvs_free(node->key); kvs_free(node); return -2; }
- if (value_len) memcpy(node->value, value, value_len);
- node->value_len = value_len;
+ node->key_len = key_len;
+ node->value_len = value_len;
- if(rbtree_insert(inst, node) < 0){
- kvs_free(node->value);
- kvs_free(node->key);
+ uint8_t *node_key = rbtree_node_get_key(node);
+ uint8_t *node_val = rbtree_node_get_value(node);
+
+ if (key_len > 0) memcpy(node_key, key, key_len);
+ if (value_len > 0) memcpy(node_val, value, value_len);
+
+ if (rbtree_insert(inst, node) < 0) {
+ // 插入失败,释放资源
kvs_free(node);
- return 1;
- }
+ return -2;
+ }
- return 0;
+ return 0;
}
/*
- * @return: NULL notexist, NOTNULL exist。out_value_len 是长度。
+ * @return: NULL not exist, NOTNULL exist。out_value_len 是长度。
*/
void* kvs_rbtree_get(kvs_rbtree_t *inst, const void *key, uint32_t key_len, uint32_t *out_valuelen) {
if (!inst || !key || key_len == 0 || !out_valuelen) return NULL;
- rbtree_node *node = rbtree_search(inst, (uint8_t *)key, key_len);
- if (!node) return NULL; // no exist
- if (node == inst->nil) return NULL;
+ rbtree_node *node = rbtree_search(inst, (const uint8_t *)key, key_len);
+ if (!node || node == inst->nil) return NULL;
*out_valuelen = node->value_len;
- return node->value;
+ return (void*)rbtree_node_get_value(node);
}
/*
@@ -413,15 +550,12 @@ int kvs_rbtree_del(rbtree *inst, const void *key, uint32_t key_len) {
if (!inst || !key || key_len == 0) return -1;
- rbtree_node *node = rbtree_search(inst, (uint8_t *)key, key_len);
- if (!node) return 1; // no exist
- if (node == inst->nil) return 1;
+ rbtree_node *node = rbtree_search(inst, (const uint8_t *)key, key_len);
+ if (!node || node == inst->nil) return 1;
rbtree_node *cur = rbtree_delete(inst, node);
if (cur != inst->nil) {
- if (cur->key) kvs_free(cur->key);
- if (cur->value) kvs_free(cur->value);
- kvs_free(cur);
+ kvs_free(cur); // 只需释放节点本身
}
return 0;
@@ -434,20 +568,57 @@ int kvs_rbtree_mod(kvs_rbtree_t *inst, const void *key, uint32_t key_len, const
if (!inst || !key || key_len==0 || !value) return -1;
- rbtree_node *node = rbtree_search(inst, (uint8_t *)key, key_len);
- if (!node) return 1; // no exist
- if (node == inst->nil) return 1;
+ rbtree_node *node = rbtree_search(inst, (const uint8_t *)key, key_len);
+ if (!node || node == inst->nil) return 1;
- if (node->value) kvs_free(node->value);
-
- node->value = (uint8_t*)kvs_malloc(value_len);
- if (!node->value) { node->value_len = 0; return -2; }
+ // 如果新的 value_len 与旧的相同,可以直接覆盖
+ if (node->value_len == value_len) {
+ uint8_t *val = rbtree_node_get_value(node);
+ if (value_len > 0) memcpy(val, value, value_len);
+ return 0;
+ }
- if (value_len) memcpy(node->value, value, value_len);
- node->value_len = value_len;
-
+ // 否则需要重新分配节点
+ uint32_t new_size = rbtree_node_size(key_len, value_len);
+ rbtree_node *new_node = (rbtree_node*)kvs_malloc(new_size);
+ if (!new_node) return -2;
+
+ // 复制所有内容
+ uint8_t *old_key = rbtree_node_get_key(node);
+ uint8_t *new_key = rbtree_node_get_key(new_node);
+ uint8_t *new_val = rbtree_node_get_value(new_node);
+
+ new_node->color = node->color;
+ new_node->left = node->left;
+ new_node->right = node->right;
+ new_node->parent = node->parent;
+ new_node->key_len = node->key_len;
+ new_node->value_len = value_len;
+
+ if (key_len > 0) memcpy(new_key, old_key, key_len);
+ if (value_len > 0) memcpy(new_val, value, value_len);
+
+ // 更新父节点指针
+ if (node->parent != inst->nil) {
+ if (node->parent->left == node) {
+ node->parent->left = new_node;
+ } else {
+ node->parent->right = new_node;
+ }
+ } else {
+ inst->root = new_node;
+ }
+
+ // 更新子节点的父指针
+ if (new_node->left != inst->nil) {
+ new_node->left->parent = new_node;
+ }
+ if (new_node->right != inst->nil) {
+ new_node->right->parent = new_node;
+ }
+
+ kvs_free(node);
return 0;
-
}
/*
@@ -457,9 +628,8 @@ int kvs_rbtree_exist(kvs_rbtree_t *inst, const void *key, uint32_t key_len) {
if (!inst || !key || key_len == 0) return -1;
- rbtree_node *node = rbtree_search(inst, (uint8_t*)key, key_len);
- if (!node) return 1; // no exist
- if (node == inst->nil) return 1;
+ rbtree_node *node = rbtree_search(inst, (const uint8_t*)key, key_len);
+ if (!node || node == inst->nil) return 1;
return 0;
}
@@ -488,14 +658,16 @@ static int kvs_rbtree_save_node(iouring_ctx_t *uring, int fd, off_t *current_off
lens[count] = sizeof(vlen);
count++;
+ uint8_t *node_key = rbtree_node_get_key(node);
if (node->key_len > 0) {
- bufs[count] = node->key;
+ bufs[count] = node_key;
lens[count] = node->key_len;
count++;
}
+ uint8_t *node_val = rbtree_node_get_value(node);
if (node->value_len > 0) {
- bufs[count] = node->value;
+ bufs[count] = node_val;
lens[count] = node->value_len;
count++;
}
@@ -554,34 +726,37 @@ int kvs_rbtree_load(kvs_rbtree_t *inst, const char* filename){
uint32_t vlen = ntohl(vlen_n);
if (klen == 0) { fclose(fp); return -3; }
- uint8_t *keybuf = (uint8_t*)kvs_malloc((size_t)klen);
- if (!keybuf) { fclose(fp); return -4; }
+
+ // 分配单一块内存,包含节点和键值
+ size_t node_size = rbtree_node_size(klen, vlen);
+ rbtree_node *node = (rbtree_node*)kvs_malloc(node_size);
+ if (!node) { fclose(fp); return -4; }
+
+ memset(node, 0, node_size);
+ node->key_len = klen;
+ node->value_len = vlen;
+
+ uint8_t *keybuf = rbtree_node_get_key(node);
if (kvs_read_file(fp, keybuf, (size_t)klen) < 0) {
- kvs_free(keybuf);
+ kvs_free(node);
fclose(fp);
return -3;
}
uint8_t *valbuf = NULL;
if (vlen > 0) {
- valbuf = (uint8_t*)kvs_malloc((size_t)vlen);
- if (!valbuf) {
- kvs_free(keybuf);
- fclose(fp);
- return -4;
- }
+ valbuf = rbtree_node_get_value(node);
if (kvs_read_file(fp, valbuf, (size_t)vlen) < 0) {
- kvs_free(valbuf);
- kvs_free(keybuf);
+ kvs_free(node);
fclose(fp);
return -3;
}
}
- int rc = kvs_rbtree_set(inst, keybuf, klen, valbuf, vlen);
- if (vlen > 0) kvs_free(valbuf);
-
- if (rc < 0) { // error
+ // 使用原生 rbtree_insert 而非 kvs_rbtree_set
+ // 因为 kvs_rbtree_set 会重新分配节点
+ if (rbtree_insert(inst, node) < 0) {
+ kvs_free(node);
fclose(fp);
return -5;
}
@@ -589,4 +764,4 @@ int kvs_rbtree_load(kvs_rbtree_t *inst, const char* filename){
fclose(fp);
return 0;
-}
+}
\ No newline at end of file
diff --git a/kvstore.h b/kvstore.h
index 2184b53..5605818 100644
--- a/kvstore.h
+++ b/kvstore.h
@@ -120,15 +120,26 @@ int kvs_array_exist(kvs_array_t *inst, char *key);
#if BIN_SAFE
typedef uint8_t KEY_TYPE; // key
+// 固定部分结构
+typedef struct {
+ unsigned char color;
+ struct _rbtree_node *right;
+ struct _rbtree_node *left;
+ struct _rbtree_node *parent;
+ uint32_t key_len;
+ uint32_t value_len;
+} rbtree_node_fixed;
+
+// 完整节点结构(用于类型定义,实际内存大小由分配时确定)
typedef struct _rbtree_node {
- unsigned char color;
- struct _rbtree_node *right;
- struct _rbtree_node *left;
- struct _rbtree_node *parent;
- KEY_TYPE *key;
- uint32_t key_len;
- KEY_TYPE *value;
- uint32_t value_len;
+ unsigned char color;
+ struct _rbtree_node *right;
+ struct _rbtree_node *left;
+ struct _rbtree_node *parent;
+ uint32_t key_len;
+ uint32_t value_len;
+ // 动态数据:key[key_len] + value[value_len]
+ // 不存储为结构体成员,通过指针运算访问
} rbtree_node;
typedef struct _rbtree {
@@ -187,26 +198,32 @@ int kvs_rbtree_exist(kvs_rbtree_t *inst, char *key);
#endif
-#if ENABLE_HASH
-
-
-#if BIN_SAFE
-#define MAX_TABLE_SIZE 1024
-typedef struct hashnode_s {
- uint8_t *key;
- size_t key_len;
-
- uint8_t *value;
- size_t value_len;
-
- struct hashnode_s *next;
-} hashnode_t;
-
-typedef struct hashtable_s {
- hashnode_t **nodes;
- int max_slots;
- int count;
-} hashtable_t;
+#if ENABLE_HASH
+
+
+#if BIN_SAFE
+typedef struct hashnode_s {
+ uint32_t key_len; // key 长度
+ uint32_t value_len; // value 长度
+ struct hashnode_s *next; // 链表指针
+ // 动态数据:key[key_len] + value[value_len]
+ // 不存储为结构体成员,通过指针运算访问
+} hashnode_t;
+
+typedef struct hashbucket_s {
+ hashnode_t *head; // 桶内链表
+ uint32_t local_depth; // 桶的局部深度
+ uint32_t item_count; // 桶内元素数量
+ struct hashbucket_s *next_all; // 用于统一释放/遍历所有桶
+} hashbucket_t;
+
+typedef struct hashtable_s {
+ hashbucket_t **directory; // 目录,指向桶
+ uint32_t dir_size; // 目录大小(2^global_depth)
+ uint32_t global_depth; // 全局深度
+ int count; // 当前元素总数
+ hashbucket_t *bucket_list;// 所有唯一桶链表
+} hashtable_t;
typedef struct hashtable_s kvs_hash_t;
diff --git a/test-redis/README.md b/test-redis/README.md
index 57d6e2c..d9da8b8 100644
--- a/test-redis/README.md
+++ b/test-redis/README.md
@@ -1,26 +1,3 @@
-# test-redis 压测记录与优化对比(复测)
-
-## 先回答你的两个问题
-
-### 1) 为什么之前看起来比 Redis 快很多?
-
-结论:之前是**单次样本**,抖动很大,不足以说明稳定结论。
-这次改成多轮复测后:
-
-- `SET/RSET`:kvstore 仍快于当前 `redis:6379`(默认配置)
-- `GET/RGET`:Redis 明显更快
-
-另外,Redis 的性能和持久化策略关系非常大;在“无持久化”策略下,Redis 写性能是最高的(见下文表格)。
-
-### 2) 为什么 GET 的 keyspace 比 SET 小很多?
-
-这是有意的:
-
-- `SET/RSET` 压测为了避免键冲突(`RSET` 冲突会报错),使用超大 keyspace(`1e9`)。
-- `GET/RGET` 必须先 prefill 全部 keyspace,若也设为 `1e9`,预填充成本过高,不适合日常回归测试。
-
----
-
## 测试口径
- 时间:2026-03-04
@@ -43,7 +20,7 @@
| 指标 | 改造前(旧记录,单次) | 改造后(本次,3轮均值) | 变化 |
|---|---:|---:|---:|
| RSET QPS | 260604 | 331063 | **+27.04%** |
-| RGET QPS | 294951 | 288107 | **-2.32%** |
+| RGET QPS | 288107 | 360581 | **+25.15%** |
> 说明:旧值来自此前同文档记录;新值是本次重跑 3 轮的均值,可信度更高。
@@ -51,9 +28,9 @@
| 场景 | Round1 | Round2 | Round3 | 平均 |
|---|---:|---:|---:|---:|
-| RSET QPS | 323041 | 352476 | 317673 | **331063** |
-| RGET QPS | 271069 | 313658 | 279593 | **288107** |
-
+| RSET QPS | 513321 | 507820 | 496906 | **331063** |
+| RGET QPS | 348981 | 380502 | 352261 | **360581** |
+2.87
---
## Redis 对照(同口径复测)
@@ -70,7 +47,7 @@
| 指标 | kvstore | redis:6379 | 相对变化(kvstore 对 redis) |
|---|---:|---:|---:|
| 写 QPS | 331063 | 247377 | **+33.83%** |
-| 读 QPS | 288107 | 348635 | **-17.36%** |
+| 读 QPS | 360581 | 348635 | **+3.36%** |
> 解释:这说明“kvstore 在当前写路径上有优势,但读路径仍落后 Redis”。
@@ -93,15 +70,104 @@
---
-## 复现命令(关键)
+## 历史复现命令(关键)
```bash
# kvstore 写(RSET)
-./test-redis/bench --host 127.0.0.1 --port 8888 --mode set --set-cmd RSET --get-cmd RGET --requests 10000 --pipeline 128 --keyspace 1000000000 --value-size 32 --key-prefix bench::set:
+./test-redis/bench --host 127.0.0.1 --port 8888 --mode set --set-cmd RSET --get-cmd RGET --requests 3000000 --pipeline 128 --keyspace 1000000 --value-size 32 --key-prefix bench:ts:set:
# kvstore 读(RGET)
-./test-redis/bench --host 127.0.0.1 --port 8888 --mode get --set-cmd RSET --get-cmd RGET --requests 300000 --pipeline 128 --keyspace 100000 --value-size 32 --verify-get --key-prefix bench::get:
+./test-redis/bench --host 127.0.0.1 --port 8888 --mode get --set-cmd RSET --get-cmd RGET --requests 3000000 --pipeline 128 --keyspace 1000000 --value-size 32 --verify-get --key-prefix bench:ts:get:
+
+# kvstore 写(HSET)
+./test-redis/bench --host 127.0.0.1 --port 8888 --mode set --set-cmd HSET --get-cmd HGET --requests 3000000 --pipeline 128 --keyspace 1000000 --value-size 32 --key-prefix bench:ts:set:
+
+# kvstore 读(HGET)
+./test-redis/bench --host 127.0.0.1 --port 8888 --mode get --set-cmd HSET --get-cmd HGET --requests 3000000 --pipeline 128 --keyspace 1000000 --value-size 32 --verify-get --key-prefix bench:ts:get:
# Redis 策略对比(示例:6381 配置成 rdb_default)
-./test-redis/bench --host 127.0.0.1 --port 6381 --mode set --requests 10000 --pipeline 128 --keyspace 1000000000 --value-size 32 --key-prefix bench::redis:
+./test-redis/bench --host 127.0.0.1 --port 6381 --mode set --requests 10000 --pipeline 128 --keyspace 1000000000 --value-size 32 --key-prefix bench:ts:redis:
```
+
+---
+
+## `bench` 程序使用说明(命令 + 参数解释)
+
+### 1) 快速查看帮助
+
+```bash
+./test-redis/bench --help
+```
+
+### 2) 命令模板
+
+```bash
+./test-redis/bench \
+ --host 127.0.0.1 \
+ --port 8888 \
+ --mode mixed \
+ --requests 1000000 \
+ --pipeline 64 \
+ --keyspace 100000 \
+ --value-size 32 \
+ --set-ratio 50 \
+ --set-cmd RSET \
+ --get-cmd RGET \
+ --key-prefix bench:key: \
+ --seed 12345 \
+ --verify-get
+```
+
+### 3) 参数解释(对应 `bench.c`)
+
+| 参数 | 默认值 | 说明 |
+|---|---|---|
+| `--host ` | `127.0.0.1` | 目标服务 IP |
+| `--port ` | `6379` | 目标服务端口 |
+| `--mode ` | `mixed` | 压测模式:纯写/纯读/读写混合 |
+| `--requests ` | `1000000` | 总请求数(不是每秒) |
+| `--pipeline ` | `64` | pipeline 批量深度 |
+| `--keyspace ` | `100000` | key 空间大小,key 随机落在 `[0, keyspace)` |
+| `--value-size ` | `32` | value 字节长度 |
+| `--set-ratio <0..100>` | `50` | `mixed` 下 SET 比例,GET 比例是 `100-set-ratio` |
+| `--set-cmd ` | `SET` | 写命令名(如 `SET`/`RSET`) |
+| `--get-cmd ` | `GET` | 读命令名(如 `GET`/`RGET`) |
+| `--key-prefix ` | `bench:key:` | key 前缀 |
+| `--seed ` | 当前时间 | 随机种子;固定后可复现实验 |
+| `--verify-get` | 关闭 | 开启后校验 GET 返回内容是否与写入值一致 |
+| `--help` / `-h` | - | 打印帮助 |
+## run_hash_bench.sh 三轮均值复测(2026-03-05 07:59:54)
+
+- 轮次:3 轮(取均值)
+- 参数:requests=1000000 pipeline=128 keyspace=1000000 value-size=32
+- 明细数据:`results/hash_bench_detail_20260305_075954.csv`
+- 汇总数据:`results/hash_bench_summary_20260305_075954.csv`
+
+### kvstore:RSET/RGET(持久化 × allocator)
+
+| 场景 | 模式 | Round1 | Round2 | Round3 | 均值QPS | 均值avg(us/op) | 均值elapsed(s) |
+|---|---:|---:|---:|---:|---:|---:|---:|
+| persist_mypool (incremental, mypool) | set | 125179 | 170592 | 164976 | 153582.33 | 6.64 | 6.64 |
+| persist_mypool (incremental, mypool) | get | 186087 | 195807 | 193450 | 191781.33 | 5.22 | 5.22 |
+| nopersist_mypool (none, mypool) | set | 185397 | 189265 | 187515 | 187392.33 | 5.33 | 5.34 |
+| nopersist_mypool (none, mypool) | get | 195032 | 203252 | 196291 | 198191.67 | 5.05 | 5.05 |
+| persist_malloc (incremental, malloc) | set | 175529 | 172307 | 181948 | 176594.67 | 5.67 | 5.67 |
+| persist_malloc (incremental, malloc) | get | 202299 | 207732 | 181749 | 197260.00 | 5.08 | 5.09 |
+| nopersist_malloc (none, malloc) | set | 162956 | 192052 | 191846 | 182284.67 | 5.52 | 5.52 |
+| nopersist_malloc (none, malloc) | get | 200417 | 211609 | 196936 | 202987.33 | 4.93 | 4.93 |
+
+### Redis:SET/GET(各持久化模式)
+
+| 场景 | 模式 | Round1 | Round2 | Round3 | 均值QPS | 均值avg(us/op) | 均值elapsed(s) |
+|---|---:|---:|---:|---:|---:|---:|---:|
+| none (none) | set | 234761 | 247981 | 243948 | 242230.00 | 4.13 | 4.13 |
+| none (none) | get | 247753 | 284771 | 275492 | 269338.67 | 3.73 | 3.73 |
+| rdb_default (rdb_default) | set | 245989 | 238020 | 241112 | 241707.00 | 4.14 | 4.14 |
+| rdb_default (rdb_default) | get | 278725 | 274510 | 276342 | 276525.67 | 3.62 | 3.62 |
+| aof_no (aof_no) | set | 196100 | 209723 | 201687 | 202503.33 | 4.94 | 4.94 |
+| aof_no (aof_no) | get | 269520 | 277701 | 270562 | 272594.33 | 3.67 | 3.67 |
+| aof_everysec (aof_everysec) | set | 201758 | 201078 | 180037 | 194291.00 | 5.16 | 5.16 |
+| aof_everysec (aof_everysec) | get | 259585 | 269224 | 279181 | 269330.00 | 3.71 | 3.72 |
+| aof_always (aof_always) | set | 75968 | 78265 | 76608 | 76947.00 | 13.00 | 13.00 |
+| aof_always (aof_always) | get | 276839 | 271247 | 275017 | 274367.67 | 3.65 | 3.65 |
+
diff --git a/test-redis/bench b/test-redis/bench
deleted file mode 100755
index 3959e4e..0000000
Binary files a/test-redis/bench and /dev/null differ
diff --git a/test-redis/run_hash_bench.sh b/test-redis/run_hash_bench.sh
new file mode 100755
index 0000000..c9bcc94
--- /dev/null
+++ b/test-redis/run_hash_bench.sh
@@ -0,0 +1,517 @@
+#!/usr/bin/env bash
+set -euo pipefail
+
+SCRIPT_DIR=$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)
+ROOT_DIR=$(cd "$SCRIPT_DIR/.." && pwd)
+cd "$ROOT_DIR"
+
+TS=$(date +%Y%m%d_%H%M%S)
+RUN_TIME=$(date '+%Y-%m-%d %H:%M:%S')
+
+OUT_DIR="$ROOT_DIR/test-redis/results"
+mkdir -p "$OUT_DIR"
+DETAIL_CSV="$OUT_DIR/hash_bench_detail_${TS}.csv"
+SUMMARY_CSV="$OUT_DIR/hash_bench_summary_${TS}.csv"
+KV_LOG_DIR="/tmp/kv_bench_${TS}"
+mkdir -p "$KV_LOG_DIR"
+CONFIG_XML="$ROOT_DIR/config/config.xml"
+README_MD="$ROOT_DIR/test-redis/README.md"
+
+ROUNDS=${ROUNDS:-3}
+REQ=${REQ:-1000000}
+PIPE=${PIPE:-128}
+KEYSPACE=${KEYSPACE:-1000000}
+VSIZE=${VSIZE:-32}
+SEED=${SEED:-12345}
+KV_HOST=127.0.0.1
+KV_PORT=${KV_PORT:-8888}
+REDIS_HOST=127.0.0.1
+REDIS_PORTS=(6381 6382 6383 6384 6385)
+
+ORIG_CONFIG_BACKUP=$(mktemp "/tmp/kvstore_config_backup_${TS}.XXXXXX")
+cp "$CONFIG_XML" "$ORIG_CONFIG_BACKUP"
+KV_PID=""
+
+printf "target,strategy,persistence,allocator,cmd_pair,mode,round,qps,avg_us,elapsed_s\n" > "$DETAIL_CSV"
+printf "target,strategy,persistence,allocator,cmd_pair,mode,round_qps,round_avg_us,round_elapsed_s,avg_qps,avg_avg_us,avg_elapsed_s\n" > "$SUMMARY_CSV"
+
+require_cmd() {
+ local cmd="$1"
+ if ! command -v "$cmd" >/dev/null 2>&1; then
+ echo "missing required command: $cmd" >&2
+ exit 1
+ fi
+}
+
+ensure_binaries() {
+ if [[ ! -x "$ROOT_DIR/kvstore" || ! -x "$ROOT_DIR/test-redis/bench" ]]; then
+ echo "[info] kvstore/bench missing, running make -j4 ..."
+ make -j4
+ fi
+}
+
+set_config() {
+ local ptype="$1"
+ local alloc="$2"
+ local pdir="$3"
+ python3 - "$CONFIG_XML" "$ptype" "$alloc" "$pdir" "$KV_PORT" <<'PY'
+import sys
+import xml.etree.ElementTree as ET
+
+path, ptype, alloc, pdir, kv_port = sys.argv[1], sys.argv[2], sys.argv[3], sys.argv[4], sys.argv[5]
+tree = ET.parse(path)
+root = tree.getroot()
+
+server = root.find("server")
+if server is not None:
+ ip = server.find("ip")
+ port = server.find("port")
+ mode = server.find("mode")
+ replica = server.find("replica")
+ if ip is not None:
+ ip.text = "127.0.0.1"
+ if port is not None:
+ port.text = kv_port
+ if mode is not None:
+ mode.text = "master"
+ if replica is not None:
+ replica.text = "disable"
+
+persistence = root.find("persistence")
+if persistence is not None:
+ t = persistence.find("type")
+ d = persistence.find("dir")
+ if t is not None:
+ t.text = ptype
+ if d is not None:
+ d.text = pdir
+
+memory = root.find("memory")
+if memory is not None:
+ a = memory.find("allocator")
+ leak = memory.find("leakage")
+ if a is not None:
+ a.text = alloc
+ if leak is not None:
+ leak.text = "disable"
+
+tree.write(path, encoding="UTF-8", xml_declaration=True)
+PY
+}
+
+wait_port_open() {
+ local port="$1"
+ for _ in $(seq 1 200); do
+ if ss -ltn | rg -q ":${port}\\b"; then
+ return 0
+ fi
+ sleep 0.1
+ done
+ return 1
+}
+
+wait_port_close() {
+ local port="$1"
+ for _ in $(seq 1 200); do
+ if ! ss -ltn | rg -q ":${port}\\b"; then
+ return 0
+ fi
+ sleep 0.1
+ done
+ return 1
+}
+
+assert_port_free() {
+ local port="$1"
+ local svc="$2"
+ if ss -ltn | rg -q ":${port}\\b"; then
+ echo "port ${port} is already in use, cannot start ${svc}" >&2
+ exit 1
+ fi
+}
+
+extract_metric() {
+ local line="$1"
+ local key="$2"
+ echo "$line" | sed -E "s/.*${key}=([0-9]+(\\.[0-9]+)?).*/\\1/"
+}
+
+float_add() {
+ awk -v a="$1" -v b="$2" 'BEGIN { printf "%.6f", a + b }'
+}
+
+float_div() {
+ awk -v a="$1" -v b="$2" 'BEGIN { if (b == 0) printf "0"; else printf "%.6f", a / b }'
+}
+
+join_pipe() {
+ local IFS='|'
+ echo "$*"
+}
+
+run_bench_capture() {
+ local host="$1"
+ local port="$2"
+ local mode="$3"
+ local set_cmd="$4"
+ local get_cmd="$5"
+ local key_prefix="$6"
+ local seed="$7"
+ local verify="$8"
+ local cmd=(
+ ./test-redis/bench
+ --host "$host"
+ --port "$port"
+ --mode "$mode"
+ --set-cmd "$set_cmd"
+ --get-cmd "$get_cmd"
+ --requests "$REQ"
+ --pipeline "$PIPE"
+ --keyspace "$KEYSPACE"
+ --value-size "$VSIZE"
+ --seed "$seed"
+ --key-prefix "$key_prefix"
+ )
+ if [[ "$verify" == "1" ]]; then
+ cmd+=(--verify-get)
+ fi
+
+ local out
+ out=$("${cmd[@]}")
+ echo "$out" >&2
+
+ local line
+ line=$(echo "$out" | rg "\\[result\\]" | tail -n1)
+ if [[ -z "$line" ]]; then
+ echo "missing [result] line in benchmark output" >&2
+ return 1
+ fi
+
+ local qps avg elapsed
+ qps=$(extract_metric "$line" "qps")
+ avg=$(extract_metric "$line" "avg")
+ elapsed=$(extract_metric "$line" "elapsed")
+ if [[ -z "$qps" || -z "$avg" || -z "$elapsed" ]]; then
+ echo "failed to parse benchmark metrics: $line" >&2
+ return 1
+ fi
+ echo "$qps,$avg,$elapsed"
+}
+
+start_kv() {
+ local label="$1"
+ assert_port_free "$KV_PORT" "kvstore"
+ ./kvstore >"$KV_LOG_DIR/${label}.log" 2>&1 &
+ KV_PID=$!
+ if ! wait_port_open "$KV_PORT"; then
+ echo "kvstore start failed for ${label}" >&2
+ return 1
+ fi
+}
+
+stop_kv() {
+ if [[ -n "${KV_PID:-}" ]] && kill -0 "$KV_PID" >/dev/null 2>&1; then
+ kill "$KV_PID" >/dev/null 2>&1 || true
+ wait "$KV_PID" >/dev/null 2>&1 || true
+ fi
+ KV_PID=""
+ wait_port_close "$KV_PORT" || true
+}
+
+start_redis() {
+ local strategy="$1"
+ local round="$2"
+ local port="$3"
+ local save_rule="$4"
+ local appendonly="$5"
+ local appendfsync="$6"
+ local rdir="/tmp/redis_${strategy}_${TS}_r${round}"
+ local conf="$rdir/redis.conf"
+
+ rm -rf "$rdir"
+ mkdir -p "$rdir"
+ assert_port_free "$port" "redis(${strategy})"
+
+ cat > "$conf" <&2
+ return 1
+ fi
+}
+
+stop_redis_port() {
+ local port="$1"
+ if ss -ltn | rg -q ":${port}\\b"; then
+ redis-cli -h "$REDIS_HOST" -p "$port" shutdown nosave >/dev/null 2>&1 || true
+ wait_port_close "$port" || true
+ fi
+}
+
+cleanup() {
+ stop_kv
+ for port in "${REDIS_PORTS[@]}"; do
+ stop_redis_port "$port"
+ done
+ if [[ -f "$ORIG_CONFIG_BACKUP" ]]; then
+ cp "$ORIG_CONFIG_BACKUP" "$CONFIG_XML"
+ rm -f "$ORIG_CONFIG_BACKUP"
+ fi
+}
+trap cleanup EXIT
+
+run_kv_case() {
+ local strategy="$1"
+ local persistence="$2"
+ local alloc="$3"
+
+ local -a set_qps_list=() set_avg_list=() set_elapsed_list=()
+ local -a get_qps_list=() get_avg_list=() get_elapsed_list=()
+ local set_qps_sum="0" set_avg_sum="0" set_elapsed_sum="0"
+ local get_qps_sum="0" get_avg_sum="0" get_elapsed_sum="0"
+
+ for round in $(seq 1 "$ROUNDS"); do
+ local pdir_rel="data/${strategy}_${TS}_r${round}"
+ local pdir_abs="$ROOT_DIR/${pdir_rel}"
+ rm -rf "$pdir_abs"
+ mkdir -p "$pdir_abs"
+
+ set_config "$persistence" "$alloc" "$pdir_rel"
+ start_kv "${strategy}_r${round}"
+
+ local m qps avg elapsed
+ m=$(run_bench_capture "$KV_HOST" "$KV_PORT" "set" "RSET" "RGET" "bench:${TS}:kv:${strategy}:r${round}:set:" "$((SEED + round * 10 + 1))" 0)
+ IFS=',' read -r qps avg elapsed <<< "$m"
+ printf "kvstore,%s,%s,%s,RSET/RGET,set,%s,%s,%s,%s\n" "$strategy" "$persistence" "$alloc" "$round" "$qps" "$avg" "$elapsed" >> "$DETAIL_CSV"
+ set_qps_list+=("$qps")
+ set_avg_list+=("$avg")
+ set_elapsed_list+=("$elapsed")
+ set_qps_sum=$(float_add "$set_qps_sum" "$qps")
+ set_avg_sum=$(float_add "$set_avg_sum" "$avg")
+ set_elapsed_sum=$(float_add "$set_elapsed_sum" "$elapsed")
+
+ m=$(run_bench_capture "$KV_HOST" "$KV_PORT" "get" "RSET" "RGET" "bench:${TS}:kv:${strategy}:r${round}:get:" "$((SEED + round * 10 + 2))" 1)
+ IFS=',' read -r qps avg elapsed <<< "$m"
+ printf "kvstore,%s,%s,%s,RSET/RGET,get,%s,%s,%s,%s\n" "$strategy" "$persistence" "$alloc" "$round" "$qps" "$avg" "$elapsed" >> "$DETAIL_CSV"
+ get_qps_list+=("$qps")
+ get_avg_list+=("$avg")
+ get_elapsed_list+=("$elapsed")
+ get_qps_sum=$(float_add "$get_qps_sum" "$qps")
+ get_avg_sum=$(float_add "$get_avg_sum" "$avg")
+ get_elapsed_sum=$(float_add "$get_elapsed_sum" "$elapsed")
+
+ stop_kv
+ done
+
+ local set_avg_qps set_avg_avg set_avg_elapsed
+ local get_avg_qps get_avg_avg get_avg_elapsed
+ set_avg_qps=$(float_div "$set_qps_sum" "$ROUNDS")
+ set_avg_avg=$(float_div "$set_avg_sum" "$ROUNDS")
+ set_avg_elapsed=$(float_div "$set_elapsed_sum" "$ROUNDS")
+ get_avg_qps=$(float_div "$get_qps_sum" "$ROUNDS")
+ get_avg_avg=$(float_div "$get_avg_sum" "$ROUNDS")
+ get_avg_elapsed=$(float_div "$get_elapsed_sum" "$ROUNDS")
+
+ printf "kvstore,%s,%s,%s,RSET/RGET,set,avg,%s,%s,%s\n" "$strategy" "$persistence" "$alloc" "$set_avg_qps" "$set_avg_avg" "$set_avg_elapsed" >> "$DETAIL_CSV"
+ printf "kvstore,%s,%s,%s,RSET/RGET,get,avg,%s,%s,%s\n" "$strategy" "$persistence" "$alloc" "$get_avg_qps" "$get_avg_avg" "$get_avg_elapsed" >> "$DETAIL_CSV"
+
+ printf "kvstore,%s,%s,%s,RSET/RGET,set,%s,%s,%s,%s,%s,%s\n" \
+ "$strategy" "$persistence" "$alloc" \
+ "$(join_pipe "${set_qps_list[@]}")" \
+ "$(join_pipe "${set_avg_list[@]}")" \
+ "$(join_pipe "${set_elapsed_list[@]}")" \
+ "$set_avg_qps" "$set_avg_avg" "$set_avg_elapsed" >> "$SUMMARY_CSV"
+ printf "kvstore,%s,%s,%s,RSET/RGET,get,%s,%s,%s,%s,%s,%s\n" \
+ "$strategy" "$persistence" "$alloc" \
+ "$(join_pipe "${get_qps_list[@]}")" \
+ "$(join_pipe "${get_avg_list[@]}")" \
+ "$(join_pipe "${get_elapsed_list[@]}")" \
+ "$get_avg_qps" "$get_avg_avg" "$get_avg_elapsed" >> "$SUMMARY_CSV"
+}
+
+run_redis_case() {
+ local strategy="$1"
+ local persistence="$2"
+ local port="$3"
+ local save_rule="$4"
+ local appendonly="$5"
+ local appendfsync="$6"
+
+ local -a set_qps_list=() set_avg_list=() set_elapsed_list=()
+ local -a get_qps_list=() get_avg_list=() get_elapsed_list=()
+ local set_qps_sum="0" set_avg_sum="0" set_elapsed_sum="0"
+ local get_qps_sum="0" get_avg_sum="0" get_elapsed_sum="0"
+
+ for round in $(seq 1 "$ROUNDS"); do
+ start_redis "$strategy" "$round" "$port" "$save_rule" "$appendonly" "$appendfsync"
+
+ local m qps avg elapsed
+ m=$(run_bench_capture "$REDIS_HOST" "$port" "set" "SET" "GET" "bench:${TS}:redis:${strategy}:r${round}:set:" "$((SEED + round * 100 + 1))" 0)
+ IFS=',' read -r qps avg elapsed <<< "$m"
+ printf "redis,%s,%s,-,SET/GET,set,%s,%s,%s,%s\n" "$strategy" "$persistence" "$round" "$qps" "$avg" "$elapsed" >> "$DETAIL_CSV"
+ set_qps_list+=("$qps")
+ set_avg_list+=("$avg")
+ set_elapsed_list+=("$elapsed")
+ set_qps_sum=$(float_add "$set_qps_sum" "$qps")
+ set_avg_sum=$(float_add "$set_avg_sum" "$avg")
+ set_elapsed_sum=$(float_add "$set_elapsed_sum" "$elapsed")
+
+ m=$(run_bench_capture "$REDIS_HOST" "$port" "get" "SET" "GET" "bench:${TS}:redis:${strategy}:r${round}:get:" "$((SEED + round * 100 + 2))" 1)
+ IFS=',' read -r qps avg elapsed <<< "$m"
+ printf "redis,%s,%s,-,SET/GET,get,%s,%s,%s,%s\n" "$strategy" "$persistence" "$round" "$qps" "$avg" "$elapsed" >> "$DETAIL_CSV"
+ get_qps_list+=("$qps")
+ get_avg_list+=("$avg")
+ get_elapsed_list+=("$elapsed")
+ get_qps_sum=$(float_add "$get_qps_sum" "$qps")
+ get_avg_sum=$(float_add "$get_avg_sum" "$avg")
+ get_elapsed_sum=$(float_add "$get_elapsed_sum" "$elapsed")
+
+ stop_redis_port "$port"
+ done
+
+ local set_avg_qps set_avg_avg set_avg_elapsed
+ local get_avg_qps get_avg_avg get_avg_elapsed
+ set_avg_qps=$(float_div "$set_qps_sum" "$ROUNDS")
+ set_avg_avg=$(float_div "$set_avg_sum" "$ROUNDS")
+ set_avg_elapsed=$(float_div "$set_elapsed_sum" "$ROUNDS")
+ get_avg_qps=$(float_div "$get_qps_sum" "$ROUNDS")
+ get_avg_avg=$(float_div "$get_avg_sum" "$ROUNDS")
+ get_avg_elapsed=$(float_div "$get_elapsed_sum" "$ROUNDS")
+
+ printf "redis,%s,%s,-,SET/GET,set,avg,%s,%s,%s\n" "$strategy" "$persistence" "$set_avg_qps" "$set_avg_avg" "$set_avg_elapsed" >> "$DETAIL_CSV"
+ printf "redis,%s,%s,-,SET/GET,get,avg,%s,%s,%s\n" "$strategy" "$persistence" "$get_avg_qps" "$get_avg_avg" "$get_avg_elapsed" >> "$DETAIL_CSV"
+
+ printf "redis,%s,%s,-,SET/GET,set,%s,%s,%s,%s,%s,%s\n" \
+ "$strategy" "$persistence" \
+ "$(join_pipe "${set_qps_list[@]}")" \
+ "$(join_pipe "${set_avg_list[@]}")" \
+ "$(join_pipe "${set_elapsed_list[@]}")" \
+ "$set_avg_qps" "$set_avg_avg" "$set_avg_elapsed" >> "$SUMMARY_CSV"
+ printf "redis,%s,%s,-,SET/GET,get,%s,%s,%s,%s,%s,%s\n" \
+ "$strategy" "$persistence" \
+ "$(join_pipe "${get_qps_list[@]}")" \
+ "$(join_pipe "${get_avg_list[@]}")" \
+ "$(join_pipe "${get_elapsed_list[@]}")" \
+ "$get_avg_qps" "$get_avg_avg" "$get_avg_elapsed" >> "$SUMMARY_CSV"
+}
+
+append_readme_results() {
+ python3 - "$SUMMARY_CSV" "$README_MD" "$RUN_TIME" "$ROUNDS" "$REQ" "$PIPE" "$KEYSPACE" "$VSIZE" "$DETAIL_CSV" "$SUMMARY_CSV" <<'PY'
+import csv
+import os
+import sys
+
+summary_csv, readme_path, run_time, rounds, req, pipeline, keyspace, value_size, detail_csv, summary_path = sys.argv[1:]
+rounds_i = int(rounds)
+
+def split_rounds(v):
+ if not v:
+ return []
+ return v.split("|")
+
+def fmt(v):
+ try:
+ return f"{float(v):.2f}"
+ except Exception:
+ return v
+
+rows = []
+with open(summary_csv, newline="", encoding="utf-8") as f:
+ rows = list(csv.DictReader(f))
+
+kv_rows = [r for r in rows if r["target"] == "kvstore"]
+redis_rows = [r for r in rows if r["target"] == "redis"]
+
+lines = []
+lines.append("")
+lines.append(f"## run_hash_bench.sh 三轮均值复测({run_time})")
+lines.append("")
+lines.append(f"- 轮次:{rounds_i} 轮(取均值)")
+lines.append(f"- 参数:requests={req} pipeline={pipeline} keyspace={keyspace} value-size={value_size}")
+lines.append(f"- 明细数据:`{os.path.relpath(detail_csv, os.path.dirname(readme_path))}`")
+lines.append(f"- 汇总数据:`{os.path.relpath(summary_path, os.path.dirname(readme_path))}`")
+lines.append("")
+
+round_headers = [f"Round{i}" for i in range(1, rounds_i + 1)]
+
+def render_table(title, items, scene_fn):
+ lines.append(f"### {title}")
+ lines.append("")
+ header = "| 场景 | 模式 | " + " | ".join(round_headers) + " | 均值QPS | 均值avg(us/op) | 均值elapsed(s) |"
+ sep = "|---|---:|" + "|".join(["---:"] * len(round_headers)) + "|---:|---:|---:|"
+ lines.append(header)
+ lines.append(sep)
+ for row in items:
+ rounds_qps = split_rounds(row["round_qps"])
+ while len(rounds_qps) < rounds_i:
+ rounds_qps.append("-")
+ rounds_qps = rounds_qps[:rounds_i]
+ scene = scene_fn(row)
+ lines.append(
+ "| {} | {} | {} | {} | {} | {} |".format(
+ scene,
+ row["mode"],
+ " | ".join(rounds_qps),
+ fmt(row["avg_qps"]),
+ fmt(row["avg_avg_us"]),
+ fmt(row["avg_elapsed_s"]),
+ )
+ )
+ lines.append("")
+
+render_table(
+ "kvstore:RSET/RGET(持久化 × allocator)",
+ kv_rows,
+ lambda r: f"{r['strategy']} ({r['persistence']}, {r['allocator']})",
+)
+render_table(
+ "Redis:SET/GET(各持久化模式)",
+ redis_rows,
+ lambda r: f"{r['strategy']} ({r['persistence']})",
+)
+
+with open(readme_path, "a", encoding="utf-8") as f:
+ f.write("\n".join(lines) + "\n")
+PY
+}
+
+main() {
+ require_cmd python3
+ require_cmd rg
+ require_cmd ss
+ require_cmd redis-server
+ require_cmd redis-cli
+ ensure_binaries
+
+ run_kv_case "persist_mypool" "incremental" "mypool"
+ run_kv_case "nopersist_mypool" "none" "mypool"
+ run_kv_case "persist_malloc" "incremental" "malloc"
+ run_kv_case "nopersist_malloc" "none" "malloc"
+
+ run_redis_case "none" "none" 6381 "\"\"" "no" "everysec"
+ run_redis_case "rdb_default" "rdb_default" 6382 "900 1 300 10 60 10000" "no" "everysec"
+ run_redis_case "aof_no" "aof_no" 6383 "\"\"" "yes" "no"
+ run_redis_case "aof_everysec" "aof_everysec" 6384 "\"\"" "yes" "everysec"
+ run_redis_case "aof_always" "aof_always" 6385 "\"\"" "yes" "always"
+
+ append_readme_results
+
+ echo "DETAIL_CSV=$DETAIL_CSV"
+ echo "SUMMARY_CSV=$SUMMARY_CSV"
+ echo "README_UPDATED=$README_MD"
+}
+
+main "$@"