6.9 KiB
name, description
| name | description |
|---|---|
| unidesk-ops | UniDesk 手动运维 CLI — `server`、`gc`、PK01 `platform-db postgres`、platform-infra egress proxy 和 k3s dependency proxy benchmark 运维。覆盖主 server 启停、健康检查、swap、日志、Docker 镜像清理、磁盘 GC、服务重建/重启、PK01 host PostgreSQL、D601/D518 proxyserver 视角流量测速和 k3s 真实依赖拉取 benchmark。用户提到 server start、server status、server swap、server rebuild、server restart、gc、磁盘清理、platform-db、PK01 PostgreSQL、egress-proxy traffic、proxy 测速、k3s benchmark、apk/npm/go/git mirror 拉取测速时使用。 |
UniDesk Ops
主 server、GC 和 PK01 PostgreSQL 的手动运维入口。常规操作走 bun scripts/cli.ts server ...、gc ...、platform-db postgres ...。
高频入口
bun scripts/cli.ts server status
bun scripts/cli.ts server start
bun scripts/cli.ts server stop
bun scripts/cli.ts server logs --tail-bytes 12000
bun scripts/cli.ts gc plan
bun scripts/cli.ts platform-db postgres status
bun scripts/cli.ts platform-infra egress-proxy traffic --target D601 --sample-seconds 15
bun scripts/cli.ts platform-infra egress-proxy k3s-build-benchmark --targets D601,D518 --profile real-deps-500m --dry-run
启停、健康检查、节点资源指标、swap、日志、服务重建/重启见 references/server.md;Docker 镜像清理和磁盘 GC 见 references/gc.md;PK01 PostgreSQL、YAML-first 运维、egress proxy 和 k3s benchmark 见 references/platform-infra.md。
K3s Dependency Proxy Benchmark
用于验证 k3s CI/CD 构建出网性能时,必须用真实远程依赖,不用 Cloudflare synthetic。标准 profile 是 real-deps-500m:k3s 远程拉 alpine:3.20、node:22-bookworm、golang:1.24-bookworm,然后在 Pod 内跑 apk add、npm install、go mod download、git clone --mirror 和 remote update --prune;proxyserver 视角累计/窗口流量至少要能支撑 500MiB+ 验收。
# 计划预览:确认 D601/D518、镜像、pull policy、最小 proxy 流量和依赖集合。
bun scripts/cli.ts platform-infra egress-proxy k3s-build-benchmark \
--targets D601,D518 --profile real-deps-500m --dry-run
# 启动 benchmark:fire-and-forget,同时启动 stage recorder 持久化阶段流量证据。
bun scripts/cli.ts platform-infra egress-proxy k3s-build-benchmark \
--targets D601,D518 --profile real-deps-500m --confirm
# 状态表:看 APK/NPM/GO/GIT_MIRROR/REAL_DEPS、STAGE_PROXY、failure family 和可选即时采样。
bun scripts/cli.ts platform-infra egress-proxy k3s-build-benchmark status \
--targets D601,D518 --profile real-deps-500m --traffic-sample-seconds 15
# 日志 drill-down:按 init container 展开 image pull、apk、npm、go、git mirror 阶段尾部。
bun scripts/cli.ts platform-infra egress-proxy k3s-build-benchmark logs \
--targets D601,D518 --profile real-deps-500m --tail-lines 160
# 只看 proxyserver 视角实时/累计流量和 top client/destination。
bun scripts/cli.ts platform-infra egress-proxy traffic --target D601 --sample-seconds 15
bun scripts/cli.ts platform-infra egress-proxy traffic --target D518 --sample-seconds 15
# 清理测试 Job,避免慢速或失败样本继续占用 k3s 资源。
bun scripts/cli.ts platform-infra egress-proxy k3s-build-benchmark cleanup \
--targets D601,D518 --profile real-deps-500m --confirm
D601/D518 结果必须分表记录:STATE、Job/run、duration、APK/NPM/GO/GIT_MIRROR/REAL_DEPS、STAGE_PROXY、STAGE_PROXY_EVIDENCE、TRAFFIC_WINDOW、TRAFFIC_RATE、PROXY_CUM、TOP_CLIENT、TOP_DEST 和 FAILURE。D518 通过不代表 D601 通过;D601 只证明 k3s/containerd 走到 proxy 也不等于性能达标。未完成 500MiB+ 的真实 k3s image pull + apk/npm/go/git mirror 测试前,不关闭对应 issue,不合并标记为等待运行面验收的 PR。
Egress Proxy 运行面修复入口
sub2api-egress-proxy 的持久化配置从 config/platform-infra/sub2api.yaml 渲染,运行面变更必须通过受控 CLI 落地。不要把一次性 kubectl patch 留作最终状态。
bun scripts/cli.ts platform-infra sub2api apply --target D601 --dry-run
bun scripts/cli.ts platform-infra sub2api apply --target D601 --confirm --wait
bun scripts/cli.ts platform-infra sub2api status --target D601 --full
D601 若需要让 sub2api-egress-proxy 绕开 pod overlay,可在 YAML 中显式配置 egress proxy hostNetwork: true,manifest 必须同时使用 dnsPolicy: ClusterFirstWithHostNet,并用 maxSurge=0/maxUnavailable=1 避免 hostNetwork 端口冲突导致 rollout 残留 Pending pod。D518 当前保持 hostNetwork: false,不要把 D601 的运行面实验自动泛化到其它 node。
常见判读:
TOP_CLIENT=10.42.0.1且TOP_DEST=registry-1.docker.io:443:k3s/containerd image pull 已从 proxyserver 视角可见。TOP_DEST=dl-cdn.alpinelinux.org:443:Pod 内apk阶段已走 proxy。registry.npmjs.org:443、proxy.golang.org:443、github.com:443:分别对应npm install、Go module 拉取和 Git mirror clone/sync。STAGE_PROXY_EVIDENCE是 Job annotation 中持久化的阶段证据;最终succeeded后仍应保留 apk/npm/go/git-mirror 各阶段 top destination、window bytes、max rate 和 proxy cumulative。TRAFFIC_*列只是 status 命令即时采样。image-pullfailure 表示还卡在 kubelet/containerd 拉镜像;apk-download、npm-download、go-download、git-mirror分别表示 Pod 内依赖阶段失败。- proxy 窗口
0 B/s但 active cumulative 增长很慢时,按性能不达标处理;先清理 Job,再继续查上游,不要让慢速 benchmark 长时间占用资源。
P0 边界
- backend-core 运行面恢复 healthy 后,除非用户明确要求,不主动 rebuild/restart/替换 backend-core。
- Master server 不作为通用构建机;Docker/Rust/Go/前端高 CPU 构建必须走批准的 CI/运行面。
- GC 默认 plan 只读,真实删除必须显式
run --confirm并遵循 allowlist/retention。 - Secret、database URL 和 API key 不打印完整值。
- k3s proxy benchmark 是运行面验收,不是源码层测试;长任务必须 start/status/logs/traffic 短轮询,结束或不达标时必须 cleanup。
何时读取 reference
- 需要服务 rebuild/restart、日志、swap 或 health 判定:读 references/server.md。
- 需要磁盘/镜像/trace GC:读 references/gc.md。
- 需要 PK01 PostgreSQL 或 YAML-first 运维:读 references/platform-infra.md。
- 需要 k3s proxy benchmark 或 D601/D518 egress proxy 流量测速时,优先使用本 SKILL 的高频入口;涉及 CI/CD rollout 再加载
$unidesk-cicd。 - 需要 profile smoke、Moon Bridge 或 session recovery:读 references/server.md。