入门

简介

了解 Castrel 是什么,以及它如何工作。
Castrel 是一名可靠且安全的 AI SRE 智能体,可用于事故调查、告警分诊、自动化运维等场景。

Castrel 有什么不同?

  • 感知上下文,但不需要 CMDB 的复杂建设
    Castrel 会学习如何从你的基础设施中采集并关联上下文。通过简单的提示词或你提供的文档,它就能理解该抓取哪些数据,不需要先做大规模 CMDB 建设或痛苦的数据清洗。
  • 基于 Runbook 执行,而不是先搭一个工作流编辑器
    不必再做拖拖拽拽的工作流配置。Castrel 能根据文档执行巡检、排障和修复任务。你可以让它自动生成文档、上传现有 runbook,或直接在线编辑,重点是它能真正执行。
  • 推理有依据,而且全程透明
    Castrel 的每一步分析都建立在真实数据之上,不靠幻觉。所有执行过的查询都会被记录下来,你可以随时查看支撑结论的证据。

核心能力

  • 告警分诊:通过关联指标、日志和上下文,自动将告警分类为误报、潜在风险或真实事故。
  • 事故调查:生成假设、收集证据,并与你协作,更快定位根因。
  • 任务执行:基于 runbook 规划并执行运维任务,对敏感操作保留人工确认。
  • 数据探索:通过 AI 自动识别实体、建立关系,并从可观测性数据中生成可复用查询模板。
  • 系统问答:用自然语言查询你的系统。你可以通过 @ 提及服务或 IT 资源,询问状态、架构或告警信息。

交互方式

Castrel 会直接进入你的工作流:

  • Slack:无需离开聊天窗口即可完成告警分诊并获取分析结果
  • Web UI:适合做更深入、更细节化的事故调查
  • 本地 Agent Proxy:把本地诊断能力接到 Castrel 上,用于文件分析和命令执行