最後更新:
Click to expand / collapse
API性能不僅是可用性,而且是響應速度和負載下的穩定性。我們實現了關鍵API指標的收集和可視化:響應時間、呼叫次數、錯誤、方法和用戶分布。這有助於跟蹤集成效率、預測負載並提高系統可擴展性。
所有度量都可以導出到APM,圖形行車(Grafana,Datadog,New Relic),也可以直接通過API進行分析。
跟蹤哪些指標
| 度量標準 | 顯示的內容 |
|---|---|
| 響應時間(響應時間) | API的平均、最小和峰值響應時間 |
| 請求數(RPS) | 每秒/分鐘/小時查詢,呼叫總數 |
| 錯誤(error rate) | 使用4xx和5xx代碼的查詢百分比 |
| 方法和endpoints | 最繁忙的路線和行動 |
| 查詢來源 | 啟動呼叫的IP、令牌、地理、應用程序或服務 |
如何實現
與Prometheus、Grafana、Datadog、New Relic的集成
基於middleware的自動指標聚合
通過令牌,用戶,endpoint和API版本進行跟蹤
圖形、直方圖和測量的可視化
在超過時間或負載閾值時設置通知
對團隊和業務的好處
了解API在哪裏的運行緩慢
優化特定方法或線程的能力
合理的擴展規劃
快速診斷性能問題
監控外部集成商和客戶的行為
在哪裏,特別重要
高負載和SLA限制產品
金融、遊戲和電子商務平臺
具有外部API合作夥伴的基礎架構
移動和SPA應用程序速度敏感API