[Metrics] Collect more fine grained metrics for p2p comms #410

jorgeantonio21 · 2025-02-14T08:45:50Z

In order for clients to best route their requests in the best possible way, it is necessary to collect the more fine grained metrics available:

Accelerator max and optimal thermal and power values (vendor and accelerator specific);
Number of received inference requests for given model;
Inter token latency (on average);
Time to first token (on average);
Number of total requests;
Number of successful requests;
Number of failed requests.

maschad · 2025-02-15T23:01:13Z

I've removed the first two metrics for a separate issue as it's more involved

jorgeantonio21 assigned Cifko, jorgeantonio21 and maschad Feb 14, 2025

This was referenced Feb 14, 2025

feat: node scores computation and storage atoma-network/atoma-proxy#222

Merged

Compute better scoring for node performance atoma-network/atoma-proxy#232

Closed

jorgeantonio21 added enhancement New feature or request good first issue Good for newcomers atoma-vllm optimizations atoma-state atoma-service deployment liveness important p2p metrics labels Feb 14, 2025

maschad removed enhancement New feature or request good first issue Good for newcomers atoma-vllm optimizations atoma-state atoma-service deployment liveness labels Feb 14, 2025

This was referenced Feb 14, 2025

build: allow for linux/amd64 profiles on docker builds #412

Merged

feat: add more GPU metrics #414

Closed

Add KV Cache Manager to track block metrics #415

Open

maschad unassigned jorgeantonio21 and Cifko Feb 15, 2025

This was referenced Feb 15, 2025

Track bandwidth of a Node #416

Closed

feat: add initial metrics for p2p comms #435

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Metrics] Collect more fine grained metrics for p2p comms #410

[Metrics] Collect more fine grained metrics for p2p comms #410

jorgeantonio21 commented Feb 14, 2025 •

edited by maschad

Loading

maschad commented Feb 15, 2025

[Metrics] Collect more fine grained metrics for p2p comms #410

[Metrics] Collect more fine grained metrics for p2p comms #410

Comments

jorgeantonio21 commented Feb 14, 2025 • edited by maschad Loading

maschad commented Feb 15, 2025

jorgeantonio21 commented Feb 14, 2025 •

edited by maschad

Loading