Pregunta de entrevista de OpenAI

Design a distributed rate limiter for an LLM inference API