Pregunta de entrevista de Spectrum

How do you benchmark LLM performance?