Pregunta de entrevista de Avanade

How to identify duplicates using Spark SQL from a datasets