1) A aula aborda classificação e ponderação de documentos para recuperação de informação, discutindo porque a classificação é importante ao invés de resultados não ordenados;
2) A frequência de termos é fundamental para a classificação, e métricas como tf (frequência do termo no documento) e idf (frequência do termo na coleção) são usadas para calcular pesos;
3) O esquema tf-idf, que multiplica os pesos tf e idf, é o mais conhecido para classificar documentos de acordo com sua relevância para uma consulta.