Evaluation

Evaluation cours 4
II. L’évaluation appliquée à la didactique du FLE
II.1. Introduction
Selon les approches, d’abord communicative puis actionnelle (celle que promeut le CECRL),
l’évaluation en didactique des langues est censée mesurer la maîtrise fonctionnelle de la langue.
Cela implique de recourir à des épreuves se rapprochant le plus possible des situations authentiques
d’utilisation de la langue, de manière à être en mesure d’évaluer la performance dans des situations
de communication quotidiennes.
Brendan Carroll écrit à ce sujet :
« Une pleine et entière application de ce principe d’authenticité signifierait que toutes les épreuves
faites devraient être des opérations de communication interactives proches du réel et non les
réponses d’examen, routinières et typiques, aux stimuli du professeur, stimulus-réponse ; que la
langue du test devrait être celle de la conversation de tous les jours et non créée et trafiquée dans
l’intérêt de la simplification pédagogique, mais présentée avec toutes les irrégularités auxquelles
on peut s’attendre. »[1]
[1] Cité par BOLTON Sybille (1991) : Évaluation de la compétence communicative en langue
étrangère, Paris, Hatier/Didier, LAL, p. 42.

Les savoirs de types linguistiques ne doivent être considérés que comme des objectifs
intermédiaires comme le montre bien le schéma ci-contre (cf. exemplier, doc. 6, p. 3)
Dans l’idéal, les quatre capacités (CE, CO, EE, EO) ne devraient pas être évaluées de façon
distincte puisque dans les situations de communication réelles, différentes compétences sont
groupées.
C’est par exemple le cas lorsque l’on demande un renseignement par téléphone : on parle (EO) et
on écoute (CO), donc on interagit (5e
compétence du CECRL) et on prend des notes (PE).
Dans la réalité des pratiques pédagogiques, il n’est toutefois pas toujours évident d’appliquer ces
principes. Avec un public de débutants, il est ainsi difficile de s’appuyer sur des documents
véritablement authentiques. C’est notamment vrai en ce qui concerne les documents oraux, du type
émissions de radio, trop complexes sur les plans lexicaux, grammaticaux, trop difficiles à
comprendre en raison du débit de voix, du registre de langue, etc. C’est la raison pour laquelle, on
recourt souvent à des documents faussement authentiques : par exemple une émission de radio
réécrite et enregistrée par des acteurs. L’autre raison pour laquelle les principes énoncés plus haut
ne sont pas souvent appliqués tient à la nature des certifications (DELF, DALF…) qui distinguent
les quatre compétences.

Pour résumer, on peut dire qu’en DDL, on évalue des habiletés langagières par le biais de tâches
évaluatives axées sur la performance telles que le jeu de rôle, l’écoute de dialogues, la description
de photographie, la compréhension d’un texte. Il s’agit de demander aux élèves d’effectuer ces
tâches en situations de communication aussi réelles que possible. Pour y parvenir, on simule des
scénarios d’évaluation comme on simule des scénarios d’apprentissage en situations
d’enseignement. On y intègre, dans la mesure du possible, les quatre habiletés linguistiques et on
propose des mises en situation aussi authentiques que possible. Le schéma ci-dessous, extrait de
l’ouvrage de Denise Lussier (cf. exemplier, doc. 5, p. 3) résume ces principes :
Quelles sont les variables dont il faut tenir compte pour s’assurer qu’un support est, en
termes de difficultés, adapté au public auquel il se destine ?
Voici ce que nous dit le CECRL :
(Ch. 7 : « Les tâches et leur rôle dans l’enseignement des langues »)
« Pour les activités de réception, il faut tenir compte de 2 critères principaux :
1) les caractéristiques du texte ;
2) les types de réponses attendus.
1) Les caractéristiques du texte
a) La complexité linguistique : une syntaxe complexe, en particulier, consomme un potentiel
d’attention qui pourrait se porter sur le contenu (par exemple, des phrases longues, avec de
nombreuses subordonnées, de multiples négations, des limites ambiguës, des anaphoriques et des
déictiques dont les antécédents ou les références sont obscurs). Néanmoins, une trop grande
simplification de textes authentiques peut, en fait, déboucher sur un accroissement de la difficulté

(à cause de la suppression des redondances, des indices textuels, etc.).
b) Le type de texte : la familiarité que l’apprenant peut avoir du type de discours ou du domaine de
référence (et en partant du principe qu’il a les connaissances socioculturelles nécessaires) l’aidera
à anticiper le contenu et la structure.
Il est probable que la nature plus ou moins abstraite ou concrète du texte jouera également un
rôle ; par exemple, une description, des instructions ou un récit concrets (notamment accompagnés
de supports visuels adéquats) seront sans doute moins difficiles qu’une argumentation ou une
explication abstraites.
c) La structure du discours : la cohérence textuelle et un plan clair (par exemple, l’articulation
temporelle, la présentation et la mise en évidence des points importants avant leur exemplification),
la présentation explicite plutôt qu’implicite de l’information, l’absence d’informations
contradictoires ou inattendues, tout cela contribue à réduire la complexité des opérations de
traitement de l’information.
d) Les conditions matérielles : de toute évidence l’oral et l’écrit présentent des difficultés
différentes compte tenu de la nécessité de traiter l’information orale en temps réel. En outre, le
bruit, les distorsions et les interférences (par exemple une réception de radio ou de télévision à
faible volume ou une écriture peu soignée, une mise en page désordonnée) augmentent les
difficultés de compréhension ; dans le cas d’un texte oral (audio), plus il y a de locuteurs au timbre
indistinct, plus il est difficile de les identifier et de les comprendre ; parmi les autres facteurs qui
augmentent la difficulté d’écoute ou de visionnement, on peut rappeler le chevauchement des voix,
les élisions, les accents peu familiers, le débit, le faible volume, une voix monocorde, etc.
e) La longueur du texte : en règle générale, un texte court est moins difficile qu’un texte long sur un
même sujet car ce dernier exige plus d’opérations de traitement, la mémoire est plus sollicitée, le
risque de fatigue ou de distraction augmente (notamment avec de jeunes apprenants).
Cependant, un texte long pas trop dense et relativement redondant peut s’avérer plus simple qu’un
texte court et dense qui apporte la même information.
f) L’intérêt de l’apprenant : la forte motivation à comprendre provoquée par l’intérêt que
l’apprenant a pour un contenu soutiendra ses efforts (bien qu’elle ne facilite pas directement la
compréhension). L’utilisation d’un vocabulaire peu fréquent risque, en règle générale, d’accroître
la difficulté d’un texte ; mais s’il contient un vocabulaire très spécialisé sur un sujet familier et
pertinent, il sera moins difficile pour un spécialiste du domaine qu’un texte contenant un
vocabulaire riche d’ordre très général et, en conséquence, sera abordé avec plus d’assurance.
2) Les types de réponses attendus
Bien qu’un texte puisse être relativement difficile, le type de réponses exigé par la tâche peut être
manipulé pour s’adapter aux compétences et aux caractéristiques de l’apprenant.
La conception de l’activité dépendra également de son objectif qui peut être de développer les
aptitudes à la compréhension ou de vérifier la compréhension. Selon le cas, le type de réponse
demandée peut considérablement varier ainsi que l’illustrent les nombreuses typologies d’activités
de compréhension. »
Source : CECRL, pp. 125-126
« L’enseignant ou l’auteur de méthode peut contrôler un certain nombre d’éléments afin
d’augmenter ou de diminuer le niveau de difficulté d’une activité lors de son exécution.
Dans le cas d’activités de compréhension, on peut proposer un même texte à tout apprenant mais
les produits seront différents au point de vue quantitatif (par exemple, la quantité d’information
demandée) ou qualitatif (niveau de la performance attendue).
Dans d’autres cas, le texte support peut contenir une quantité d’informations ou se situer à des
niveaux de complexité cognitive et/ou d’organisation différents ; ou encore un certain nombre de
facilitateurs variés (images, mots-clés, déclencheurs, tableaux, schémas, etc.) peut être mis à
disposition de l’apprenant. Le texte support peut être choisi pour sa pertinence à l’égard de
l’apprenant (motivation) ou pour des raisons propres à l’apprenant. Un texte peut être écouté ou lu
aussi souvent qu’il faut ou un nombre limité de fois. Le type de réponse attendu peut être très
simple (Levez le doigt !) ou plus exigeant (Écrivez un nouveau texte). Dans le cas d’activités

d’interaction et de production, on peut jouer sur les conditions de la performance afin de rendre
une tâche plus ou moins difficile, par exemple en faisant varier la durée de la préparation et de la
réalisation, la durée de l’interaction ou de la production, le degré de prévisibilité, le nombre et la
nature des supports non verbaux proposés, etc. » CECRL
Cela veut dire concrètement qu’un même support (mais cela ne vaut pas pour tous les supports) peut
être exploité pour des niveaux différents (du A1 au B1 par exemple).
Pour varier le niveau de difficulté de l’évaluation, l’enseignant peut jouer à la fois sur les types de
stimuli qu’il propose aux élèves (oraux, visuels, écrits) et sur les techniques d’évaluation (types
d’épreuves utilisés : QCM, appariement, classement, etc.).
C’est à ce dernier point que nous allons à présent nous intéresser.
II.2. Les différents types d’épreuves utilisés dans l’évaluation des LVE
II.2. A. Les questionnaire à choix multiples (QCM) (savoirs linguistiques, CE, CO)[1]
[1] A la suite du titre des différents types d’épreuves, nous indiquons entre parenthèses ce qui peut
être évalué à travers ces tests : il peut s’agir de savoirs linguistiques (grammaire, conjugaison,
lexique) ou de compétences de communication : CE = compréhension écrite ; CO = compréhension
orale ; PE = production écrite ; PO = production orale.
Les formes que peuvent prendre les QCM sont multiples – c’est une des grandes richesses de ce
type de test -, cependant le principe est toujours le même. L’élève a une décision à prendre, un choix
à faire.
On a beaucoup critiqué l’importance que joue le hasard dans ce type de test (certains linguistes les
appellent « les choix heureux par ignorance »). Ces critiques ne sont pas toujours fondées car il
existe nombre de techniques qui permettent de réduire la place laissée au hasard.
On a pu dire également que le QCM était difficile à élaborer, ce qui est exact : il faut une formation
adéquate pour cela afin de ne pas laisser passer d’erreurs trop grossières.
Quels sont les avantages et les inconvénients des QCM ?
Les avantages et les inconvénients des QCM peuvent être résumés de la manière suivante :
AVANTAGES INCONVENIENTS
- La correction est objective et peut être
automatisée (présence d’une grille) ;
- La fidélité de la notation est garantie : la note ne
peut plus être aléatoire.
- Facilité/rapidité de la correction.
- Le temps de conception et d’élaboration
est important ;
- Le temps de vérification de l’élaboration est
également important ;
- Les capacités intellectuelles supérieures
(création, synthèse, esprit critique) sont difficiles à
évaluer.
Les différents types de QCM les plus courants
a) Le QCM à 2 ou 3 choix, de type « Vrai »/« Faux » avec ou sans « ? »
L’appellation QCM lorsqu’il n’y a que 2 choix possibles. L’élève en effet ne choisit pas parmi
plusieurs réponses proposées mais se contente de donner son avis en espérant ne pas se tromper.
Notons que la question à deux options (Vrai/faux) correspond davantage à la réalité de la
communication que la question à trois ou quatre options. Quand il s’agit de comprendre un texte
écrit ou parlé, la question fondamentale se limite normalement à savoir si l’information a été bien
comprise ou non. Le problème principal de ce type d’épreuve est que la probabilité de bonnes
réponses dues au hasard – 50 % ou 33 % – est plus importante que dans d’autres tests.
Ce type de test peut évaluer aussi bien des savoirs de type linguistique que des savoir-faire
communicatifs. Si l’on inclut un « ? », il convient de l’expliquer dans la consigne. Il peut en effet
avoir plusieurs significations :
- on ne peut pas répondre car la réponse n’est pas dans le texte ;
- les deux choix sont possibles ;
- l’élève n’a pas d’opinion sur le sujet ou ne connaît pas la réponse.
Pour élaborer ce type de QCM, il convient de respecter les étapes suivantes :

1) Chercher un document qui corresponde à l’objectif à évaluer ou créer un corpus, écrit ou oral ;
2) Repérer, dans le texte ou dans le corpus, ce qui va faire l’objet d’une question ;
3) Tracer le squelette de la grille de correction ;
4) Rédiger les questions et, au fur et à mesure, placer les croix dans les cases correspondantes de la
grille de correction (seule façon de vérifier que la réponse existe) ;
5) En dernier lieu, attribuer des points à chaque réponse correcte en pondérant éventuellement.
b) Le QCM à 3, 4 ou 5 choix, avec une seule réponse correcte
Ce type de QCM comporte plusieurs items (questions) composés d’une amorce ou stimulus
(phrase sur laquelle va porter le QCM), puis de distracteurs (les réponses incorrectes) et d’une clé
(la réponse correcte). Il peut également comporter un texte oral ou écrit comme support, avant la
phrase amorce.
Un certain nombre de règles régit l’élaboration des distracteurs et de la clé. En voici les principales :
1) Les distracteurs doivent être erronés mais doivent pouvoir fonctionner dans un autre contexte que
celui donné par la phrase amorce. Ils doivent tous avoir la même force attractive que la réponse
correcte. Ils ne doivent jamais proposer de mots incorrects ou qui n’existent pas, comme dans
l’exemple ci-dessous :
Consigne : entourez la définition du mot en italique.
« La ratification de Vienne est reportée. »
a) diffusée
b) ajournée
c) annulationnée
d) refusée
2) Le distracteur doit toujours être vraisemblable. Un distracteur non plausible, loufoque (du type de
ceux proposés dans « Qui veut gagner des millions » pour les 5 premières questions) serait aussitôt
éliminé par le candidat par simple jugement de bon sens et réduirait ainsi le champ des choix
possibles. Exemple de distracteur loufoque :
Consigne : entourez la réponse correcte.
« Vous ne comprenez pas les explications du professeur. Vous lui dites : »
a) Je n’avais pas compris.
b) Quelle heure est-il ?
c) Je n’ai pas compris.
d) Je comprendrai mieux.
3) La clé ne doit pas être trop différente des distracteurs, elle ne doit pas être sensiblement plus
longue ou plus courte. D’une façon générale, on a tendance à trop développer la clé pour être
certain que l’élève la comprendra, comme dans l’exemple suivant :
« Dans un texte, une « coquille » c’est :
a) Une faute de frappe lorsqu’on saisit un manuscrit sur une machine.
b) Un coquillage.
c) Un texte sans intérêt.
d) Un fruit de mer.
Pour élaborer ce type de QCM, il convient de respecter les étapes suivantes :
- Rédiger le premier item. Pour cela, rédiger tout d’abord l’amorce. S’il s’agit d’une question, éviter
la double négation. Dans tous les cas, éviter les phrases trop longues ;
- Rédiger la clé en veillant à ce qu’elle ne soit plus longue que les distracteurs ;
- Rédiger ensuite les distracteurs en s’assurant qu’ils sont inexacts mais que dans un autre contexte,
ils pourraient être exacts. Un mot ou une structure incorrects ne peuvent en aucun cas faire partie
d’un QCM. Les distracteurs ne doivent pas être loufoques ;
- Rédiger l’item suivant ;
- Vérifier, vérifier et vérifier encore.
c) Le QCM à plusieurs réponses correctes
La matrice est la même. Dans la consigne, il convient de préciser qu’il peut y avoir plus d’une
réponse correcte. Suivant la manière dont on prépare le test, il peut y avoir d’autres cas de figure :

- toutes les réponses peuvent être correctes ;
- toutes les réponses peuvent être correctes sauf une ;
- toutes les réponses peuvent être fausses, etc.
A condition de l’indiquer clairement dans la consigne.
d) Le QCM à 4 choix, plus le choix « E »
Il s’agit du même type de QCM que les précédents, mais avec une possibilité supplémentaire pour
l’élève : le choix « E » qui permet, si l’élève veut apporter une précision ou nuancer sa réponse, de
cocher cette case et d’écrire son commentaire au verso de la feuille de réponses.
Ce système, importé des États-unis permettrait de réduire le stress et la frustration face à un
questionnaire où la seule façon de s’exprimer est de cocher une case.
II.2. B. Le tableau de production à double entrée (CE, CO)
Il s’agit dans ce type de test de faire produire à l’élève des phrases simples qui témoigneront de sa
compréhension du document oral ou écrit correspondant.
II.2. C. L’appariement (CE, CO)
Cette activité, également connue sous les termes de « pairage » ou « association » sert à évaluer la
capacité de l’élève à établir des liens, à percevoir la cohérence d’une phrase simple ou complexe à
travers ses différents éléments : sa nature, sa logique interne, son registre de langue, son émetteur et
son destinataire, etc.
Les phrases sont scindées au niveau d’une articulation et l’élève doit, à l’aide flèches, relier les deux
éléments. Dans la grille de correction, on veillera à ce que deux fins de phrases ne puissent pas être
attribuées, sémantiquement, à la même amorce.
Cette activité peut consister également à associer entre elles deux listes d’éléments, l’une étant
considérée comme l’ensemble-question et l’autre comme l’ensemble-réponse. Ces deux listes ne
doivent pas comprendre le même nombre d’éléments. On fournira généralement à l’élève plus
d’éléments-réponses que d’éléments-questions pour éviter un dernier pairage intuitif de sa part.
Ce type d’activité peut être utilisé pour évaluer le CE et la CO : une liste de phrases est proposée à
l’écrit et l’élève doit faire correspondre à chaque phrase un numéro ou une lettre correspondant à un
énoncé oral qui lui a été proposé à partir d’un support K7, CD ou qui lui a été dicté par l’enseignant.
On peut également associer une image à un mot ou une phrase.
II.2. D. Le classement (CE, CO)
Ce type d’épreuve, également appelé « réarrangement » consiste à replacer dans un ordre logique ou
chronologique une série d’éléments ou d’énoncés présentés dans le désordre. Ce test permet de
vérifier la cohérence discursive des apprenants qui doivent prendre en compte l’ordre logique des
idées (la cohérence) et l’utilisation adéquate des mots charnières ou connecteurs (cohésion).
II.2. E. Le texte lacunaire (savoir linguistique, CO)
De tous les outils d’évaluation, le texte lacunaire, dit également « exercice à trous », est celui qui est
le plus employé en LVE pour évaluer les savoirs de type linguistique. Ses avantages sont :
- sa facilité d’élaboration ;
- le fait qu’il n’évalue que ce que l’on souhaite évaluer (acquisition de vocabulaire, application de
règles de grammaires, compréhension orale) ;
- sa rapidité d’administration.
II.2. F. Le test de closure (savoir linguistique, CE, CO)
La technique de ce test consiste à supprimer un mot sur cinq d’un texte authentique (alors que le
texte lacunaire est généralement conçu de toute pièce par l’enseignant).
Son but est de mesurer la capacité de compréhension des élèves. L’intérêt de ce test est qu’il permet
de repérer de nombreux types d’erreurs indépendantes de la compréhension. La grille d’évaluation
et le barème ne sont pas toujours aisés à établir, plusieurs réponses étant souvent possibles.
L’enseignant qui conçoit ce type de test a tout intérêt à en soumettre une première mouture à ses
collègues pour faire en sorte de repérer les problèmes éventuels, d’anticiper les réponses possibles
des étudiants et de se mettre d’accord sur celles qui seront acceptées et celles qui ne le seront pas.
Quel barème adopter ?
Le barème adopté peut être le suivant :

- bonne réponse = 2 points ;
- mauvaise réponse = 0 point ;
- réponse incomplète ou partiellement incorrecte = 1 point.
Exemple pour l’attribution d’un seul point : l’étudiant utilise le bon verbe, conjugué au bon temps
mais avec un problème au niveau de la morphologie ou d’orthographe : « regarde » pour
« regardes » ; « prandrions » pour « prendrions ».
L’une des utilisations possibles du test de closure consiste à supprimer, dans une proportion à peu
près égale, des mots relevant de différentes catégories : mots lexicaux (substantifs, adjectifs, verbes,
adverbes) et mots grammaticaux (déterminants, pronoms, conjonctions de coordination et de
subordination, prépositions). Il est également possible de ne supprimer que les occurrences d’une
même catégorie (par exemple seulement les déterminants ou les substantifs) de façon à n’évaluer
que la maîtrise de cette catégorie.
II.2. G. Le QROC (Questionnaire à Réponses Ouvertes Courtes) (PE, PO)
En langue vivante, le QROC est un test de production minimale qui peut par exemple être utilisé
pour demander son opinion en une phrase sur ce que l’on peut dire ou écrire à telle personne dans
une situation donnée, comme dans les exemples ci-dessous :
- « Selon vous, que peut-on dire à quelqu’un qui vient de réussir son examen ? »
- « Que diriez-vous si on vous invite au restaurant et que vous avez déjà dîné ? »
Il s’agit donc de questions directes que l’enseignant pose à l’élève et qui demandent un mot ou
quelques mots comme réponse. On privilégie ainsi le rappel de connaissance.
L’exemple type d’application du QROC est l’interrogation écrite ou orale de début de cours. Ce
type d’activité a l’avantage d’être facile à élaborer et de laisser à l’élève une initiative non
négligeable dans le choix des termes et des structures qu’il utilisera pour répondre.
La contrepartie est la difficulté qu’il peut y avoir à évaluer les productions. Que va-t-on prendre en
compte : l’intention de communication, même incorrecte dans sa forme ou la correction de la
production de l’élève en termes linguistiques au détriment de l’aspect créatif ?
II.2. H. Le texte induit, guidé, avec contraintes (PE, PO)
Il s’agit d’une technique qui permet d’élaborer des activités de production écrite, où l’évaluation est
en adéquation avec l’objectif visé et où la consigne joue un rôle important. Elle doit en effet
indiquer clairement les contraintes imposées.
Paradoxalement, on se rend compte que la créativité se révèle beaucoup plus dans un cadre limité
qu’en toute liberté. Cette technique peut également être utilisée à l’oral lorsque l’on demande à des
élèves de participer à un jeu de rôle à partir de consignes contraignantes.
II.2. I. Les sujets de synthèse (PE, PO)
A ce niveau la tâche est complexe, comme le reflètent la nature des verbes utilisés dans les
consignes des sujets de synthèses : discuter, expliquer, décrire, résumer, commenter, analyser, juger,
etc. L’outil très ouvert, ce qui pose des problèmes à l’évaluateur en termes d’objectivité : la part
laissée à l’appréciation personnelle est très importante.
Ce type d’épreuve porte sur la capacité d’analyse, de synthèse, l’esprit critique. Il permet de vérifier
les habiletés mentales plus complexes qui exigent des efforts de réflexion et demandent à
l’apprenant d’organiser sa pensée et de l’exprimer de façon cohérente.
Ce type d’épreuve peut prendre la forme d’un résumé, d’une analyse de texte ou d’image ou d’une
synthèse de documents émanant de sources diverses.
Il s’agit d’un type d’évaluation contraignant, la consigne imposant une limite de temps et de volume
de production (150 mots en 1h30). Il s’agit d’un type d’épreuve qui peut également être proposé à
l’oral : compte-rendu d’article, analyse d’image, synthèses de documents, etc.
II.3. Classement des différents types d’épreuves (ouverture/fermeture ; types de capacités
intellectuelles mobilisées)
Comme on peut le voir dans le schéma ci-dessous représentant les différents types d’épreuves,
celles-ci forment un continuum allant des outils les plus simples et les plus fermés à ceux les plus
complexes et les plus ouverts :

On peut, de manière assez sommaire, les regrouper dans 3 catégories :
Les épreuves fermées, pour lesquelles le candidat doit reconnaître mais non formuler lui-même la
bonne réponse. Les épreuves fermées peuvent être appliquées pour tester des éléments et des
structures de la langue ou la compréhension de l’organisation sémantique d’énoncés écrits ou oraux.
Les épreuves fermées regroupent les QCM, les tableaux à double entrée, les tests d’appariement et
de classement ;
Les épreuves semi-ouvertes, pour lesquelles les réponses doivent se situer dans un cadre imposé par
un contexte délimité avec précision. Ce type d’épreuve permet de contrôler la maîtrise productive
du vocabulaire et des structures grammaticales.
On y trouve les textes lacunaires, les tests de closure ainsi que les exercices de complétion, de
transformation et de paraphrase ;
Les épreuves ouvertes, pour lesquelles la réponse est relativement libre. Ce type d’épreuve est
utilisé pour contrôler des performances langagières productives à l’oral comme à l’écrit.
Peuvent être considérées comme des épreuves ouvertes les QROC (test à la limite entre les épreuves

semi-ouvertes et les épreuves ouvertes), les textes induits et les sujets de synthèse.
Épreuves ouvertes, semi-ouvertes et fermées ne se distinguent pas seulement quant aux capacités et
compétences qu’elles testent, mais aussi quant à leur objectivité de dépouillement et leur fidélité
propres (leur précision comme instruments de mesure et leur fiabilité).
Les épreuves ouvertes, qui laissent au candidat une plus grande liberté dans l’exécution de la tâche,
accroissent la marge d’appréciation dans la notation de la performance de testé et ont ipso facto une
objectivité de dépouillement moindre que les épreuves fermées. La fiabilité est elle aussi plus
difficile à obtenir avec des épreuves ouvertes.
Le degré de complexité croissant des épreuves, telles qu’elles apparaissent dans la classification ci-
dessus sont à mettre en lien avec le type de capacités intellectuelles mobilisées par l’élève dans la
réalisation des tâches qu’on lui demande.
Pour approfondir ce point, il utile de se référer aux hiérarchisations des mécanismes cognitifs
établies, d’une part, par Bloom (« taxonomie »), d’autre part, par V. et G. Landsheere (« trilogie »).
Bloom fait l’hypothèse que, dans le processus d’apprentissage, les capacités peuvent être mesurées
sur une échelle allant des opérations mentales les plus simples au plus complexes. Il établit ainsi 6
catégories, distinguant, d’un côté, les connaissances (catégorie 1), de l’autre côté, les habiletés et les
capacités langagières (regroupant les catégories 2 à 6).
Les connaissances (1), qui se réfèrent aux savoirs mémorisés, constituent les niveaux inférieurs de
la taxonomie établie par Bloom.
Les habiletés et les capacités langagières rendent comptent, quant à elles, des phénomènes de le
compréhension (2), de l’application (3), de l’analyse (4), de la synthèse (5) et de ce que Bloom
appelle l’évaluation (6), que nous nommerons « esprit critique » afin d’ôter toute ambiguïté.
V. et G. Landsheere reclassent les concepts de Bloom en trois objectifs qui, à court, moyen et long
terme, permettent d’évaluer les acquis :
- La maîtrise peut s’évaluer dans le court terme. Elle correspond aux niveaux inférieurs de
« connaissance » et de « compréhension » définis par Bloom ;
- Le transfert peut s’évaluer soit dans le moyen terme, en cours de cursus, soit dans le long terme,
lorsque l’élève devra, dans sa vie d’adulte professionnelle ou sociale, utiliser des savoirs ou des
savoir-faire acquis en situation scolaire. Il s’agit de la capacité à transférer des maîtrises de
connaissances à des champs d’application. Il s’agit d’une capacité essentielle dans le processus de
l’apprentissage et de l’éducation ;
- L’expression qui s’évalue sur le long terme. Elle touche les niveaux supérieurs (les mécanismes
intellectuels complexes) de la taxonomie de Bloom. La performance attendue de l’élève n’est plus
du tout prévisible : la tâche demandée fait non seulement appel aux savoirs et aux savoir-faire
acquis, mais également à la personnalité de chaque élève, à sa propre créativité.

TRILOGIE DE
LANDSHEERE
TAXONOMIE DE
BLOOM
MECANISMES COGNITIFS MIS EN ŒUVRE
EXPRESSION
Capacités
intellectuelles
supérieures
6. L’évalua-
tion/l’esprit
critique
Avoir un
esprit critique
Apprécie, argumente, compare des idées,
critique, choisit, déduit, évalue des éléments
5. La synthèse Synthétiser
Assemble, réunit, collecte des données, crée,
développe, compose des éléments entre eux,
reformule des idées
TRANSFERT
Capacités
intellectuelles
médianes
4. L’analyse Analyser
Catégorise, compare, critique, distingue,
examine,met en question des éléments de la
langue
3. L’applica-
tion
Appliquer
Choisit, démontre, illustre, pratique, utilise
l’information
MAÎTRISE
Capacités
intellectuelles
inférieures
2. La com-
préhension
Comprendre
Classe, décrit, explique, discute, exprime,
identifie, localise, sélectionne des éléments
1. La con-
naissance
Mémoriser
Organise, recopie, répète, liste, apprend par
cœur, reconnaît retient, associe, reproduit des
éléments de la langue
Si à présent on essaie d’appliquer ces catégories aux types d’épreuves utilisées en évaluation dans le
domaine de la DDL, on peut estimer que plus les épreuves sont fermées, plus elles font appel à des
niveaux inférieurs du processus d’apprentissage (Connaissance, compréhension chez Bloom ;
Maîtrise chez Landsheere), plus, au contraire, elles sont ouvertes, plus elles feront appel à des
niveaux supérieurs du processus d’apprentissage (Application, analyse, synthèse, esprit critique
chez Bloom ; transfert, expression chez Landsheere).

Evaluation

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a Evaluation

Semelhante a Evaluation (20)

Evaluation