Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Travailler avec des corpus audiovisuels numériques par Peter Stockinger
1. Travailler avec des corpus audiovisuels numériques.
Le programme AAR et le projet ASA-SHS
Peter Stockinger
Fondation Maison des Sciences de l’Homme (FMSH) - ESCoM
Institut National des Langues et Civilisations Orientales (INALCO)
ESCoM – Programme AAR (Archives Audiovisuelles de la Recherche)
Paris, 18 - 19 décembre 2012
Journée d’études CPST – 14/15 décembre 2012
2. Principaux points :
1. Projet « Archive numérique »: corpus AV, environnement de travail,
workflow
2. Analyse (description/indexation) de corpus AV
Les principaux
points 3. Publication-diffusion de corpus AV analysés et indexés
Journée d’études CPST – 14/15 décembre 2012
3. Le contexte:
Le Programme « Archives Audiovisuelles de la Recherche »
(2002 – 2012)
Journée d’études CPST – 14/15 décembre 2012
4. Contexte de référence: Programme des Archives Audiovisuelles de la Recherche
(AAR): http://www.archivesaudiovisuelles.fr :
1. de production-diffusion de patrimoines culturels et scientifiques
Environnement de documentés par des corpora audiovisuels,
travail AAR et
Workflow
2. de mise en place de projets d’archives audiovisuelles numériques.
Journée d’études CPST – 14/15 décembre 2012
5. 2 résultats après 10 ans d’existence du programme AAR:
1) Procédures explicites qui régissent les différentes étapes de
constitution de patrimoines scientifiques ou culturels sous forme
d’archives AV numériques
Environnement de = Workflow d’un projet d’archives.
travail AAR et
Workflow
2) Un environnement de travail AAR intégré …
… pour produire, analyser et publier des corpus audiovisuels et pour
gérer des archives audiovisuelles « personnelles »
= environnement de travail adapté à un projet d’archive
Journée d’études CPST – 14/15 décembre 2012
6. Le projet « Archive »:
Environnement de travail AAR et Workflow
Journée d’études CPST – 14/15 décembre 2012
7. Le workflow d’un projet d’archives numériques …
1. 1ère phase: Activités préparatrices en amont de l’enregistrement AV d’un
« terrain » (lato sensu)
2. 2ème phase: Activités de l’enregistrement du terrain (lato sensu) et de la
collecte des données en vue de la constitution d’un corpus de
Environnement de documentation du terrain
travail AAR et
Workflow 3. 3ème phase: Traitement et analyse du corpus (de travail) documentant un
terrain;
4. 4ème phase: Prépublication et publication/republication des corpus
audiovisuels traités et analysés préalablement
5. 5ème phase: Activités clôturant le travail sur le corpus.
Journée d’études CPST – 14/15 décembre 2012
8. Environnement et processus de travail (schéma F. Lemaitre, ESCoM)
Environnement de
travail AAR et
Workflow
Journée d’études CPST – 14/15 décembre 2012
9. Le Studio ASA –
pour l’analyse/indexation et la publication/republication de ressources AV…
… dans le cadre d’un projet « Archive »
Journée d’études CPST – 14/15 décembre 2012
10. Le Studio ASA – une partie de l’environnement de travail du programme AAR
consacrée à la description, indexation et publication de ressources/corpus AV:
Studio ASA
Atelier de Atelier de Atelier de Atelier de
Le Studio ASA Modélisation Segmentation Description Publication
OntoEditeur Interview Interview Semiosphere
Interface de travail
Plus d’informations
sur le Studio ASA:
« formulaires »)
Diaporamas de la
1ère Journée ASA- Ontologie de l’univers du
SHS (Décembre
discours ASA
2011)
Bibliothèque de modèles de
Ontologie du domaine description (propre à une archive)
d’une archive
Journée d’études CPST – 14/15 décembre 2012
11. Les principaux rôles autour du Studio ASA spécialisé dans l’analyse –
indexation et publication de ressources/corpus AV (schéma: Francis Lemaitre,
ESCoM):
Le Studio ASA
Journée d’études CPST – 14/15 décembre 2012
12. Les logiciels du Studio ASA – exemples d’interface ….
Journée d’études CPST – 14/15 décembre 2012
13. Le Studio ASA – une suite de logiciels pouvant être installée sur un PC …
Studio ASA -
interfaces
Journée d’études CPST – 14/15 décembre 2012
14. L’Atelier de segmentation virtuelle d’une ressource AV: Interview (INA-ESCoM)
Studio ASA -
interfaces
Plus
d’informations sur
le Studio ASA:
Diaporamas de la
1ère Journée ASA-
SHS (Décembre
2011)
Journée d’études CPST – 14/15 décembre 2012
15. L’Atelier de description d’une ressource AV: Interview (INA-ESCoM)
Studio ASA -
interfaces
Plus d’informations
sur le Studio ASA:
Diaporamas de la
1ère Journée ASA-
SHS (Décembre
2011)
Journée d’études CPST – 14/15 décembre 2012
16. L’Atelier de Modélisation de l’univers du discours du domaine ASA/du domaine
d’une archive particulière: OntoEditeur (ESCoM) – Interface (vue partielle)
Studio ASA -
interfaces
Plus d’informations
sur le Studio ASA:
Diaporamas de la
1ère Journée ASA-
SHS (Décembre
2011)
Journée d’études CPST – 14/15 décembre 2012
17. L’Atelier de publication de corpus AV: Semiosphere (ESCoM) et le CMS Umbraco ….
Studio ASA -
interfaces
Journée d’études CPST – 14/15 décembre 2012
18. L’Atelier de publication Semiosphere: Interface de travail (suite – les archives …)
Studio ASA -
interfaces
Journée d’études CPST – 14/15 décembre 2012
19. Le projet « Archive »:
« Publications « automatiques » et publications « auteur »
de corpus audiovisuels via l’Atelier de publication Semiosphère
Journée d’études CPST – 14/15 décembre 2012
20. Publications de corpus AV enligne:
1) Publications « automatiques »:
basées exclusivement sur l’exploitation systématique des résultats des
descriptions/indexations de corpus AV réalisés par un auteur dans le cadre
d’un projet d’archive numérique
Publications
« automatiques »
et publications
« auteur » 2) Publications « auteur »:
Accès: réalisées par l’auteur (les auteurs) d’un projet archive,
1) Sémiosphère –
Manuel d’utilisation sur la base d’un scénario de publication,
2) Showcases:
et en utilisant (ou non) des ressources AV préalablement analysées (i.e.
Portail AMSUR décrites et indexées) …
Portail FMSH-AAR,
Portail ALIA, par l’auteur lui-même (les auteurs eux-mêmes)
ou d’autres personnes …
Portail PCIA.
Journée d’études CPST – 14/15 décembre 2012
21. Publications « automatiques »
de corpus audiovisuels via l’Atelier de publication Semiosphère
dans le cadre d’un projet d’archive
Journée d’études CPST – 14/15 décembre 2012
22. Quatre grandes catégories de publications automatiques:
1. La « Vidéothèque » d’une archive.
Publications
« automatiques »
2. Le « Thesaurus » d’une archive.
Accès: 3. La « Bibliothèque des Sujets » d’une archive.
1) Showcase:
Vidéothèque FMSH-
4. Le « Vidéo-dossier » (« page-vidéo ») d’une ressource AV faisant partie
AAR,
d’une archive.
Journée d’études CPST – 14/15 décembre 2012
23. Première Catégorie de publications automatiques: la Vidéothèque
Type de publications automatiques …
Publications … qui exploite notamment les informations paratextuelles et
« automatiques » pragmatiques d’un corpus AV
Accès:
Exemples::
1) Showcase: • ressources AV par auteur,
Vidéothèque FMSH- • ressources AV par type/genre,
AAR, • ressources AV par lieu de production/publication,
• ressources AV par langue,
• ressources AV par type de public/d’usage,
• …
Journée d’études CPST – 14/15 décembre 2012
24. Accès via la rubrique Vidéothèque - portail FMSH-AAR ….
Publications
« automatiques »
Accès:
1) Showcase:
Vidéothèque FMSH-
AAR,
Journée d’études CPST – 14/15 décembre 2012
25. Deuxième catégorie de publications automatiques: le Thesaurus
Type de publications automatiques qui exploite …
… les facettes choisies pour interpréter les ressources AV d’une
archive à l’aide de valeurs prédéfinies (« descripteurs »)
Publications
« automatiques »
Exemples:
Accès: Les facettes du thesaurus ALIA:
1) Showcase:
Ecrivains de littérature française.
Vidéothèque ALIA
Courants de la littérature française.
Littérature par thème.
Littérature par langue.
…
Chaque archive possède son propre thesaurus (Facettes + valeurs
prédéfinies …)
Journée d’études CPST – 14/15 décembre 2012
26. Accès via la rubrique « Thesaurus » - portail ALIA ….
Publications
« automatiques »
Accès:
1) Showcase:
Thesaurus ALIA
Journée d’études CPST – 14/15 décembre 2012
27. Troisième catégorie de publications automatiques: La Bibliothèque des sujets
Type de publications automatiques qui exploite les analyses du contenu de
ressources AV (topiques, …)
Ces analyses sont réalisées à l’aide de modèles que l’analyste adapte à la
spécificité de son objet
Publications
« automatiques »
Modèle = méta-texte syntagmatique composé de séquences suivantes:
1. Séquence « Domaine de connaissance ».
Accès: 2. Séquence « Localisation du domaine de connaissance ».
1) Showcase: 3. Séquence « Mise en discours du domaine de connaissance ».
4. Séquence « Expression (audiovisuelle, verbale) du domaine de
Vidéothèque FMSH-
connaissance ».
AAR,
5. Séquence « Commentaire ».
Exemples:
La bibliothèque des sujets du portail FMSH-AAR (cf. ci-après …)
Journée d’études CPST – 14/15 décembre 2012
28. Accès via la rubrique « Bibliothèque des Sujets » - portail FMSH-AAR ….
Publications
« automatiques »
Accès:
1) Showcase:
Bibliothèque des
sujets FMSH-AAR,
Journée d’études CPST – 14/15 décembre 2012
29. Quatrième catégorie de publications automatiques: Le Vidéo-dossier
Type de publications automatiques qui exploite tous les résultats
d’analyse d’une et d’une seule ressource audiovisuelle:
« une et une seule ressource AV » =
soit une « vidéo dans son ensemble »,
Publications soit d’une partie d’une vidéo,
« automatiques »
soit de chaque « chapitre » composant une vidéo
« tous les résultats » =
Accès:
1) Showcase: paratextuels,
pragmatiques,
Vidéo-dossier
rhétoriques,
« Aconcagua »
AMSUR audiovisuels,
thématiques, …
Exemples:
Le vidéo-dossier du 3ème chapitre de « La reina del Aconcagua »
dans l’archive AMSUR (cf. ci-après …)
Journée d’études CPST – 14/15 décembre 2012
30. Accès via le « Vidéo-dossier La reina del Aconcagua (3ème chapitre) » Publication
d’une ressource AV analysée: …
Publications
« automatiques »
Accès:
1) Showcase:
Vidéo-dossier
« Aconcagua »
AMSUR
Journée d’études CPST – 14/15 décembre 2012
31. Accès via le « Vidéo-dossier La reina del Aconcagua (Chapitres) » Publication
d’une ressource AV analysée: … : …
Publications
« automatiques »
Accès:
1) Showcase:
Vidéo-dossier
« Aconcagua »
AMSUR
Journée d’études CPST – 14/15 décembre 2012
32. Publications « auteur »
de corpus audiovisuels via l’Atelier de publication Semiosphère
Journée d’études CPST – 14/15 décembre 2012
33. Rappel:
Publications « auteur »:
réalisées par l’auteur (les auteurs) d’un projet archive,
Publications
« auteur »
sur la base d’un scénario de publication,
Accès:
1) Sémiosphère – et en utilisant (ou non) des ressources AV préalablement analysées (i.e.
Manuel d’utilisation décrites et indexées) …
2) Showcases:
Portail AMSUR par l’auteur lui-même (les auteurs eux-mêmes)
Portail FMSH-AAR, ou d’autres personnes …
Portail ALIA,
Portail PCIA.
Journée d’études CPST – 14/15 décembre 2012
34. Genres de publications « auteur »:
1. Dossier
Dossier « Evénement » (= modèle de publication « standard » pour
les AAR).
Dossier thématique.
Dossier pédagogique.
Publications Dossier bi- ou multilingue.
« auteur »
2. « Vidéo-lexiques »
3. Web-documentaires, POM, …
Accès:
1) Showcase: 4. Portail personnalisé
Rubrique personnalisée
Rubrique
« Dossiers » de
l’archive AMSUR
Exemples
Portail PCIA
Rubrique « Dossiers » de l’archive AMSUR
Linguistique et langues amérindiennes (auteur: Manuela Papino)
Rubrique « Ressources » du portail PCIA (auteur: Valérie Legrand-
Galarza)
Journée d’études CPST – 14/15 décembre 2012