ALT.NET Modéliser Parallèle avec C# 4.0

Modéliser Parallèle avec C# 4.0 Code Session : TCP301 21 avril 2010 Bruno BOUCARD boucard.bruno@free.fr http://blogs.msdn.com/devpara/default.aspx http://msmvps.com/blogs/brunoboucard

Choisir une stratégie et un algorithme adaptés Trouver la concurrence Méthode itérative

Etape 1 Mesurer les performances de la solution

Etape 1Analyser les performances Analyser les coûts de la solution séquentielle

Analyser les performances Démonstration

Etape 2 Trouver la concurrence

Etape 2Trouver la concurrence Commencer avec un cahier des charges qui décrit le problème Quel que soit le contexte fonctionnel ou technique, vous serez guidé naturellement par l’une des décompositions ,[object Object]

Il arrive qu’on passe d’une décomposition orientée tâches à une décomposition orientée données ou bien flux de données en fonction du type de traitementCommencer Analyse des dépendances Décomposition Grouper les tâches Orientée données Ordonner les tâches Evaluer le design Orientée tâches Partager les données Analyser les dépendances ,[object Object]

NDepend: http://www.ndepend.com/,[object Object]

Trouver la concurrenceSolution séquentielle Dépiler un nom de fichier WM_TIMER Sélectionner un répertoire Charger une image Structure de pile partagée Charger tous les noms d’images dans le répertoire et ses sous répertoires Normaliser l’image Twister l’image Insérer dans le contrôle graphique Empiler les noms de fichiers sélectionnés Convertir l’image en une vignette

Etape 2Décomposition et granularité Votre décomposition en tâches doit tenir compte de leur granularité et de leur surcoût Cœur 0 Cœur 1 Cœur 2 Cœur 3 Cœur 1 Cœur 2 Cœur 0 Cœur 3 tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche Configuration 2 Quelle est la meilleure configuration ? Configuration 1 surcoût charge

Etape 2Décomposition et répartition de charge Votre groupement de tâches doit tenir compte de leur charge Cœur 1 tâche Cœur 2 Cœur 0 Cœur 3 Cœur 1 Cœur 2 Cœur 0 Cœur 3 tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche tâche Configuration 2 Quelle est la meilleure configuration ? Configuration 1 surcoût charge

Etape 2Evaluer votre design Flexibilité Préférer l’abstraction pour faciliter l’adaptation à différents scénarios d’exécution Nombre de cœurs sollicités Partitionnement des données Efficacité Le temps dépensé à gérer le parallélisme vs le temps gagné à tirer parti des cœurs Amélioration des performances en fonction du nombre de processeurs Simplicité Le code peut être facilement diagnostiqué La solution technique choisie est facile à maintenir

Etape 3 Choisir un algorithme en fonction de votre stratégie

Etape 3Choisir un algorithme en fonction de votre stratégie

Etape 3Algorithmes données Décomposition géométrique Taille des morceaux ,[object Object]

Trop petit – sur consommation Format des morceaux ,[object Object],Traitement d’une collection d’images, addition de matrices …

ModéliserAlgorithmes données – Attention au False Sharing Pour des raisons de performances, les systèmes utilisent des lignes de cache Lorsque des threads sur différents processeurs modifient en parallèle les variables qui résident sur la même ligne de cache, le False Sharing n’est pas loin  Coeur 0 Coeur 1 T0 T1 Cache Cache Ligne de cache Ligne de cache ,[object Object]

Deux champs d'instance dans la même instance de classe sont proches dans leurs emplacement de mémoire

Deux champs statiques dans le même type sont proches en mémoire

Deux éléments avec des index adjacents dans un tableau sont proches en mémoire

Les objets alloués consécutivement sont probablement proches en mémoire

Les variables locales utilisées ensemble dans une fermeture sont probablement capturées dans les champs d'instance, et ainsi, d'après le premier commentaire ci-dessus, sont également proches en mémoireMémoire

Algorithmes données: False Sharing Démonstration

Etape 3Décomposition géométrique for (int i = 0; i < size; i++) { Parallel.For(0, size, j => { inttemp = 0; for (int k = 0; k < size; k++) { temp += m1[i, k] + m2[k, j]; } result[i, j] = temp; }); }

Etape 3Algorithmes données Décomposition récursive Le choix de la profondeur détermine la performance - Arbre profond ,[object Object],- Arbre de profondeur limitée ,[object Object],1 tâche 2 tâches 3 tâches 3 tâches Parcours de graphe ou parcours d’arbre …

Etape 3Récursivité sur des données staticvoidWalk<T>(Tree<T> root, Action<T> Action) { if (root == null) return; var t1 = Task.Factory.StartNew(() => action(root.Data)); var t2 = Task.Factory.StartNew(() => Walk(root.Left, action)); var t3 = Task.Factory.StartNew(() => Walk(root.Rigth, action)); Task.WaitAll(t1, t2, t3); }

Etape 3Algorithmes tâches Parallélisme de tâches linéaires Nombre de tâches ,[object Object]

trop élevé: contention des tâchesDépendances ,[object Object]

lecture seule ou lecture/écrituresous opération 1 sous opération 2 sous opération 3 sous opération 4 sous opération 4 sous opération 1 sous opération 2 Paralléliser des opérations décomposables sous opération 3

Etape 3Algorithmes tâches Arbres profond ,[object Object],Arbres de profondeur limitée ,[object Object],Diviser pour régner Problème Séquentiel Split Sous - problème Sous - problème 2 chemins parallèles Split Split Sous - problème Sous - problème Sous - problème Sous - problème 4 chemins parallèles Résoudre Résoudre Résoudre Résoudre Sous - problème Sous - problème Sous - problème Sous - problème Fusionner Fusionner 2 chemins parallèles Sous - solution Sous - solution Fusionner QuickSort Solution Séquentiel

Etape 3Diviser pour régner staticvoidQuickSort<T>(T[] data, intfromInclusive, inttoExclusive) where T : IComparable<T> { if (toExclusive - fromInclusive <= THRESHOLD) { InsertionSort(data, fromInclusive, toExclusive); } else { intpivotPos = Partition(data, fromInclusive, toExclusive); if (toExclusive - fromInclusive <= PARALLEL_THRESHOLD) { // NOTE: PARALLEL_THRESHOLD ischosen to begreaterthan THRESHOLD. QuickSort(data, fromInclusive, pivotPos); QuickSort(data, pivotPos, toExclusive); } elseParallel.Invoke( () => QuickSort(data, fromInclusive, pivotPos), () => QuickSort(data, pivotPos, toExclusive)); } }

Etape 3Algorithmes flux de données Pipeline Les charges de travail des étapes ,[object Object]

inégales – pipeline non-linéaireChaîne de montage automobile

Etape 3Algorithmes flux de données Coordination orientée événements Traitement d’une dépêche sur un desk journalistique …

Etape 3Pipeline var input = new BlockingCollection<string>(); var readLines = Task.Factory.StartNew(() => { try { foreach(var line in File.ReadAllLines(@"input.txt")) input.Add(line); } finally { input.CompleteAdding(); } }); var writeLines = Task.Factory.StartNew(() => { File.WriteAllLines(@"output.txt", input.GetConsumingEnumerable()); }); Task.WaitAll(readLines, writeLines);

Etape 4 Choisir un pattern de structure

Etape 4Choisir un pattern de structures de programme Après avoir sélectionné votre algorithme parallèle, il faut maintenant le supporter dans votre programme Structures de programme SPMD Master/Worker Boucle parallèle Fork/Join

Etape 4Les Patterns de structures de programme SPMD, Master/Worker, Boucle parallèle et Fork/Join partagent les mêmes idiomes Partitionner Exécuter Fusionner

ALT.NET Modéliser Parallèle avec C# 4.0

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a ALT.NET Modéliser Parallèle avec C# 4.0

Semelhante a ALT.NET Modéliser Parallèle avec C# 4.0 (20)

Mais de Bruno Boucard

Mais de Bruno Boucard (9)

ALT.NET Modéliser Parallèle avec C# 4.0