Session des Journées SQL Server 2014 - Galla Pupel
---
Power Q&A permet d’interroger vos modèles en langage naturel. Mais comment bien construire son modèle ? Comment bien configurer la sémantique pour une utilisation optimum ?
Nommage, typage, métadonnées, synonymes, phrasings…nous aborderons tous les concepts qui permettront à vos modèles de répondre à vos questions..
6. #JSS2014
Galla Pupel
Consultante en Business Intelligence
CGI Business Consulting
@GallaPupel
Jean-Pierre Riehl
Responsable Data & Business Intelligence – AZEO
MVP SQL Server
Membre du Board GUSS
8. #JSS2014
1. L'importance d'avoir un bon modèle de données
Normaliser son modèle de données
Affuter son modèle de données
2. Structuration de la recherche
Comment Q&A interprète ce que vous écrivez ?
3. Phrasing
Comment ces interprétations peuvent être améliorées ?
Agenda
12. #JSS2014
Préparer ses données
– Nettoyer en amont
– Structurer et modéliser
– Optimiser (typage, tri, comportement des colonnes)
Conséquences sur l’analyse, la restitution
– Facilité de compréhension des utilisateurs
– Facilité d’assimilation par les outils (Power View, Q&A)
• Meilleures suppositions
• Lever les ambiguïtés (Q&A)
Comment avoir un bon modèle de données
14. #JSS2014
Créer de nouvelles tables pour les entités multi-colonnes
Unités distinctes dans une table
Splitter ces unités dans leur propre table.
Normaliser son modèle de données
15. #JSS2014
Pivoter les Property bags
Colonnes « fourre-tout »
Pivoter en colonne car Q&A fonctionne seulement quand une colonne = une signification
Normaliser son modèle de données
16. #JSS2014
Union pour éviter le partitionnement
Partitionnement des valeurs sur plusieurs colonnes
Consolider les données dans une seule colonne, facilite l’agrégation dans Q&A
Normaliser son modèle de données
17. #JSS2014
Splitter les colonnes formatées
Colonnes contenant plusieurs sous-informations
Splitter les valeurs des colonnes afin de les analyser en tant que valeur
Créer une nouvelle table pour les colonnes avec plusieurs valeurs
Normaliser son modèle de données
18. #JSS2014
De-normaliser pour éliminer les relations inactives
Plus d’une relation entre deux tables
Q&A utilise seulement les liaisons actives
Normaliser son modèle de données
20. #JSS2014
Lier les tables
Fondement d’un bon modèle de données
Power View et Q&A ne peuvent deviner les liaisons
Epurer le modèle
Masquer les colonnes inutiles
Eviter le « bruit »
Affuter son modèle de données : Base
21. #JSS2014
Renommer les tables et colonnes
Être le plus précis possible
Trier ses données
Trier une colonne par une autre
Exemple : Libellés de mois, tailles (S,M,XL)
Typer les données correctement
Attention aux dates et aux nombres
Affuter son modèle de données : Base
22. #JSS2014
Ne pas agréger tous les champs
Power View agrège par défaut
Mesures implicites vs Mesures explicites
Affuter son modèle de données : Avancé
23. #JSS2014
Définir les Champs par défaut
Ces colonnes seront affichées par défaut
Définir les Libellés par défaut
Impact sur la visualisation
Tables de fait n’ont pas de labels par défaut
Catégories de données
Impact sur la visualisation qui sera associée
Impact sur la compréhension de la question
Affuter son modèle de données : Avancé
24. #JSS2014
Ajouter des synonymes aux tables et colonnes
Fonctionnalité spécifique à Q&A
Avoir plusieurs terminologie pour une même chose
Plus de synonymes
Attention
Un objet = Une signification
Ne pas créer d’ambiguïté
Affuter son modèle de données : Avancé
26. #JSS2014
Q&A
Correspondance sur la base de la structure du modèle
Compréhension générale de la syntaxe anglaise
Commandes intégrées de business intelligence
La customisation des connaissances spécifiques au domaine
30. #JSS2014
Phrasing
• La relation entre les choses
• Descriptions des relationsQuoi ?
• Phrasing ajouté automatiquement
• Phrasing ajouté manuellementComment ?
• Définir de nouveaux termes
• Résoudre les ambiguïtés
• Améliorer la pertinence des questions
Pourquoi ?
31. #JSS2014
Quels sont les types de Phrasing ?
Un nom (substantif) désigne les catégories d'êtres, de choses et les concepts
Exemples: voiture, soleil, le SQL.
Un verbe est une action, ou un état
Exemples: supprimer, éclater, dévorer, éjecter.
Un adjectif est un mot qui décrit un nom et le modifie
Exemples: puissants, magique, rouge.
Une préposition est un mot utilisé devant un nom afin de le relier à un
substantif, verbe ou un adjectif précédent
Exemples: of, for, per, from, to
Phrasing
32. #JSS2014
Attribute Phrasings : Which venues have categories ?
Phrasing : Venues have categories
Name Phrasings : Which categorie named Cubana Café ?
Phrasing : venue is the name of categories
Adjective Phrasings : Which cities are swag ?
Phrasing : swag city has large somme de total user
Noun Phrasings : Which venues are Noman’sland ?
Phrasing : Noman'sland is venue where somme de total user < 2
Preposition Phrasings : Which cities are in France ?
Phrasing : City is in Country
Verb Phrasings : Where did djeepy travel last week ?
Phrasing : djeepy checkin travels in city
Type de Phrasing
35. #JSS2014
Des règles à respecter en amont pour faciliter l’analyse :
Modélisation
Couche sémantique
Q&A comprend nativement un « bon » modèle sémantique …
… Mais il est possible de l’aider grâce aux Synonymes & Phrasings
Conclusion
On parlait des speakers, il y a une chose qui leur tient à cœur !
On parlait des speakers, il y a une chose qui leur tient à cœur !
Jusqu’à présent vous avez surement déjà vu des démo de Power BI Q&A et vous avez peut-être même déjà joué avec.
Donc à ce niveau, vous pensez probablement une de ces deux choses :
Soit vous êtes conquis, vous êtes émerveillé par l’intelligence du système, et vous êtes convaincu que le moteur peut répondre sans effort à presque toutes les questions sur n’importe quelle données
Ou, vous ne pensez pas qu’une chose pareille est possible, que c’est trop beau pour être vrai, et pour vous c’est certain que Q&A ne fonctionne que sur des modèle ultra travaillés par une armée de doctorant qui ont analysés le modèle pendant des années afin de le rendre le plus performant possible.
Enfaite, la vérité est entre les deux.
Nous allons vous apprendre pourquoi optimiser votre modèle de base bénéfique à la fois pour la construction et la consommation de Power View ainsi que pour Q & A .
Dans cette session, nous verrons ce que vous pouvez espérer que Q&A comprenne et les choses que vous pouvez faire pour élargir sa compréhension, et améliorer ses réponses.
Présentation de création des règle de phrasing, qui sont utilisées pour réduire l’ambiguité et introduire les termes complexes.
Cette session a pour objectif de montrer comment les données peuvent être préparées afin de les délivrer de la meilleure manière possible
Cette session, au travers d’explications et de démonstration montrera comment les différents outils de Power Bi permettent de préparer son modèle de données.
Présentation des possibilités et des fonctionnalités de chaque outil qui vous aideront à déterminer quels sont les prérequis à mettre en œuvre afin de faciliter l’analyse.
Vise Q&A mais aussi PowerView
Introduction 5’’
L'importance d'avoir un bon modèle de données 20’’
Normaliser son modèle de données
Affuter son modèle de données
+ demo
Structuration de la recherche15
Comment Q&A interprète ce que vous écrivez ?
Phrasing 15
Comment ces interprétation peuvent être améliorées ?
démo
CCL 5
Where am I ?
Q&A c’est ici mais c’est un tout
Prérequis : Office 365
Power BI est une plateforme de business intelligence self-service accessible via Excel et Office 365. Les utilisateurs peuvent identifier et analyser leurs données via une l’interface intuitive qu’est Excel. Les données peuvent être hébergées et partagées dans l’organisation mais aussi dans le “Cloud”.
Le Power BI Sites est un portail de collaboration destiné à partager ses documents.
Partager, et interagir avec les rapports présents dans l’espace collaboratif Power BI sites.
Centre d’administration Power BI qui permet de gérer l’infrastructure du Power BI sites
Partage et gestion des requêtes
Récupérer et façonner les données
Analyser les données
Construire des tableaux de bord
Partager et consommer les données
Slide visuel qui focus sur Power View et Power Q&A (remplace l'agenda)
Vision de Microsoft : une démarche universelle
Offrir un accès simple à tous les types de données d’où qu’elles viennent : Analyser et afficher ses résultats à partir de données présentes (ou non) dans l’entreprise
Donner l’accès aux données à tout le monde grâce à des outils puissants et familiers : Partager ses rapports et ses jeux de données aux travers de l’organisation et les tenir à jour
Poser des questions directement sur ses données via le “natural language search” (Q&A)
Accéder et rester connecté à ses données et rapports via son mobile
Vision de Microsoft : une démarche universelle
Offrir un accès simple à tous les types de données d’où qu’elles viennent : Analyser et afficher ses résultats à partir de données présentes (ou non) dans l’entreprise
Donner l’accès aux données à tout le monde grâce à des outils puissants et familiers : Partager ses rapports et ses jeux de données aux travers de l’organisation et les tenir à jour
Poser des questions directement sur ses données via le “natural language search” (Q&A)
Accéder et rester connecté à ses données et rapports via son mobile
OK, alors avant de paniquer, je ne vais pas vous dire, refaites tout votre modèle afin qu’il ressemble à la 6e forme normal ou quoi.
Mais il y’a des structures, des modèles qui sont tordus, compliqués, et que Q&A ne vas pas être capable de comprendre.
Mais en faisant des normalisation basiques de structure sur votre modèle, l’utilisation de Power View sera meilleure et les résultats de Q&A seront plus précis.
La règle de base, générale à suivre est la suivante :
Chaque chose unique dont l’utilisateur parle doit représenter exactement un seul objet du modèle (table ou colonnes)
Donc si les utilisateurs parlent des clients, il ne doit y’avoir qu’un objet nommé client. Et si les utilisateurs parlent des ventes, il ne doit y avoir qu’un seul objet vente.
Simple non ? Peu importe la structure des données avec laquelle vous démarrer, vous pouvez le faire.
Power Query vous permet de mettre en forme vos données, alors que d’autres transformations simples peuvent être faites avec les colonnes calculées de Power Pivot
Expliquer Dataset : Foursquare djeepy
Si vous avez plusieurs colonnes qui interagissent comme une unité distinct à l’intérieur d’une table plus grande.
Ces colonnes devront être splitté dans leur propre table
Cela va rendre plus facile l’analyse des questions des checks indépendamment de la catégorie ou de la géographié, and améliorer aussi la façon de représenter les données
Le fait de le transformer en entité propre, techniquement cela lui donne plus d’options, plus d’objets associés.
Attention vient en contradiction avec le modèle classique de tabulaire, qui auurait tendance à dire de tout rassembler dans une seule et unique table
Les property bags, Les colonnes fourre tout
Restructurer pour avoir une seule colonne par propriété.
Property bag peuvent servir à gérer beaucoup de propriétés, mais ils souffrent d’énormémment de limitation que ni PowerView ni Q&A ne sera capable de contourner.
Par exemple sur une dimension geography du client avec CustomerID property, et les valeurs des colonnes ou chaque ligne représente une propriété différente du client, (e.g age, marital status, city) .
En utilisant la signification de la colonne value, qui se base sur le contenu de la colonne propriété, il devient possible à Q&A de comprendre la plupart des requêtes qui y réfère. Par exemple la question suivante : « montre moi l'âge de chaque client » peut fonctionner, car il est interprété de la façon suivante : « montre les clients quand la propriété est age ».
Cependant la structure du modèle ne supportera pas des questions plus complexe tel que : la moyenne d'Age des clients de Chicago.
Q&A fonctionne seulement quand chaque colonne a une seule signification
Si vous avez partitionné vos données dans plusieurs tables, ou si vous les avez pivotés les valeurs dans plusieurs colonne, beaucoup d’opérations classiques seront difficiles ou impossible à réaliser pour vos utilisateurs.
Par exemple une table partitionnée avec les ventes de 2000 à 2010 et les ventes de 2011 à 2020.
Si vos rapports doivent respecter ces décennies vous pouvez les laisser tel quel dans Power View
Cependant dans Q&A vos utilisateurs vont espérer pouvoir poser des questions de type : Total des ventes par années. Mais pour ça, vous aurez besoin d’unir vos données dans une seule et unique table power pivot.
Similarly, consider a typical pivoted value column: a BookTour table containing Author, Book, City1, City2, and City3 columns. With a structure like this, even simple questions like “count books by city” cannot be interpreted correctly. For this to work, you should create a separate BookTourCities table, which unions the city values into a single column.
Si la source de données contient des colonnes formatées, Power View et Q&A ne seront pas capables d’atteindre les données contenues à l’intérieur
Par exemple, avec une adresse complète il est important de scinder les colonnes
Cela peut vous aider dans plusieurs cas,
Par exemple sur les colonnes de Nom, prénom il est préconisé de les scinder dans le cas ou dans Q&A les utilisateurs posent des questions en utilisant une parti du nom
Autre exemple pour les colonnes de dates, ajouter années et mois afin que les utilisateurs puissent poser des questions en groupant sur l’année et/ou le mois
De la même façon si votre source de données contient une colonne avec plusieurs valeurs à l’intérieur, il est important de la spliter.
Denormalisation.
La seule exception au « Normalization is better » c’est lorsque vous avez plus d’une liaison entre deux tables.
Par exemple si vous avez une table « vol » avec à la fois SourceCityId et destinationCity Id columns, ces deux id reliés à la table ville, une des deux liaisons doit être marquées comme inactive.
Q&A utilise seulement les liaisons actives, du coup vous ne pourrez pas poser des questions sur la source et la destination, selon lequel vous choisissez.
Si à la place vous dénormalisez le nom de la vile dans la table « vol » vous serez alors capable de poser des question comme :
Donne mois les avions pour demain qui ont pour depart Seattle et comme destination San Francisco
Mais finalement tous des prof de la BI => Bonnes pratiques de modélisation BI
Règles de modélisations qui vont permettre à votre PowerView & Q&A de restituteur correctement l’information
Cependant il y’a encore une couche liée à la sémantique.
Nous allons voir l’Enrichissement et les bonne pratique qui vont permettre au moteur Q&A de pouvoir comprendre correctement ce que l’utilisateur lui demande
Affutage modèle de données
-> pour chaque, montrer l'impact dans Power View
Bonus track : bonnes pratiques d'import de Power Query ??
Si vous oubliez les relations entre vos tables dans voter modèle, ni power view ou Q&A ne sera capable de deviner comment joindre les tables entre elles, si vous posez une question.
Par exemple vous ne pouvez demander “ les ventes totales pour les clients de seatlles” si il n’y a pas de relations entre les tables de commande et de clients
Renommer les tables et les colonnes
Si les tables et les colonnes sont mal renseignées, même Power View aura du mal à fonctionner. Et cela est d’autant plus vrai pour Q&A.
Par exemple si vous avez une table nommé DataCustomer qui contient la liste de vos clients, vous devrez poser la question suivante : List the DataCustomer in Chicago, au lieu de list the customers in Chicago. Ce qui n’est pas intuitif.
Les tables et les colonnes doivent refléter le contenu au plus proche.
Eviter les DIMCustomer, FACCustomer
Corriger les types de données;
Lorsque vous importez des données, elles peuvent avoir des types incorrects.
Principalement les dates et les nombres qui peuvent être importés comme des string (champs texte) et qui ne seront pas correctement compris par PowerView et Q&A
Il est important de mettre le bon type dans power pivot
Trier par
La propriété trier par colonne permet de trier les colonnes, par une autre colonne.
Par exemple trier les colonnes de mois en lettre, par les colonnes de mois en chiffre.
Ou pour les tailles :Shirt Size column to sort by the underlying size number (XS, S, M, L, XL) rather than alphabetically (L, M, S, XL, XS).
Marquer les années comme, ne pas sommer.
Power View agrège de façon agressive les colonnes numérique par défaut.
Par exemple, les questions de type Total des ventes par années, peut résulter un total des ventes par le total des années.
Si il y’a d’autres colonnes pour lesquelles vous ne souhaitez pas voir ce comportement : années, mois, jour, colonnes ID.
Choisir les champs par défaut
Sélectionner des colonnes qui seront affichées par défaut lorsque des questions seront posées sur une table.
Par exemple si vous voulez voir les commandes de la semaine dernière, vous ne voulez pas voir les 30 colonnes de votre table de commande
Définir les libellés par défaut
Le libellé par défaut est utilisé par Power View pour sélectionner les éléments dans les filtres.
C’est également le cas pour Q&A quand il va décider quel style de graphique ou histogramme pour présenter le résultat.
Par exemple « Count orders by customer » vous montrera un résultat tabulaire si le défaut label n’est pas mis en place.
Si vous mettez le champ Customer Name comme colonne par défaut alors le résultat sera visualisable dans un diagramme à barre.
A noter que pour certaines tables, notamment les tables de fait, de mesures, vous aurez uniquement les champs par défaut et non les labels par défaut
Catégorie de données
Pour les dates et les colonnes de type géographique.
Les catégories apportent une connaissance supplémentaire de la sémantique, en plus du type de données.
Par exemple une colonne entier, peut être marqué comme une année, ou un code postal.
Ces informations sont utilisées pour Q&A pour deux choses :
La visualisation qui sera choisi
La compréhension de la question
Premièrement Q&A utilise les informations des catégories afin d’aider au choix du visuel. Par exemple, il va reconnaitre que les colonnes avec des dates ou du temps pour la catégorie sont des bons clients pour l’axe horizontal d’un line graph, ou l’axe de visualisation d’un bubble chat.
Et que les colonnes contenant des données géographiques peuvent apparaitre correctement sur une carte
Deuxièmement, Q&A fait des suppositions sur la façon dont les utilisateurs sont susceptibles de parler des colonnes de date et de géographie, cela lui permet de comprendre certains types de questions.
Par exemple, le when (quand) de When Jean-Pierre est-il allé au restaurant ? Est presque certain de mapper sur une colonne de date
Et Count customers in Brown sera plus probable d’être une ville qu’une couleur de cheveux.
Note que des données tel que L’année, ont besoin d’etre entré comme custom category
Synonymes aux tables et colonnes;
C’est la seule étape qui est spécifique à Q&A, plus que PowerView en général.
Les utilisateurs utilisent souvent une variété de terminologie pour se référer à la même chose. Exemple : Ventes totales, le total des ventes.
Power Pivot permet de créer ces synonymes et de les ajouter aux tables et colonnes au sein du modèle.
Surtout ne pas sous-estimer l’importance de cette étape !
Même si vous pensez que vos tables et colonnes ont les meilleurs noms, les utilisateurs de Q&A vont poser des questions en utilisant le vocabulaire qui leur vient en premier, ils ne vont pas le prendre d’une liste prédéfinis de colonnes. Le maximum de synonymes vous pouvez ajouter, mieux c’est.
Attention cependant.
Il faut être conscient que vous introduisez une ambiguïté quand vous ajouter le même synonyme à plus d’une colonne ou table !
Q&A utilisera le contexte, quand cela est possible, pour choisir entre deux synonymes ambiguë. Mais toutes les questions n’ont pas suffisamment de contexte.
Par exemple lorsque vos utilisateurs demandes : ‘Count the customers’, si vous avez trois objets avec le synonyme Customer dans votre modèle, ils ne pourront pas avoir la réponse qu’ils cherchent. Faites attention à ce que le synonyme principal soit unique.
Q&A est essentiellement un moteur de compréhension du langage naturel basé sur des techniques traditionnelles de recherche et de filtrage , rehaussés avec :
Correspondance sur la base de la structure du modèle : capacités de recherche de mots clés dépendant du contexte pour les données et les métadonnées .
Compréhension générale de la syntaxe anglaise
Pré- commandes intégré de business intelligence : il dispose d'un ensemble de connaissances intégré pour comment filtrer , trier des données , agrégées , groupe et d'affichage
La customisation des connaissances spécifiques au domaine
Ces capacités de base peuvent être appliquées à toutes les données de modèle Power Pivot.
Cependant, indépendamment de l'intelligence construite dans le système , il y’a des limites claires aux capacités de tout système d'interpréter les données et les questions relatives.
Par exemple, Q&A ne pourra pas vous dire pourquoi les ventes n’ont pas augmenté l’année dernière ! (et il ne sert pas non plus le café)
Mais au lieu de dire ce qu’il ne fait pas, nous allons nous pencher sur ce qu’il fait.
Activer son classeur sur le Power BI Site
Ajouter des featured questions
Heureusement, le moteur Q&A a des capacités de langage naturel qui fonctionnent sur tous les modèles Power Pivot .
Premièrement, il a des capacités de recherche de mots clés dépendant du contexte pour les données et les métadonnées .
Deuxièmement, il dispose d'un ensemble de connaissances intégré pour comment filtrer , trier des données , agrégées , groupe et d'affichage
Bien que Q & A travailleront certainement mieux contre les modèles qui ont été optimisés pour Power View et le meilleur contre les modèles annotés avec les règles de phrasé , ces deux capacités primaires se appliquent à tous les modèles .
Nous avons vu les capacités basiques de Q&A, et comment nous pouvions optimiser notre modèle afin d’en prendre les avantages.
Ceux qui ont une courte capacité d'attention ont cessé de suivre depuis longtemps, je peux donc vous révéler en toute sécurité à ceux d'entre vous qui restent les incantations secrètes qui sont maintenant disponibles afin de faire passer vos modèles au niveau suivant ..
Qu’est ce que c’est ?
Le Phrasing c’est tout simplement, comment est-ce que vous parler des relations entre les choses.
Par exemple, pour décrire les relations entre les clients et les produits, vous pouvez dire, les clients achètent les produits.
Ou pour décrire les relations entre les clients et leur numéro de téléphone, vous pouvez dire, les clients ont un numéro de téléphone.
Ces phrasés sont possibles dans une variété de formes et de tailles différentes.
Certaines correspondent directement au modèle sémantique, d’autres relatent les colonnes et leur relation avec les tables dont elles font parties.
D'autres concernent plusieurs tables et colonnes dans des relations complexes . Dans tous les cas , ils décrivent comment les choses sont liées en utilisant des termes de tous les jours .
D’où vient le Phrasing ?
Certains Phrasing ont été ajouté au modèle automatiquement, basé sur la structure d modèle et sur des suppositions basées sur le nom des colonnes.
Par exemple beaucoup de colonnes seront liées aux tables les contenant avec un Phrasing simple comme « les produits ont des descriptions »
Les relations du modèle ont pour Phrasing par défaut les deux directions, commandes ont des produits, les produits ont des commandes.
Certaines relations de modèles peuvent , en fonction de leurs noms de colonnes , obtenir un phrasé de défaut plus complexe comme " les commandes sont expédiées vers les villes «
Il y’a plein de façons avec lesquelles vos utilisateurs parlent des choses que nous ne pouvons pas deviner
Pour ceux , vous pouvez ajouter vos propres phrasés manuellement.
Pourquoi ajouter du Phrasing ?
La première raison pour ajouter du Phrasing est pour définir un nouveau terme.
Par exemple, si vous voulez demander à Q&A ‘List les plus vieux clients” vous devez d’abord apprendre à Q&A ce que vieux signifie.
Donc vous pouvez ajouter un Phrasing de type : les vieux clients sont les clients avec le plus d’ancienneté
La seconde raison, est de résoudre les ambiguïté.
Les mots clés basiques de recherche ne peuvent pas comprendre lorsque les mots ont plus d’un sens.
Par exemple, “Flight to Chicago”, n’a pas la même signification que “flight from Chicago”, mais Q&A ne sait pas ça, jusqu’a ce que vous lui appreniez avec le Phrasing :
“flights are from departure cities” and “flights are to arrival cities”.De la même façon, the distinction between “cars that John sold to Mary” and “cars that John bought from Mary” will only be understood once you add the phrasings “customers buy cars from employees” and “employees sell customers cars”.La dernière raison pour ajouter un phrasé est d'améliorer l’affichage des données.
Plutôt que de dire Show customers and their products, il serait plus clair de dire « show customers and products they bought »
lutôt que de Q & A écho de nouveau à vous " Montrer les clients et leurs produits " , il serait plus clair se il se agissait de dire " Afficher les clients et les produits qu'ils ont acheté " ou " Afficher les clients et les produits qu'ils ont examinées " , selon la façon dont bien entendu la question . Ajout personnalisés phrasés permet retraitements soit plus explicite et sans ambiguïté
Quels sont les types de Phrasing?
Pour comprendre les différents types de Phrasing, vous devez vous remémorer vos cours de grammaire , quand vous aviez 10 ans ?
Pour ceux qui ont été traumatisée par madame michu, je vais vous donner un cours rapide et indolore
Un nom (substantif) désigne les catégories d'êtres, de choses et les concepts
Exemples: voiture, Jean-Pierre, soleil.
Un verbe est une action, ou un état
Exemples: Hatch, éclater , dévorer , éjecter
Un adjective est un mot qui décrit un nom et le modifie
Exemples: puissants, magique, sympas, rouge
Une préposition est un mot utilisé devant un nom afin de le relier à un substantif précédent, verbe ou un adjectif
Exemples: of, for, near, from (, de, pour, sur, dans, avec, en, par, parmi, )
Ouvre les yeux c’est fini.
Quels sont les types de Phrasing?
Pour comprendre les différents types de Phrasing, vous devez vous remémorer vos cours de grammaire , quand vous aviez 10 ans ?
Pour ceux qui ont été traumatisée par madame michu, je vais vous donner un cours rapide et indolore
Un nom (substantif) désigne les catégories d'êtres, de choses et les concepts
Exemples: voiture, Jean-Pierre, soleil.
Un verbe est une action, ou un état
Exemples: Hatch, éclater , dévorer , éjecter
Un adjective est un mot qui décrit un nom et le modifie
Exemples: puissants, magique, sympas, rouge
Une préposition est un mot utilisé devant un nom afin de le relier à un substantif précédent, verbe ou un adjectif
Exemples: of, for, near, from (, de, pour, sur, dans, avec, en, par, parmi, )
Ouvre les yeux c’est fini.
Les types de phrase
Attribute Phrasings (verbe avoir)
C’est le cheval de bataille de Q & A , utilisé lors une chose agit comme un attribut d'une autre chose .
Ils sont simples,
They’re simple, straightforward and perform most of the heavy lifting when a subtler, more detailed phrasing hasn’t been defined.
Attribute Phrasing sont descrit en utilisant le verbe basic have (avoir) Products have categories et automatiquement permet les questions
Attribute phrasings are described using the basic verb “have” (e.g. “products have categories”), and automatically also allow questions to be asked using “of” and “for” (e.g. “categories of products”, “orders for products”) and possessive (e.g. “John’s orders”). Attribute phrasings are used in questions such as this:
Which customers have orders?
Show orders that have chai
List customers with orders
What is the category of each product?
Count Robert King's orders
The overwhelming majority of attribute phrasings needed in your model will be automatically generated, based on table/column containment and model relationships, so you typically won’t need to create them yourself.
Name Phrasings
Name phrasings are key for tables in your model which represent things that have names. For example, a “product names are names of products” phrasing is essential for being able to use product names in questions. While a name phrasing also enables “named” as a verb (e.g. “List customers named John Smith”), it is most important when used in conjunction with other phrasings, to allow a name value to be used to refer to a particular table row. For example, in “Customers that bought chai”, Q&A can tell that the value “chai” is referring to a product rather than merely a product name. Name phrasings are used in questions such as this:
Which employees are named Robert King
Who is named Ernst Handel
What did Robert King buy?
Assuming you used a sensible naming convention for name columns in your model (e.g. “Name” or “ProductName” rather than “PrdNm”), the majority of name phrasings needed in your model will be automatically generated, so you usually won’t need to create them yourself.
Adjective Phrasings
Adjective phrasings define new adjectives used describe things in your model. For example, a “happy customers are customers where rating > 6” phrasing is needed to ask questions like “list the happy customers in Des Moines”. There are several forms of adjective phrasings, for use in different situations.
Simple adjective phrasings define a new adjective based on a condition, such as “discontinued products are products where status = D”. Simple adjective phrasings are used in questions such as this:
Which products are discontinued?
List the discontinued products
Products that are backordered
Measurement adjective phrasings define a new adjective based on a numeric value that indicates the extent to which the adjective applies, such as “long rivers are rivers with large lengths”. Measurement adjective phrasings are used in questions such as this:
List the long rivers
Which rivers are the longest?
How long is the Rio Grande?
Dynamic adjective phrasings define a set of new adjectives based on values in a column in the model, such as “colors describe products”. Dynamic adjective phrasings are used in questions such as this:
List the red products
Which products are green?
Count issues that are active
Noun Phrasings
Noun phrasings define new nouns that describe subsets of things in your model. For example, a “flops are movies where net profit < 0” phrasing is needed to ask questions like “count the flops by year”. There are two forms of noun phrasings, for use in different situations.
Simple noun phrasings define a new noun based on a condition, such as “contractors are employees where full time = false”. Simple noun phrasings are used in questions such as this:
Which employees are contractors?
Count the contractors in Portland
Dynamic noun phrasings define a set of new nouns based on values in a column in the model, such as “jobs define subsets of employees”. Dynamic noun phrasings are used in questions such as this:
List the cashiers in Chicago
Which employees are baristas?
Preposition Phrasings
Preposition phrasings are used to describe how things in your model are related via prepositions. For example, a “cities are in countries” phrasing improves understanding of questions like “count the cities in Washington”. Some preposition phrasings are created automatically when a column is recognized as a geographical entity. Preposition phrasings are used in questions such as this:
Count the customers in New York
List the books about linguistics
Which city is John Galt in?
How many books are by Stephen Pinker?
Verb Phrasings
Verb phrasings are used to describe how things in your model are related via verbs. For example, a “customers buy products” phrasing improves understanding of questions like “who bought cheese?” and “what did John buy?” Verb phrasings are the most flexible of all of the types of phrasings, often relating more than two things to each other, such as in “employees sell customers products”. Verb phrasings are used in questions such as this:
Who sold what to whom?
Which employee sold chai to John?
How many customers were sold chai by Mary?
List the products that Mary sold to John.
Which discontinued products were sold to Chicago customers by Boston employees?
Verb phrasings can also contain prepositional phrases, thereby adding to their flexibility, such as in “athletes win medals at competitions” or “customers are given refunds for products”. Verb phrasings with prepositional phrases are used in questions such as this:
How many athletes won a gold medal at the Visa Championships?
Which customers were given a refund for cheese?
At which competition did Danell Leyva win a gold medal?
Some verb phrasings are created automatically when a column is recognized as containing both a verb and a preposition.
When All Else Fails
There’s one additional feature that will be available to you for when phrasings aren’t enough: Global Synonyms. A global synonym is a simple textual replacement which is applied to any question prior to Q&A trying to understand it. This can be used in some cases where there exists no phrasing type applicable for the kind of question you are trying to enable.
For example, with this global synonym: “how do you make” means “recipe for”
Then this question: How do you make a Shirley Temple?
Would be answered as if you asked: Recipe for a Shirley Temple?
Outil pour le data steward
J’espère que cette session vous a donné les billes pour comprendre ce que peut faire Q&A, et comment vous pouvez améliorer votre modèle en amont dans votre power pivot ou ensuite dans le Power Bi site avec l’aide des Phrasing.
L’objectif de cette session était de vous apporter une boite à outil, une to do list avec l’ensemble des éléments qui vous sont nécessaire pour appréhender Q&A.
Au fil du temps , la maîtrise générale de Q&A va continuer à croître , tout comme sa capacité à apprendre la linguistiques sur votre modèle .
Pour l'instant , imaginez que Q&A est au niveau élémentaire, plein d'enthousiasme et avec une excellente intuition pour la langue , mais limitée à la fois dans l'expérience de vie et le vocabulaire .
Plus vous lui enseignez des choses, meilleur il fera ses devoirs .C’est un principe de machine learning