Analyse de cohorteL’analyse de cohorte est une méthode utilisée pour étudier le comportement d’un groupe spécifique de personnes (ou d’objets) sur une période de temps. Une « cohorte » est simplement un groupe de personnes ayant vécu un même événement ou partageant une même caractéristique au cours d’une même période.
Analyse de causalitéL’analyse de causalité est une méthode statistique utilisée pour déterminer si une chose (appelée cause) a un effet direct sur une autre chose (appelée effet). L’idée est de comprendre non seulement si deux choses sont liées, mais aussi si l’une provoque l’autre.
AnovaL’ANOVA, ou « Analyse de la Variance », est une méthode statistique utilisée pour comparer les moyennes de plusieurs groupes et déterminer s’il existe des différences significatives entre ces groupes.
B
Base de données SPSSBSPSS, qui signifie « Statistical Package for the Social Sciences » (ou « Paquet statistique pour les sciences sociales » en français), est un logiciel utilisé pour l’analyse statistique. Il est très populaire dans les domaines de la recherche en sciences sociales, en psychologie, en économie, en médecine, et bien d’autres.
Base de données SQLSQL (sigle pour Structured Query Language, « langage de requêtes structurées ») est un langage informatique normalisé servant à exploiter des bases de données relationnelles. La partie langage de manipulation des données de SQL permet de rechercher, d’ajouter, de modifier ou de supprimer des données dans les bases de données relationnelles.
Bench MarketingLe benchmarking, également appelé benchmarking marketing, est une technique utilisée par les entreprises pour évaluer et améliorer leurs stratégies marketing en comparant leurs performances à celles de leurs concurrents ou des leaders du secteur. L’objectif est d’identifier les meilleures pratiques et d’apporter des améliorations pour être plus compétitif.
Biometric Market ReseachLe biometric market research (recherche de marché biométrique) est une méthode de recherche qui utilise des données biométriques pour comprendre les comportements, les préférences et les réactions des consommateurs. Les données biométriques sont des informations obtenues à partir des caractéristiques physiques ou des réponses physiologiques des personnes, comme le rythme cardiaque, les mouvements des yeux, les expressions faciales, et la conductance de la peau (sudation).
BrandwatchLe Brandwatch est un outil de veille et d’analyse des médias sociaux. Il permet aux entreprises de surveiller ce qui se dit sur elles et sur leurs concurrents sur les réseaux sociaux, les blogs, les forums, et d’autres sources en ligne. L’objectif est de comprendre les opinions, les sentiments et les tendances autour de leur marque ou de leurs produits.
C
ClusteringLe clustering, ou regroupement en français, est une technique utilisée en statistique et en apprentissage automatique pour regrouper des objets similaires en groupes appelés clusters. Le but est de s’assurer que les objets dans un même groupe sont plus similaires entre eux qu’avec ceux des autres groupes.
CrunchbaseCrunchbase est une base de données en ligne qui fournit des informations détaillées sur les entreprises, les startups, les fondateurs, les investisseurs, les fonds de capital-risque, et plus encore. Il est utilisé par des professionnels du monde des affaires pour rechercher des informations sur les entreprises, suivre les tendances du marché, et identifier des opportunités d’investissement.
D
Données CRMLes données CRM (Customer Relationship Management) sont des informations collectées par une entreprise sur ses clients et leurs interactions avec l’entreprise. L’objectif est d’améliorer les relations avec les clients, de les fidéliser et d’augmenter les ventes. Les données CRM peuvent inclure des informations telles que les coordonnées des clients, l’historique des achats, les interactions avec le service client, les préférences et les comportements des clients.
G
GamificationLa gamification est le processus d’intégrer des éléments de jeu dans des contextes non ludiques pour encourager la participation et l’engagement. En d’autres termes, il s’agit d’utiliser des mécanismes et des techniques de jeu (comme les points, les badges, les classements, etc.) dans des domaines comme l’éducation, le travail, le marketing, et bien d’autres, pour rendre ces activités plus attrayantes et motivantes.
H
HootsuiteHootsuite est une plateforme de gestion des réseaux sociaux qui permet de gérer plusieurs comptes de réseaux sociaux à partir d’un seul tableau de bord. Elle aide à planifier, publier et suivre les performances des publications sur des plateformes comme Facebook, Twitter, Instagram, LinkedIn, et plus encore.
I
InsightsLes « insights » (ou « aperçus » en français) désignent des informations significatives et utiles dérivées de données. Ces informations peuvent aider à prendre des décisions éclairées, à comprendre des tendances ou à résoudre des problèmes. Les statistiques jouent souvent un rôle clé dans l’extraction de ces insights
K
K-meansLe K-means est une méthode de classification non supervisée utilisée en apprentissage automatique et en analyse de données. Son but est de regrouper un ensemble de données en un nombre prédéfini de groupes (ou « clusters ») en fonction de leurs caractéristiques.
M
Machine learningLe machine learning (ou apprentissage automatique) est un domaine de l’informatique qui consiste à permettre à une machine (comme un ordinateur) d’apprendre à partir de données, sans être explicitement programmée pour réaliser une tâche spécifique. En d’autres termes, au lieu de donner des instructions précises à l’ordinateur, on lui fournit des données et des algorithmes qui lui permettent de découvrir des modèles et de faire des prédictions ou des décisions basées sur ces modèles.
Méthode de clusteringLe DBS CAN (Density-Based Spatial Clustering of Applications with Noise) est une méthode de clustering, c’est-à-dire une technique qui permet de regrouper des données en fonction de leur similarité ou de leur proximité. Contrairement à d’autres méthodes de clustering comme le k-means, DBS CAN n’a pas besoin de connaître à l’avance le nombre de clusters et peut identifier des formes de clusters de n’importe quelle forme, même si elles sont non convexes.
Méthode MaxdiffLa méthode MaxDiff, aussi appelée « meilleur-pire » (Best-Worst Scaling en anglais), est une technique utilisée en recherche de marché pour évaluer les préférences des répondants. Elle permet de déterminer ce que les gens apprécient le plus et le moins parmi une liste d’options.
Modèle de régression vectorielle autorégressive (VAR)Un modèle de régression vectorielle autorégressive (VAR) est une technique utilisée en statistique et en économétrie pour capturer les relations entre plusieurs séries temporelles (données collectées au fil du temps). Contrairement à une régression simple qui pourrait essayer de prédire une variable en fonction d’une ou plusieurs autres variables, un modèle VAR permet à plusieurs variables de se prédire mutuellement.
R
Recherche exploratoireLa recherche exploratoire est une approche utilisée pour mieux comprendre un sujet ou un phénomène dont on sait peu de choses. Elle est souvent utilisée en début de projet de recherche pour identifier les principaux éléments, poser des hypothèses ou formuler des questions de recherche.
Régression logistiqueLa régression logistique est une méthode statistique utilisée pour prédire l’issue d’une variable dépendante binaire (c’est-à-dire une variable qui a deux résultats possibles, comme oui/non, succès/échec) à partir d’une ou plusieurs variables indépendantes (les variables explicatives).
Régression PLSLa régression PLS (Partial Least Squares = Moindres carrés partiels) est une méthode statistique utilisée principalement pour construire des modèles de prédiction lorsqu’il y a beaucoup de variables explicatives (c’est-à-dire des variables indépendantes) qui sont fortement corrélées entre elles. Cette méthode est particulièrement utile quand on a plus de variables explicatives que d’observations.
Réseau de neuronesUn réseau de neurones est un modèle de calcul inspiré du cerveau humain, utilisé pour reconnaître des motifs et prendre des décisions en se basant sur des données.
S
Search ListeningLe Search listening est une technique qui consiste à analyser les recherches effectuées par les utilisateurs sur des moteurs de recherche comme Google. L’idée est de comprendre ce que les gens cherchent, quelles sont leurs préoccupations, leurs besoins ou leurs intérêts, en se basant sur les mots et phrases qu’ils tapent dans la barre de recherche.
Simulations Monte-CarloLes simulations Monte Carlo sont une méthode statistique utilisée pour comprendre l’impact de l’incertitude et de la variabilité dans les systèmes complexes. Elles consistent à utiliser des échantillons aléatoires pour estimer des résultats.
Social ListeningLe social listening, ou écoute des réseaux sociaux en français, est une technique utilisée pour surveiller et analyser les conversations et les tendances sur les réseaux sociaux, les forums, les blogs, et autres plateformes en ligne. L’objectif est de comprendre ce que les gens disent à propos d’une marque, d’un produit, d’un service, ou d’un sujet spécifique. Cela permet aux entreprises et aux organisations de prendre des décisions informées basées sur les opinions et les comportements des consommateurs.
T
Technique ArimaL’ARIMA (AutoRegressive Integrated Moving Average) est une technique utilisée pour prédire des séries chronologiques, c’est-à-dire des données collectées au fil du temps (par exemple, les ventes mensuelles, les températures quotidiennes, etc.). Elle est particulièrement utile lorsque les données montrent des tendances et des saisonnalités
Technique de BootstrappingLe bootstrap est une méthode de rééchantillonnage utilisée pour estimer la distribution d’un échantillon statistique. En d’autres termes, il permet d’estimer la variabilité d’une statistique (comme la moyenne, la médiane, etc.) en créant de nombreux « nouveaux » échantillons à partir de l’échantillon original. Cela se fait en tirant des échantillons avec remplacement (c’est-à-dire qu’on peut sélectionner plusieurs fois la même observation) à partir de l’échantillon initial.
Technique de modélisation prédictiveLa modélisation prédictive est une technique qui utilise des données historiques pour faire des prévisions sur des événements futurs. En d’autres termes, elle essaie de trouver des modèles dans les données passées afin de prédire ce qui pourrait se passer ensuite.
Technique resamplingLe resampling est une technique en statistiques qui consiste à tirer des échantillons répétés de vos données afin d’estimer la variabilité d’une statistique. Cela permet de mieux comprendre la distribution de la statistique sans faire d’hypothèses strictes sur la distribution sous-jacente des données.
Text MiningLe text mining, ou exploration de texte, est une technique utilisée pour extraire des informations utiles à partir de grands ensembles de données textuelles. En d’autres termes, il s’agit d’analyser des textes pour en dégager des tendances, des patterns, ou des informations spécifiques.
Traitement de données Apache SparkApache Spark est un framework de traitement de données distribué qui permet de traiter de grandes quantités de données de manière rapide et efficace. Pour comprendre Apache Spark, il est utile de le comparer à un autre outil que vous connaissez peut-être : Apache Hadoop. Les deux sont utilisés pour le traitement des big data, mais Spark est souvent plus rapide grâce à sa capacité à conserver les données en mémoire plutôt que de les écrire et les lire constamment sur le disque.
Typologie sémantiqueLa typologie sémantique est un domaine de la linguistique qui étudie comment différentes langues catégorisent et organisent les significations. En d’autres termes, elle s’intéresse à la manière dont les langues du monde expriment des concepts similaires à travers des mots et des structures grammaticales différentes.