Excel – Extraire des données aléatoire

Si vous travaillez sur une grande base de données et que vous souhaitez extraire seulement un échantillon, cet article va vous montrer comment sélectionner un nombre réduit sans trop d'effort.

Etape 1 : Taille de notre échantillon

Nous voulons extraire un échantillon de 1% de la totalité de nos clients.

Pour éviter toute erreur d'arrondi nous allons utiliser la fonction ENT pour renvoyer le résultat sous forme d'entier.

=ENT(53769*1%)    => 537

Nous devons donc extraire 537 clients de notre base 😮😓😱.

Ca fait beaucoup mais vous allez voir comment c'est facile avec cette technique 😉

Etape 2 : Créer un nombre aléatoire

Nous allons chercher à créer une formule qui va nous retourner un nombre entre 2 et 53770.

  • 2 car il s'agit du numéro de ligne contenant le premier nom de nos clients
  • 53770 car il s'agit de la dernière ligne de notre base client

Pour retourner une valeur aléatoire entre ses 2 valeurs, nous allons utiliser la fonction ALEA.ENTRE.BORNES

=ALEA.ENTRE.BORNES(2;53770)

Et cette formule, nous allons la recopier 537 (résultat calculé dans le point précédent).

 

 

Etape 3 : Collage-Spécial en Valeur

Une fois la recopie réalisée, il faut transformer les formules en nombre.

C'est indispensable car la fonction ALEA.ENTRE.BORNES va recalculer de nouvelles valeurs à chaque nouvelle action dans Excel.

Pour convertir le résultat de la formule en valeur, il faut passer par un collage spécial (aller sur l'article pour voir la technique)

Etape 4 : Lier les valeurs à une référence

L'ordinateur a généré comme premier nombre aléatoire la valeur 41721.

Donc pour retourner le mail (colonne A) correspondant à cette ligne, la formule à écrire est tout simplement

=A41721

Etape 5 : Convertir en référence avec INDIRECT

Nous allons maintenant écrire la même référence mais dans une fonction INDIRECT, en écrivant la référence de la cellule entre guillemet.

Le résultat reste le même

=INDIRECT("A41721")

C'est maintenant que tout se joue :

  1. Nous allons retirer de la chaîne de caractère le numéro de la ligne
  2. A la suite de la chaîne de caractères, nous allons ajouter le symbole & (comme cela a été expliqué dans cet article)
  3. Enfin, nous allons sélectionner la cellule E2 (la cellule qui contient le numéro de la ligne)

L'écriture devient alors

=INDIRECT("A"&E2)

Il ne nous reste plus qu'à recopier cette formule pour les 536 autres valeurs est ainsi récupérer les emails de notre échantillon.

Vous pouvez de nouveau convertir en valeur mais ce n'est pas obligatoire.

Etape 6 : Retourner une autre colonne

Ensuite, si vous voulez retourner le nom, ou le prénom de vos clients en plus du mail, il suffit de refaire exactement la même formule mais en changeant la lettre de la colonne, toujours entre guillemets

Le nom est en colonne C donc la formule sera

=INDIRECT("C"&E2)

Le prénom est en colonne B donc la formule sera

=INDIRECT("B"&E2)

Articles complémentaires


Voici une liste d'articles qui pourrait également vous intéresser sur le même thème.

Lien Permanent pour cet article : https://www.excel-exercice.com/excel-extraire-des-donnees-aleatoire/


Laisser un commentaire

Your email address will not be published.