Site icon Excel Exercice

Conserver la dernière mise à jour des données

Présentation du problème

Il est très facile d'extraire sans doublon les données d'un tableau grâce à l'option du menu Données>Supprimer les doublons. Mais dans certains cas, l'outil ne permet pas de conserver certaines données spécifiques.

Par exemple dans le classeur suivant, nous avons un document qui contient des adresses de clients.

Seulement, nous ne souhaitons conserver que les données les plus récentes en se basant sur la colonne de mise à jour (la colonne G)

Dans ce cas de figure, l'outil d'extraction sans doublon ne peut pas nous aider. En utilisant l'outil Données>Supprimer les doublons le résultat est inopérant car pour chaque ligne, il y a des différences (numéro de téléphone notamment)

Pour autant, nous savons que nous devons nettoyer notre liste pour ne conserver que les dates de mise à jour les plus récentes.

Solution avec NB.SI.ENS

Toute l'astuce consiste à

  1. Trouver un identifiant unique pour chaque individu (ici l'email).
  2. Puis de comptabiliser le nombre de fois que nous retrouvons cet identifiant dans la liste.

Nous allons donc nous baser sur la fonction NB.SI.ENS pour faire ce travail MAIS avec une référence hybride pour la plage de données.

Une référence hybride est fixée sur une seule référence d'une plage de données. L'autre référence de la plage est laissée libre.

Détail des étapes de la solution

Construction de la formule

=NB.SI.ENS($H$2:H2,H2)

Le résultat est le suivant

Vous pouvez voir dans l'image le mail de Richard SAVARD est présent 3 fois. Dans la colonne que nous venons de créer, nous retrouvons 3 fois son mails dans notre liste avec les valeurs 1, 2 et 3.

Explication de la formule

La première référence de notre plage de données étant fixées ($H$2) et la seconde libre (H2), le fait de recopier cette formule va changer uniquement la seconde référence.

Tri des données

Maintenant, nous allons trier notre tableau sur 2 clés

Allez dans le menu Données>Trier et créer l'ordre de tri suivant

  1. Sélectionner le premier critère de tri (l'email)
  2. Ajouter un nouveau niveau de tri
  3. Sélectionner la colonne de date de mise à jour
  4. Changez l'ordre de tri

Après validation, les mails en doubles ou triples, se retrouvent les uns sous les autres.

Filtrer les données

Le travail est presque terminé ?

Il nous suffit maintenant d'utiliser le filtre d'Excel (Données>Filtre) sur la colonne que nous avons ajouté précédemment et de DECOCHER LA VAEUR 1.

De cette façon, nous n'affichons que les éléments que nous voulons supprimer.

Supprimer les lignes anciennes

  1. Sélectionnez toutes les lignes visibles
  2. Supprimez les avec un Clic-droit>Supprimer la ligne ou le raccourci clavier Ctrl + -
  3. Effacer le filtre de la colonne (cf image)

Notre liste est maintenant à jour des dernières informations sur nos clients sans le moindre doublon

Articles liés

Quitter la version mobile