Hello 👋🏼
Cette semaine, deux sujets. Un très concret (la déduplication CRM), et un plus personnel (mon rapport à la course aux LLM). On y va.
🧼 CRM Hygiène : Pourquoi la déduplication est votre premier chantier
Avant d’automatiser, de scorer ou de scaler, il y a une étape incontournable : le déduplication.
Pas sexy. Mais absolument fondamental.
Pourquoi c'est la première étape ? Parce qu'avant de parler enrichissement, automatisation ou scoring, il faut une base propre. Sinon, vous allez enrichir des doublons.
Concrètement, un CRM rempli de doublons, c'est :
des emails marketing envoyés 3 fois à la même personne
des données éparpillées sur plusieurs fiches
des sales qui travaillent sur des comptes "différents"… pour la même entreprise
des dashboards qui racontent n'importe quoi
une coordination d'équipe impossible
Bref, vous ne pouvez pas scaler un CRM si la donnée n'est pas propre.
🔍 D'où viennent les doublons ?
Les sources sont multiples :
imports massifs (fichiers Excel, listes événements…)
extensions Chrome qui créent des fiches à la volée
synchronisation LinkedIn
formulaires marketing
saisies manuelles par les sales
Résultat : des doublons qui s'accumulent sans que personne ne s'en rende compte.
🎯 L'approche qu'on utilise avec Cargo
On utilise Cargo pour automatiser la déduplication. Voici le workflow en 3 étapes :
Étape 1 : Définir les variables de matching
Il faut choisir les bons critères pour identifier les doublons. Les plus fiables :
le nom de domaine
l'URL LinkedIn entreprise
l'ID LinkedIn (encore plus robuste quand il est disponible)
l'identifiant légal selon la zone géographique (SIRET en France, etc.)
⚠️ Attention : exclure impérativement les domaines génériques type Bitly, Linktree, outils de redirection. Sinon, vous fusionnez des entreprises qui n'ont rien à voir entre elles.
Étape 2 : Identifier les objets CRM qui partagent ces variables
Cargo détecte automatiquement les fiches qui ont le même domaine, la même URL LinkedIn, etc.
Étape 3 : Déterminer le "master" et fusionner
Quand deux fiches matchent, il faut choisir laquelle garder. C'est la fiche "master".
Notre logique en waterfall :
Priorité au tiering : Tier 1 > Tier 2 > Tier 3
Si égalité → la fiche la plus complète (nombre de propriétés renseignées)
Exclusions : ne pas fusionner automatiquement Prospect vs Client vs Partenaire. Ces cas nécessitent un contrôle manuel.
Cette logique peut être scriptée pour tourner automatiquement.
⚠️ Tester avant de déployer
Une règle d'or : toujours tester sur de petits volumes.
Une erreur classique : ne pas exclure les domaines génériques. Résultat ? Des entreprises totalement différentes fusionnées par erreur.
Et dans HubSpot, une fusion est irréversible. Pas de retour en arrière possible.
Donc : créer la logique, tester sur 50-100 fiches, vérifier manuellement, puis seulement scaler.
⚙️ Exécution et monitoring
Le workflow doit tourner régulièrement. Notre recommandation : chaque matin, sur les nouvelles entrées ou celles modifiées dans les dernières 24h.
Pour le monitoring, on utilise les rapports HubSpot :
taux de doublons avant/après chaque run
nombre de fusions effectuées
évolution dans le temps
📊 Les résultats
Avec cette approche :
70%+ des doublons éliminés automatiquement
une base enfin exploitable pour l'enrichissement et l'automatisation
une efficacité commerciale nettement améliorée
des sales qui n'ont plus à gérer plusieurs fiches pour la même société
🧩 Et les 30% restants ?
Ce sont les cas "fuzzy" : noms similaires mais domaines ou LinkedIn différents. Typiquement : les filiales, les groupes, les entreprises qui ont changé de nom.
Pour ceux-là, notre approche :
Enrichir avant de dédupliquer : plus vous avez de données, plus le matching est précis
Utiliser des LLM / agents IA pour identifier les matchs probables
Ne pas fusionner automatiquement : envoyer une notif Slack ou créer une tâche CRM pour validation humaine
L'IA assiste. L'humain garde le contrôle.
❌ Les erreurs fréquentes à éviter
Fusionner sans filtrer les domaines génériques
Lancer en batch sans avoir testé sur un échantillon
Ne pas adapter la logique aux enjeux métier
Oublier d'enrichir avant de dédupliquer (moins de données = moins de matchs)
Fusionner automatiquement des cas sensibles (Prospect vs Client)
Rendons à César ce qui est à César : la vidéo d’Alexis Girard, réalisée avec Cargo, explique parfaitement le processus.
👉🏼 Voir l'épisode complet d'Alexis avec Cargo : Episode #1 - Deduplication | The CRM Hygiene Series
🌐 Tout notre contenu, réuni au même endroit
Études de cas, médias, articles, ressources, replays et plus encore. Centralisé ici.
Et si vous souhaitez qu'Architect Ops vous accompagne sur votre stratégie Go-To-Market, on est disponible pour en discuter.
🤯 La course aux LLM : confession d'un mec censé suivre le sujet
Je vais être honnête avec vous.
Cette année, j'ai eu l'impression d'assister à une course complètement folle entre OpenAI, Anthropic et Google. Un modèle sort. Deux semaines plus tard, un autre arrive. "Plus puissant." "Plus rapide." "Plus intelligent."
Et ça recommence. En boucle.
Résultat : même en étant très exposé au sujet, je me sens parfois largué.
Il y a en permanence un nouveau modèle, une nouvelle version, une nouvelle "révolution" annoncée. Et ça crée un FOMO énorme :
peur de rater "le" modèle
peur de ne pas utiliser le bon outil
impression d'avoir toujours un train de retard

Cette image a été réalisée avec l’aide d’un graphiste…Je plaisante, c’était plié en 3 prompts ChatGPT (toujours pas Nano Banana).
Mon aveu : je n'ai jamais vraiment utilisé Gemini.
Je sais. Je "devrais" l'avoir testé, comparé, benchmarké. Mais comme beaucoup d'entre vous, je cours après le temps. Et à force de vouloir tout suivre, on finit par ne rien approfondir.
Peut-être que la vraie question n'est pas "quel LLM est le meilleur". Peut-être que c'est plutôt : comment on les utilise concrètement dans nos workflows business ?
Aujourd’hui, très concrètement, tous nos workflows “IA” reposent sur Claude ou ChatGPT.
Et voilà pour cette édition. Un sujet technique, un sujet plus introspectif.
💬 Question rapide : vous aussi, vous ressentez ce FOMO sur les LLM ? (oui / non / j’ai décidé de préserver ma santé mentale)
On se retrouve dès la semaine prochaine pour la prochaine édition ! Chez Architect Ops, même pendant les fêtes, la newsletter ne prend pas de congés.
Christian


