
Screaming Frog : Tous les Connecteurs API et le Pipeline d’Audit SEO GEO SXO Automatisé par HDVMA en 2026
En 2026, Screaming Frog SEO Spider n’est plus un simple crawler technique : c’est devenu le hub central de l’audit SEO, GEO et SXO. Sa version 23.3 centralise en un seul crawl les données de six connecteurs API data (GA4, GSC, Ahrefs, PageSpeed, Moz, Majestic) et quatre connecteurs IA (OpenAI, Claude, Gemini, Ollama), avec la possibilité d’exécuter jusqu’à 100 prompts IA personnalisés par crawl. Aucun autre outil sur le marché ne propose cette profondeur d’intégration dans une seule ligne de données par URL. C’est cette puissance que le pipeline HDVMA exploite pour produire des audits SEO, GEO et SXO complets en quatre phases automatisées — de la collecte à la distribution du rapport. Ce guide détaille chaque connecteur, chaque cas d’usage et l’architecture opérationnelle complète du pipeline.
Screaming Frog en 2026 : le hub central de l’audit SEO technique
Screaming Frog SEO Spider s’est imposé comme l’outil de référence mondiale pour l’audit technique de sites web. Ce crawler desktop, utilisé par des milliers d’agences et consultants SEO à travers le monde, simule le comportement de Googlebot pour explorer un site et en extraire plus de 300 points de contrôle : liens cassés, redirections en chaîne, balises title manquantes ou dupliquées, contenu dupliqué, profondeur de crawl, architecture de site, Core Web Vitals et bien davantage.
Aujourd’hui en version 23.3 (février 2026), l’outil a considérablement évolué. La version gratuite permet de crawler jusqu’à 500 URL. La licence payante à 199 £/an (environ 259 $) débloque le crawl illimité, le rendu JavaScript via Chromium headless, les extractions personnalisées, la planification de crawl et surtout l’accès aux intégrations API — la fonctionnalité qui transforme un simple crawl technique en tableau de bord analytique multi-sources.
Ce qui distingue Screaming Frog de ses concurrents cloud (Semrush Site Audit, Ahrefs Site Audit, Sitebulb), c’est sa capacité à centraliser en une seule ligne de données par URL les métriques provenant de six connecteurs data et quatre connecteurs IA. Aucun autre outil sur le marché ne propose cette profondeur d’intégration dans un crawl unique. Et tout cela peut être orchestré en mode CLI sans interface graphique — un atout décisif pour l’automatisation à grande échelle que nous exploitons dans notre stratégie SEO et GEO automatisée.
| Critère | Screaming Frog | Semrush Site Audit | Ahrefs Site Audit | Sitebulb |
|---|---|---|---|---|
| Type | Desktop | Cloud | Cloud | Desktop |
| Connecteurs data natifs | 6 | 2 | 1 | 3 |
| Connecteurs IA natifs | 4 (OpenAI, Claude, Gemini, Ollama) | 0 | 0 | 0 |
| Mode CLI headless | ✅ | ❌ | ❌ | ❌ |
| Prix / an | 199 £ (~259 $) | ~2 400 $ | ~1 188 $ | 324 £ |
| Prompts IA par crawl | Jusqu’à 100 | 0 | 0 | 0 |
Tous les connecteurs API data : GA4, GSC, Ahrefs, Moz, Majestic, PageSpeed
L’accès aux connecteurs API se fait via Configuration > API Access dans Screaming Frog. Chaque intégration enrichit le crawl en associant à chaque URL des métriques provenant de sources tierces. Ces données, alignées par URL, permettent des croisements impossibles avec des outils séparés.
Google Analytics 4 (GA4)
En connectant votre compte GA4, Screaming Frog récupère pour chaque URL crawlée les données de trafic réel : sessions, pages vues, taux de rebond, durée moyenne de session, conversions et transactions e-commerce. Cette intégration révèle quelles pages à problèmes techniques reçoivent réellement du trafic — une information cruciale pour prioriser les corrections. Vous sélectionnez la propriété, les segments et la période d’analyse directement dans l’interface.
Google Search Console (GSC)
Le connecteur GSC offre une double fonction. D’une part, il importe les données de performance de recherche : impressions, clics, CTR et position moyenne pour chaque URL. D’autre part, via l’URL Inspection API, il vérifie en temps réel le statut d’indexation Google de chaque page : indexée, découverte mais non indexée, crawlée mais non indexée, canonical non sélectionné. On filtre par pays et par appareil. Cette combinaison identifie les pages à fort potentiel d’impressions mais faible CTR (optimisation de snippets) ou les pages indexées sans trafic (contenu à consolider). C’est cette logique que nous détaillons dans notre guide pour savoir si votre site est cité par les LLM.
Ahrefs
L’intégration Ahrefs, mise à jour en v3 depuis la version 23.0, nécessite un abonnement actif et un token API. Elle enrichit chaque URL avec le nombre de domaines référents (RefDomains), l’URL Rating (UR), le nombre total de backlinks et l’estimation du trafic organique. C’est le connecteur indispensable pour croiser la santé technique d’une page avec son autorité de liens — identifier les pages avec beaucoup de backlinks mais un code 404, ou les pages bien positionnées mais sans lien entrant.
PageSpeed Insights / Insight Audits
Depuis la version 23.0, l’intégration Lighthouse et PSI a évolué en Insight Audits. Ce connecteur récupère les scores Core Web Vitals : Largest Contentful Paint (LCP), Interaction to Next Paint (INP), Cumulative Layout Shift (CLS), ainsi que le score de performance global, mobile et desktop. Ces données sont essentielles pour l’approche SXO (Search Experience Optimization) qui combine SEO et UX — un facteur de classement que Google pondère de plus en plus.
Moz et Majestic
Le connecteur Moz importe les métriques Link Explorer : Domain Authority (DA), Page Authority (PA) et Spam Score. Majestic fournit le Trust Flow (TF), Citation Flow (CF), le ratio TF/CF et la classification thématique des liens. Croiser les deux permet d’évaluer à la fois l’autorité quantitative et la pertinence topique d’un profil de liens — un complément précieux pour les audits approfondis.
| Connecteur | Métriques clés | Prérequis | Usage principal |
|---|---|---|---|
| Google Analytics 4 | Sessions, rebond, conversions | Compte GA4 connecté | Priorisation par trafic réel |
| Google Search Console | Clics, impressions, position, indexation | Propriété GSC vérifiée | Analyse SERP + indexation |
| Ahrefs | RefDomains, UR, backlinks | Abonnement + API token | Audit backlinks |
| PageSpeed / Insight Audits | LCP, INP, CLS, score perf | Clé API Google (gratuit) | Audit Core Web Vitals / SXO |
| Moz | DA, PA, Spam Score | Abonnement Moz + API | Autorité de domaine |
| Majestic | TF, CF, ratio TF/CF | Abonnement Majestic + API | Pertinence topique des liens |
Les connecteurs IA : OpenAI, Claude, Gemini, Ollama, DeepSeek, Grok
Depuis la version 21.0 et surtout les versions 22.0 et 23.0, Screaming Frog a ajouté une catégorie de connecteurs qui transforme la nature même de l’audit SEO : les intégrations IA directes, accessibles via Configuration > API Access > AI. Ces connecteurs permettent d’exécuter des prompts contre les données de chaque page pendant le crawl, ouvrant des possibilités inédites.
OpenAI (GPT-4o, GPT-4.1)
Le premier connecteur IA intégré à Screaming Frog. Les cas d’usage courants : génération automatique de textes alt pour les images, réécriture de meta descriptions, analyse de sentiment, classification de l’intention de recherche et extraction de données structurées. L’endpoint OpenAI est personnalisable, ce qui permet aussi de connecter DeepSeek ou Grok (xAI) en modifiant simplement l’URL de l’API — une flexibilité précieuse pour tester différents modèles sur un même crawl.
Claude d’Anthropic
Intégré nativement depuis la version 22.0, le connecteur Anthropic permet d’utiliser Claude Sonnet ou Claude Opus pour des analyses de contenu à grande échelle. Claude excelle dans l’analyse contextuelle longue (fenêtre de 200k tokens), la compréhension des nuances éditoriales et la structuration de recommandations — des qualités idéales pour évaluer la qualité de contenu, détecter le thin content et scorer le GEO readiness de chaque page pendant le crawl. Pour comprendre en profondeur ce que le GEO représente, consultez notre guide complet du GEO en 2026.
Google Gemini
Gemini est particulièrement intéressant pour les budgets serrés : Google offre un accès gratuit via AI Studio (US, UK), avec des limitations de débit. La version payante débloque des RPM plus élevés. Gemini est aussi utilisé pour les embeddings avec le modèle gemini-embedding-001, permettant l’analyse de similarité sémantique entre les pages — détecter la cannibalisation de contenu et construire des clusters thématiques visuels directement dans Screaming Frog.
Ollama (modèles locaux)
Pour les organisations soucieuses de confidentialité, Ollama exécute des LLM localement : Llama, Mistral, Phi. Idéal pour les audits de sites sensibles (santé, finance, juridique). Le modèle EmbeddingGemma tourne localement pour les analyses sémantiques sans envoyer de données à des serveurs tiers — un argument décisif pour les cabinets d’avocats ou les entreprises soumises à des contraintes réglementaires strictes.
| Cas d’usage | Prompt type | Modèle recommandé |
|---|---|---|
| Textes alt manquants | Décris l’image depuis le contexte page | GPT-4o / Claude Sonnet |
| Intention de recherche | Classifie : info, transactionnelle, navigation | Claude Opus / GPT-4.1 |
| Qualité contenu /10 | Évalue et justifie le score | Claude Sonnet / Gemini Pro |
| Extraction d’entités | Liste personnes, lieux, concepts | GPT-4o / Claude |
| Cannibalisation sémantique | Embeddings vectoriels | gemini-embedding-001 / Ollama |
| Score GEO readiness /10 | Page optimisée pour citation LLM ? | Claude Opus |
| Analyse E-E-A-T | Évalue expertise, autorité, confiance | Claude Opus |
Le mode CLI headless : la clé de l’automatisation
Le mode CLI transforme Screaming Frog d’outil desktop en brique d’infrastructure automatisable. On lance des crawls complets avec tous les connecteurs activés, sans ouvrir l’interface graphique. Les prompts IA Claude, OpenAI et Gemini sont embarqués dans le fichier .seospiderconfig — ils s’exécutent automatiquement pendant le crawl headless.
Concrètement, une seule commande suffit pour lancer un audit complet multi-sources :
ScreamingFrogSEOSpiderCli --crawl https://exemple.com --headless --config "/configs/audit-complet.seospiderconfig" --use-google-analytics-4 --use-google-search-console --use-ahrefs --use-pagespeed --use-majestic --use-mozscape --export-tabs "Internal:All,Response Codes:Client Error (4xx)" --bulk-export "All Inlinks,All Outlinks" --output-folder /audits/client-x --timestamped-output --save-crawl
Les noms d’exports doivent correspondre exactement aux libellés de l’interface — une faute de frappe et l’export échoue silencieusement. La commande --help export-tabs vérifie les noms exacts disponibles dans votre version. La planification via cron (Linux/Mac) ou Task Scheduler (Windows) permet d’automatiser les crawls à fréquence régulière : quotidien pour le monitoring, hebdomadaire pour le suivi, mensuel pour les rapports complets.
| Commande CLI | Fonction |
|---|---|
--crawl URL --headless | Lance un crawl sans interface graphique |
--config "chemin/fichier.seospiderconfig" | Charge une configuration complète avec prompts IA |
--use-google-analytics-4 | Active le connecteur GA4 pendant le crawl |
--use-google-search-console | Active le connecteur GSC (performance + indexation) |
--use-ahrefs | Active le connecteur Ahrefs v3 |
--use-pagespeed | Active Insight Audits (LCP, INP, CLS) |
--export-tabs "Internal:All" | Exporte les onglets spécifiés en CSV |
--timestamped-output | Ajoute un horodatage pour le suivi historique |
C’est cette capacité d’automatisation CLI qui rend le pipeline HDVMA possible. Les mêmes commandes, les mêmes configurations, les mêmes prompts IA produisent des résultats reproductibles d’un audit à l’autre — un avantage considérable que nous intégrons dans notre approche de SEO et GEO automatisés.
Le pipeline d’audit SEO GEO SXO automatisé par HDVMA
Voici l’architecture complète du pipeline développé par HDVMA. Le principe directeur est clair : Screaming Frog fait toute la collecte avec tous ses connecteurs natifs. Claude intervient en amont (stratégie, configuration) et en aval (analyse croisée, rapport). n8n ne fait que la distribution finale. Chaque phase a un rôle précis et ne dépend que de la sortie de la phase précédente.
Phase 1 — Claude (amont : stratégie et configuration)
Claude reçoit le brief client (URL du site, secteur d’activité, objectifs business) et produit trois livrables. Premièrement, un fichier .seospiderconfig sur mesure qui configure tous les connecteurs et paramètres de crawl. Deuxièmement, la rédaction des prompts IA à injecter dans Screaming Frog : score GEO readiness /10, intention de recherche par page, qualité de contenu /10, détection de cannibalisation, analyse E-E-A-T. Troisièmement, la définition des KPI cibles et des seuils d’alerte adaptés au secteur. Cette phase exploite les mêmes capacités que celles décrites dans notre article sur le déploiement d’agents IA en entreprise.
Phase 2 — Screaming Frog CLI headless (collecte unique)
Le crawl headless s’exécute avec tous les connecteurs natifs activés simultanément : GA4 (sessions, rebond, conversions), GSC (clics, impressions, CTR, position, statut d’indexation), Ahrefs v3 (RefDomains, UR, backlinks), PageSpeed/Insight Audits (LCP, INP, CLS), Majestic (TF, CF), Moz (DA, PA). Les prompts IA Claude, configurés en phase 1, s’exécutent pendant le crawl pour scorer chaque page. Le résultat : des CSV enrichis multi-sources où une ligne = une URL = technique + trafic + backlinks + Core Web Vitals + scores IA + GEO readiness. Toutes les données alignées par URL.
Phase 3 — Claude (aval : analyse croisée et rapport)
Claude reçoit les CSV enrichis complets et réalise une analyse croisée en sept dimensions. L’audit technique SEO identifie les erreurs 404, chaînes de redirections, problèmes de canonical et pages orphelines. L’audit contenu et sémantique exploite les scores de qualité IA et les embeddings pour détecter le thin content et la cannibalisation. L’audit backlinks croise Ahrefs et Majestic pour repérer les liens toxiques et les pages à forte autorité mais en erreur. L’audit SXO/Core Web Vitals signale les pages critiques (LCP > 2,5s, INP > 200ms). L’audit GEO exploite les scores Claude intégrés au crawl pour évaluer la citabilité par les IA. Les croisements intelligents révèlent les quick wins (impressions élevées × position 5-20) et les urgences business (trafic GA4 × erreur 404). Le plan d’action top 20 classe chaque action par impact estimé × effort. Le tout est livré en rapport HTML/PDF brandé HDVMA.
Phase 4 — n8n (distribution uniquement)
n8n se charge exclusivement de la distribution : envoi email client avec rapport PDF joint, push Google Drive ou Notion partagé, notification Slack ou WhatsApp, archivage CRM et planification de la récurrence (mensuel, trimestriel). C’est le même moteur d’automatisation que celui de notre pipeline de publication de 50 articles par mois.
| Dimension d’analyse | Données sources | Exemple d’insight |
|---|---|---|
| SEO technique | Crawl SF (404, redirects, canonical) | Chaîne de redirections sur une page à fort trafic |
| Contenu + sémantique | Scores IA + embeddings | Pages cannibalisées sur le même cluster |
| Backlinks | Ahrefs + Majestic croisés | Pages à fort UR mais en erreur 404 |
| SXO / Core Web Vitals | PageSpeed (LCP, INP, CLS) | LCP > 2,5s sur les 20 landing pages principales |
| GEO readiness | Scores Claude intégrés au crawl | Pages à trafic fort mais non citables par les IA |
| Croisements intelligents | Toutes sources combinées | Impressions GSC élevées × position 5-20 = quick wins |
| Plan d’action top 20 | Synthèse priorisée impact × effort | Actions classées par ROI estimé |
Pourquoi cette approche change la donne pour les agences et les PME
Le pipeline HDVMA résout un problème fondamental du marché : les audits SEO complets étaient réservés aux grandes entreprises capables de payer 5 000 à 10 000 € par mois à une agence, ou de mobiliser une équipe interne de 3 à 5 personnes pendant plusieurs jours. Avec l’architecture Screaming Frog + Claude + n8n, le coût total du pipeline tombe à une fraction de ce montant.
Le détail des coûts parle de lui-même. La licence Screaming Frog revient à 199 £/an (soit environ 17 €/mois). Les appels API IA (Claude, OpenAI ou Gemini) coûtent entre 20 et 50 € par mois selon le volume de crawl. Un abonnement Claude Pro à 20 €/mois couvre les phases d’analyse Claude. Et n8n en self-hosted est gratuit. Le coût total mensuel d’un pipeline d’audit complet SEO, GEO et SXO se situe donc entre 50 et 90 € par mois — contre 5 000 à 10 000 € en prestation d’agence traditionnelle.
Au-delà du coût, trois avantages structurels font la différence. La reproductibilité : la même configuration produit le même audit, éliminant les variations de qualité entre analystes. La scalabilité : le mode CLI headless permet d’enchaîner les audits de dizaines de sites sans intervention manuelle. L’exhaustivité : aucun humain ne peut croiser manuellement six sources de données et quatre modèles IA sur des milliers d’URL — le pipeline le fait en quelques heures. Pour les PME qui veulent accéder à ce niveau d’analyse, c’est une révolution.
Cette approche s’applique à tous les secteurs d’activité : nautisme, restauration, BTP, juridique, informatique. Les mécanismes sont identiques — seuls les prompts IA et les KPI changent. Et pour les entreprises qui veulent commencer sans investissement, notre audit GEO IA gratuit offre un premier diagnostic de visibilité. Les plus ambitieux peuvent directement faire créer un site web optimisé dès le départ ou structurer un tunnel de vente IA pour convertir le trafic en leads qualifiés.
Questions fréquentes sur Screaming Frog, les connecteurs API et le pipeline HDVMA
Screaming Frog est-il gratuit ?
Screaming Frog propose une version gratuite qui permet de crawler jusqu’à 500 URL par crawl. Cette version inclut les fonctionnalités de base : détection de liens cassés, analyse des balises title et meta, génération de sitemaps XML. Pour accéder aux connecteurs API (GA4, GSC, Ahrefs, PageSpeed, Moz, Majestic), aux intégrations IA (OpenAI, Claude, Gemini, Ollama), au mode CLI headless et au crawl illimité, une licence payante à 199 £/an (environ 259 $) est nécessaire.
Quels connecteurs IA sont disponibles dans Screaming Frog en 2026 ?
Screaming Frog intègre nativement quatre connecteurs IA : OpenAI (GPT-4o, GPT-4.1), Anthropic Claude (Sonnet, Opus), Google Gemini et Ollama pour les modèles locaux. L’endpoint OpenAI est personnalisable, ce qui permet aussi de connecter DeepSeek et Grok (xAI) en modifiant l’URL de l’API. Chaque crawl peut exécuter jusqu’à 100 prompts IA personnalisés contre les données de chaque page.
Peut-on automatiser un audit Screaming Frog sans ouvrir l’interface ?
Oui, grâce au mode CLI (Command Line Interface) headless. Une seule commande lance un crawl complet avec tous les connecteurs data et IA activés, exporte les résultats en CSV et sauvegarde le crawl. Les prompts IA sont embarqués dans le fichier .seospiderconfig et s’exécutent automatiquement. La planification via cron (Linux/Mac) ou Task Scheduler (Windows) permet d’automatiser les crawls à la fréquence souhaitée.
Qu’est-ce que le score GEO readiness dans un audit Screaming Frog ?
Le score GEO readiness est une note sur 10 attribuée par Claude pendant le crawl Screaming Frog. Il évalue si une page est optimisée pour être citée par les moteurs de réponse IA (ChatGPT, Perplexity, Gemini). Les critères incluent la densité d’entités nommées, la présence de données structurées JSON-LD, les FAQ structurées, la clarté des définitions et la fraîcheur du contenu. Un score inférieur à 5/10 signale une page mal préparée pour le GEO.
Combien coûte le pipeline d’audit HDVMA ?
Le coût total mensuel se situe entre 50 et 90 €. La licence Screaming Frog revient à environ 17 €/mois (199 £/an). Les appels API IA coûtent entre 20 et 50 € selon le volume. Claude Pro coûte 20 €/mois pour les phases d’analyse Claude. n8n en self-hosted est gratuit. Pour comparaison, une prestation d’audit SEO équivalente en agence coûte entre 5 000 et 10 000 € par mois.
Screaming Frog peut-il remplacer Semrush ou Ahrefs ?
Screaming Frog ne remplace pas Semrush ou Ahrefs — il les complète et les centralise. L’outil n’a pas de base de données de mots-clés propre ni de suivi de positions quotidien. En revanche, il surpasse ses concurrents cloud en audit technique grâce à ses 300+ points de contrôle, ses six connecteurs data natifs, ses quatre connecteurs IA et son mode CLI. Le pipeline HDVMA utilise Screaming Frog comme collecteur central et s’appuie sur les données Ahrefs via son connecteur natif.
Comment Screaming Frog détecte-t-il la cannibalisation de contenu ?
Depuis la version 22.0, Screaming Frog intègre l’analyse par embeddings vectoriels. En connectant un fournisseur IA (OpenAI, Gemini ou Ollama), l’outil capture les embeddings de chaque page et calcule la similarité sémantique entre elles. Les pages avec un score de similarité supérieur au seuil configurable (par défaut 0,95, ajustable jusqu’à 0,5) sont identifiées comme sémantiquement similaires. Cela détecte la cannibalisation même quand les pages utilisent des mots-clés différents mais couvrent le même sujet.
Quelles sont les limites de Screaming Frog pour les très gros sites ?
Screaming Frog étant un outil desktop, il dépend des ressources de la machine locale (RAM, CPU, stockage). Pour les sites de plusieurs centaines de milliers d’URL, il est recommandé de disposer d’au moins 16 Go de RAM et d’utiliser le mode de stockage disque. Le mode CLI headless consomme moins de ressources que l’interface graphique. Pour les crawls massifs, il est possible de segmenter par répertoire ou par sitemap pour répartir la charge.
Le pipeline HDVMA fonctionne-t-il pour tous les secteurs d’activité ?
Oui. L’architecture en quatre phases est identique quel que soit le secteur : nautisme, restauration, BTP, juridique, informatique, e-commerce. Seuls trois éléments changent d’un secteur à l’autre : les prompts IA (adaptés aux spécificités métier), les KPI cibles (selon les objectifs business) et le template de rapport. La phase 1 (Claude amont) se charge de cette personnalisation avant chaque audit.
Comment démarrer avec le pipeline d’audit HDVMA ?
Le point d’entrée le plus simple est notre audit GEO IA gratuit, qui fournit un premier diagnostic de visibilité. Pour un pipeline complet, commencez par installer Screaming Frog avec une licence payante, configurez vos connecteurs API (GA4, GSC au minimum), puis contactez HDVMA pour la mise en place des phases Claude et n8n. Notre Diag IA personnel évalue en 5 minutes quels outils et connecteurs sont les plus pertinents pour votre situation.
Diag IA gratuit
Nous contacter
Parler à Eric



