Comment Auctorya détermine l'Indice Humain d'un ebook
Derrière un chiffre simple, une analyse littéraire rigoureuse.
Quand vous parcourez une fiche livre sur Auctorya, vous remarquez un score affiché bien en évidence : l'Indice Humain. Un nombre entre 0 et 100, qui indique la probabilité que ce livre ait été écrit par un être humain. Mais comment arrive-t-on à ce chiffre ? Qu'est-ce qu'on analyse exactement dans un texte pour savoir qui l'a écrit ?
La réponse est à la fois plus simple et plus subtile qu'on ne l'imagine.
Un texte, c'est bien plus que des mots
Un texte est un enchaînement de mots, mais pas uniquement. Le vocabulaire, la ponctuation, la longueur des phrases et leurs variations sont autant de marqueurs de style qui peuvent aider à déterminer qui — ou quoi — a écrit un livre.
Un auteur humain écrit avec ses habitudes, ses hésitations, ses rythmes propres. Cette variabilité est profondément humaine. Elle naît de l'émotion, de la réflexion, de l'improvisation.
Les intelligences artificielles produisent du texte d'une tout autre façon. Elles calculent le mot le plus probable à chaque étape. Le résultat est fluide, cohérent — mais statistiquement régulier. Trop régulier.
Ce que l'on mesure concrètement
Notre système analyse chaque livre selon plusieurs dimensions stylistiques.
La variabilité des phrases. Un auteur humain alterne naturellement entre phrases courtes et longues. Une IA tend à lisser ces écarts : ses phrases se ressemblent, leur longueur varie peu.
La richesse du vocabulaire. Les humains répètent moins leurs mots que les modèles d'IA. Un auteur cherche l'adjectif juste, évite les répétitions, diversifie ses tournures.
La ponctuation. Le point-virgule, le tiret cadratin, les guillemets français sont des marqueurs stylistiques forts. Ils sont rares dans les textes générés par IA.
Les enchaînements de mots. Certaines associations de mots reviennent trop souvent dans les textes IA. Ce phénomène de répétition, presque invisible à l'œil nu, est détectable statistiquement.
Deux niveaux d'analyse
Pour calculer l'Indice Humain, Auctorya combine deux approches complémentaires.
La première est stylistique et statistique : on calcule les marqueurs décrits ci-dessus sur l'ensemble du texte. C'est rapide, précis, et ne nécessite aucune interprétation subjective.
La seconde repose sur un modèle de langage spécialisé, entraîné spécifiquement sur des textes français — romans, essais, guides. Ce modèle a appris à reconnaître les patterns profonds qui distinguent l'écriture humaine de l'écriture artificielle.
Le score final est la combinaison pondérée des deux.
Une spécialisation pour le français
La plupart des outils disponibles ont été développés et entraînés principalement sur des textes anglais. Appliqués à des livres français, leurs résultats sont peu fiables. Nous l'avons vérifié : l'un des outils les plus utilisés dans le secteur a attribué un score de 80 % humain à un guide entièrement rédigé par IA.
Le modèle d'Auctorya a été entraîné et évalué exclusivement sur des textes français.
Un score global, et une analyse chapitre par chapitre
L'Indice Humain ne se limite pas à un score global. Auctorya analyse chaque chapitre séparément, ce qui permet de détecter les livres hybrides — où certains chapitres sont écrits par un humain et d'autres générés par IA.
Ce que les chiffres disent
Résultats de notre protocole d'évaluation sur 998 textes :
- Précision globale : 99,8 %
- Textes IA classés comme humains : 0,0 %
- Textes humains classés comme IA : 0,2 %
Ces chiffres sont mesurés sur un corpus exclusivement francophone.
Ce que l'Indice Humain ne prétend pas être
Un score, aussi précis soit-il, reste une indication. L'Indice Humain est un outil d'aide à la décision, pas un verdict définitif.
Ce que nous mesurons, c'est la probabilité stylistique qu'un texte soit d'origine humaine. L'objectif n'est pas de sanctionner. C'est d'informer les lecteurs qui veulent savoir ce qu'ils achètent.
