L'ethnologie étudie, entre autres, la manière dont, au sein des sociétés de tradition orale, les gens organisent et classent le monde qui les entoure (faune, flore, découpage de la société en clans, castes, etc. cosmologie, etc.). La divination à Madagascar est une pratique traditionnelle qui repose sur des tableaux de graines que les devins disposent sur le sol. Il se trouve que les devins notent, pour leur usage personnel, de nombreux tableaux de ce type dans des carnets (un carnet peut contenir près de 1.000 tableaux). Le problème est, à partir de ces carnets recueillis sur le terrain et numérisés, de découvrir quelles sont les méthodes de classement des tableaux utilisées par les devins.
L'une des idées mises en oeuvre en intelligence artificielle dans la fouille de données (data mining) est de découvrir des règles d'organisation des données dans des corpus. Par exemple, un éditeur vend 5 sortes de magazines : sport, voiture, maison, musique et BD. Il souhaite mieux étudier ses clients pour découvrir de nouveaux marchés ou vendre plus de magazines à ses clients habituels. Une question qu'il se pose est :
Ici on demande si les données vérifient une règle d'association BD-sport. La réponse pourrait se formuler par une valeur estimant la probabilité que la règle soit vraie. Souvent, des outils statistiques sont utilisés. Cette question peut être généralisée à des associations fréquentes entre acheteurs de magazine, pour permettre des actions promotionnelles. Voici une autre question beaucoup plus ouverte :
La problématique ici est de trouver une règle et non plus de la vérifier ou de l'utiliser. C'est pour ce type de question que l'on met en oeuvre des outils de fouille de données. Pour en savoir plus : http://www.grappa.univ-lille3.fr/polys/fouille/sortie004.html
Choix de l'environnement informatique libre. Une solution intéressante serait de faire une application qui tourne en ligne sur Internet, en introduisant un système de contrôle d'accès pour préserver la confidentialité des données des devins (les carnets).