Objectif : Le but de ces projets est d'établir la table des matières de carnets dans lesquels les devins à Madagascar notent certains tableaux de graine. Ces carnets sont donnés sous forme numérisées (format texte), et sous forme de fac-simile (format pdf). Les étudiants devront donc faire des procédures permettant d'explorer ces carnets et de découvrir quelles sont les méthodes de classements utilisées. D'autres carnets seront proposés en fin d'années pour valider les méthodes mises en place.
Travail demandé (à choisir dans cette liste) :
conception du schéma de la base de données
définir les champs :
carnet
page
ligne
tableau
attributs du tableau (figures, points cardinaux, toka éventuel, autres propriétés)
interface pour charger un carnet (format txt + éventuellement pdf) et le stocker dans la base
procédures d'interrogation de base de données
énumérer les tableaux vérifiant certaines propriétés
afficher un histogramme des pages où ils se trouvent pour faire apparaître des séries
affichage de l'image graphique d'une page du carnet d'origine où une propriété est vérifiée
en affichant les matrices mères d'après le fichier txt, disposées selon les lignes (cela permet de surligner les matrice-mère vérifiant la propriété)
directement à partir des fac-simile des pages en pdf, en affichant une image
langage pour définir de nouvelles propriétés "composées" à partir de propriétés de base (par exemple doubles toka), et ajout de nouveaux champs correspondants à ces propriétés
construction progressive de la table des matières du carnet (c'est-à-dire indiquant les numéros de page et les propriétés des tableaux contenus dans ces pages)
enregistrement des propriétés découvertes par interrogation de la base
visualisation de la table des matières et affichage de la page courante (comme dans un pdf, voir plus bas)
d'après le fichier txt, redisposé selon les lignes
directement à partir du pdf
exportation des données au format Weka, pour faire des essais de techniques plus avancées de "fouille de données" pour découvrir des propriétés non connues d'avance (et non pas seulement vérifier des propriétés connues)