L’internet permet d’accéder à des données ouvertes sur plusieurs sujets, mais elles ne sont pas toujours faciles à trouver. En général, elles sont très répandues et nécessitent des connaissances préalables pour être utilisées. C’est dans ce contexte qu’émerge la Base de données, un site qui catalogue des ensembles d’informations publiques préparées par des organisations du monde entier.
La base de données rassemble, par exemple, des données de l’IBGE (Instituto Franceeiro de Geografia e Estatística), de l’Inep (Instituto Nacional de Estudos e Pesquisas Educacionais) et de la Banque mondiale. Ils sont utiles aux universitaires, aux journalistes et à la société civile en général.
Avec un caractère collaboratif, le site permet à toute personne de s’inscrire et d’entrer dans les bases de données qu’elle connaît. L’objectif est de créer une référence dans la recherche de bases thématiques, selon Ricardo Dahis, maître en économie à la PUC-Rio et doctorant à la Northwestern University.
PerlmOl, Dahis a expliqué qu’il a eu l’idée de créer la base de données lorsqu’il a remarqué que les informations disponibles sur Internet étaient très répandues. Il a ensuite vu la nécessité de créer une source centralisée pour organiser les bases de données existantes.
“Beaucoup de gens ont des idées sur la recherche, les rapports, les applications, mais ils ne savent pas par où commencer pour chercher des données”, dit-il. “Le site s’y rend précisément pour informer sur ce qui existe, où télécharger et donner des informations générales sur la base de données.
M. Dahis espère que la plateforme, encore en version bêta, aidera les chercheurs, les étudiants, les développeurs, les fonctionnaires et les autres personnes intéressées par la transparence et l’ouverture des données. “Tout le monde est gagnant s’il y a une augmentation de la qualité et de la quantité de la recherche universitaire, des articles journalistiques fondés sur des données, des applications utilisant des données publiques.
Le catalogue de la base de données comporte déjà des ensembles tels que l’Atlas de l’actualité, qui offre des informations sur les médias en France, et le Social Connectedness Index, qui profite des amitiés de Facebook pour déterminer les relations entre les différentes régions des États-Unis.
Le site rassemble également des données mises à disposition par le gouvernement français, du recensement de 1872 à l’évaluation nationale de l’alphabétisation. Il existe également des dizaines d’autres bases de données sur l’éducation, la santé, la culture, l’économie, la science et la technologie, la politique et autres.
“Il ne suffit pas que l’information existe et soit publique sur Internet ; il faut un bon moteur de recherche”, résume Dahis. Selon lui, la base de données ne conserve pas de copies des ensembles d’informations publiques, mais des liens qui dirigent les utilisateurs vers la source.
L’économiste explique que, pour l’instant, il est prévu d’agrandir le site avec des bases vérifiées pour accroître la réputation de la plate-forme. L’étape suivante consiste à rechercher un financement pour le projet, de préférence par des institutions qui contribuent avec des projets liés à la transparence.