API : Application Programming Interface. Interface de programmation permettant d’accéder à une application ou à un programme. Des jeux de données peuvent être rendus accessibles ainsi, soit par téléchargement (pour les jeux de données raisonnablement stables dans le temps) soit par API (pour les jeux de données très volumineux ou très volatiles).

Big Data : Le terme de Big Data est utilisé lorsque la quantité de données qu’une organisation doit gérer atteint une taille critique qui nécessite de nouvelles approches technologiques pour leur stockage, leur traitement et leur utilisation. Volume, vitesse et variété sont souvent les trois critères qui permettent de qualifier une base de données de “Big Data”.

CADA : Commission d’Accès aux Documents Administratifs, elle sert de recours aux citoyens qui ont des problèmes pour accéder aux données publiques.La CADA est une autorité administrative indépendante dont le rôle est consultatif. Elle peut aider un citoyen à obtenir un document administratif individuel qui lui a été refusé. Elle répond aux consultations des administrations qui la saisissent sur le caractère communicable ou réutilisable des documents qu’elles détiennent ou sur les modalités de leur communication ou de leur réutilisation. Elle intervient pour tous les documents détenus par un service de l’Etat, une collectivité territoriale, un établissement public ou un organisme chargé de la gestion d’un service public, que cet organisme soit public ou privé.

CKAN : Comprehensive Knowledge Archive Network. Logiciel open source pour portail Open Data permettant de publier, de partager et de trouver des données. Il inclut une base de données pour cataloguer et stocker des jeux de données.

CNIL : La CNIL, Commission Nationale Informatique et Liberté, est une autorité publique chargée de veiller à la protection des données personnelles. Elle dispose d’un pouvoir de contrôle et peut également sanctionner les entreprises, organisations ou individus collectant des informations personnelles qui ne respectent pas la loi informatique et liberté.

Crawl : Processus de recueil d’information sur le web qui consiste à mettre en place un robot qui parcourt tout ou partie du Web, copie les pages trouvées et les stocke dans une archive. Par exemple, le métier de la société Google est de crawler et d’indexer l’ensemble du Web pour y faciliter la recherche.

Crowdsourcing : Pratique qui correspond à faire appel à des internautes volontaires pour proposer ou créer des contenus, répondre aux questions d’autres visiteurs. Il s’agit ainsi d’une mutualisation des ressources et des compétences (par exemple Open Street Map ou Open Food Facts).

Data.gouv.fr : Site officiel servant de répertoire pour les données publiques du gouvernement français, qui a été mis en ligne le lundi 5 décembre 2011 par la Mission Etalab. En décembre 2013, data.gouv.fr a subi une profonde transformation, en changeant sa structure et la philosophie de son site. Elle est en effet devenue une plate-forme collaborative orientée vers la communauté, au bénéfice d’une meilleurs réutilisation des données publiques.

Datavisualisation : Aussi nommée « dataviz« , il s’agit de technologies, méthodes et outils de visualisation des données. Elle peut se concrétiser par des graphiques, des camemberts, des diagrammes, des cartographies, des chronologies, des infographies, ou même des créations graphiques inédites. La présentation sous une forme illustrée rend les données plus lisibles et compréhensibles.

Les 10 principes  de l'Open Data : Tels que définis dans l’article de la Sunlight Foundation « Ten principles for opening up governement information » c'est-à-dire « dix principes pour l’ouverture de l’information gouvernementale », précisent que les données sont ouvertes quand elles sont à la fois :

  1. complètes ;
  2. primaires (c'est à dire brutes) ;
  3. fraîches ;
  4. accessibles ;
  5. électroniquement lisibles par une machine ;
  6. accessibles sans discrimination ;
  7. disponibles sous des formats ouverts (dont les spécifications techniques sont publiques et sans restriction d’accès);
  8. disponibles sous une licence libre ;
  9. accessibles de façon pérenne en ligne ;
  10. sans coût d'utilisation (le prix de mise à disposition ne doit pas excéder le coût de production).


Etalab : Mission initiallement rattachée au premier ministre, proposée initialement dans le rapport Riester de novembre 2010, mise en place en 2011, chargée de mettre en oeuvre la politique d’ouverture des données de l’administration française, et de mettre en place un annuaire des données publiques françaises, data.gouv.fr. A défini en octobre 2011 la Licence Ouverte. La mission Etalab a été rattachée en novembre 2012 au Secrétariat Général pour la Modernisation de l’Etat.

INSPIRE : Directive européenne concernant les données géographiques. Elle garantit l’accès à tous des ressources géographiques de chaque pays. Elle définit des standards devant assurer l’interopérabilité des applications géographiques utilisant des données venant de plusieurs pays.

Jeu de données : (ou Dataset). Collection structurée et documentée de données sur laquelle les réutilisateurs s’appuient.


ODbL : Open Data Base Licence, licence imposant la gratuité à toute donnée dérivée des données sous cette licence et autorisant une utilisation commerciale de celles-ci.

Réutilisation : Fait de prendre un jeu de données pour le visualiser, le fusionner avec d’autres jeux, l’utiliser dans une application, le modifier, le corriger, le commenter, etc.


Scraping : Processus d’aspiration des données d’un site par un robot qui connait et utilise la structure du site pour en extraire les données.


Source :
http://www.data-publica.com/content/lexique-de-lopen-data