Cours de bases de données

“ - C'est ma base de données Excel !
- Tu emploies toujours ce mot. Je ne sais pas s’il veut bien dire ce que tu penses. ”
Vizzini et Inigo Montoya, The princess bride (1987)

Est-ce ça ?

Ou bien ça ?

Ou encore ... ça ?

Qu'est-ce qu'une BDD ?

Bénéfices

  • structuration de l'information
  • requêtes
  • sécurité
  • travail collaboratif

Conception

  • éviter la redondance de l'information
  • éviter les incohérences
  • privilégier la sémantique forte
  • penser aux relations

Problème ?

Nom et prénom Âge
Gilles Poitou 42
Hubert Thibault 17
Witz Régis heu..?

Clés uniques, invariants, typage

ID Nom Prénom Date de naissance
1 Poitou Gilles 1978/03/17
2 Hubert Thibault 2003/06/18
3 Witz Régis heu..?

Problème ?

ID Nom Prénom UMR
1 Poitou Gilles UMR 3400
2 Hubert Thibault UMR 3400
3 Witz Régis USR 3227

Plusieurs modèles (tables)

ID Nom Prénom Appartenance
1 Poitou Gilles 3400
2 Hubert Thibault 3400
3 Witz Régis 3227
ID Type Nom
3400 UR Arche
3227 USR Misha

FAIRness

F.A.I.R.

  • Findable
  • Accessible
  • Interoperable
  • Reusable

F.A.I.R.

  • Facile à (re)trouver
  • Accessible
  • Interopérable
  • Réutilisable

FAIR: fondations

  • Article fondateur: Nature (2016)
    Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016).
    https://doi.org/10.1038/sdata.2016.18

FAIR: objectifs

Que la recherche soit ...

  • traçable
  • compréhensible
  • reproductible
  • réutilisable

... pour toutes et tous.

Donnée « FAIR » ≃≠ Donnée « Ouverte »

Open Data

F

Facile à (re)trouver

  • par les humains, par les machines
  • identifiant
    1. unique
    2. persistant
  • métadonnées

A

Accessible

  • standards de communication
  • standards de métadonnées
  • authentification transparente
  • conditions (licence, ...) claires, visibles
  • hébergement : durée ? lieu (hôte) ?

I

Interopérable

  • sémantiquement
  • syntaxiquement

R

Réutilisable

  • standards communs
  • données claires, vérifiées, et
    décrites par des métadonnées
  • directement (ré)utilisables
    recherche ou autres usages

D'accord
... mais ?

En pratique

Une question d'équilibre

  • découverte ⟿ structuration
  • ? ⟿ métadonnées
    • descriptives
    • structurelles
    • administratives

Métadonnées ?

(clé, valeur)

  • titre: Sarabande
  • année: 1733
  • "année": 2021
  • auteur: Haendel
  • "auteur": vous
  • propriétaire: Unistra
  • laboratoire: Arche

Standards

Exemple: Datacite

Identifiant unique ?

DOI: Digital Object Identifier

  • Pérenne
  • Cohérent
  • Facile à utiliser
  • Sémantique
  • Relations
  • Infrastructure technique

Exemples

  • Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016).
    https://doi.org/10.1038/sdata.2016.18
  • Wilkinson, M. D., Verborgh, R., Santos, L. O. B. da S., Clark, T., Swertz, M. A., Kelpin, F. D. L., … Dumontier, M. (2017). Interoperability and FAIRness through a novel combination of Web technologies. PeerJ Computer Science, 3, e110.
    https://doi.org/10.7717/peerj-cs.110
  • Wilkinson, M. D., Sansone, S.-A., Schultes, E., Doorn, P., Santos, L. O. B. da S., & Dumontier, M. A design framework and exemplar metrics for FAIRness (2017). BioRxiv, 225490.
    https://doi.org/10.1101/225490
  • Mons, B. et al (2017), 37(1), 49-56, Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud. Information Services & Use.
    https://doi.org/10.3233/ISU-170824

Plus jamais ça ...

Sécurité

“ Aussi ouvert que possible,
aussi fermé que nécessaire. ”

Sécurité

  • visibilité
  • droits d'accès
  • lecture, écriture

Logiciels

  • logiciels propriétaires = privateurs
  • logiciels libres ≃ open source

Logiciels privateurs

Logiciels libres

  1. liberté d'utiliser le logiciel
  2. liberté de copier le logiciel
  3. liberté d'étudier le logiciel
  4. la liberté de redistribuer les versions modifiées

Logiciels libres : bénéfices

  • coût
  • qualité
  • adaptabilité
  • pérennité

Logiciels libres : où les trouver ?

SGBD

Heurist

Omeka

Des questions ?

Régis WITZ rwitz@unistra.fr

Maison Interuniversitaire des Sciences de l’Homme - Alsace | MISHA
5 allée du Général Rouvillois - CS 50008 - 67083 Strasbourg cedex

Bureau 141

Crédits images

Sora Shimazaki, Element5 Digital, Snapwire, Pixabay, Pixabay, Pixabay, SangyaPundir, TheMattrix.

Logos: Creative Commons, DOI®, GO FAIR, Heurist Omeka

Licence

Cette présentation est mise à disposition par Régis Witz (rwitz@unistra.fr) selon les termes de la licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International.