Accueil / Focus sur / Représentations visuelles des connaissances via Wikidata

Représentations visuelles des connaissances via Wikidata

Posted on

Rendre Wikidata visible


Texte publié initialement en anglais par Martin Poulter, Wikimédien en Résidence à la bibliothèque de Bodley de l’université d’Oxford sous CC-BY-SA 3.0 le 23 janvier 2019.


Logo de WikidataVisualisation interactive des données de Wikidata

J’ai testé des façons de montrer comment Wikidata représente la connaissance ; plus spécifiquement, comment elle trace des chemins à partir des relations entre les choses. Dans un billet précédent, j’ai écrit sur la façon dont les représentations de Wikidata permettent d’établir de nouveaux chemins. Ces chemins faisant partie d’un réseau géant, ils offrent de nouvelles manières de découvrir les objets des collections existantes. Après avoir décrit les collections culturelles d’Oxford dans Wikidata, nous pouvons montrer des exemples concrets de ce graphe de connaissances en expansion. 

Démonstrations graphiques

Normalement, avec Wikidata, nous spécifions des propriétés et obtenons des résultats qui sont des choses identifiables. Par exemple, si nous demandons “les historiennes nées dans les années 1730 qui figurent dans le dictionnaire biographique Electronic Enlightenment”, nous obtenons Catherine Macaulay. Ici, j’utilise des requêtes qui spécifient un groupe de choses et demandent les propriétés qui les relient. Nous obtenons donc un petit fragment du graphique de connaissance Wikidata (qui compte actuellement un peu plus de 54 millions de personnes, lieux, publications, objets et concepts). Nous pouvons voir comment différents types de données (biographiques, bibliographiques et de catalogues) sont combinés dans le même modèle. J’ai fait des captures d’écran de ces graphiques, mais je recommande de cliquer sur la requête en direct où vous obtenez un graphique étirable.Rendre visible wikidata
D’abord, quelques trésors de la bibliothèque Bodléienne. “With a guitar, to Jane” est un poème manuscrit de Percy Bysshe Shelley sur une guitare (qui est maintenant connu sous le nom de “Shelley’s guitar“). La guitare et le poème étaient des cadeaux de Percy à sa muse, Jane Williams. Mary Shelley était bien sûr un titan littéraire à part entière, et parmi les représentations de Mary détenues par la bibliothèque Bodléienne se trouve une peinture à l’huile. Si l’on recherchait  “des œuvres littéraires inspirées d’œuvres de Shakespeare”, “des peintures représentant des auteurs de science-fiction” ou “des emplacements actuels d’objets ayant appartenu à l’origine à la famille Shelley”, ce graphique indique quelques résultats que nous pourrions obtenir. (Voir la requête en direct)
Notez que ces graphiques excluent beaucoup d’informations pour des raisons de clarté visuelle. Il y a des périodes et des dates (Wikidata sait donc que la bibliothèque Bodléienne a acquis la guitare après que Jane Williams l’ait possédée). Il y a des identificateurs pour les articles (par exemple des cotes pour les articles de la collection ; des douzaines d’identificateurs de fichiers d’autorité pour Mary et Percy Shelley).Rendre visible wikidata
Voici une requête reliant les éléments de deux institutions GLAM. Si vous vous intéressez au calligraphe Wang Xianzhi du IVe siècle, peut-être pour avoir entendu parler d’une œuvre exposée au Musée du Palais de Pékin, vous voudrez peut-être savoir que le Musée Ashmolean possède trois œuvres en lien avec lui : une œuvre de lui, une œuvre qui le représente et une œuvre qui représente son frère Wang Huizhi. (Voir la requête en direct)
Rendre visible Wikidata
Un exemple des données utilisées par l’Explorateur d’Astrolabes. Certains des astrolabes associés à Jean Fusoris se trouvent au Musée d’histoire des sciences d’Oxford, mais il y en a d’autres dans d’autres institutions du GLAM. Heureusement, ils ont tous librement partagé les images des astrolabes, qui apparaissent sous forme de vignettes dans ce graphique. (Voir la requête)
Rendre visible Wikidata

Dans un précédent billet, j’ai traduit un autre billet de blog de mon collègue Alasdair Watson en données structurées. Voici une visualisation du graphe qui en a résulté. Le noeud Shahnameh représente l’œuvre littéraire et le « Shahnamah of Ibrahim Sultan » est un manuscrit qui en est un exemplaire. Il y a d’autres exemplaires connus de Wikidata, donc j’ai inclus « the Windsor Shahnameh » en tant qu’exemple. (Voir la requête)

Rendre visible Wikidata
Voici le même graphe que précédemment, à la différence que les libellés sont en farsi. Cet exercice est une illustration du fait que Wikidata représente les choses d’une manière indépendante de la langue, et rajoute des libellés selon les préférences de l’utilisateur. Quelques éléments et propriétés de ce graphe n’ont pas de libellés en farsi, comme on peut s’y attendre étant donné que leur présence dépend du fait que des utilisateurs humains les aient renseignés. Il n’y a pas de traduction automatique ici. Néanmoins, nous voyons que Wikidata a la capacité d’exprimer à l’intension de lecteurs du Farsi que le manuscrit du sultan Hibrahim a été possédé par le passé par Sir Gore Ousely et est désormais dans la collection de la bibliothèque de Bodley d’Oxford.

Au final tout est relié

Rappelez-vous que, si nous les étendons pleinement, tous ces graphes fragmentaires vont finalement se connecter les uns aux autres. Wikidata est un graphe unique qui connecte des millions de choses entre elles, et ellemême est une partie du web des Données Reliées Ouvertes (Open Linked Data en anglais) qui connecte des millions d’entités et de propriétés supplémentaires. 
Ces graphes sont une démonstration de ce que nous entendons par graphe de connaissances (knowledge graph), et ce que nous faisons quand on combine des jeux de données séparés dans une représentation « web sémantique ». Ce ne sont pas des outils de navigation pour l’utilisateur final, mais ils illustrent le problème auquel nous nous confrontons lorsque nous construisons des interfaces d’aide à la découverte : comment rendre les relations d’un jeu de données – celles qui intéressent les utilisateurs – visibles et facilement explorables ?
Top