Semantic annotation of mutable data.

Morris, R.A., Dou, L., Hanken, J., Kelly, M., Lowery, D.B., Ludaescher, B., Macklin, J.A., et Morris, P.J. (2013). « Semantic annotation of mutable data. », PLoS ONE, 8(11: Article number e76093). doi : 10.1371/journal.pone.0076093  Accès au texte intégral (en anglais seulement)

Résumé

L’annotation électronique des données scientifiques est très semblable à l’annotation des documents. Les deux types d’annotation amplifient l’information originale et les connaissances qui s’y rattachent et permettent d’appuyer ou de mettre en cause les affirmations qui y sont faites. Dans chaque cas, l’annotation est un cadre qui permet de commenter le contenu original et qui doit préciser clairement sa portée et sa propre terminologie. L’annotation électronique des données diffère toutefois de l’annotation des documents par un certain nombre de points. Ainsi, le contenu des annotations, y compris les attentes et les preuves à l’appui, sont plus souvent partagées entre les membres de réseaux. Toutes interventions prises ultérieurement par les détenteurs des données annotées peuvent également être partagées. Toutefois, même avec les systèmes d’annotation existants qui acceptent des données comme objet, il est souvent difficile voire impossible d’annoter les données à un niveau de granularité suffisamment fin pour utiliser les résultats de cette manière à des fins de contrôle de la qualité des données. Pour résoudre ces problèmes, nous proposons des extensions simples à une ontologie d’annotation existante et décrivons comment les résultats peuvent appuyer une répartition des annotations fondée sur les intérêts. Nous utilisons les résultats pour concevoir et déployer une plate-forme qui prend en charge l’application de services d’annotation à des réseaux de données distribuées, avec une utilisation particulière en contrôle de qualité de données. Notre instance initiale prend en charge un ensemble de services de métadonnées se rattachant à des collections de sciences naturelles. L’utilisation à des fins de contrôle de la qualité et la fourniture de données manquantes en constituent une application importante. Une validation de principe antérieure a fait la démonstration d’une telle utilisation fondée sur des annotations de données modélisées au moyen de XML-Schema.

Date de modification :