How to quickly detect the overlap and the consistency between LADM with LandInfra and LandXML : application of schema matching techniques

Pouliot, Jacynthe (Université Laval, Québec, Canada) ; Monney, Claire (Haute école d’ingénierie et de gestion du canton de Vaud (HEIG-VD) HES-SO // Haute Ecole Spécialisée de Suisse Occidentale) ; Ingensand, Jens (Haute école d’ingénierie et de gestion du canton de Vaud (HEIG-VD) HES-SO // Haute Ecole Spécialisée de Suisse Occidentale) ; Larrivée, Suzie (Université Laval, Québec, Canada)

In this paper, we explore the schema matching techniques to compare the content of three geospatial standards which are LADM, LandInfra (InfraGML) and LandXML. Those standards all refer to the concept of “land” and we will try to quantify the similarity of them based on syntax and semantic comparison of the class names exposed in their respective schema. Consequently, we will demonstrate the applicability, the accuracy and the usefulness (rapidity and automation) of schema matching techniques for comparing the content of standards. The comparison is performed with XSD (XML Schema Definition) files that describe the schema in English. The results show that syntactic match rate between LADMLandInfra (54%) is higher than LADM-LandXML (10%). In adding the semantic information extracted from Wordnet, the match rate between LADM-LandInfra goes to 84% and 59% for LADM-LandXML. In comparing our matching results with two independent sources of information that already and manually compared these three standards, we obtained distinctive results. The correctness of LADM-LandInfra is 60%, while the correctness of LADM-LandXML is only 20%. The applicability of schema matching is positively demonstrated while the usefulness and the accuracy still need further improvements in order to make any statement.

Dans ce papier, nous explorons les techniques d’appariement de schémas pour comparer le contenu de trois standards géospatiaux soit LADM, LandInfra (InfraGML) and LandXML. Ces trois standards réfèrent au concept de « land » et nous allons tenter de quantifier leur similitude en tenant compte de la syntaxe et de la sémantique des noms de classe contenu dans leur schéma respectif. Nous allons ainsi démontrer l’applicabilité, l’exactitude et la facilité (rapidité et automation) des techniques d’appariement de schémas. La comparaison est effectuée à partir des fichiers XSD (XML Schema Definition), qui présentent la modélisation en anglais des standards. Les résultats montrent que, lorsqu’uniquement la syntaxe est prise en compte, le taux d’appariement de LADM-LandInfra (54%) est plus élevé que celui de LADM-LandXML (10%). En tenant compte des relations sémantiques possibles extraites de Wordnet, le taux d’appariement de LADM-LandInfra grimpe à 84%, alors qu’il revient à 59% pour LADM-LandXML. En comparant nos résultats avec des sources d’information externes qui ont déjà comparées manuellement ces trois standards, nous obtenons un taux d’exactitude de 60% pour LADM-LandInfra et de 20% pour LADM-LandXML. L’applicabilité des techniques d’appariement de schémas est démontrée par nos expérimentations tandis que l’exactitude et la facilité montrent des résultats divergeant qui nécessiteront d’autres tests et analyses.


Keywords:
Conference Type:
full paper
Faculty:
Ingénierie et Architecture
School:
HEIG-VD
Institute:
insit - Institut d’ingénierie du territoire
Publisher:
Kuala Lumpur, Malaysia, 1-3 October 2019
Date:
2019-10
Kuala Lumpur, Malaysia
1-3 October 2019
Pagination:
20 p.
Published in:
Proceedings of 8th International FIG workshop on the Land Administration Domain Model, 1-3 October 2019, Kuala Lumpur, Malaysia
Numeration (vol. no.):
pp. 135-154
Appears in Collection:

Note: The status of this file is: restricted


 Record created 2020-01-14, last modified 2020-04-28

Fulltext:
Download fulltext
PDF

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)