共通語彙基盤について
2016年11月18日公開
「IMI共通語彙基盤 導入の手引き」では、共通語彙基盤を利用するメリット、語彙などの利用イメージについて図を使い分かりやすくまとめています。
IMI共通語彙基盤は、共通で使われる語彙と語彙同士の関係を示す仕組みとで構成される、オープンデータと電子政府データ、また民間のデータの相互運用性を高めるためのフレームワークです。
IMI共通語彙基盤は、事柄を指し示す概念を共通化の対象とし、これを用語と呼びます。用語はクラス概念とプロパティ概念から構成され、それらを組み合わせて定義されます。
各用語には代表的な表記が用意されています。文字列中の単語やデータセットに含まれるデータ項目名はIMIの用語と関連づけることで、元の情報を変更せずに相互運用性を高めることができます。
IMI共通語彙基盤では、分野によらず共通に使われる基本的な語彙をコア語彙として提供しています。コア語彙は約60のクラス語彙と約250のプロパティ語彙からなります。
個別のドメインのための語彙(ドメイン語彙)と個別の利用ケースのための語彙(応用語彙)はコア語彙の拡張として定義され、コア語彙と一緒に使われることで、
個別のドメインや利用ケースでの語彙として働きます。
データ提供者、アプリケーション等の開発者、データ活用者の3者がIMI共通語彙基盤を採用し、データ提供者がデータの語彙と共通語彙との関係を示すデータを添えれば、従来のデータ項目名を変えることなく、機械的なデータ交換が実現されます。
このための情報がデータモデル記述(DMD : Data Model Description)という情報パッケージで提供されます。DMDには、語彙を人間向けに説明する文章や語彙利用における制約、コンピューター向けに説明するデータ構造、語彙とデータ構造とのマッピングなどが含まれます。DMDを定義することで、データ提供者はデータ構造を変更せずデータが公開でき、アプリケーション等の開発者やデータ利用者は公開されたデータの意味を正しく解釈できます。
このように、IMI共通語彙基盤の特長は、既存データの交換の方法を大きく変えることなく、データの相互運用性を高めることができる点です。