FAQ:よくある質問と回答
Q1:共通語彙はなぜ必要なのですか
・データの意味を共通認識させることで、相互運用性を高めることを目的としています。
・行政にかかわる文書は言語(日本語)によって記されています。そこに含まれている用語は専門性の高い用語(例えば、法律用語)から日常で用いられる用語まで多岐にわたり、その語数は膨大です。この膨大な用語は、それぞれの分野の必要性に応じて歴史的積み重ねによって作られている一方、専門分野の細分化、分野間での交流の薄さから、類似の用語、重複する用語、分野で意味が異なる同一語といった用語の氾濫による混乱をもたらしています。IMI共通語彙基盤ではこの用語の氾濫による混乱に対して、分野を超えて使われるような事柄を中心に共通語彙として整備しています。
・もっと詳しくお知りになりたい方は、
相互運用性のための共通語彙の必要性をご参照ください。
Q2:項目名が同じで意味の異なるデータがあると、なぜ困るのですか
・ある事柄を検索しようと文書のデータベースをある用語で検索したとき、もしその用語で違う意味のデータが検索されると結果は不十分になってしまいます。表題や項目名においても意味を明確に表現していないとデータを使ったときに、意味の取違いなどの影響を及ぼします。
・項目名はデータの意味を的確に表す用語や構造化を行い、意味の取違いを防ぐようにすべきです。
Q3:コア語彙の用語は何を基準に選定されたのですか
・経済産業省調査事業「公共情報交換標準スキームの整備に関する調査研究(2012年度)」の成果物をベースに、 省庁、⾃治体などの⽤語例、海外事例(NIEM,ISA)を元に検討しています。
Q4:コア語彙の用語とはどのようなものですか
・用語で共通化する対象は事柄を指し示す概念とします。文章や表題名、項目名、項目の値などに出てくる語(言葉、単語)は概念を表現する手段と考えます。例えば、【人】という概念があったとき、文書の中で【人】を表現するときに「人間」という語を使うかもしれませんし、「人」あるいは「Person」という語を使うかもしれません。この場合、IMI共通語彙基盤では、語「人」「人間」「Person」は同じ概念【人】を指しているということで、同じ意味をもつ語と判断します。このように対応させることで、分野における用語の多様性を許容します。ただし、そのような場合でも用語が不必要に多様化することは望ましくありません。このため、IMI共通語彙基盤では原則として、一つの概念には一つの語(概念の名称に対応する語)を代表的な表記として用意することで、この語を使うことを推奨します。なお、IMI共通語彙基盤では、特に混同が問題ない場合は、概念を用語と呼びます。すなわち、上の例では用語【人】は人という概念を示すもので、「人」、「人間」などと表記しています。
Q5:コア語彙の用語名は、データ項目名としてそのまま使わないといけないのですか
・コア語彙の用語名とデータ項目名は同じである必要はありません。
・データはある特定の事情や状態をもっています。データ項目名にはその事情や状態を的確に表す名称が望まれます。コア語彙の用語名は概念構造によって共通認識できるようにしていますので、既存のデータ項目名にコア語彙をひもづけたり継承させたりすることによって、概念から特定の事情や状態を指し示して認識できるように利用します。
Q6:語彙定義における概念とは何ですか
・ある語を用いたとき、抽象的な事柄を示しているときと、具体的な事柄を示しているときがあります。「人には名前がある」といったときは「人」は誰かを指しているわけではなく、人という概念そのものに関しての説明となっています。一方、「前の道路で人が電柱にぶつかった」といったときには、「人」は特定の誰かを指しているのであって、人という概念に関することを説明しているわけではありません。最初の場合は言及しているのは概念、2番目の場合は個体(あるいは個別の事柄)を言及しているわけです。
・IMI共通語彙基盤では、個体を指すときは、ある概念の具体化と考えます。「田中さん」という人物を指すときは【人】概念の一つであるというように表現します。このようにすることで、表型データ等で、どんな値が入るかを明確に指示することができます。例えば、ある表型のデータを書くとき、ある項目に参加者の情報を記録するなら、この項目の値は【人】概念の具体化であるというように指示することができます。
Q7:IMIの語彙はコア語彙以外にもあるのですか
・IMI共通語彙基盤の語彙は、コア語彙とドメイン語彙の2層からなります。ドメイン語彙は、業界等の分野ごとに作成されることが期待されていますが、IMIとして認証しているものは現在ありません。
・もっと詳しくお知りになりたい方は、
共通語彙をご参照ください。
Q8:コア語彙の検索、選択はどうしたら良いのか分からない
Q9:ドメイン語彙、応用語彙の作成方法が分からない
・語彙を作り上げるためには、クラス用語・プロパティ用語及びそれらの関連性を定義します。
・語彙のクラス用語をベースに、プロパティ用語の追加、回数の変更などを行って新たなクラス用語を定義します。
・IMIの語彙では、クラス用語を継承し、プロパティ用語を追加する拡張の手法を使います。
・語彙の作成については、
「コア語彙解説書」も併せてご確認ください。
Q10:クラス用語内の構造化されたプロパティ用語の選び方が分からない
・選択したクラス用語に付随するプロパティ用語は、すべて利用するのではなく目的にあったプロパティ用語を選択して使用します。
・選択したクラス用語のうち、付随するプロパティに回数指定がある場合、グループ指定でユニークにして使います。
Q11:コア語彙のプロパティ用語だけ使うといけないのか
・項目名の標準化のためプロパティ用語だけ使用すると区別がつかなくなるためクラス型を継承してお使いください。
・単一の項目名を作成する際には、構造化された意味が分かるようなxxxのyyyというように作成すると意味が分かりやすくなります。
Q12:データ変換後の構造化において、XSD Sequence Validation error がおきる
・IMI語彙記法で作成するXSD Schemaを使用した場合、プロパティの順序が厳密に制限されますので、XSD Schemaに従った順序でデータを作成する必要があります。
Q13:固定値制約、グループ指定のデータモデルの意味が分からない
・意味の違う電話番号が2つあった場合など区別がつかなくなるので、「固定値制約」を用いて値を設定し、作成しなおすことで意味を明確にすることができます。
Q14:日付データと語彙の書式が合わない場合はどうしたらよいか
・標準型日付はxsd:dateとなり、YYYY-MM-DDと厳密な書式をもとめられますが、プロパティの表記(xsd:string)を使うことで文字列とすることもできます。