構築型分類について

出典: WINGpro

分類の出典  科学技術振興調整費 科学技術連携施策群の効果的・効率的な推進に関する研究「生命科学データベース統合に関する調査研究」 の採択課題「ライフサイエンス分野のデータベースの統合化に関する調査研究」

代表者 大学共同利用機関法人 情報・システム研究機構 国立遺伝学研究所 教授 大久保公策

  1. データベースの収集
     対象となるデータベースを「4省庁へのアンケート」と「15のデータベースカタログサイトからの自動収集」で収録し、国内のデータベースは226すべてを、国外のデータベースは5以上のカタログサイトに登録されている60を一覧表示している。国内のデータベースは開発機関別に、国外のデータベースはカタログサイトへの登録数が多い順に並べている。
  2. データベースの構築型分類
     データベースをデータの情報源とデータの処理方法で分類したものを構築法による分類としている。
    バンク型:不特定多数の研究者より提供された一次データを提供するタイプ
    プロジェクト型:一次データを出した研究者・グループ自体がデータベース化して提供するタイプ
    プログラム型:他のデータベースから取得したデータを機械的に処理して再構成したタイプ
    注釈(キュレーション)型:他のデータベースから取得したデータに対して手動で(人間の知識に基づいて)情報を追加し、再構成したタイプ
    知識モデル型:論文など非定型の情報源から手動で情報収集し、構造を持ったデータ形式を作り上げたタイプ
    辞典型:論文など非定型の情報源から手動で情報収集し再構成し、自由形の文章を中心とした形で提供するタイプ
    リソース型: 研究材料(データ 生物材料)の目録情報のデータベース
    解析サービス型: 実験データや公的データを解析研究するための独自プログラムを稼動させ提供するサイト


    表にまとめると以下のとおりである。

    データベース分類(構築法)

    表 構築法からみたデータベースの分類
    型名称 情報源の種類 処理方法 処理主体 データ形式
    バンク型 測定器と
    登録者
    - 不特定多数 構造化
    テキスト
    DDBJ
    プロジェクト型 測定器と
    実験者
    - 特定人間 構造 BodyMap
    プログラム型 DBレコード 機械的処理 マシン 構造 UniGene
    キュレーション型 DBレコード 高度情報処理 特定人間 構造 SCOP
    知識モデル型 読み物
    (電子・紙)
    高度情報処理 特定人間 構造 KEGG
    辞典型 読み物
    (電子・紙)
    高度情報処理 特定人間 構造化テキスト OMIM
    注)出来上がったレコードの本態である情報がIDの対応関係やマップ情報など機械で取り出して利用する形になっている場合を”構造”、専門家が読むことが主眼である場合を”自由文”と表現した。 バンク型には不特定多数の人間の動機付け法が必要である。