SlideShare a Scribd company logo
ビッグデータ時代の
インベントリー利活用プラットフォーム
国立研究開発法人農業環境技術研究所
農業環境インベントリーセンター
大澤 剛士<arosawa@affrc.go.jp>
2016年2月24日 第6回農業環境インベントリー研究会
エポカルつくば
コンテンツ
• NIAES VIC
•
•
•
コンテンツ
• NIAES VIC
•
•
•
農環研の情報資産
http://www.niaes.affrc.go.jp/techdoc/db_image.html?ref=top0
多種多様なデータベース
情報資産=インベントリー
~全国的な土壌、気象、生物、土地利用、
衛星画像、農業統計などの農業環境情報を
一元的に提供できる農業環境情報
統合データベースを構築する。
農環研 第三期中(長)期計画
(FY2011-2015)
農業環境情報統合
データベースの開発
農業環境情報統合データベース
NIAES VIC (Virtual Inventory Complex)
http://dc.niaesvic.affrc.go.jp
第三期中長期計画の成果物(年度末公開)
CKAN
カタログサイト
農業環境資源を検索
アクセス、取得の補助
農業環境情報統合データベース
NIAES VIC (Virtual Inventory Complex)
http://dc.niaesvic.affrc.go.jp
Webシステムの検索
データセットの検索
ダウンロードサービス
仮想的な統合の実現
農業環境情報統合データベース
NIAES VIC (Virtual Inventory Complex)
http://dc.niaesvic.affrc.go.jp
API(インターネット経由でデータに
直接アクセスする仕組み)の実装
自由な利用の保証(原則CC-BY)
オープンデータの推進
農業環境情報統合データベース
NIAES VIC (Virtual Inventory Complex)
http://dc.niaesvic.affrc.go.jp
・仮想的な統合
・オープンデータ
• NIAES VIC
•
•
•
情報のビッグバン
1年間に約3ゼッタバイトのデータが生成
キロ < メガ < ギガ < テラ < ペタ< エクサ < ゼッタ
これは��世界で1人あたり約400GBに相当
巨大データの時代
容量の心配は(ほぼ)不要
目的に応じてデータベースを構築
『●●統合データベース』
いわゆる「データ統合」
『●●統合データベース』
いわゆる「データ統合」
一つの“箱”の中にありとあらゆるデータを入れる
どこかにあるんだけど
どこにあるんだよ・・・
本来、仕事を便利にしてくれるはずのDBが
足かせになってしまう!
ありがちな問題
方向を間違えたり、やり過ぎたりしない
ようにするには、
まず「本当は重要でも何でもない」1000の
ことにノーと言う必要がある
スティーブ ジョブス(1955-2011)
統合データベース
全てのデータを規格化
同じデータベースに格納
NO!
クラウドコンピューティング
=インターネット技術
データベースを雲の中に放り込み、
処理は機械に任せてし���う。
ユーザはインタフェースを介して
欲しいデータを呼び出すのみ!
由来が異なるデータを無理に
規格化し、”結合”する必要はない!
・ 既存のデータベースは、
既存の状態=独立で保持(管理)、拡充
・ ただし、緩やかに連携させる
・ 全てのデータベースを雲に放り込む。
データの性質は簡単に把握できるようにする
metadata
metadata
metadata
metadata
metadata
webAPI
webAPI
webAPI
webAPI webAPI
・ データにアクセスする窓口(API)を取り付け、
自由にアクセス可能にする
metadata
metadata
metadata
metadata
metadata
・ そのときにニーズに応じてインタフェースを開発し、
横断利用コンテンツをつくる。
気象+土壌
温室効果ガスの発生量を予測
・ コンテンツは役割を果たした後に廃止
でもデータは維持され、再利用可能
・ 新たなデータベースは追加していく
=雲の中に放り込んでいく
再利用・拡張の自由
農業環境資源を検索
アクセス、取得の補助
農業環境情報統合データベース
NIAES VIC (Virtual Inventory Complex)
http://dc.niaesvic.affrc.go.jp
Webシステムの検索
データセットの検索
ダウンロードサービス
仮想的な統合の実現
農業環境情報統合データベース
NIAES VIC (Virtual Inventory Complex)
http://dc.niaesvic.affrc.go.jp
API(インターネット経由でデータに
直接アクセスする仕組み)の実装
コンテンツ
• NIAES VIC
•
•
•
Q.ネット上に氾濫する情報
その著作権を考えたことはありますか?
著作権法の原則:著作者の許諾なしに
創作物を利用してはいけない!
著作権への意識
ライセンスによって許諾条件を明確化する
(商用不可、再配布不可、著作者明記etc..)
ライセンス
著作権法の原則:著作者の許諾なしに
創作物を利用してはいけない!
知財を保護しつつ、社会に還元できる
適切なライセンスを付与すべき
ライセンス設定
我々の研究成果
=税金が主な原資
研究成果、情報資源
法律知識を持たない非専門家による
設定には限界がある
ライセンス設定
商用の範囲?
教育用は?
NPOが使う場合?
内部利用は?
印刷物では?
国外利用は?
Open Data
オープンデータ
誰でも自由に利用、加工、配布が可能
コンテンツ
• NIAES VIC
•
•
•
Open Data
オープンデータ
誰でも自由に利用、加工、配布が可能
・政府情報は原則としてオープンデータ
・質と量を担保するべし
・すべての者が利用できるように
・自由に使って新しいものを生もう
G8で合意
ガバナンス改善、イノベーションのため
政府データの公表を促進すべし!
公的研究機関として従うべき考え
オープンデータ憲章
クリエイティブ・コモンズ
標準ライセンス
国際NGOによって提案されたライセンス
オープンデータライセンスと���て利用可能
標準ライセンス
必要条項が組み込まれたものが利用可能
自身でライセンスを設定しないで済む
自由な利用の保証(原則CC-BY)
オープンデータの推進
農業環境情報統合データベース
NIAES VIC (Virtual Inventory Complex)
http://dc.niaesvic.affrc.go.jp
http://www.data.go.jp/
日本政府のオープンデータ
政府発表や統計情報を中心に
様々なデータをオープン化
CKAN
カタログサイト
農業環境情報統合データベース
NIAES VIC (Virtual Inventory Complex)
http://dc.niaesvic.affrc.go.jp
第三期中長期計画の成果物
CKAN
カタログサイト
NIAES VICは同じシステム
政府オープンデータとの横断利用が容易
分野横断的な利活用が期待される
CKAN
カタログサイト
まとめ
• NIAES VIC
•
•
カタログサイトは「箱」に過ぎません。
最も重要なのは、格納されたデータです
「100年前から受け継いだインベントリーを
150年後も使えるようにすること」
組織再編後も、
この役割は決してなくなりません
Take Home Message

More Related Content

20160224osawa