SlideShare a Scribd company logo
CSVならいいのか?
ちょっと立ち止まろう
(研)農研機構
大澤 剛士<arosawa@affrc.go.jp>
2017/12/19 GLOCOM オープンデータトークLT
オープンデータ!
機械判読可能な形で!
官民データ活用推進基本法制定の背景
http://www.kantei.go.jp/jp/singi/it2/senmon/dai9/siryou1.pdf
PDF
OCR不可
※イメージです
官民データ活用推進基本法制定の背景
http://www.kantei.go.jp/jp/singi/it2/senmon/dai9/siryou1.pdf
PDF
OCR不可
※イメージです
ち-が-う-だ-ろ!
この●●ー!
CSV/XML/RDF
(`・ω´・)+
機械判読可能なCSVファイルにしました。
これでお手元のパソコン等でご利用いただけます
C・S・V!C・S・V!
comma-separated values/variables
いくつかのフィールド(項目)を区切り文字である
カンマ「 , 」で区切ったテキストデータおよびテキストファイル。
ある意味定番化
(´・ω・`)
でもさ・・・
機械判読の意味わかってる?
こんな例
たくさんありそう!
「農林水産省では、農林業・農山村の現
状と変化を的確に捉え、きめ細かな農林
行政を推進するために、5年ごとに農林
業を営んでいるすべての農家、林家や法
人を対象に調査を実施しております。
http://www.maff.go.jp/j/tokei/census/afc/
数百~数千回クリックして
エクセルファイル(.xls)を保存
THE ネ申請エクセル!
https://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do
天下り 関連団体が
CSV化して県単位で販売
一般社団法人 農業統計協会
http://www.aafs.or.jp/
(`・ω´・)+
機械判読可能なCSVファイルにしました。
これでお手元のパソコン等でご利用いただけます
44,000円/県
高いか安いか・・・
さあ購入
中身を見てみると
( ゚д゚)
生データみても意味不明
半角と全角が混在
( ゚д゚)
※ 回ごとに変わる仕様
謎のフラグが各レコードに
(# ゚д゚) メタデータがpdf
(70ページ)
機械判読=プログラム処理
そこまでまだまだ遠い!
ダ鳥獣ギ画
http://www.chojugiga.com/whats/
でもこれ、どっかの地下で
泣きながら河童さんが作ってる
ダ鳥獣ギ画
http://www.chojugiga.com/whats/
先を見る前に
CSVならいいって空気を
何とかしたほうがいいかも!
●●ならいいってレベルで
標準化XMLとかRDFが
普及するなら大歓迎
違ったら大惨事
(ex. ボキャブラリーのない
オリジナルXMLの乱立( ;゚Д゚))
先を見るのは重要。
でも社会の現状も
ちゃんと見てみようね
http://agrimeshopen.web.fc2.com/index.html
地域メッシュ化して規格化
CSV化してオープン化
※ 2005年まで。2010年、2015年はこれから(たぶん)やります
弊社のカタログサイトからも
取れます
https://niaesvic.dc.affrc.go.jp/

More Related Content

Csvならいいのか?