O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
CSVならいいのか?
ちょっと立ち止まろう
(研)農研機構
大澤 剛士<arosawa@affrc.go.jp>
2017/12/19 GLOCOM オープンデータトークLT
オープンデータ!
機械判読可能な形で!
官民データ活用推進基本法制定の背景
http://www.kantei.go.jp/jp/singi/it2/senmon/dai9/siryou1.pdf
PDF
OCR不可
※イメージです
官民データ活用推進基本法制定の背景
http://www.kantei.go.jp/jp/singi/it2/senmon/dai9/siryou1.pdf
PDF
OCR不可
※イメージです
ち-が-う-だ-ろ!
この●●ー!
CSV/XML/RDF
(`・ω´・)+
機械判読可能なCSVファイルにしました。
これでお手元のパソコン等でご利用いただけます
C・S・V!C・S・V!
comma-separated values/variables
いくつかのフィールド(項目)を区切り文字である
カンマ「 , 」で区切ったテキストデータおよびテキストファイル。
ある意味定番化
(´・ω・`)
でもさ・・・
機械判読の意味わかってる?
こんな例
たくさんありそう!
「農林水産省では、農林業・農山村の現
状と変化を的確に捉え、きめ細かな農林
行政を推進するために、5年ごとに農林
業を営んでいるすべての農家、林家や法
人を対象に調査を実施しております。
http://www.maff.go.jp/j/toke...
数百~数千回クリックして
エクセルファイル(.xls)を保存
THE ネ申請エクセル!
https://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do
天下り 関連団体が
CSV化して県単位で販売
一般社団法人 農業統計協会
http://www.aafs.or.jp/
(`・ω´・)+
機械判読可能なCSVファイルにしました。
これでお手元のパソコン等でご利用いただけます
44,000円/県
高いか安いか・・・
さあ購入
中身を見てみると
( ゚д゚)
生データみても意味不明
半角と全角が混在
( ゚д゚)
※ 回ごとに変わる仕様
謎のフラグが各レコードに
(# ゚д゚) メタデータがpdf
(70ページ)
機械判読=プログラム処理
そこまでまだまだ遠い!
ダ鳥獣ギ画
http://www.chojugiga.com/whats/
でもこれ、どっかの地下で
泣きながら河童さんが作ってる
ダ鳥獣ギ画
http://www.chojugiga.com/whats/
先を見る前に
CSVならいいって空気を
何とかしたほうがいいかも!
●●ならいいってレベルで
標準化XMLとかRDFが
普及するなら大歓迎
違ったら大惨事
(ex. ボキャブラリーのない
オリジナルXMLの乱立( ;゚Д゚))
先を見るのは重要。
でも社会の現状も
ちゃんと見てみようね
http://agrimeshopen.web.fc2.com/index.html
地域メッシュ化して規格化
CSV化してオープン化
※ 2005年まで。2010年、2015年はこれから(たぶん)やります
弊社のカタログサイトからも
取れます
https://niaesvic.dc.affrc.go.jp/
Próximos SlideShares
Carregando em…5
×

Csvならいいのか?

2.348 visualizações

Publicada em

オープンデータ・トークシリーズ 第22回のLTスライド

Publicada em: Dados e análise
  • Seja o primeiro a comentar

Csvならいいのか?

  1. 1. CSVならいいのか? ちょっと立ち止まろう (研)農研機構 大澤 剛士<arosawa@affrc.go.jp> 2017/12/19 GLOCOM オープンデータトークLT
  2. 2. オープンデータ!
  3. 3. 機械判読可能な形で!
  4. 4. 官民データ活用推進基本法制定の背景 http://www.kantei.go.jp/jp/singi/it2/senmon/dai9/siryou1.pdf PDF OCR不可 ※イメージです
  5. 5. 官民データ活用推進基本法制定の背景 http://www.kantei.go.jp/jp/singi/it2/senmon/dai9/siryou1.pdf PDF OCR不可 ※イメージです
  6. 6. ち-が-う-だ-ろ! この●●ー!
  7. 7. CSV/XML/RDF
  8. 8. (`・ω´・)+ 機械判読可能なCSVファイルにしました。 これでお手元のパソコン等でご利用いただけます
  9. 9. C・S・V!C・S・V! comma-separated values/variables いくつかのフィールド(項目)を区切り文字である カンマ「 , 」で区切ったテキストデータおよびテキストファイル。
  10. 10. ある意味定番化
  11. 11. (´・ω・`) でもさ・・・ 機械判読の意味わかってる?
  12. 12. こんな例 たくさんありそう!
  13. 13. 「農林水産省では、農林業・農山村の現 状と変化を的確に捉え、きめ細かな農林 行政を推進するために、5年ごとに農林 業を営んでいるすべての農家、林家や法 人を対象に調査を実施しております。 http://www.maff.go.jp/j/tokei/census/afc/
  14. 14. 数百~数千回クリックして エクセルファイル(.xls)を保存 THE ネ申請エクセル! https://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do
  15. 15. 天下り 関連団体が CSV化して県単位で販売 一般社団法人 農業統計協会 http://www.aafs.or.jp/
  16. 16. (`・ω´・)+ 機械判読可能なCSVファイルにしました。 これでお手元のパソコン等でご利用いただけます 44,000円/県 高いか安いか・・・
  17. 17. さあ購入 中身を見てみると
  18. 18. ( ゚д゚) 生データみても意味不明 半角と全角が混在
  19. 19. ( ゚д゚) ※ 回ごとに変わる仕様 謎のフラグが各レコードに
  20. 20. (# ゚д゚) メタデータがpdf (70ページ)
  21. 21. 機械判読=プログラム処理 そこまでまだまだ遠い! ダ鳥獣ギ画 http://www.chojugiga.com/whats/
  22. 22. でもこれ、どっかの地下で 泣きながら河童さんが作ってる ダ鳥獣ギ画 http://www.chojugiga.com/whats/
  23. 23. 先を見る前に CSVならいいって空気を 何とかしたほうがいいかも!
  24. 24. ●●ならいいってレベルで 標準化XMLとかRDFが 普及するなら大歓迎 違ったら大惨事 (ex. ボキャブラリーのない オリジナルXMLの乱立( ;゚Д゚))
  25. 25. 先を見るのは重要。 でも社会の現状も ちゃんと見てみようね
  26. 26. http://agrimeshopen.web.fc2.com/index.html 地域メッシュ化して規格化 CSV化してオープン化 ※ 2005年まで。2010年、2015年はこれから(たぶん)やります
  27. 27. 弊社のカタログサイトからも 取れます https://niaesvic.dc.affrc.go.jp/

×