2012年5月6日日曜日

#Gov2.0 で重要なのは、政府側が出すデータのユーザビリティとマシンリーダビリティとライセンス

Gov2.0 的なことが色々進んでいく中で、

政治は聖域と思ってる人々←-----------------------<超えられない壁>-----------------------→テクノロジーで社会に変革を起こせると思っている人々

。。。だった距離が、どんどん近づいてきていて何よりです。

政府側がデータを出すのはとても重要なことです。ですが、政府側がいくら Gov2.0! と叫んでいても、開発者・国民が乗ってこないなら何も始まりません。

開発者が国のため、社会のために自らのスキルを役立てようと動くのもとても重要なことです。ですが、開発者側がいくら Gov2.0! と叫んでいても、政府がデータや事実をきちんと開示してくれないと進みません。

両輪がちゃんと動いていくことが重要だと思います。Gov2.0 という言葉がメディアで盛り上がりすぎてどちらもあまり乗っていない時期もあったし、政府が掛け声をかけたけど現場がついてきていなかったり、まあ色々ありましたけど、結局物を言うのは成果なので、地道にコツコツと新しいチャレンジを続け、進めていくしかないのかなと思います。実際、色々なところで色々な成果が出てきています。最近、ロシアの Gov2.0 の話とかも出てきて、面白い。

ところで最近顕著になってきているのが、政府側はデータを出したつもりになっているんだけど、開発者側からすると全然データが使いやすくないので、使われないというケース。もしくは、使われるんだけど、使うために開発者側にえらい負担がかかるというケース。あるいは、使って欲しいと言いつつ、ライセンスがガチガチもしくは不明瞭で、怖くて使えないケース。つまり、データを公開する側のユーザビリティ、データのマシンリーダビリティとライセンスの問題が重要になってきたというわけです。(まあ前から重要だったのですが、それ以前の問題が山積みだったので。)

SFC の ORF で村井先生もお話されていたけれど、震災後に文部科学省が公開した放射線モニタリング情報は、データを出すまでに時間がかかった上、マシンリーダブルでなかった。村井先生いわく、「最初、データがファクシミリで送られてきたときはびっくりした。『デジタルデータでほしい』と頼んで送ってもらった Excel シートも、ヘッドラインが日本語で、日本人にしか理解できないものだった」そうです。そこで、Joi 達が始めた SafeCast は、市民がみんなで放射線のモニタリングを行い、使う側が使いやすいように、ライセンスも public domain で出し、現在は世界最大の放射線モニタリングとなっているそうです。

また、震災直後の計画停電が続く中、東京電力が「公開」した電力供給状況の「データ」も、マシンリーダブルではない「画像」でした。



これでは使えない。そんな中、スイッチサイエンスの金本さんが、HTMLの文字データと画像データを取得し、 解析する事によって、使用状況を「推定」して、データを提供する「東京電力電力供給状況API」を公開。そうすると何が起きるかというと、こんなにたくさん↓のアプリやサービスをみんながガンガン作り始める。画像のままだったら、これらは生まれなかった。サイトには API のパラメータの説明もちゃんと記述されており、「クレジットの表示は特に求めません。ご自由にどうぞ。」ユーザビリティ、マシンリーダビリティとライセンスが重要というのはこういうことを指しています。以下、金本さんのサイトから引用:

応用例
プログラマじゃない方が今すぐ使える応用例です。
アプリを作った方はお知らせください。ここに掲載します。
お知らせくださったのに掲載されていない場合は、ご指摘ください。
Android用
  • 本来はツイッタークライアントだそうですが、電力グラフが見られるそうです。
iPhone用
  • iPhoneアプリ「東京節電」まもなく公開。(頓智ドットさん @nissa0916さん)
DoCoMo携帯用
SoftBank携帯用
ウィンドウズ用アプリ
Mac用アプリ
Linux用アプリ
Twitterボット
Chrome拡張
FireFoxアドオン
ブログパーツ
ウェブサイト
  • Google Visualization APIを使ってグラフ化。
  • PHP言語から使用した例です。
ブラビア用アプリ(アプリキャスト)
その他色々
  • Arduinoとイーサネットシールドを使った例 (@mitsumame_oasisさん)

先日の NASA Hackathon (International Space App Challenge) の時も、会場からは「NASAはデータを出してるって言ってるけど、パラメータの使い方の説明とかないので全然わかんない。使えないよ。」とか「データ出てるって言ってもAPIとかがないので、プログラムが組めない」などなどたくさんの声が聞かれていました。宇宙好きの人が集まっているので、それでも使って頑張ってくれるわけですが、普通だったらあきらめていたかもしれません。実際、ハッカソンの開催前にこの問題に気づいていた人たちもいて、アプリ開発をせずに、「NASAのデータのための Open Data API の設計をする」というチームも現れました。"Preliminary Design for Open Data API"のプロジェクト紹介は、「NASAは素晴らしいデータをたくさん開示してくれているし、data.nasa.gov のサイトにAPIも存在するが、データセットのメタデータを読むための API しかなくて、データ自体にアクセスするための API がない。これでは、アプリ開発者たちにとっては、NASA のデータにアクセス出来ない。だからアプリ開発者がちゃんと使える API とはどういうものかを、俺達が Open Data API の設計をしてやろう」というもの。飛べない豚は、ただの豚だ。使えないデータも、ただのデータにすぎない。使えないデータを使えるようにすることによって、たくさんのイノベーションが生まれる。API を公開する、もしくは PDF ではなくデータの形で公開する。。。ということが政府側で増えてくれると、色々変わると思います。

同様の事例として、NASA ハッカソンの東京会場の Crater API チームがあります。NASA のクレーターのデータが使いにくいので、アプリ開発以前の問題として、まずはクレーターのデータの API を作って、みんなが使いやすいようにしようと。その上で、自分達もアプリを作ろうと。APIを作る以前は、「使えねー」だったのが、APIを作ることで、たった2日のハッカソンで、あれやこれやのアプリが作られました。例えば、好きなクレーターを選んでいくと、あなたにぴったりなクレーターを表示してくれる、クレーター版の hot or not とか。クレーターについてのクイズアプリとか。無意味に UI が美しすぎる、クレーターと戯れるための iPhoneアプリとか。クレーターの写真を加工してくれるクレーター版のInstagramとか。月のクレーターの緯度経度の位置を「地球だったら同じ緯度経度はどこにあたるのか」を元に表示してくれる Android アプリとか。クレーターの名前から、イメージに合う音楽を YouTubeから探してきてくれるサービスとか。鬼のように開発しまくり、そして題材がクレーターなので、おそらく何一つ役に立たない(笑)。だけど、これがすごく役立つデータだったら、どうでしょう。データがマシンリーダブルではないことで蔵に入っちゃっている状態と、データが扱いやすくなることでこんなにたくさんのアプリやサービスがたった2日で開発されちゃう状態を明らかにしてくれる非常によい例だったと思うのです。




まあこの話はいくらでも書き続けられそうなので、このへんで切ります。重要なのはひとつだけ。政府のオープンガバメントを推進している皆さん、ユーザビリティと、データのマシンリーダビリティと、データのライセンスが重要なんで、そこのとこ、日本の未来の為に、ぜひよろしくお願いします。

Disclaimer このブログは山崎富美の個人的なものです。ここで述べられていることは私の個人的な意見に基づくものであり、私の雇用者には一切の関係はありません。