2011年12月12日月曜日

ソースを読むこと。データを読むこと。

2010年に書いた妄想ブログ「国会についての妄想」。Rathergate 事件とか懐かしいですね。テレビのニュース番組内での米大統領についての報道について、アメリカのブロガー達がそれって嘘じゃない?と気づいて検証を始めてアンカーのダン=ラザー降板、番組終了に。。。という事件。で、当時はこれを例にとって、政府やマスコミはもっと情報をオープンにして、情報クリーニングを国民にアウトソースしてはとか妄想しておりました。

ところで今日 Google+の方にも書いていたのですが、現代に放射線測定器「文科省は数値改ざんを要求してきた」という記事があります。

市民が政府の言うことを全て信じる脳みそになっちゃいけないと思うので、マスコミがちゃんと真実を突きにいくのはとてもよい。ただ、市民はマスコミを全て信じるマスコミ脳にもなっちゃいけない。ちゃんと頭を使おうよと。

現代の記事には「米国製の測定器は、他の測定器と比べて数値が高く表示されるので、数値を修正した」とあり、これは普通にありうる話で、測定器による数値のブレは今までも何度も指摘されている。だけど、だからといって正しい「数値修正」が行われていたのかどうかはわからない。だから検証しなきゃいけない。政府がこう言ってるから安全というのも、政府が信用できないからマスコミを信じようというのも思考停止の一歩。

さて、岩崎直木さんの 3/12 の Buzz によると、文科省原子力安全課の環境防災 N ネットというサイトがあって、原子力施設周辺の環境モニタリングデータを掲載するサイトになっている。岩崎さんがここの放射線の観測をしているページの気になる辺りをチェックしたところ、全部「調整中」になっている。

スクリプトを見ると

} else if (parseInt(data.value) >= dangerous_threshold || (data.value < 0)) {this.tdTag2.innerHTML = '調整中';

これは「危険な閾値を超えたら,'調整中'と出す」ようになっているように見える、と。

まあやばい値が出たら検証せずに自動で出すのは危険なので一旦検証。。。となっているのかもしれませんが、 当然市民にデータが来るのは遅れます。というか、もう 9 ヶ月もたつのに調整中のままなのか。しびれるなあ。 で、ここから宮城についてはここを見ろということで飛ばされる先がこちら。このページは更新を停止したので更にこっちに行けと飛ばされる先がこちら。やっとここで 12 月 12 日現在のデータが見られるようになっている。最初からここに飛ばせばいいのにと思うのは私だけ?(修正:私が英語ページに飛ばされたのは環境の問題らしい。)

環境防災 N ネットでは、最新の状態はここから取得できるものの、-999という不正な値が返っているようです。なるほど。サイトに「調整中」って書いてあるーとそこで終わっていた自分は思考停止で、一歩学ぶためにはここを読めばいいのか、と。"Follow the source, Luke"と Tim Bray 先生も仰っている。

ソースを読め。」それが今後のリテラシーなのかもしれない。

'pref_name':'青森県', 'pref_name_en':'Aomori', 'rsd':'0.3330E+02', 'value':'33', 'name':'三沢市 三沢市役所', 'furigana':'みさわし みさわしやくしょ', 'name_en':'Misawa City hall Misawa City'}}}, '2':{ 'site':'3', 'area':'宮城県', 'area_en':'Miyagi', 'value':'-999', 'station':'石巻市 小積(いしのまきし こづみ)', 'name_en':'Kodumi Ishinomaki City', 'plant':'女川原子力発電所', 'plant_en':'Onagawa Nuclear Power Station', 'url':'jichitai/miyagi/index.html', 'url_en':'speedi/statichtml/display_data_04.html', 'pref_data':{ '0':{ 'site_id':'3', 'pref_id':'4', 'pref_name':'宮城県', 'pref_name_en':'Miyagi', 'rsd':'-999.0', 'value':'-999', 'name':'石巻市 小積', 'furigana':'いしのまきし こづみ', 'name_en':'Kodumi Ishinomaki City'}}},

更に岩崎さんのこのサイトの検証が続きます。

「追加で2011/09/30にいくつかコードの変更があって,"注意"と出すところは

//if ((parseInt(data.value) >= attention_threshold)) { // MOD @20110930
if ((parseInt(data.value) >= attention_threshold) && attention_threshold / 1 != 9999) {

に変わっており、この変更によって、今までよりも即座に (JavaScriptの変更なしに) 実際に危険な値が原因で"注意"と表示されている領域を"調整中"に変えることができるようになったというもの。が、そもそも今のところ閾値が非常に高く設定されているので、どんなに放射線の量が増えても"注意"と出ることはない。」

うーん、何のためのサイトなのか。。。(^^;;

。。。みたいなことを、ちゃんと検証することが重要なのだと思います。なので、岩崎直木さん++とここでもお伝えしておきます :)

市民がこういう検証がちゃんとできるようにするためにも、政府とマスコミは情報公開を。そしてマスコミと市民はデータの読み方を学ばなければいけませんね。あ、これは Open Research Forum での村井先生と Joi のセッションでも言ってましたね :)

見損ねた方はここから動画が見られますよ。お勧めですよ!

当時のメモ:

Joi が今やっている「SafeCast」は、みんなで放射能データを測ろうというプロジェクト。10 台のガイガーカウンターを買ったけれど全然足りないので DIY でガイガーカウンターを作り始める動きも。村井先生は以前から車のワイパーの動きで雨の一滴目を把握しようとするなどのプロジェクトをしてきた。こうやって二人とも"Scanning the Earth"〜地球上のデータをスキャンして有用な情報として人々の手に渡るようにする活動をしてきました。というわけで「Scanning the Earth」というのがこの時のセッションタイトルでした。

※ちなみに Safecast は Kickstarter で資金調達をおこない、5 週間で 4 万ドル調達したそうです。

Joi: 福島の原発事故の後、放射能のエキスパートで、スリーマイル島の事故の時もコンサルをしていた Dan Sythe が来日。そんなエキスパートを含む外人だらけのチームで福島を訪問し、福島の人達に放射能やガイガーカウンターについて教えていった。すると、福島の人達が「今度海外で原発事故が起きたら福島から来ましたと言って手伝いに行く」と言ってくれた。こうやって Citizen Science が広がっていく。

情報公開について:

村井先生:文科省から放射能のデータが出て来るのが時間がかかり、しかもそれが FAX で来るので machine readable ではなかった。デジタルデータでくれとお願いして、やっと Excel で出してくれるようになったが、それもヘッドラインが日本語で日本人にしか理解できないものだった。

Joi: 「文科省がデータを出しているのに、なぜ君たちはデータを作るのか」と聞かれる。放射能のデータは、細かく取らないと意味がない。 福島原発から距離が近くても数値が低いところも、遠くても数値が高いところもある。数メートルの差で数値が異なる。文科省のデータでは足りず、もっと細かく取る必要がある。

今回は、医療データと放射線のデータを一緒に解析する初めての機会。放射能の医療へのインパクトのデータを 研究所の中で囲っておかず、シェアすべき。 (もちろんプライバシーには配慮した上で)

学術ジャーナルも著作権保護されている。情報をシェアすべきでは?

知的財産とは、自然には起きないイノベーションを起こさせるために生まれた物のはずなのに、今はお金儲けのためのツールになっており、逆にクリエイティビティを阻害している。

東洋医学は長い歴史でその効果を証明して来たが、漢方の複雑な組み合わせの影響をネットを使えば、大量データを集めてネットで解析することで、時間をかけずにわかるようになるかもしれない。

また、文科省はオープンにしている「つもりの」データでも、使えなければ意味がない。アメリカで Open Data をやっている(元マイクロソフトの)Ray Ozzieですら読めなかった。読めない/使えないデータをいくら出しても意味がない。

データを読む力の重要性について:

データサイエンスの知識を持つ人達が少ないので、データが出されても、それを読み取る力を持っている人が少ないという問題もある。

データサイエンス/統計学がわからない人が政策や法律を作るのは間違い。メディアと政策を作る人に技術者を送り込まないと、わからない人が作ったポンコツの政策が出て来てしまう。原発事故が起きた時に原子力安全・保安院の人が「僕は文系なのでわからない」と言ったらしいが、数値/データがわからない人がリスクマネジメントをする地位についていること自体が間違い。文系でも理系でも構わないが、データをきちんと読める人間でないと困る。

また、プロは普通の人にちゃんと説明できるようにすべき。医者が患者に詳しい医療データを教えない。学会で学者同士にしかわからない説明しかしない。お坊さんが「あなたにはわからないから説明しない」とか言う。説明スキルの低さをひけらかすのではなく、説明力を上げるべきではないか。SafeCastの放射能データに対して、プロが「素人なデータを出すな」と言って来たこともある。

また、ジャーナリストがデータを読めないという問題もある。データを読めないので、読める人を呼んで来てデータを読んでもらって記事を書く。それじゃダメ。ジャーナリストなら自分でデータを読めるようになるべき。

学生さんへのメッセージ:
学ぶことが今はとても重要。大学にいなくても、学びなさい。大学にいたら、学位を取るためではなく、資格がないと仕事がないとかそういうことではなく、ちゃんと学ぶべきことを学びなさい。

Disclaimerこのブログは山崎富美の個人的なものです。ここで述べられていることは私の個人的な意見に基づくものであり、私の雇用者には一切の関係はありません。