2012年11月11日日曜日

オバマ再選メモ

Election 2012: where do Obama, Romney, Johnson, and Stein stand on tech issues?

各政策カテゴリーについて各候補者の取る立場を数行でサマリー。



New York Times: Paths to the White House

これ、実に素晴らしかったんですが実際は最初の分岐のフロリダが最後まで決まらなかった件。いや、いずれにせよわかりやすい。



Google Politics and Elections

よく見られていたのはこれかな。



まあでもこういうのも問題にはなっている。



●New York Times Presidential Network Calls

忘れられない開票当日のスクリーンショット。APェ。。。



Inside the Secret World of the Data Crunchers Who Helped Obama Win

But from the beginning, campaign manager Jim Messina had promised a totally different, metric-driven kind of campaign in which politics was the goal but political instincts might not be the means. “We are going to measure every single thing in this campaign,” he said after taking the job. He hired an analytics department five times as large as that of the 2008 operation, with an official “chief scientist” for the Chicago headquarters named Rayid Ghani, who in a previous life crunched huge data sets to, among other things, maximize the efficiency of supermarket sales promotions. 

今回の選挙運動本部長 Jim Messina は統計情報重視で行うことを最初から宣言していた。「今回の選挙では全てを数値化する」とし、分析チームの人員を5倍に増やし、 “chief scientist” としてデータ分析のプロ Rayid Ghani を採用。Rayid は大規模データを分析することを専門としており、例えばデータからスーパーマーケットのセールスプロモーションの効率最大化などの仕事をしてきた人物。

前回の選挙ではぐちゃぐちゃだったデータベースを統合し、それらを資金調達(その額10億ドルに及ぶ)に利用。「どのようなタイプの人にどのようなアピールをすればどういう効果が期待できるのか」をテストし、予測に使い、"persuadability" 〜説得可能性〜を元に、リストをランク付けしていった。意思決定要因の 75% は基本情報(年齢、性別、人種、どういう地域に住んでいるか、そして投票履歴)によるものだとわかった。2008 年の選挙と比べて、今回は「モデリング」が効率化に大きな役割を果たした。どんな人がオンラインで投票するのかの予測。ボランティアをしそうな人のモデリング。

憶測で行動するのではなく、数値のバックアップを重視。2008年のキャンペーンMLに参加していたのにその後MLをやめてしまった人達を呼び戻すためにもまずはいくつかのグループでテスト。中央から連絡が行くのと、その人が住んでいる地元のボランティアから連絡が行く場合の結果を比較してから実施。

資金調達の事務局からのメールも、タイトル、送信者名、メッセージ内容を変えて、どの組み合わせが最も多くのお金を集めたかを集計。春頃にはMichelle Obamaからのメールが集金を集めることがわかり、時にはキャンペーンマネージャの Messina の方が副大統領の Joe Bidenよりも多く集めることも。トップパフォーマーは他の人の10倍も集金に貢献する。

ドアノックの代わりに Facebook が使われた。Facebook 友だちから何かリクエストがあった場合、「知っている人から来たメッセージだから」 5 人に 1 人は何かアクションを取っていることがわかった。

どこに選挙広告を出すかも、外部のメディアコンサルタントに任せるのではなく、データから導き出した。「35歳以下のマイアミの女性がターゲットなら、この番組とこの番組にテレビCMを出す」こうしてテレビ広告を14%効率的に出稿することができたという。(この14%の根拠は記事には詳細を書いていないので調べたいものだが)

It’s another sign that the role of the campaign pros in Washington who make decisions on hunches and experience is rapidly dwindling, being replaced by the work of quants and computer coders who can crack massive data sets for insight. As one official put it, the time of “guys sitting in a back room smoking cigars, saying ‘We always buy 60 Minutes’” is over. In politics, the era of big data has arrived. 

ワシントンの「選挙のプロ」が勘と経験に基づき意思決定をしてきた時代は終わりに近づき、大規模データから知見を取り出せる分析の専門家やコンピュータコーダーに取って代わられる。「60 Minutesの広告をいつも買っていればいいのさ」とタバコを燻らせながら座っていればいい時代は終わった〜アメリカの政治では、ビッグデータの時代がやってきた、と記事では結ばれている。日本はどうかな。

Triumph of the Nerds: Nate Silver Wins in 50 States

Nate Silver が全ての州での当落を当てたという話。Nate は数々の数値(色々な世論調査の結果を規模や質、時期などの要素によって重みづけ)や過去の選挙データなどの膨大なデータを元に、予測を行なっている。



彼の FiveThirtyEight ブログはこちら。選挙が終わると、今度はどの世論調査の結果が適合率が高かったかを検証している。"Which Polls Fared Best (and Worst) in the 2012 Presidential Race"。。。当然だ、これが彼の商売道具なのだから。いわく、オンライン調査や電話調査はかなりいい結果を出している。調査会社の結果が間違っている場合のバイアスの要因、間違いの振れ幅などを更に分析している。

例えば Pharos Research Group の調査なんかは、やってることもおかしいし due-diligence のための質問にも答えられない状態だったので FiveThirtyEight の集計からはそもそも外されていた。そして蓋をあけてみたら、やはり結果は外れていた。

著名調査会社 Gallup の結果が一番下の大ハズレで、ちなみに二番目に Google の Consumer Survey が入っている。



Tech Crunch の記事でもNate Silverのことを取り上げている。

Pundit Forecasts All Wrong, Silver Perfectly Right. Is Punditry Dead?
大統領選でニューヨークタイムズのネイト・シルバーの数理モデル予測が全50州で的中―政治専門家はもはや不要?


まあ、正直これ> It's Time to Grade Pundit Predictions も乱暴すぎてあれですが(そもそもどっちが勝つか間違ってても、数字が大きく違ってても小さく違ってても全部赤字で WRONG の一言。。。w)


で、Nate の方が政治評論家よりも当たる。だったら彼にテレビの選挙番組に出てもらえばよいかというとそうは問屋がおろさない。

いわく、テレビ局が政治評論家に政治番組の出てもらえれば視聴者がわかるが、Nate のことを視聴者に理解させるには数学の素養や統計の知識が必要になり、かつそんな番組は視聴者が飽きてしまうのではないかと。また、予測モデルは安定しているため、ショッキングな選挙予測で視聴率を取りにいけない。

Why Big Data Falls Short of Its Political Promise

これは選挙前の記事だけれど。

Big Data は選挙においてとても役に立つ物ではあると思うが、人間はデータなんかよりずっと非論理的な生き物で、予測しにくく、非合理な物なんだよ、という話。Atomic Fallacy〜仮に環境団体のTwitterアカウントをフォローしてたからといってKeystone pipelineの政策でロムニーに投票を決めるとは限らない。Interruption Fallacy〜ビッグデータを元にターゲティングされた広告があまりに多くてスパムになったり気持ち悪くなっていったり、広告効果の低下につながっていく。Narrative Fallacy〜選挙は個々の政策ではなく、それらを包括したストーリーやイメージ、大きな構造で決まっていく物、など。

まあその非論理性も非合理も予測しにくさも全部当たり前で、それがあるのをわかった上でやってるのが Jim Messina や Nate Silver なんだけどね :)

The Economist : The remaking of the president

。。。まーそうなるわな。。。


ちなみに今年の SF Pride (サンフランシスコのゲイパレード)を見に行ったのだけれど、ゲイの皆さんはオバマ支持で団結しているようでした。下記は LGBT for Obama チームのパレード。

SF Pride


データ民主主義って、知っていますか?~グーグルの壮大な「試行錯誤型」経営
2008年、グーグルでプロダクトマネジャーを務めていたダン・シロカーは、グーグルを休職してバラク・オバマ(2009年初から第44代アメリカ合衆国大統領)の選挙キャンペーンに加わることになりました。 その2週間前、オバマがグーグル本社で講演したときの「私は、事実やデータに基づく選挙戦をやりたい。だから、エンジニアのみなさんの助けが必要だ」に惹かれた(*1)のです。 
ネット広報を担当したシロカーはまず、目標となる指標を定め(「オバマWebサイトへの訪問者数」→「Webサイトへの登録者」→「メールマガジンの登録者数」→「寄付金の額」など)、施策の効果を数字で測定し、その改善を図り続けました。結果として、シロカーは「Webサイトへの登録率40%増、メールアドレス300万件増、ボランティアの30万人増、寄付金6000万ドルアップ」に貢献した(*2)といわれています。それを支えたのが、彼がグーグルで経験していた「A/Bテスト」です。
オバマさんに惹かれて Google を休職して手伝いに行ってしまった人は多いらしいですね。

Harper Reed の選挙当日の写真には Eric Schmit の姿も。

で、2010年のちょっと古い記事ですが、上記記事のダンが書いたブログ記事が下記。

How Obama Raised $60 Million by Running a Simple Experiment


どのボタン、どの写真、どんな組み合わせが一番よいのか。



こうしたダッシュボードで検証していた。




で、ダンは結局この A/B テストをするのを事業化して、Optimizely という会社を作っている。2012年現在でもオバマ陣営は Optimizely を使い続けているので、ある意味すんげー規模の一ユーザー、データソース、インパクトを持ったお客さんとすんげー規模の実験をし続けられる環境にダンはいるわけだ。

100,000 Experiments Later, Optimizely Surpasses Omniture Test&Target to Become #1 Website Optimization Platform

で、このスタートアップについて CNN 等のメディアも取り上げている。

●CNN Obama campaign opens Silicon Valley field office

Felsen estimates that the sophisticated tests helped the campaign raise an extra $75 million dollars. "Because it worked so well, that's the kind of thing the Obama campaign is doubling down on now," says Felsen, who is now a freelance digital strategist and speaker. "Everything they do is going to be highly rigorous and scientific."
ある意味、どんな広告より強力な広告。

オバマ大統領の再選を勝ち取ったITチームは、どんなメンバーで構成されていたのか?
PublicKeyさんの記事。どんな経歴の、どんな人達を、どういうメンバー配置で構成していたのかを明らかに。

●チームオバマの CTO を務めた Harper Reed と彼のチームの活躍についての記事3連発:
 ●Built to win: Deep inside Obama's campaign tech How Obama's tech team built a "force multiplier" with Amazon and a narwhal.
 ●When the Nerds Go Marching In
 ●Inside the Obama Campaign's Hard Drive

使われたダッシュボードの動画



そして企業もその勝利の方程式をほしがる。
Corporations Want Obama's Winning Formula

●おまけ

バラク・オバマ米大統領、再選のスピーチ 英語全文
バラク・オバマ米大統領、再選のスピーチ 全文和訳

「2分半でわかるオバマ大統領の再選スピーチ」




Disclaimer このブログは山崎富美の個人的なものです。ここで述べられていることは私の個人的な意見に基づくものであり、私の雇用者には一切の関係はありません。