RMT-WM
RMT-WM

ROアンケート集計番外編,アンケートデータの裏の裏


   ラグナロク RMT ご存じのように,4Gamerが盆と正月に行っている特大プレゼント企画では,かなり長大なアンケート項目が用意されている。ほとんどが記入必須であり,とくに前回のアンケートは一段と項目数が増えていたので,応募された人の中には,なんでここまでデータを取るのかと疑問に思っている人もいるかもしれない。

  アンケートデータの集計には簡単なデータマイニングツールが使用される。画面のような感じのツールで,個人情報(といってもIPアドレスとメールアドレスだけだが)と自由記入部分を抜いたCSVファイルを読み込ませると,ささっと集計結果を表示するものだ。

  同じような項目列が二列あるのは,2条件での絞り込みや相関などを見るためで,図のように興味のある分野と誕生年を指定して「音楽/CD」とかをクリックすると,「音楽/CD」に興味がある人の年齢別集計が出てくる。このあたりの使い方で出てきたデータはすでに公開されているので,ここではもうちょっと突っ込んだ話をしていこう。

  ※オンラインゲームプレイヤーに関する考察記事は「こちら」からどうぞ

  ※ハードウェア&OSに関する記事は「こちら」からどうぞ

  RO RMTさて,先ほどのグラフの山を見て「このへんの年代は音楽に興味を持ってる人が多いなあ」と能天気なことをいっていてもしかたない。単に年齢分布が多いだけで,関心が低めであっても同じような結果が出てくる。で,このツールには全体の投票数分布と投票傾向からどの程度多いかを探る機能もつけられている。それを利用して,興味の全体傾向から,「相関度(このツール独自の算出方式なので注意)」が2以上のケースのみを表示してみたのが次の表だ。ざっと,普通にあるばらつきと比べて2倍以上の分布が確認された項目がピックアップされていると思っておけばよい。

  家電製品/オーディオ 2.55 1947年

  アウトドア 2.44 1964年

  アウトドア 2.41 1961年

  アウトドア 2.37 1962年

  アウトドア 2.15 1966年

  演劇/コンサート 2.13 1960年

  このようにして,アンケートデータ+ブラウザ情報など45項目の間で相互に相関関係を抽出して見ることが可能になっている。全体的な傾向は個別の集計で確認するのがよいが,そのデータだけでは見えてこない「傾向」を探るのが今回の趣旨である。以下では,総計,45×45=2025通りの分析結果のなかからいくつか面白そうなものをピックアップして紹介していこうRMT

twitter facebook google 0は参加なら

関連記事