LinuCエヴァンジェリストの鯨井貴博@opensourcetechです。
今回は、BI/データ分析ツールである「Tableau public」を使ってみます。
まず、以下でメールアドレスを登録して、Tableau publicをダウンロードします。
https://public.tableau.com/ja-jp/s/
そして、インストール。
インストール後、起動。
直感的でわかりやすいUIですねw
リソースメニューから、サンプルデータが取得します。
試しに、FIFA World Cup Match Resultsを取得。
※1930年の第1回サッカーワールドカップから2014年のブラジルまでの結果データセット
そして、Tableau publicで「Microsoft Excel」からデータを開きます。
続いて、左にある3つのテーブルから「WorldCupMatches」を右側へドラッグ。
すると、テーブルに含まれるデータが表示されます。
画面下部にある「シート1」をクリックし、グラフ化するペインに移動します。
左にある「Year」を行へ、「WorldCupMatches(カウント)」を列へドラッグします。
すると、大会毎の試合数がグラフで表示されます。
グラフ内のプロットされた点にマウスポインターを持っていくと、データの詳細が表示されます。
で、ここでちょっと違和感が。
2014年ブラジル大会って、80試合もあったかな。。。
いや、64試合だべ!!!!!!!
まぁ、データの間違いはあとで探すとして、とりあずTableauを引き続き使っていきます。
上部にある「マークラベルの表示」をクリックすると、各データ値が表示されます。
表示形式から様々なグラフに変更できます。
※変更できないものは、グレイになっている。
左側の「WorldCupMatches(カウント)」をマークペインのラベルにドラッグします。
すると、開催年だけではなくデータ(試合数)が追加されます。
マークペインの色から表示する色の編集が可能です。
おまけ(2014Brazil大会の試合数が違った原因)
以下がデータ元なのですが、ベスト16以上の試合が重複してました。
https://data.world/sportsvizsunday/sports-viz-sundays-2018/workspace/file?filename=World+Cup+Results.xlsx