Opensourcetechブログ

OpensourcetechによるNGINX/Kubernetes/Zabbix/Neo4j/Linuxなどオープンソース技術に関するブログです。

BI/データ分析ツール Tableau publicを使ってみる


LinuCエヴァンジェリストの鯨井貴博@opensourcetechです。


今回は、BI/データ分析ツールである「Tableau public」を使ってみます。

まず、以下でメールアドレスを登録して、Tableau publicをダウンロードします。
https://public.tableau.com/ja-jp/s/
f:id:opensourcetech:20200915143744p:plain:w300


そして、インストール。
f:id:opensourcetech:20200915143832p:plain:w300

f:id:opensourcetech:20200915143923p:plain:w300

インストール後、起動。
直感的でわかりやすいUIですねw
f:id:opensourcetech:20200915144036p:plain:w400

リソースメニューから、サンプルデータが取得します。
試しに、FIFA World Cup Match Resultsを取得。
※1930年の第1回サッカーワールドカップから2014年のブラジルまでの結果データセット
f:id:opensourcetech:20200915144228p:plain:w400


そして、Tableau publicで「Microsoft Excel」からデータを開きます。
f:id:opensourcetech:20200915144036p:plain:w400
f:id:opensourcetech:20200915144439p:plain:w400

続いて、左にある3つのテーブルから「WorldCupMatches」を右側へドラッグ。
すると、テーブルに含まれるデータが表示されます。
f:id:opensourcetech:20200915145102p:plain:w400

画面下部にある「シート1」をクリックし、グラフ化するペインに移動します。
f:id:opensourcetech:20200915145329p:plain:w400

左にある「Year」を行へ、「WorldCupMatches(カウント)」を列へドラッグします。
すると、大会毎の試合数がグラフで表示されます。
f:id:opensourcetech:20200915151436p:plain:w400

グラフ内のプロットされた点にマウスポインターを持っていくと、データの詳細が表示されます。
f:id:opensourcetech:20200915151719p:plain:w400

で、ここでちょっと違和感が。
2014年ブラジル大会って、80試合もあったかな。。。
いや、64試合だべ!!!!!!! f:id:opensourcetech:20200915151908p:plain:w400

まぁ、データの間違いはあとで探すとして、とりあずTableauを引き続き使っていきます。
上部にある「マークラベルの表示」をクリックすると、各データ値が表示されます。
f:id:opensourcetech:20200915153803p:plain:w300

表示形式から様々なグラフに変更できます。
 ※変更できないものは、グレイになっている。
f:id:opensourcetech:20200915164506p:plain:w300

左側の「WorldCupMatches(カウント)」をマークペインのラベルにドラッグします。
すると、開催年だけではなくデータ(試合数)が追加されます。
f:id:opensourcetech:20200915165932p:plain:w300

マークペインの色から表示する色の編集が可能です。
f:id:opensourcetech:20200915170220p:plain:w300
f:id:opensourcetech:20200915170333p:plain:w300



おまけ(2014Brazil大会の試合数が違った原因)
以下がデータ元なのですが、ベスト16以上の試合が重複してました。
https://data.world/sportsvizsunday/sports-viz-sundays-2018/workspace/file?filename=World+Cup+Results.xlsx

Opensourcetech by Takahiro Kujirai