重複した行をカウントしない
こんにちは。Deckです。
今回はQlik Senseでデータ分析をする際の「重複する値を取り除くにはどうすればよいか?」という疑問を解説します。
例えばこのようなデータを見てみましょう。

上はとある学校祭の予定ですが、場所や催し物にいくつか重複がありますね。
QlikViewを使い、重複する値を取り除いてみましょう。
サンプルデータはこちらからダウンロードできます。
データの準備
新規アプリを作成し、ロードスクリプト編集画面から「テーブル ファイル..」をクリックします。

ファイルを選択し、「開く」をクリックします。

単一項目のテーブルを読み込む際のDistinct
まず、読み込む項目が1つだけのLOAD文を作ってみましょう。
データのプレビューで「催し物」のみ選択して「終了」をクリックします。

生成されたスクリプトの画像の位置にDistinctを追加します。

Distinctは重複しているデータをそれぞれ1回のみ読み込みするようにする指定です。
今回のサンプルデータでは取り込みが以下のように行われます。

重複している行は1回だけ読み込まれるため、テーブル ビューワで確認するとDistinctをつけてロードした場合はとDistinctをつけない場合と比べて件数が異なっていることがわかります。

複数項目のテーブルを読み込む際のDistinct
では、複数の項目を読み込むLOAD文ではどうなるかを見てみましょう。
先ほどのLOAD文を次のように修正します。

データ ロード エディタでLOADに続くDistinctは読み込まれる項目全体が重複しているかをチェックするため、一部分のみが重複する行は省かれずに読み込みが行われます。

データ ロード エディタで使われるDistinctの解説は以上です。
次回の記事ではシートで使われるDistinctの説明をします。