Power BI Desktop クエリ エディターでは、統計学者、データ科学者、データ分析官によって広く使用されているプログラミング言語、R を使用できます。 R とクエリ エディターを統合することで、R によるデータ クレンジングを実行したり、データセットで高度なデータ シェイプ/データ分析 (失ったデータを埋める、予測、クラスター化など) を実行したりできます。 R は高度な言語であり、クエリ エディターで使用し、データ モデルを用意したり、レポートを作成したりできます。
R をインストールする
クエリ エディターで R を使用する
クエリ エディターで R を使用する方法を示すために、ある株式市場のデータセットを例として使用します。これは .CSV ファイル形式であり、ここからダウンロードし、ご利用いただけます。 この例の手順は次のようになります。
最初に、Power BI Desktop にデータを読み込みます。 この例では、EuStockMarkets_NA.csv ファイルを読み込みます。 Power BI Desktop の [ホーム] リボンで [データの取得]、[CSV] の順に選択します。
ファイルを選択し、[開く] を選択します。CSV が [CSV ファイル] ダイアログに表示されます。
読み込まれたデータは、Power BI Desktop の [フィールド] ウィンドウに表示されます。
Power BI Desktop の [ホーム] タブで [クエリを編集] を選択し、クエリ エディターを開きます。
[変換] タブで、[R スクリプトを実行する] を選択します。[R スクリプトを実行する] エディターが表示されます (次の手順の画像を参照してください)。 行 15 と行 20 にデータが欠けています。画像では確認できませんが、他にもデータが欠けている行があります。 このような行のデータを R で自動的に補完する方法を以下に示します。
この例では、次のスクリプト コードを入力します。
library(mice)tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)completedData <- complete(tempData,1)output <- datasetoutput$completedValues <- completedData$"SMI missing values"
注: 前のスクリプト コードを正しく動作させるためには、R 環境に mice ライブラリをインストールする必要があります。 mice をインストールするには、R のインストールで | > install.packages('mice') を実行します。
[R スクリプトを実行する] ダイアログに入力するコードは次のようになります。
[OK] を選択すると、クエリ エディターにデータ プライバシーに関する警告が表示されます。
Power BI サービスで R スクリプトを正しく動作させるためには、すべてのデータ ソースを [パブリック] に設定する必要があります。 プライバシー設定とその意味に関する詳細については、「プライバシー レベル」を参照してください。
パブリックに設定すると、フィールドに completedValues という新しい列が表示されます。 行 15 や行 18 行など、いくつかの行でデータ要素が不足しています。 次のセクションでは、R がデータ要素の不足を処理するしくみを確認します。
注意
わずか 5 行の R スクリプトで、クエリ エディターは予測モデルで不足値を埋めました。
R スクリプト データからビジュアルを作成する
これで、R スクリプト コードと mice ライブラリで不足値を補うしくみを示すビジュアルを作成できます。次の画像のようになります。
そのビジュアルが完成したら (Power BI Desktop 他のビジュアルを作成すると、さらに効果的な場合もあります)、Power BI Desktop ファイルを保存し (.pbix ファイルとして保存)、Power BI サービスでデータ モデル (R スクリプトが含まれる) を使用できます。
注: 以上の手順を完了した .pbix ファイルをご覧になる場合は、 上記の例で使用されている Power BI Desktop ファイルの完成したものをここからダウンロードできます。
.pbix ファイルを Power BI サービスにアップロードしたら、さらにいくつかの手順を実行し、(サービスで) データ更新を有効にし、サービスでビジュアルの更新を有効にする必要があります (ビジュアルを更新するには、データが R にアクセスする必要があります)。 追加の手順は次のとおりです。
データセットの定期更新を有効にする - データセットを含むブックを R スクリプトで定期的に更新する方法については、「スケジュールされた更新の構成」を参照してください。Personal Gateway に関する情報もあります。
Personal Gateway をインストールする - ファイルが置かれ、R がインストールされているコンピューターに Personal Gateway をインストールする必要があります。Power BI サービスは、そのブックにアクセスし、更新されたビジュアルがあれば、それを再レンダリングできなければなりません。 Personal Gateway のインストール方法と構成方法については、他にも情報を参照できます。
制限事項
クエリ エディターで作成された R スクリプトを含むクエリにはいくつかの制限事項があります。
R データ ソース設定はすべて、[パブリック] に設定する必要があります。クエリ エディターで作成されたクエリの他の手順もすべてパブリックにする必要があります。 データ ソース設定にアクセスするには、Power BI Desktop で、[ファイル]、[オプションと設定]、[データ ソース設定] の順に選択します。
[データ ソース設定] ダイアログで、データ ソースを選択し、[アクセス許可の編集...] を選択し、[プライバシー レベル] が [パブリック] に設定されていることを確認します。
R のビジュアルやデータセットの定期更新を有効にするには、スケジュール更新を有効にし、ブックが置かれ、R をインストールしているコンピューターに Personal Gateway をインストールする必要があります。 それぞれの詳細な情報については、この記事の前のセクションにリンクがあります。
R とカスタム クエリを利用すれば、さまざまなデータ表示が可能です。いろいろ試してください。