BigQuery

BigQuery

【BigQuery】DATE_DIFF()で日付の差分から経過日数を計算する

BigQueryで日数を計算する _diffで第1引数と第2引数の差を日/月/年単位で集計することが可能です。 TIMESTAMP_DIFF(date1, date2, DAY) TIMESTAMP_DIFF(...
BigQuery

【SQL/BigQuery】分析関数で移動平均を集計する

SELECT 日付, 値, AVG(値) OVER (ORDER BY 日付 ROWS BETWEEN 3 PRECEDING AND 3 FOLLOWING) AS 移動平均 FROM (日付ごとに値...
BigQuery

【BigQuery】日付データを月単位、年単位に変換する

こんにちは、ミナピピン(@python_mllover)です。今回は自分用のBigqueryで日付のデータを月単位や年単位で集計したいときのメモになります。 DATE_TRUNC()で日付/月/年の単位変換 ...
BigQuery

【BigQuery】分析関数を使って獲得ポイントでユーザーを順位付けする

こんにちは、ミナピピン(@python_mllover)です。仕事でよくイベントのログからユーザーごとのイベント獲得ポイントを抽出し順位付けをすることがあるので、今回はその時に使うクエリをメモしておこうと思います。 サンプ...
BigQuery

【BigQuery】LAG関数とLEAD関数で前後のデータを同じ行にスライドさせる

こんにちは、ミナピピン(@python_mllover)です。ソシャゲの分析をしているとユーザの課金前後の行動を1つの行にまとめて順序ごとにクラスタリングして、クラスターごとの課金傾向や課金要因を分析したいときなんかがあります。そん...
BigQuery

【SQL/BigQuery】ユーザー単位のN日後継続率を集計する

こんにちは、ミナピピン(@python_mllover)です。たまに仕事でN日後継続率を集計することがあるので、次からコピペですぐできるようにメモしておきます。 データを用意 <table1>...
BigQuery

【BigQuery】日付データの加算・減算処理

こんにちは、ミナピピン(@python_mllover)です。今回はBigQueryでの日付データの加算・減算の関数について自分用にまとめておこうと思います。日付の加算・減算は、UTC⇒日本時間への変換やN日後継続率などのK...
BigQuery

【Python】pandas-gbqを使ってbigqueryのテーブルを呼び出す

こんにちは、ミナピピン(@python_mllover)です! 前回以下の記事でPythonからBigqueryでのテーブル操作のやり方について紹介したのですが、ちょっと使い勝手が悪く、もっといい方法はないか探したとこ...
BigQuery

【Python】GCPのBigQueryを「google-cloud-bigquery」を使って操作する

こんにちは、ミナピピン(@python_mllover)です。今回はPythonからGCPのBigqueryにアクセスしてテーブルの作成からデータの挿入、呼び出すまでを一通り紹介していきたいと思います。 PythonからG...
BigQuery

【SQL/BigQuery】ROW_NUMBERでグループごとに順番・順位を付ける

こんにちは、ミナピピン(@python_mllover)です。今回は分析関数を使用したSQLによる高度な集計方法について解説していきたいと思います。これができればわざわざPythonとかRでデータフレームを処理しなくていいのが大きな...
タイトルとURLをコピーしました