Python

【Python】statsmodelsで時系列データの基本的な前処理をやってみる

こんにちは、ミナピピン(@python_mllover)です。Pythonのライブラリである「statsmodels」を用いて時系列データでの基本的な前処理を実装していきます。 statsmodelsとは 統計モ...
BigQuery

【SQL/BigQuery】ユーザー単位のN日後継続率を集計する

こんにちは、ミナピピン(@python_mllover)です。たまに仕事でN日後継続率を集計することがあるので、次からコピペですぐできるようにメモしておきます。 データを用意 <table1>...
Python

【Python】「ADF検定」で時系列データの定常性・単位根を確認する

こんにちは、ミナピピン(@python_mllover)です。今回は時系列データ分析で必要な定常性(単位根)の確認に使用するADF検定をPythonで実装していきたいと思います。 単位根・単位根過程とは 時系列分...
Python

Joblibで「ModuleNotFoundError:No module named sklearn.ensemble.forest」のエラー

MENTAの案件でJoblibで生成した機械学習モデルを出力&読み込みみたいなことやったのですが、Joblibの関数実行に「ModuleNotFoundError:No module named sklearn.ensemb...
heroku

Herokuのデータベースにスクレイピングした情報を保存する

こんにちは、ミナピピン(@python_mllover)です! 今回はherokuのデータベースにPythonで収集した情報を保存する手順を紹介したいと思います。 herokuの基本的なことについては以下...
時系列分析

【時系列分析】定常性とは何かを分かりやすく説明する

定常性とはなにか 時間によらず期待値、自己共分散が一定であるような時系列データの性質を定常性といいます。また、定常性を持つ確率過程のことを定常過程と呼びます。定常であるとき、時系列データは平均に回帰する、そんなイメージを持つと...
BigQuery

【BigQuery】日付データの加算・減算処理

こんにちは、ミナピピン(@python_mllover)です。今回はBigQueryでの日付データの加算・減算の関数について自分用にまとめておこうと思います。日付の加算・減算は、UTC⇒日本時間への変換やN日後継続率などのK...
Python

【Python】Youtubeの再生数・コメント数・高評価数をスクレイピングで取得する

こんにちは、ミナピピン(@python_mllover)です。 今回はYoutubeの提供しているAPIを使用して、特定のワードでの検索結果と再生回数を取得し、そこに加えて高評価数とコメント数も一緒に取得していきたいと...
Python

【Python】scipyでの統計的仮説検定の実装とP値での結果解釈

こんにちは、ミナピピン(@python_mllover)です。この前の記事でP値について解説したので、今回はは実際にPythonでscipyというライブラリを使って、仮説検定を行いP値を計算し結果の解釈したいと思います。 ...
Python

Youtubeの動画コメントをAPIで全件取得してCSV保存

こんにちは、ミナピピン(@python_mllover)です。今回はMENTAでYoutubeの特定の動画に紐づいているコメントを全件取得してほしいという依頼を受けたので調べた結果をまとめておこうかなと思います。 ...
タイトルとURLをコピーしました