ミナピ@データアナリスト

heroku

Herokuのデータベースにスクレイピングした情報を保存する

こんにちは、ミナピピン(@python_mllover)です! 今回はherokuのデータベースにPythonで収集した情報を保存する手順を紹介したいと思います。 herokuの基本的なことについては以下...
時系列分析

【時系列分析】定常性とは何かを分かりやすく説明する

定常性とはなにか 時間によらず期待値、自己共分散が一定であるような時系列データの性質を定常性といいます。また、定常性を持つ確率過程のことを定常過程と呼びます。定常であるとき、時系列データは平均に回帰する、そんなイメージを持つと...
BigQuery

【BigQuery】日付データの加算・減算処理

こんにちは、ミナピピン(@python_mllover)です。今回はBigQueryでの日付データの加算・減算の関数について自分用にまとめておこうと思います。日付の加算・減算は、UTC⇒日本時間への変換やN日後継続率などのK...
Python

【Python】Youtubeの再生数・コメント数・高評価数をスクレイピングで取得する

こんにちは、ミナピピン(@python_mllover)です。 今回はYoutubeの提供しているAPIを使用して、特定のワードでの検索結果と再生回数を取得し、そこに加えて高評価数とコメント数も一緒に取得していきたいと...
Python

【Python】scipyでの統計的仮説検定の実装とP値での結果解釈

こんにちは、ミナピピン(@python_mllover)です。この前の記事でP値について解説したので、今回はは実際にPythonでscipyというライブラリを使って、仮説検定を行いP値を計算し結果の解釈したいと思います。 ...
Python

Youtubeの動画コメントをAPIで全件取得してCSV保存

こんにちは、ミナピピン(@python_mllover)です。今回はMENTAでYoutubeの特定の動画に紐づいているコメントを全件取得してほしいという依頼を受けたので調べた結果をまとめておこうかなと思います。 ...
Python

【Python】Scikit-learnで作成した決定木のモデルを可視化する

こんにちは、ミナピピン(@python_mllover)です。 先日クラウド環境でデータ分析を行って決定木の結果を可視化したいと思ったのですが、graphvizがインストールできないという自体に遭遇しました。その回避法...
Flask

【Python】Heroku+FlaskでサーバレスWebアプリをデプロイする

こんにちは、ミナピピン(@python_mllover)です。今回は前回使用したHerokuを使ってPythonのwebアプリケーションフレームワークであるFlaskを使ったサーバレスアプリをデプロイしたいと思います。 H...
Python

【Python】「CATBoost」を使ってタイタニックの機械学習をやってみた

こんにちは、ミナピピン(@python_mllover)です。これまで「XGBoost」と「LightGBM」について紹介しましたが、今回は同じ勾配ブースティングのアルゴリズムである「CATboost」について紹介したいと思...
pandas

pandasでcsv読み込み時にインデックスや列がズレる原因と対処法

こんにちはミナピピン(@python_mllover)です。 仕事でPythonを触っていたのですが、クライアントからもらったcsvをpandasで読み込むと列がズレて先頭列のデータが勝手にインデックスになるという謎の...
タイトルとURLをコピーしました