データ分析

pandas

【Python】pandas-profilingの「ImportError: cannot import name ‘AppLayout’ from ‘ipywidgets’」の原因と解消法

こんにちは、ミナピピン(@python_mllover)です。 ローカル環境でpandas-profilingのprofile_report()を実行しようとした以下のようなエラーが発生したので、原因と解決方法をメモし...
Python

【Python】Scilit-learnで作成した決定木を可視化する

こんにちは、ミナピピン(@python_mllover)です。 先日クラウド環境でデータ分析を行って決定木の結果を可視化したいと思ったのですが、graphvizがインストールできないという自体に遭遇しました。その回避法...
Python

【Python】データフレームの列の要素をLamda(無名関数)で条件分岐させつつ一括変換する

pandasのデータフレームで特定の列に対して、その数値を2倍にするなど同じような処理を実施したい、特定条件で1、0に置換してフラグにしたい・・・なんて時があります。データフレームの列に対してfor文を回すことでも実装可能で...
Python

【実務用】決定木分析を行う際の学習データで意識すべきポイントまとめ

こんにちは、ミナピピン(@python_mllover)です。この記事は決定木を実務で使う上で自分が指摘された点をつらつらと書いています。これは他人用じゃなくて自分用なので、読ませるものじゃないです。意味が分からないときはツイッター...
Python

【Python】主成分分析(PCA)でのクラスタリングを実装する

こんにちは、ミナピピン(@python_mllover)です。今回はデータ分析の業務でよく行う「クラスタリング」の手法の1つである「主成分分析(PCA)」について解説していきます。 主成分分析(PCA)とは ...
BigQuery

【BigQuery】分析関数で連続ログイン日数を集計する

こんにちは、ミナピピン(@python_mllover)です。今回は業務で「ユーザーごとの連続ログイン日数」を集計したので、その時に使ったコードを保存しておこうと思います。 分析関数とは? まず分析関数と...
エンジニア日記

データ分析業界で未経験が高給取りを目指すためには何をするべきか

このエントリーの対象読者 データサイエンスに携わるお仕事を志望する学生さん. データサイエンティスト, コンサルタント, アナリストなど 現役エンジニアもしくはエンジニア以外からデータサイエンティストを目指す皆様 ...
エンジニア日記

中途未経験者がデータサイエンティストで入れそうなデータ分析会社を一覧でまとめてみた

こんにちは、ミナピピン(@python_mllover)です。今回はデータ分析業界未経験者が分析会社選びの際に注意するべきことと、データサイエンティストで入れそうなデータ分析会社を一覧でまとめてみました。 中途未経験でデー...
pandas

【Python】pandasで時系列データのOHLC(始値・最高値・最安値・終値)を算出する

前回のやったこと 前回は 関連記事:【Python】pandasのresample()で株価データを月/日/時ごとに再集計で時系列データを1週間や1か月といった一定期間ごとに再集計する方法について紹介しましたが、今回は株価デー...
Python

【Anaconda】JupyterNotebookの便利コマンドのまとめ

JupyterNotebookには%で始まるマジックコマンドという便利なコマンドが用意されています。 恐らく一番身近なのは、Matplotlibでプロットしたグラフをノートブック内に表示するための%matplotlib...
タイトルとURLをコピーしました