データ分析

Python

【Python】openpyxlで「Excelの数式」の読み込み・書き込み

最近業務でエクセル処理をPythonで自動化しようとしていたのですが、エクセルの関数がうまく反映されず少しハマったので調べたことをメモしておきます。 # インストール $ pip install openpyxl ...
Python

【Python】Googleスプレッドシートの読み込み・書き出し・追記処理をgspreadで自動化する

こんにちは、ミナピピン(@python_mllover)です。今回はPythonを使ってgoogleスプレッドシートを操作する方法について紹介したいと思います。 前準備 Pythonの設定 まずはgspre...
Beautiful Soup

【Python】ウェブサイトのTableタグ内の情報をpandasで効率良くスクレイピングする

こんにちは、ミナピピン(@python_mllover)です! 今回はスクレイピングしたwebサイトのテーブルタグの中の情報をデータフレームにして効率良く処理する方法について紹介したいと思います。 panda...
Python

【Python】ツイートのリツイートテキストからメンション・URLを正規表現で除去する

こんにちは、ミナピピン(@python_mllover)です。 今回はツイートデータからメンションやURLを除去して自然言語処理を行う前処理のコードに書いたのでメモとして残しておきます。 Pythonでは...
pandas

【Python】エクセルファイルの複数のシートにデータフレームを出力・追記する

こんにちは、ミナピピン(@python_mllover)です。 今回は案件でスクレイピングしたデータをエクセル(.xlsx) のシートにまとめるということを行ったのですが、まずPythonではpandasのdf.to_...
pandas

【Python】pandas-profilingのprofile_report()の型推論の初期設定を変更する方法

こんにちは、ミナピピン(@python_mllover)です。 MENTAの案件でpandas-profilingのprofile_report()でデータフレームを自動分析した際に連続の数値として所為したいものがカテ...
pandas

【Python】pandas-profilingの「ImportError: cannot import name ‘AppLayout’ from ‘ipywidgets’」の原因と解消法

こんにちは、ミナピピン(@python_mllover)です。 ローカル環境でpandas-profilingのprofile_report()を実行しようとした以下のようなエラーが発生したので、原因と解決方法をメモし...
Python

【Python】Scilit-learnで作成した決定木を可視化する

こんにちは、ミナピピン(@python_mllover)です。 先日クラウド環境でデータ分析を行って決定木の結果を可視化したいと思ったのですが、graphvizがインストールできないという自体に遭遇しました。その回避法...
Python

【Python】データフレームの列データをapply関数+lambdaで条件分岐して一括変換する

pandasのデータフレームで特定の列に対して、その数値を2倍にするなど同じような処理を実施したい、特定条件で1、0に置換してフラグにしたい・・・なんて時があります。データフレームの列に対してfor文を回すことでも実装可能で...
Python

【実務用】決定木分析を行う際の学習データで意識すべきポイントまとめ

こんにちは、ミナピピン(@python_mllover)です。この記事は決定木を実務で使う上で自分が指摘された点をつらつらと書いています。これは他人用じゃなくて自分用なので、読ませるものじゃないです。意味が分からないときはツイッター...
タイトルとURLをコピーしました