データ分析

Python

【Python】openpyxlで「Excelの数式」の読み込み・書き込み

最近業務でエクセル処理をPythonで自動化しようとしていたのですが、エクセルの関数がうまく反映されず少しハマったので調べたことをメモしておきます。 # インストール $ pip install openpyxl ...
Beautiful Soup

【Python】ウェブサイトのTableタグ内の情報をpandasで効率良くスクレイピングする

こんにちは、ミナピピン(@python_mllover)です! 今回はスクレイピングしたwebサイトのテーブルタグの中の情報をデータフレームにして効率良く処理する方法について紹介したいと思います。 panda...
Python

【Python】TwitterAPIで取得したツイートから@メンション・リツイート・URLを正規表現で除去する

こんにちは、ミナピピン(@python_mllover)です。 今回はTwitterAPIで取得したツイートデータからメンションやURLを除去して自然言語処理を行う前処理のコードに書いたのでメモとして残しておきます。 ...
pandas

エクセルの複数シートにデータフレームを出力・追記する

こんにちは、ミナピピン(@python_mllover)です。 今回は案件でスクレイピングしたデータをエクセル(.xlsx) のシートにまとめるということを行ったのですが、まずPythonではpandasのdf.to_...
pandas

【Python】pandas-profilingのprofile_report()の型推論の初期設定を変更する方法

こんにちは、ミナピピン(@python_mllover)です。 MENTAの案件でpandas-profilingのprofile_report()でデータフレームを自動分析した際に連続の数値として所為したいものがカテ...
pandas

【Python】pandas-profilingの「ImportError: cannot import name ‘AppLayout’ from ‘ipywidgets’」の原因と解消法

こんにちは、ミナピピン(@python_mllover)です。 ローカル環境でpandas-profilingのprofile_report()を実行しようとした以下のようなエラーが発生したので、原因と解決方法をメモし...
Python

【Python】Scikit-learnで作成した決定木のモデルを可視化する

こんにちは、ミナピピン(@python_mllover)です。 先日クラウド環境でデータ分析を行って決定木の結果を可視化したいと思ったのですが、graphvizがインストールできないという自体に遭遇しました。その回避法...
pandas

pandasでcsv読み込み時にインデックスや列がズレる原因と対処法

こんにちはミナピピン(@python_mllover)です。 仕事でPythonを触っていたのですが、クライアントからもらったcsvをpandasで読み込むと列がズレて先頭列のデータが勝手にインデックスになるという謎の...
pandas

Pandasの列データをapplyとlambdaで条件分岐して置換する

データの前処理でpandasのデータフレームで特定の列に対して、その数値を2倍にするなど同じような処理を実施したい、特定条件で1、0に置換してフラグにしたい・・・なんて時があります。データフレームの列に対してfor文を回すことでも実...
Python

【実務用】決定木分析を行う際の学習データで意識すべきポイントまとめ

こんにちは、ミナピピン(@python_mllover)です。この記事は決定木を実務で使う上で自分が指摘された点をつらつらと書いています。これは他人用じゃなくて自分用なので、読ませるものじゃないです。意味が分からないときはツイッター...
タイトルとURLをコピーしました