pandas

pandas

Pandasの列データをapplyとlambdaで条件分岐して置換する

データの前処理でpandasのデータフレームで特定の列に対して、その数値を2倍にするなど同じような処理を実施したい、特定条件で1、0に置換してフラグにしたい・・・なんて時があります。データフレームの列に対してfor文を回すことでも実...
pandas

【Python】pandasで株価データのOHLC(始値・最高値・最安値・終値)を算出する

前回のやったこと 前回は 関連記事:【Python】pandasのresample()で株価データを月/日/時ごとに再集計で時系列データを1週間や1か月といった一定期間ごとに再集計する方法について紹介しましたが、今回は株価デー...
Beautiful Soup

【Python】世界各国の人口データをスクレイピングして取得する

Pythonで世界各国の人口データを取得する 先日株価分析に人口データを用いたいと思いまして、pandas-datareaderとかでうまいこと取得できないかなーと色々検索していたのですが、国別にうまく取得できるサイトが中々見...
pandas

【Python】Pandas-ProfilingとPixiedustでデータをGUIみたいに可視化する

今日はPythonで分析データをGUIツールのように可視化できるpandas-profiling, pixiedustの存在を知ったので自分への保存用に使い方をまとめていきます。 前準備 #ライブラリ...
pandas

【Python】Pandasのデータフレームをテーブルに高速INSERTする

テーブルへのINSERT処理の基本 Pythonで処理したデータをSqlalchemyとかsqlite3とかで、テーブルにINSERTする方法は大きく分けて3つになります。 ①for文で1つずつ入れていく...
Matplotlib

【Python】ローソク足と移動平均線をプロットする

Pythonでローソク足をプロットする 今回はPythonで↓のようなローソク足をプロットする方法を紹介したいと思います。 プロットするデータを準備する #必要なライブラリをイン...
pandas

【Python】pandasのresample()で株価データを月/日/時ごとに再集計

今回はPandasのresample()という関数を使って株価データなどの時系列データを月/日/時ごとに再集計する方法について紹介したいと思います。 pandas_datareaderでデータを用意する まずはデ...
numpy

【Python】pandasで年齢データを各年齢層ごとにGroupByで集計する

今回はPandasでSQLと同じようなGROUPBYを行う方法について紹介したいと思います。 pandasで年齢データを10歳区切りの年齢データに再集計する 年齢データをpandasで年齢層ごとに集計しようとした...
Matplotlib

Kaggleのサンプルデータを使って実戦的な機械学習をやってみる

Kaggleとは? Kaggleに登録方法と機械学習の始め方 まずはKaggleに接続してアカウントを作成してください。アカウントはGoogleアカウントを持っていればすぐに作れま...
pandas

【Python】Pandasを使ったデータ分析②~1次元配列のpd.Seriesを使いこなす

前回までにやったこと 前回はデータフレームから特定の条件を満たす配列の抽出する方法を解説しました。今回はPandas.Series(Series)の操作とデータフレームの変換・読み込み・...
タイトルとURLをコピーしました