プログラミング

PySparkでDataFrameのカラム名を一括で変更する

この記事は約1分で読めます。

 

PySparkでDataFrameのカラム名を一括で変更する方法についてメモしておきます。一応特定の列だけに限定する場合はwithColumnRenamedで変更前、変更後のカラム名を指定してrenameすることが可能です。

 

<特定の列だけを変更する場合>

spark_df.withColumnRenamed('変更前の列名', '変更後の列名')

 

toDF()でDataFrameのカラム名を一括で変更する

 

PysparkではtoDF()で列名をまとめて変更できます

使い方は以下のような感じです

 

<サンプルコード>

column_names = ['col_a', 'col_b', 'col_c']
spark_df.toDF(*column_names)

 

関連記事:Pyspark3.0用の集計・前処理サンプルコードまとめ

 

 


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

タイトルとURLをコピーしました