【初心者向け】Pythonでcsvを読み込み・書き込み(入力・出力)する際の注意点

Pythonでのファイルの読み込みと書き出し

pythonは便利なプログラミング言語ですが、初心者の方が詰まるポイントの1つとしてファイルの読込と書き出しがあります。

実務とかであればデータベースなどが使うこともありますが、始めたばかりの人がまず行うのは、恐らくcsvからPythonにファイルを読み込んだり書き出したりする方法だと思うので、今日はその辺りについて解説していきたいと思います。

pythonでcsvを扱う方法は基本的に2つ

pythonでcsv形式のファイルを読み込んだり出力したりする方法として、「①csvモジュールとwith文を使う」「②pandasというライブラリの関数を使う」という2つの方法なのが一般的です。

jsonやdbファイルなどを扱いたい場合はwith文を使用することが多いですが、csvモジュールは正直使いにくいです。

なので、.txtや.csvを読み込む際はpandasというモジュールに入っているcsvを読込む関数を使ったほうがいいと個人的には思っています。

ちなみにこのpandasというライブラリはpythonでデータ分析をするのに欠かせない超便利なモジュールです。

そして、numpyというモジュールもpython上で数値計算をするうえでは欠かせないモジュールです。行列と数値計算は機械学習において絶対に行う作業なので、この『Pandas』『Numpy』という2つのモジュールは使いこなせるようにしておきましょう。

スポンサーリンク

pandasでcsvの読込と出力を行う

pandasがない人はpip install pandasでインストールしてください。Anacondaをインストールしている人はデフォルトでインストールされています。

Pandasでの.csvの読み込みと書き出しは↓の関数で行えます。

#モジュールの読込
import pandas as pd

#csvを読み込む
変数名= pd.read_csv('〇〇〇.csv',sep=',',encoding='utf-8')

#データをcsvに出力する
変数名.to_csv("〇〇〇.csv",sep=', ',index=True) 

csvの読み込みで気を付けたいこと(区切り文字・文字コード)

csvをpythonで読み込む際によく起こる問題点としては、正しくcsvが読み込まれない(区切りが反映されない)というケースです。

これはPythonにcsvを読み込む際に区切り文字を指定していないことが原因です。よくあるcsvの形式はカンマ区切りであることが多いので、読み込み時にカンマ区切りであることを引数にsep=','と指定することでPCに教えておげる必要があります。(ちなみにタブ区切りである場合はsep='\t'と指定するとうまくいきます。)

他にも文字コードの違いによるエラーもよくあります。というのもWindowsとMACは基本の文字コードが違うので、Macで作ったファイルをWindowsのPC上で読み込むと文字化けすることがあります。

なので、文字化けしている場合は引数をencoding='utf-8'として文字コードを指定すると文字化けが治ることがあります。

またPython(Pandas)でcsv出力する際に気を付けたいのは、行名を出力するかどうか。Falseを指定した場合、行名は出力されません。デフォルトではTrueとなっているので、最初の列のデータが列名になります。

つまり、csvの最初先頭列のデータをPandasで読み込んだ際にラベル扱いされたくない場合はindex_col=Falseにしておくといいという事になります。

終わり

他にもpandasは金融データの取得など便利な機能がいっぱいあるので、pythonでデータ分析をする人は是非使い方をマスターしておきましょう。

『pandas』『numpy』の使い方については、自分が今まで購入した参考書の中でPythonユーザのためのJupyter[実践]入門というのが一番分かりやすかったので、超オススメです。

【Python】pandasを使って日経平均株価のデータをスクレイピングで取得する

【Python】CoinGeckoからビットコイン・アルトコインの価格データを取得する方法

プログラミングの独学はとても難しい


プログラミングは小学校の義務教育にも導入され始めており、これから社会人として生きていく上でプログラミングはもはや出来て当たり前、出来なれば論外というエクセルレベルの必須スキルになりつつあります。そしてそういう話を聞いて参考書なりを購入して独学でプログラミング勉強しようと思っている人も少なくないでしょう。しかしプログラミングを独学で勉強し始めようと思うものの



・「分からない箇所で詰まって挫折してしまった」

・「勉強する時間が足りない」

・「ネットの記事だと情報が断片的でよくわからない」

・「コードのエラーの原因が分からない」



という壁にぶち当たって、プログラミングの勉強を止めてしまう方が少なくありません。独学でプログラミングを勉強してる時間のほとんどはつまづいている時間です。実際僕も最初のころ独学でプログラミングを勉強していた頃はエラーの原因が分からず丸1日を不意にしてしまった・・・そんな苦い経験がありました。それで僕は一度はプログラミングの学習を諦めてしまいましたが、就活で現実を知る中で



「プログラミングを勉強して、いずれフリーランスとして自由な生き方がしたい」

「エンジニアとして若いうちから高収入を得たい」



という強い気持ちから一念発起して「侍エンジニアのwebサービスコース」に申し込み、プロのエンジニアの方に対面でマンツーマンでPythonによるWebサービス作り方とWeb技術の基本を教えてもらい、ようやくプログラミングが理解でき、今ではエンジニアとしてそこそこの暮らしができるようになりました。





侍エンジニアでは、とりあえずプログラミングやインターネットの基本を知っておきたい人から、HTML・cssなどでWebサイトやWebアプリを作ってみたい人やPythonを勉強してデータサイエンティストやAIエンジニアになりたい人まで幅広いニーズに応えた様々なコースが用意されています。



IT業界と言ってもエンジニアの仕事はプログラミング言語次第でサーバーから機械学習・ディープラーニングまで多種多様ですし、侍エンジニアの無料レッスン(カウンセリング)を受けてみて、自分のやりたいITの仕事は何なのか?を見つけるのがエンジニアへの第一歩になります。ちなみに今侍エンジニアの無料レッスンを受けると1000円分のAmazonギフト券がもらえるので、試しに受けてみるだけもお得です。


自分は半端に独学やオンラインスクールで勉強して金と時間を無駄にするくらいなら、リアルのプログラミングスクールに通ってしっかりプログラミングを勉強した方がいいと思います。ちなみに今、侍エンジニアに申し込むと、25歳以下の学生の方であれば、受講料が20%OFFになるので超お得です。


そして、プログラミングは大勢で授業を受けたり漫然とオンライン学習をするよりも自分が分からない箇所をピンポイントでプロの講師に直接質問して、ちゃんと納得するというスタイルの方がお金は確かに少し掛かりますが、独学で学ぶよりも絶対にモノになります。


シェアする

  • このエントリーをはてなブックマークに追加

フォローする

   侍エンジニア塾       
侍エンジニアの無料体験レッスンを予約する -->