numpy Python データ分析入門シリーズ

【Python】Numpy配列の次元変換でよく使う関数のまとめ

この記事は約5分で読めます。

 

 

Numpy配列の作成と要素の確認

 

import numpy as np

#Numpy配列の作成
sample = np.arange(0, 100, 0.1)
sample

 

 

<実行結果>

array([ 0. ,  0.1,  0.2,  0.3,  0.4,  0.5,  0.6,  0.7,  0.8,  0.9,  1. ,
        1.1,  1.2,  1.3,  1.4,  1.5,  1.6,  1.7,  1.8,  1.9,  2. ,  2.1,
        2.2,  2.3,  2.4,  2.5,  2.6,  2.7,  2.8,  2.9,  3. ,  3.1,  3.2,
        3.3,  3.4,  3.5,  3.6,  3.7,  3.8,  3.9,  4. ,  4.1,  4.2,  4.3,
        4.4,  4.5,  4.6,  4.7,  4.8,  4.9,  5. ,  5.1,  5.2,  5.3,  5.4,

 

 

#.shapeでnumpy配列の次元数を確認する
sample.shape

 

 

np.shapeでsampleの次元数を確認すると(1000,)と返ってくると思います。これはsampleというNumpy配列が1000個の要素を含んだ1次元配列であるということを示しています。

 

 

1次元のNumpy配列を2次元のNumpy配列に変換する

 

次はこの1次元のNumpy配列であるsampleを2次元のNumpy配列に変換します。

 

#Numpy配列を1次元から2次元に変換する
sample.reshape(2,500)

 

 

<実行結果>

array([[ 0. ,  0.1],
       [ 0.2,  0.3],
       [ 0.4,  0.5],
       [ 0.6,  0.7],
       [ 0.8,  0.9],
       [ 1. ,  1.1],
       [ 1.2,  1.3],

 

 

Numpy配列の次元変換でnp.reshape()を使う際の注意点としては変換前と変換後の要素数があっているかです。↑のコードは(1000,1)の1次元行列を(500,2)の2次元配列に変換しています。1×1000と500×2はどちらも1000で要素数が同じなので変換ができます。

 

また行列の要素数がすごく大きくて一々頭の中で割り算して引数を指定するのはめんどくさい場合は引数を[,-1]にすることで自動的にNumpy側が要素数を合わせてくれます。

 

#どちらかの引数を-1にすると勝手に要素数を合わせてくれる
sample.reshape(-1,2)

 

 

<実行結果>

array([[ 0. ,  0.1],
       [ 0.2,  0.3],
       [ 0.4,  0.5],
       [ 0.6,  0.7],

 

 

もちろん-1で設定できるのはもう片方の要素数が割り切れる勢数になるときだけです。

 

 

#引数は全要素数割り切れるものしか無理!
sample.reshape(-1,3)


ValueError
: cannot reshape array of size 1000 into shape (3)

 

 

 

3次元のNumpy配列に変換する

 

#3次元のNumpy配列に変換する
sample.reshape(-1,1,2)

 

 

<実行結果>

array([[[ 0. ,  0.1]],

       [[ 0.2,  0.3]],

       [[ 0.4,  0.5]],

 

 

返ってきた結果を見ると、array([[[…になっており、3次元のNumpy配列に変換されていることが分かります。

 

 

2次元または3次元のNumpy配列を1次元に変換する

 

多次元のNumpy配列を1次元に変換する場合はnp.flatten()を使用します。

 

#reshapeで多次元配列を作成する
sample2=sample.reshape(-1,1,2)

#flattenで1次元配列に変換する
sample2.flatten()

 

自分は基本的にnp.reshape()を使っているのですが、何万×何万の行列だと要素数があっているはずなのに、次元削減の場合だとReshapeがうまく変換できないときがある気がするので、そういうときはnp.flatten()を使っています。

 

 

終わり

 

以上がNumpyでの次元変換の基本的な関数です。とりあえず以下の3つが使えれば問題ないです。

 

np.shape()

np.reshape()

np.flatten()

 

 

Numpyの次元数は機械学習やディープラーニングにおいて学習データの前処理で意識する場面が多いので慣れておきましょう。「現場で使える!NumPyデータ処理入門 」は実務でよく使う関数をまとめてくれているので、Numpyの参考書を何か1冊持っておきたい場合にはオススメです。

 

 

 

 

 

 

 

 


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

タイトルとURLをコピーしました