numpy 기초
본문 바로가기
PYTHON/기본 문법

numpy 기초

by 공돌이삼촌 2022. 7. 31.
반응형

1. Numpy

데이터 분석을 위해 주로 사용되는 라이브러리 numpy와 pandas를 알아보자

Numpy는 C언어로 구현된 파이썬 라이브러리로, 고성능 수치 계산을 위해 만들어 졌다.

Numerical Python의 약자로 Numpy는 수치 해석을 위한 벡터 및 행렬 연산에 있어서 매우 편리한 기능을 제공한다.

주로 데이터분석을 할 때 사용되는 라이브러리인 pandas와 matplotlib과 함께 사용되기도 한다.

먼저 numpy를 사용하기 위해서는 아래와 같은 코드로 numpy를 import해야 한다.

 

import numpy as np

 

numpy를 설치하고 단순히 import numpy 로 사용해도 되지만, 간편히 사용하고자 관례상 as np 를 붙임으로써 np라는 이름으로 numpy를 사용한다.

numpy에서는 기본적으로 array 행렬 단위로 데이터 연산을 수행한다

배열의 차원을 rank라고 하고, 각 차원의 크기를 튜플로 표시하는 것을 shape이라고 한다.

행이 2이고 열이 4인 2차원 배열에서는 rank가 2이고, shape은 (2,4)이다.

array() 안에 하나의 리스트만 들어가므로 리스트의 리스트를 넣어야한다.

numpy 배열을 생성하는 방법은 파이썬 리스트를 사용하는 방법과, numpy에서 제공하는 함수를 사용하는 방법이 있다.

-파이썬 리스트를 사용하는 방법

 

-numpy에서 제공하는 함수를 사용하는 방법

 zeros(), ones(), full(), eye() 등이 있는데, zeros()는 해당 배열에 모두 0을 집어 넣고, ones()는 모두 1을 집어 넣는다. full()은 배열에 사용자가 지정한 값을 넣는데 사용하고, eye()는 대각선으로는 1이고 나머지는 0인 2차원 배열을 생성한다.

a = np.zeros((2,2))
print(a)
# 출력:
# [[ 0.  0.]
#  [ 0.  0.]]
 
a = np.ones((2,3))
print(a)
# 출력:
# [[ 1.  1.  1.]
#  [ 1.  1.  1.]]
 
a = np.full((2,3), 5)
print(a)
# 출력:
# [[5 5 5]
#  [5 5 5]]
 
a = np.eye(3)
print(a)
# 출력:
# [[ 1.  0.  0.]
#  [ 0.  1.  0.]
#  [ 0.  0.  1.]]
 
a = np.array(range(20)).reshape((4,5))
print(a)
# 출력:
# [[ 0  1  2  3  4]
#  [ 5  6  7  8  9]
#  [10 11 12 13 14]
#  [15 16 17 18 19]]

umpy 배열은 파이썬 리스트와 마찬가지로 슬라이스(Slice)를 지원한다. 

lst = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]
arr = np.array(lst)
 
# 슬라이스
a = arr[0:2, 0:2]
print(a)
# 출력:
# [[1 2]
#  [4 5]]
 
a = arr[1:, 1:]
print(a)
# 출력:
# [[5 6]
#  [8 9]]

 

 

 

 

 

 

반응형

댓글