pandas DataFrame 데이터프레임
numpy는 1개의 데이터 타입을 갖지만 데이터 프레임은 시리즈의 집합이고 시리즈는 각각 데이터 타입을 갖을 수 있다. 데이터프레임 DataFrame - 시리즈를 모아서 데이터 테이블을 생성 기본적으로 2차원 데이터 판다스를 임포트하고 DataFrame()을 이용해 생성한다. from pandas import Series, DataFrame df = DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) from pandas import DataFrame data = {"name":["kim","lee","oh","jung","roh"], "age":["21","25","33","17","45"], "city":["seoul","da..
2019. 8. 9.
Numpy 배열의 데이터 비교 방법(any, all, where, isnan, argmax, argmin)
np.any(조건) - 배열의 데이터 중 조건과 맞는 데이터가 있으면 True 전혀 없으면 False arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) np.any(arr > 5) True np.any(arr 5) False np.all(arr < 10) True 배열의 같은 위치에 있는 요소간의 비교 배열의 shape이 같아야 함 비교연산자 ==, 로 배열 요소 비교 arr1 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) arr2 = np.array([[1, 2, 3], [1, 5, 7], [..
2019. 8. 8.
Numpy 사칙연산, Transform, 브로드캐스팅
넘파이는 사칙연산 +, -, *, / 를 사용하여 두 배열의 요소들간의 사칙연산을 할 수 있음 arr1 = np.array([[1, 2, 3], [4, 5, 6]]) arr2 = np.array([[2, 3, 4], [5, 6, 7]]) arr1 + arr2 array([[ 3, 5, 7], [ 9, 11, 13]]) arr2 - arr1 array([[1, 1, 1], [1, 1, 1]]) arr1 * arr2 array([[ 2, 6, 12], [20, 30, 42]]) arr2 / arr1 array([[2. , 1.5 , 1.33333333], [1.25 , 1.2 , 1.16666667]]) 같은 위치의 요소와 연산하므로 두 배열의 shape는 같아야 연산할 수 있고 shape가 다르면 valu..
2019. 8. 8.
Numpy 연산(sum, mean, std, exp, vstack, hstack)과 axis의 의미
sum() - 배열의 모든 요소들의 합을 구함 arr = np.array([1,2,3,4,5]) arr.sum(dtype=np.float) 15 sum(axis=0) - axis 어떤 축을 기준으로 연산할 것인가 지정. (3, 4)의 shape인 행렬을 axis=0으로 지정하면 row를 기준으로 연산 axis=1으로 지정하면 column을 기준으로 연산 shape의 가장 앞부터 0 다음 예는 (3,2,4) 행렬의 sum 연산이다. arr = np.array([ [[1, 2, 3, 4], [5, 6, 7, 8]], [[1, 2, 3, 4], [5, 6, 7, 8]], [[1, 2, 3, 4], [5, 6, 7, 8]]]) arr.shape (3, 2, 4) print(arr.sum(axis=0)) [[ 3..
2019. 8. 7.
Numpy 배열 생성 방법(arange, zeros, ones, random)
arange() - 파이썬의 range와 같음 np.arange(숫자) np.arange(최저값, 최고값, 스텝) 리스트와 다르게 소수를 step으로 할 수 있음 np.arange(0, 5, 0.5) np.arange(20).reshape(4,5) zeros() - 모든 요소가 0인 배열 np.zeros(shape=(10,), dtype=np.int8) np.zeros((3,4)) ones() - 모든 요소가 1인 배열 np.ones(shape=(10,), dtype=np.int8) np.ones((3,4)) empty() - 모든 요소가 비어있는 배열 생성 어떤 값으로 초기화 하지 않고 메모리만 잡아주기 때문에 현재 메모리에 있는 값 그대로 사용 np.empty(shape=(10, ), dtype=np..
2019. 8. 7.