목록NumPy (4)
차밍이
목차 블로그 글을 작성하거나, 이런저런 예시나 테스트를 할 때 가끔 랜덤한 데이터를 생성할 필요한 경우가 생깁니다. 한 번 알아놓으면, 매번 귀찮게 찾아보지 않아도 되니 천천히 따라 해보세요. Random 데이터로 DataFrame 만들기 바쁜 사람들을 위해 결론 소스코드만 먼저 발사합니다. import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(0,100,size=(100, 5)), columns=list("abcde")) df 0~99까지의 랜덤한 정수로 이루어진 100행 5열짜리 데이터프레임 생성완료 아래는 설명하겠습니다ㅎ 랜덤한 숫자 뽑기 넘파이 모듈을 사용해서 랜덤한 숫자 뽑기 import numpy as np np...
목차 데이터 분석을 위해 Data Preprocessing 과정을 진행하는 과정을 필수적으로 거치게됩니다. 데이터 가공을 진행하다보면 여러 Column들을 연산하여 수정하거나 새로운 데이터를 만드는 과정을 수행합니다. 이러한 과정에서 데이터량이 많아짐에 따라 연산 과정이 점점 늦어지는 현상이 발생합니다. for문 반복 혹은 itterator를 사용한 방법은 비효율적인 방법이다. 보통 apply & applymap 등을 많이 이용해서 코드를 작성합니다. 그럼에도 데이터가 많아지니, 더 빠르게 계산할 수 있는 방법은 Numpy를 최대한 활용기 + Vectorization입니다. 기본적으로 Numpy Array를 활용 단순한 연산도 Numpy Array를 활용하면 더욱 빨라집니다. 데이터프레임의 Series의..
Numpy 기초를 공부하기 2 np.fromfunction def myfunc(x,y): return 10*x + y arr1 = np.fromfunction(myfunc,(5,4), dtype=int) arr2 = np.fromfunction(myfunc,(5,4), dtype=int) arr1, arr2 >>> (array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]]), array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]])) np.fromfunction을 사용하면 함수 형식을..
• Numpy 란? NumPy는 Python의 과학 컴퓨팅을 위한 기본 패키지로 Python 라이브러리를 import하여 사용 가능합니다. • NumPy 배열과 표준 Python 시퀀스 간의 차이점 List와 Array의 차이점 일반적으로 Python은 배열(array)을 지원하지 않습니다. 일반적으로 착각하기 쉬운 부분으로 List와 Array는 정확히는 다른 것입니다. Array는 정적 할당에 해당하며, List의 경우는 동적 할당에 해당합니다. 동적으로 계속 크기가 변할 수 있는 Python List와 달리 NumPy Array는 고정된 크기를 갖습니다. Size를 변화하면 기존의 array를 삭제하고 새로운 array를 생성해야 합니다. Numpy를 사용하면 Array를 Python에서 사용할 수..