일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- ipad
- RNN
- install
- keras
- pip
- SciPy
- DFS
- imread
- Numpy
- 삼성소프트웨어멤버십
- CNN
- mariadb
- mean
- dataframe
- GT-S80
- Lotto
- E-P1
- Python
- SPL
- Series
- 알고리즘
- Button
- synology
- pycharm
- LSTM
- GitHub
- Splunk
- index
- javascript
- pandas
- Today
- Total
목록공부/Python (70)
잠토의 잠망경
iloc, loc 공통 iloc, loc 모두 행, 열 을 지정하여 Data를 획득한다. df.iloc[[행],[열]] # Data의 행 번호 활용, integer만 가능 df.loc[[행],[열]] # DataFrame index 활용, 아무 것이나 활용 가능 Data 추출 방법 슬라이싱 구문 행, 열의 list를 기본으로 표현 가능하다. subset = df.loc[:,['year','pop']] # 모든 행(:), year, pop Column subset = df.iloc[:,[2,4,-1]] # 2,4, -1(마지막) 열 획득 range 구문 #sample01 small_range = list(range(5)) #[0,1,2,3,4] df.iloc[:,small_ra..
iloc 속성 활용 Data 순서를 의미하는 행 번호를 활용 -1 은 마지막 행을 의미한다. 존재하지 않는 행 번호는 오류 발생함 loc DataFrame의 Index를 활용함 df.iloc[1] df.iloc[99] df.iloc[-1] #미지막 행 데이터를 추출 print(type(df.iloc[-1])) #Series 여러행 추출하기 list의 형태를 통하여 얻을 수 있음 print(df.iloc[[0,0,99]]) # list를 넘겨준다.
index 개념 DataFrame에는 2가지 index 개념이 존재한다. loc, iloc이다. 속성 설명 loc index 기준 iloc 행 번호 기준 index 형태: 숫자, 문자 특징: 추가, 삭제, 변경 가능 행번호 형태: 숫자 loc 활용 인덱스를 전달, Row Data 추출, Series import pandas as pd df = pd.read_csv('mushrooms.csv') print(df.loc[2]) print(df.loc[99]) print(df.loc[-1]) # error 인덱스가 존재하지 않는 영역에 접근했기때문이다. 결과는 다음과 같다 마지막 row를 추출하는 2가지 방법 1. shape 이용 Type: Series number_of_row = df.shap..
한 열 단위 데이터 추출 Series : 1개 열 DataFrame : 2개 열 이상 열단위 Data 얻기 import pandas as pd df = pd.read_csv('input.csv',sep=',') column_df = df['country'] print(type(colum_df)) # Series print(column_df.head()) # 5줄 print(column_df.tail()) # 하위 5줄 2열 이상 데이터 추출 columns_df = df[['country', 'continent', 'year']] # List 전달 print(type(columns_df)) # DataFrame print..
데이터 불러오기 csv를 읽어 들이는 방법 import pandas as pd df = pd.read_csv('input.csv', sep=',') # sep='\t' Series, DataFrame Series와 DataFrame은 다음과 같이 정의할 수 있다. DataFrame: Excel의 Sheet Series : Column, Excel의 한 열 DataFrame 앞 혹은 뒤 5줄 확인 head(), tail()을 통하여 thumbnail 식으로 확인 할 수 있다. print(df.head()) # df.head(n=5) 5개 출력 print(type(df)) # DataFrame print(df.tail()) # df.tail(n=5) 하위 5개 출력..
붓꽃 KNN GitHub GitHub 내용 KNN 알고리즘을 이용하여 Classification을 하는데 그 목적이 있다. Sample import pandas as pd # excel 같은 형태의 data table을 만들어준다. import matplotlib.pyplot as plt # 그래프를 만들어준다. from sklearn import datasets from sklearn.model_selection import train_test_split # test/train data split # data set에서 값들을 갖고 온다. iris_dataset = datasets.load_iris(); # training과 test를 나눈다. X_train, X_test, y_train, y_test..