일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- pip
- install
- 삼성소프트웨어멤버십
- 알고리즘
- mariadb
- LSTM
- mean
- Button
- GitHub
- keras
- SciPy
- Lotto
- SPL
- javascript
- E-P1
- dataframe
- index
- RNN
- DFS
- imread
- pycharm
- Python
- Numpy
- Splunk
- synology
- CNN
- pandas
- GT-S80
- ipad
- Series
- Today
- Total
목록dataframe (11)
잠토의 잠망경
Groupby 사용 하기 csv에서 col1을 기준으로 col3의 평균을 구하자 df.groupby(대상) col1,col2,col3,col4 1,2,1,4 1,1,2,3 1,1,3,4 2,0,4,3 2,2,5,4 3,1,6,3 3,2,7,4 import pandas as pd df = pd.read_csv('input.csv') print(df.groupby('col1')['col3'].mean()) 출력 col1 1 2.0 2 4.5 3 6.5 Name: col3, dtype: float64구조 설명 groupby: DataFrame 1개열 : Series groupbyed = df.groupby('col1') print(type(groupby..
index 개념 DataFrame에는 2가지 index 개념이 존재한다. loc, iloc이다. 속성 설명 loc index 기준 iloc 행 번호 기준 index 형태: 숫자, 문자 특징: 추가, 삭제, 변경 가능 행번호 형태: 숫자 loc 활용 인덱스를 전달, Row Data 추출, Series import pandas as pd df = pd.read_csv('mushrooms.csv') print(df.loc[2]) print(df.loc[99]) print(df.loc[-1]) # error 인덱스가 존재하지 않는 영역에 접근했기때문이다. 결과는 다음과 같다 마지막 row를 추출하는 2가지 방법 1. shape 이용 Type: Series number_of_row = df.shap..
한 열 단위 데이터 추출 Series : 1개 열 DataFrame : 2개 열 이상 열단위 Data 얻기 import pandas as pd df = pd.read_csv('input.csv',sep=',') column_df = df['country'] print(type(colum_df)) # Series print(column_df.head()) # 5줄 print(column_df.tail()) # 하위 5줄 2열 이상 데이터 추출 columns_df = df[['country', 'continent', 'year']] # List 전달 print(type(columns_df)) # DataFrame print..