일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- index
- pip
- pycharm
- pandas
- SciPy
- synology
- 삼성소프트웨어멤버십
- Numpy
- Button
- install
- keras
- GitHub
- ipad
- dataframe
- DFS
- CNN
- GT-S80
- mariadb
- mean
- E-P1
- SPL
- LSTM
- Lotto
- imread
- javascript
- 알고리즘
- Splunk
- Python
- Series
- RNN
- Today
- Total
목록잠토네 잠수함 (493)
잠토의 잠망경
mean(), min(), max(), std() import pandas as pd from collections import OrderedDict s = pd.DataFrame({ 'Address':['Seoul','Asan'], 'occupation':['doctor','IT'], 'Born':['1981-01-10','1999-11-02'], 'Died':['2100-01-10','2099-01-02'], 'Age':[40,20]}, index=['a','b'], columns=[..
DataFrame에서 Series 추출(loc) loc 속성을 이용하여 원하는 index를 지정후 추출 import pandas as pd from collections import OrderedDict s = pd.DataFrame({ 'Address':['Seoul','Asan'], 'occupation':['doctor','IT'], 'Born':['1981-01-10','1999-11-02'], 'Died':['2100-01-10','2099-01-02'], 'Age':[40,20]}, index=['a&#..
Series 만들기 가장 단순한 방식, index 지정 안함 import pandas as pd s = pd.Series(['a',42]) print(s) print(type(s)) output >>> print(s) 0 a 1 42 dtype: object >>> print(type(s)) Series 만들기, index를 지정 import pandas as pd s = pd.Series(['a',42],index=['name','age']) print(s) print(type(s)) output >>> print(s) name a age 42 dtype: object >>> print(type(s)) DataFrame 만들기 import pan..
Groupby 사용 하기 csv에서 col1을 기준으로 col3의 평균을 구하자 df.groupby(대상) col1,col2,col3,col4 1,2,1,4 1,1,2,3 1,1,3,4 2,0,4,3 2,2,5,4 3,1,6,3 3,2,7,4 import pandas as pd df = pd.read_csv('input.csv') print(df.groupby('col1')['col3'].mean()) 출력 col1 1 2.0 2 4.5 3 6.5 Name: col3, dtype: float64구조 설명 groupby: DataFrame 1개열 : Series groupbyed = df.groupby('col1') print(type(groupby..
Tistory Editor Tistory에 Markdown 형식으로 글을 쓸 수 있도록 도와주는 Editor입니다. 다시금 Tistory를 활용하게 해준 효자 상품 ^_^ 개발자님 감사합니다. https://tistory-editor.tistory.com/ Markdown 적용하기 아래 순서대로 진해함 github-markdown.css download highlight.pack.js 및 vs20015.css(다양함 고르면 됨) Tistory에 다음을 적용함
iloc, loc 공통 iloc, loc 모두 행, 열 을 지정하여 Data를 획득한다. df.iloc[[행],[열]] # Data의 행 번호 활용, integer만 가능 df.loc[[행],[열]] # DataFrame index 활용, 아무 것이나 활용 가능 Data 추출 방법 슬라이싱 구문 행, 열의 list를 기본으로 표현 가능하다. subset = df.loc[:,['year','pop']] # 모든 행(:), year, pop Column subset = df.iloc[:,[2,4,-1]] # 2,4, -1(마지막) 열 획득 range 구문 #sample01 small_range = list(range(5)) #[0,1,2,3,4] df.iloc[:,small_ra..
iloc 속성 활용 Data 순서를 의미하는 행 번호를 활용 -1 은 마지막 행을 의미한다. 존재하지 않는 행 번호는 오류 발생함 loc DataFrame의 Index를 활용함 df.iloc[1] df.iloc[99] df.iloc[-1] #미지막 행 데이터를 추출 print(type(df.iloc[-1])) #Series 여러행 추출하기 list의 형태를 통하여 얻을 수 있음 print(df.iloc[[0,0,99]]) # list를 넘겨준다.
index 개념 DataFrame에는 2가지 index 개념이 존재한다. loc, iloc이다. 속성 설명 loc index 기준 iloc 행 번호 기준 index 형태: 숫자, 문자 특징: 추가, 삭제, 변경 가능 행번호 형태: 숫자 loc 활용 인덱스를 전달, Row Data 추출, Series import pandas as pd df = pd.read_csv('mushrooms.csv') print(df.loc[2]) print(df.loc[99]) print(df.loc[-1]) # error 인덱스가 존재하지 않는 영역에 접근했기때문이다. 결과는 다음과 같다 마지막 row를 추출하는 2가지 방법 1. shape 이용 Type: Series number_of_row = df.shap..