일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- index
- dataframe
- Series
- Numpy
- install
- CNN
- javascript
- LSTM
- keras
- GitHub
- mariadb
- 알고리즘
- DFS
- imread
- Python
- E-P1
- GT-S80
- ipad
- pip
- pycharm
- Lotto
- mean
- SPL
- Splunk
- 삼성소프트웨어멤버십
- RNN
- pandas
- SciPy
- Button
- synology
- Today
- Total
목록pandas (13)
잠토의 잠망경
문자열 바꾸기 방법 github 기초 data datas = pd.DataFrame({'col1': [' ab_c_d_e_', 'b: cd', 'cde_ '], 'col2': ['a', 'a', 'c'], 'col3': [1, 2, 3], 'mydate': [pd.to_datetime('20200402'), pd.to_datetime('20200501')-pd.DateOffset(days=5), pd.to_datetime('20200502')] }, index=[0, 1, 2]) Replace 방식 def f_pandas_replace(datas:DataFrame): print(datas.info()) print(datas['col1'].str) print(datas['col1'].str.replace(..
mariadb를 사용하다 보면 timestamp 오류가 발생할 경우가 있다. AttributeError: 'Timestamp' object has no attribute 'translate' 해당 오류가 발생할 경우 해결책 datas = pd.DataFrame({'col1': [' ab_c', 'b: cd', 'cde_ '], 'col2': ['a', 'a', 'c'], 'col3': [1, 2, 3], 'mydate': [pd.to_datetime('20200402'), pd.to_datetime('20200501')-pd.DateOffset(days=5), pd.to_datetime('20200502')] }, index=[0, 1, 2]) print(datas.info()) 다음과 datetime6..
관련 github https://github.com/yiwonjae/Project_Stock_Markets_Python/blob/master/Sample01/20200415_01.py 방법 1 def Make_Date_01(): #https://www.programiz.com/python-programming/datetime/strftime from datetime import datetime, timedelta # 현재 시간 얻어오기 now = datetime.now() # 현재 시간을 얻어 온다. before = now - timedelta(days=10) # 현재 시간 기준 10일 전 시간을 얻는다. print(before) print(now) strBefore:str = before.strftim..
multi Column을 활용하여 Groupby하기 Github ''' dataframe을 이용하여 group by 진행할때 multicalumn을 이용하는 방법 ''' def makeGroup_s002()->None: from numpy import ndarray import numpy as np from pandas import DataFrame import pandas as pd ## Data 준비 datas = pd.DataFrame({'key1':['a', 'a', 'b', 'b', 'a'], 'key2':['one', 'two', 'one', 'two', 'one'], 'data1': np.random.rand(5), 'data2': np.random.rand(5)}) print(datas) ..
groupby하기 위해서 dataframe이 사용된다. autoindicate를 위하여 DataFrameGroupBy를 추가하면 mean, std 같은 이미 정의된 class member를 사용할 수 있다. GitHub from pandas.core.groupby.groupby import DataFrameGroupBy def makeGroup(df:DataFrame)->None: print(df.info()) grouped:DataFrameGroupBy = df.groupby(['file_name']) for key, item in grouped: print(key) print(item) grouped:DataFrameGroupBy = df.groupby(['order']) for key, item i..
파일들을 읽어 하나의 pandas로 만든다. Github https://github.com/yiwonjae/Project_Python_Lib/blob/master/PandasMy/PandasMyLibs.py import pandas as pd from pandas import DataFrame ''' 목적: 전달 받은 file list의 것들을 parsing해서 dataframe으로 만들어준다. i ) files : list형태로 전달 받으면 하나씩 읽어서 나중에 merge한다. o ) Dataframe : file 이름 list 참고: https://rfriend.tistory.com/256 ''' def readDataFrame(files:list)->DataFrame: datasets = [] fo..
DataFrame에서 Series 추출(loc) loc 속성을 이용하여 원하는 index를 지정후 추출 import pandas as pd from collections import OrderedDict s = pd.DataFrame({ 'Address':['Seoul','Asan'], 'occupation':['doctor','IT'], 'Born':['1981-01-10','1999-11-02'], 'Died':['2100-01-10','2099-01-02'], 'Age':[40,20]}, index=['a&#..
Series 만들기 가장 단순한 방식, index 지정 안함 import pandas as pd s = pd.Series(['a',42]) print(s) print(type(s)) output >>> print(s) 0 a 1 42 dtype: object >>> print(type(s)) Series 만들기, index를 지정 import pandas as pd s = pd.Series(['a',42],index=['name','age']) print(s) print(type(s)) output >>> print(s) name a age 42 dtype: object >>> print(type(s)) DataFrame 만들기 import pan..