잠토의 잠망경

[pandas] 여러 dataframe merge 본문

공부/Python

[pandas] 여러 dataframe merge

잠수함토끼 2020. 3. 22. 09:58

파일들을 읽어 하나의 pandas로 만든다.

Github

https://github.com/yiwonjae/Project_Python_Lib/blob/master/PandasMy/PandasMyLibs.py

import pandas as pd
from pandas import DataFrame

'''
목적: 전달 받은 file list의 것들을 parsing해서 dataframe으로 만들어준다.

i ) files     : list형태로 전달 받으면 하나씩 읽어서 나중에 merge한다.
o ) Dataframe : file 이름 list

참고: https://rfriend.tistory.com/256
'''

def readDataFrame(files:list)->DataFrame:

    datasets = []

    for file in files:

        rdatas = pd.read_csv(file, header=0, sep=',')

        print(rdatas.info())
        print(rdatas.describe())

        rdatas['file_name'] = file

        datasets.append(rdatas)

    merged:DataFrame = pd.concat(datasets)

    print(merged.info())
    print(merged.describe())

    return merged

if __name__ == '__main__':

    from Files.Directorys import findFiles

    fileList = findFiles('../datas/sincontan*.txt')

    df = readDataFrame(fileList)

    print(df.describe())
    print(df.info())
Comments