복붙노트

[PYTHON] csv를 Google 콜라에서 데이터 프레임으로 읽습니다.

PYTHON

csv를 Google 콜라에서 데이터 프레임으로 읽습니다.

내 컴퓨터에 로컬로 저장된 CSV 파일을 읽으려고합니다. (다만 추가 참고를 위해 여기에서 인 Kaggle에서 거대한 자료이다.)

이 질문과 답변을 통해 나는 잘 작동하는이 코드를 사용하여 데이터를 가져올 수 있다는 것을 알게되었습니다.

from google.colab import files
uploaded = files.upload()

내가 잃어버린 부분은 여기에서 데이터 프레임으로 변환하는 방법입니다. 위의 대답에 나와있는 샘플 Google 노트 페이지는 그것에 대해 이야기하지 않습니다.

from_dict 명령을 사용하여 데이터 프레임으로 업로드 한 사전을 변환하려고하지만 작동하지 못합니다. 여기서 DICT를 데이터 프레임으로 변환하는 방법에 대한 논의가 있지만 솔루션이 제게 적용되지 않습니다 (필자 생각).

그래서 요약하면, 제 질문은 :

How do I convert a csv file stored locally on my files to pandas 
datframe on google-colaboratory?

해결법

  1. ==============================

    1.Pandas read_csv가 트릭을해야합니다. read_csv는 파일과 비슷한 객체를 기대하기 때문에 업로드 된 바이트를 io.StringIO에 래핑하려고합니다.

    Pandas read_csv가 트릭을해야합니다. read_csv는 파일과 비슷한 객체를 기대하기 때문에 업로드 된 바이트를 io.StringIO에 래핑하려고합니다.

    전체 예제는 다음과 같습니다. https://colab.research.google.com/notebook#fileId=1JmwtF5OmSghC-y3-BkvxLan0zYXqCJJf

    핵심 스 니펫은 다음과 같습니다.

    import pandas as pd
    import io
    
    df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8')))
    df
    
  2. ==============================

    2.이것은 나를 위해 일했다 :

    이것은 나를 위해 일했다 :

    from google.colab import auth
    auth.authenticate_user()
    
    from pydrive.drive import GoogleDrive
    from pydrive.auth import GoogleAuth
    from oauth2client.client import GoogleCredentials
    gauth = GoogleAuth()
    gauth.credentials = GoogleCredentials.get_application_default()
    drive = GoogleDrive(gauth)
    
    myfile = drive.CreateFile({'id': '!!!YOUR FILE ID!!!'})
    myfile.GetContentFile('file.csv')
    

    Replace !!! 당신의 파일 아이디 !!! Google 드라이브에있는 파일의 ID입니다.이 파일은 "공유 할 링크 얻기"를 클릭하면 나타나는 긴 영숫자 문자열입니다. 그런 다음 pandas의 read_csv를 사용하여 file.csv에 액세스 할 수 있습니다.

    import pandas as pd
    frm = pd.read_csv('file.csv', header=None)
    
  3. ==============================

    3.Colab google : PC에서 CSV 업로드 나는 엑셀 파일 (* .xlsx)과 같은 문제가 있었는데, 나는 다음과 같은 문제를 해결했다. 그리고 나는 당신이 CSV 파일로도 똑같이 할 수 있다고 생각한다. - PC 드라이브에 file.xlsx라는 파일이있는 경우 : 1-이 간단한 코드를 사용하여 하드 드라이브에서 업로드 :

    Colab google : PC에서 CSV 업로드 나는 엑셀 파일 (* .xlsx)과 같은 문제가 있었는데, 나는 다음과 같은 문제를 해결했다. 그리고 나는 당신이 CSV 파일로도 똑같이 할 수 있다고 생각한다. - PC 드라이브에 file.xlsx라는 파일이있는 경우 : 1-이 간단한 코드를 사용하여 하드 드라이브에서 업로드 :

    from google.colab import files
    uploaded = files.upload()
    

    (Choose Files)를 누르고 Google 드라이브에 업로드하십시오.

    2 - 다음 :

    import io
    data = io.BytesIO(uploaded['file.XLSX'])    
    

    3 - 마지막으로 파일을 읽습니다.

    import pandas as pd   
    f = pd.read_excel(data , sheet_name = '1min', header = 0, skiprows = 2)
    #df.sheet_names
    df.head()
    

    4- 자신의 파일을 읽을 수 있도록 매개 변수 값을 변경하십시오. 나는 이것이 다른 유형의 파일을 읽도록 일반화 될 수 있다고 생각한다. 그것을 즐기십시오!

  4. ==============================

    4.또는 github을 사용하여 파일을 가져올 수도 있습니다. 예를 들면 다음과 같습니다. https://drive.google.com/file/d/1D6ViUx8_ledfBqcxHCrFPcqBvNZitwCs/view?usp=sharing

    또는 github을 사용하여 파일을 가져올 수도 있습니다. 예를 들면 다음과 같습니다. https://drive.google.com/file/d/1D6ViUx8_ledfBqcxHCrFPcqBvNZitwCs/view?usp=sharing

    또한 Google은 파일을 오래 유지하지 않으므로 github 스 니펫을 몇 번이고 다시 실행해야 할 수도 있습니다.

  5. ==============================

    5.1 단계 - Google 드라이브를 공동 작업대에 마운트합니다.

    1 단계 - Google 드라이브를 공동 작업대에 마운트합니다.

    from google.colab import drive 
    drive.mount('/content/gdrive')
    

    2 단계 - 이제 Google 드라이브 파일이 왼쪽 창 (파일 탐색기)에 표시됩니다. 가져올 파일을 마우스 오른쪽 단추로 클릭하고 çopy 경로를 선택하십시오. 그런 다음이 복사 된 경로를 사용하여 팬더에서 평소와 같이 가져옵니다.

    import pandas as pd 
    df=pd.read_csv('gdrive/My Drive/data.csv')
    

    끝난!

  6. from https://stackoverflow.com/questions/48340341/read-csv-to-dataframe-in-google-colab by cc-by-sa and MIT license