[PYTHON] csv를 Google 콜라에서 데이터 프레임으로 읽습니다.
PYTHONcsv를 Google 콜라에서 데이터 프레임으로 읽습니다.
내 컴퓨터에 로컬로 저장된 CSV 파일을 읽으려고합니다. (다만 추가 참고를 위해 여기에서 인 Kaggle에서 거대한 자료이다.)
이 질문과 답변을 통해 나는 잘 작동하는이 코드를 사용하여 데이터를 가져올 수 있다는 것을 알게되었습니다.
from google.colab import files
uploaded = files.upload()
내가 잃어버린 부분은 여기에서 데이터 프레임으로 변환하는 방법입니다. 위의 대답에 나와있는 샘플 Google 노트 페이지는 그것에 대해 이야기하지 않습니다.
from_dict 명령을 사용하여 데이터 프레임으로 업로드 한 사전을 변환하려고하지만 작동하지 못합니다. 여기서 DICT를 데이터 프레임으로 변환하는 방법에 대한 논의가 있지만 솔루션이 제게 적용되지 않습니다 (필자 생각).
그래서 요약하면, 제 질문은 :
How do I convert a csv file stored locally on my files to pandas
datframe on google-colaboratory?
해결법
-
==============================
1.Pandas read_csv가 트릭을해야합니다. read_csv는 파일과 비슷한 객체를 기대하기 때문에 업로드 된 바이트를 io.StringIO에 래핑하려고합니다.
Pandas read_csv가 트릭을해야합니다. read_csv는 파일과 비슷한 객체를 기대하기 때문에 업로드 된 바이트를 io.StringIO에 래핑하려고합니다.
전체 예제는 다음과 같습니다. https://colab.research.google.com/notebook#fileId=1JmwtF5OmSghC-y3-BkvxLan0zYXqCJJf
핵심 스 니펫은 다음과 같습니다.
import pandas as pd import io df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8'))) df
-
==============================
2.이것은 나를 위해 일했다 :
이것은 나를 위해 일했다 :
from google.colab import auth auth.authenticate_user() from pydrive.drive import GoogleDrive from pydrive.auth import GoogleAuth from oauth2client.client import GoogleCredentials gauth = GoogleAuth() gauth.credentials = GoogleCredentials.get_application_default() drive = GoogleDrive(gauth) myfile = drive.CreateFile({'id': '!!!YOUR FILE ID!!!'}) myfile.GetContentFile('file.csv')
Replace !!! 당신의 파일 아이디 !!! Google 드라이브에있는 파일의 ID입니다.이 파일은 "공유 할 링크 얻기"를 클릭하면 나타나는 긴 영숫자 문자열입니다. 그런 다음 pandas의 read_csv를 사용하여 file.csv에 액세스 할 수 있습니다.
import pandas as pd frm = pd.read_csv('file.csv', header=None)
-
==============================
3.Colab google : PC에서 CSV 업로드 나는 엑셀 파일 (* .xlsx)과 같은 문제가 있었는데, 나는 다음과 같은 문제를 해결했다. 그리고 나는 당신이 CSV 파일로도 똑같이 할 수 있다고 생각한다. - PC 드라이브에 file.xlsx라는 파일이있는 경우 : 1-이 간단한 코드를 사용하여 하드 드라이브에서 업로드 :
Colab google : PC에서 CSV 업로드 나는 엑셀 파일 (* .xlsx)과 같은 문제가 있었는데, 나는 다음과 같은 문제를 해결했다. 그리고 나는 당신이 CSV 파일로도 똑같이 할 수 있다고 생각한다. - PC 드라이브에 file.xlsx라는 파일이있는 경우 : 1-이 간단한 코드를 사용하여 하드 드라이브에서 업로드 :
from google.colab import files uploaded = files.upload()
(Choose Files)를 누르고 Google 드라이브에 업로드하십시오.
2 - 다음 :
import io data = io.BytesIO(uploaded['file.XLSX'])
3 - 마지막으로 파일을 읽습니다.
import pandas as pd f = pd.read_excel(data , sheet_name = '1min', header = 0, skiprows = 2) #df.sheet_names df.head()
4- 자신의 파일을 읽을 수 있도록 매개 변수 값을 변경하십시오. 나는 이것이 다른 유형의 파일을 읽도록 일반화 될 수 있다고 생각한다. 그것을 즐기십시오!
-
==============================
4.또는 github을 사용하여 파일을 가져올 수도 있습니다. 예를 들면 다음과 같습니다. https://drive.google.com/file/d/1D6ViUx8_ledfBqcxHCrFPcqBvNZitwCs/view?usp=sharing
또는 github을 사용하여 파일을 가져올 수도 있습니다. 예를 들면 다음과 같습니다. https://drive.google.com/file/d/1D6ViUx8_ledfBqcxHCrFPcqBvNZitwCs/view?usp=sharing
또한 Google은 파일을 오래 유지하지 않으므로 github 스 니펫을 몇 번이고 다시 실행해야 할 수도 있습니다.
-
==============================
5.1 단계 - Google 드라이브를 공동 작업대에 마운트합니다.
1 단계 - Google 드라이브를 공동 작업대에 마운트합니다.
from google.colab import drive drive.mount('/content/gdrive')
2 단계 - 이제 Google 드라이브 파일이 왼쪽 창 (파일 탐색기)에 표시됩니다. 가져올 파일을 마우스 오른쪽 단추로 클릭하고 çopy 경로를 선택하십시오. 그런 다음이 복사 된 경로를 사용하여 팬더에서 평소와 같이 가져옵니다.
import pandas as pd df=pd.read_csv('gdrive/My Drive/data.csv')
끝난!
from https://stackoverflow.com/questions/48340341/read-csv-to-dataframe-in-google-colab by cc-by-sa and MIT license
'PYTHON' 카테고리의 다른 글
[PYTHON] 파일 이름을 file : // URL로 변환합니다. (0) | 2018.11.20 |
---|---|
[PYTHON] URL에서 호스트 이름 변경하기 (0) | 2018.11.20 |
[PYTHON] Flask에 양식 배열 보내기 (0) | 2018.11.20 |
[PYTHON] 동일한 bool 값으로 목록 초기화 (0) | 2018.11.20 |
[PYTHON] 파이썬에서 현재 가져 오기 경로를 얻는 방법? (0) | 2018.11.19 |