캐글 데이터 다운로드

자체 분석을 위해 데이터 집합을 다운로드하는 것은 쉽습니다. 명령으로 `kaggle 데이터 세트 다운로드 -d hugomathien / 축구`, 그것은 우리를 위해 파일을 다운로드에 대해 설정합니다. 데이터 집합을 다운로드하려면 데이터 서브탭으로 이동합니다. API 섹션에서 전체 데이터 집합을 다운로드하기 위해 터미널에 복사할 수 있는 정확한 명령을 찾을 수 있습니다. 굉장한, 많은 것들에서 배울 수 및 데이터 세트를 사용합니다. 특히 도움이 되는 것은 유럽 축구 데이터베이스로, 경기, 팀 및 선수를 다루는 25,000개 이상의 항목이 있는 데이터 세트와 함께 배울 수 있는 데이터를 분석하는 훌륭한 노트북이 있습니다. Kaggle을 통해 대회, 데이터 집합 및 커널을 탐색 할 수 있지만 여기에서는 데이터 집합 다운로드에만 집중할 것입니다. 여기서 프로젝트가 시작되면 자동으로 다운로드하려는 Kaggle 대회 또는 데이터 집합 이름을 지정할 수 있습니다. 당신은 모든 Kaggle 경쟁 페이지의 데이터 탭에서이 이름을 얻을 수 있습니다 예를 들어, 위의 단계가 완료되면, 당신이 만들 때마다 / 프로젝트를 편집, 새로운 옵션은 WORKSPACE 탭아래에 표시해야합니다, Kaggle 데이터 세트. 당신이 공유하고 싶은 다른 유용한 팁 / 링크 / 제안이있는 경우, 아래의 코멘트 섹션에 넣어주시기 바랍니다. 내가 한 일은 기차 jpg.tar 아카이브를 다운로드하고 Google 드라이브에 업로드하는 것입니다. 이제 노트북에서 드라이브 폴더를 탑재하고 거기에서 데이터를 사용할 수 있습니다.

느린 연결에서 데이터를 다운로드하고 업로드해야했기 때문에 조금 짜증나지만 드라이브에 들어가면 괜찮습니다. Kaggle 데이터 세트로 학습을 즐기고 당신이 나온 것과 연락! 단일 명령(2019/8월/10일 현재)으로 여러 파일을 다운로드할 수 없으므로 다음 명령을 사용하여 하나씩 다운로드해야 합니다. 나는 404를 얻을 – 응답으로 찾을 수 없습니다. 그래서, 나는 경쟁에서 사용할 수있는 모든 파일을 나열하고 노트북을 통해 가는 Am사용할 수 없다는 것을 발견하고 모든 것이 작동하는 것 같다! 아무 일도 일어나지 않으면 GitHub 데스크톱을 다운로드하고 다시 시도하십시오. 이 시점에서, Kaggle API는 갈 좋은 해야 한다! 관심 있는 경쟁 또는 데이터 집합으로 이동하여 API 명령을 VM에 복사하면 다운로드가 시작됩니다. 대부분의 데이터 집합은 압축이 저장되므로 압축 해제 도구를 설치하고 데이터를 추출해야 합니다.