추천 사이트
• Kaggle: 투표하기(upvoting) 기능이 있어 사용자들에게 인기가 높은 데이터셋을 찾기에 좋음
• Awesome Public Datasets: github에 주제(농업, 경제, 교육, 에너지 등등)별로 분류된 방대한 데이터셋 목록
• Data Is Plural: 2015년부터 매주 발행되고 있는 “쓸모있고/흥미로운” 데이터셋 모음
• 하트카운트 샘플 데이터셋 (구글 드라이브로 이동): 실제 실무에서 쓰는 데이터셋과 유사한 대표적인 데이터셋들을 매출, HR, 마케팅, 시계열 등으로 분류해 놓음; 한글 데이터셋
• AI Hub: AI 학습용 데이터
기타 해외 데이터셋 구할 수 있는 사이트들
• Google Dataset Search: 구글 검색하듯이 데이터셋을 검색할 수 있는 서비스
• Data.gov: 미국 정부에서 주제별로 나름 잘 정리해 높은 공개 데이터 모음
• UCI Machine Learning Repository
• Pew Internet : 서베이 데이터 중심
• FiveThirtyEight
• GitHub’s Awesome-Public-Datasets
• Data.world
• Amazon Web Service Open Data Registry
• 카네기 멜론 대학교 통계학과 공개 데이터셋 저장소
• 공개 데이터 저장소가 나열되어 있는 메타포털
◦ 데이터 포털 (http://dataportals.org)
◦ 오픈 데이터 모니터 (http://opendatamonitor.eu)
◦ 퀀들 (http://quandl.com)
• 공공 데이터
◦ 세계 은행 오픈 데이터
◦ OECD 데이터
◦ COVID datasets: CDC, Our World in Data
기타 국내 데이터셋 구할 수 있는 사이트들
•공공 데이터
◦ 공공데이터포털
◦ e-나라지표
◦ KOSIS 국가통계포털
◦ 빅데이터 플랫폼 통합데이터 지도
◦ 서울 열린데이터광장
◦ 서울시부동산정보광장
◦ 서울특별시 빅데이터 캠퍼스