mnist data 다운로드

전처리 및 서식 지정에 최소한의 노력을 지출하면서 실제 데이터에 대한 기술 및 패턴 인식 방법을 학습하려는 사람들에게 좋은 데이터베이스입니다. 컨볼루션 레이어는 데이터 집합의 이미지에서 피처를 추출하는 첫 번째 레이어입니다. 픽셀은 인접 픽셀과 가까운 픽셀만 관련이 있기 때문에 컨볼루션을 통해 이미지의 여러 부분 간의 관계를 유지할 수 있습니다. 컨볼루션은 기본적으로 픽셀 간의 관계를 잃어도 이미지의 크기를 줄이기 위해 더 작은 픽셀 필터로 이미지를 필터링합니다. 1×1 보폭의 3×3 필터를 사용하여 5×5 이미지에 컨볼루션을 적용하는 경우(각 단계에서 1픽셀 이동). 우리는 3×3 출력 (복잡성64 % 감소)을 가지게될 것입니다. [4] MNIST 데이터베이스는 mNIST 데이터베이스가 http://yann.lecun.com/exdb/mnist/ 사용할 수 https://en.wikipedia.org/wiki/MNIST_database MNIST 데이터베이스에는 60,000개의 교육 이미지와 미국 인구 조사국 직원과 미국 고등학교 학생으로부터 가져온 10,000개의 테스트 이미지가 포함되어 있습니다[4]. 따라서 두 번째 줄에서는 이 두 그룹을 기차와 테스트로 분리하고 레이블과 이미지를 분리했습니다. x_train 및 x_test 부품에는 그레이스케일 RGB 코드(0~255)가 포함되어 있으며 y_train 및 y_test 부품에는 실제로 있는 숫자를 나타내는 0에서 9까지의 레이블이 포함되어 있습니다. 이 숫자를 시각화하기 위해 matplotlib에서 도움을 받을 수 있습니다.

모든 tfds 데이터 집합에는 피쳐 사전이 텐서 값에 피처 이름을 매핑합니다. MNIST와 같은 일반적인 데이터 집합에는 “이미지” 및 “레이블”이라는 2개의 키가 있습니다. 아래에서 단일 예제를 검사합니다. tfds.load는 tf.data.Data집합을 구축하고 로드하는 가장 간단한 방법입니다. 생성 후 빌더에는 데이터 집합에 대한 유용한 정보가 들어 있습니다: 열차 파일을 자동으로 다운로드하고 데이터 집합의 첫 번째 이미지를 표시하려면 데이터 집합을 로드할 때 표준 기본 버전이 사용됩니다. 그러나 사용할 데이터 집합의 주요 버전을 지정하고 결과에 사용된 데이터 집합의 버전을 보급하는 것이 좋습니다. 자세한 내용은 데이터 집합 버전 조정에 대한 설명서를 참조하십시오. 아래에서MNIST 학습 데이터를 로드합니다. 다운로드=False를 지정하지 않는 한 데이터를 다운로드하고 준비합니다.

데이터가 준비되면 후속 로드 호출은 준비된 데이터를 다시 사용합니다. data_dir= (기본값 ~ / tensorflow_datasets /)를 지정하여 데이터가 저장 / 로드되는 위치를 사용자 정의 할 수 있습니다.