728x90
1.아키텍처(architectures)
신경망의 구조를 정의하는 설계도
입력과 출력의 형태, 네트워크의 계층 구성, 각 계층의 수와 종류 등을 포함한 모델의 구성요소들
(모델이 데이터를 처리하고 학습하며 예측을 수행하는 방식이 이 설계에 따라 결정된다.)
1-1.CNN (Convolutional Neural Network)
이미지 데이터 처리

1-2.RNN (Recurrent Neural Network)
순차적 데이터처리

1-3.Transformer
자연어 처리(NLP)
2.체크포인트(checkpoints)
모델 학습 과정에서 저장된 모델의 상태를 의미한다.
특정 에포크(epoch)나 검증(validation) 성능이 최고일 때 모델 저장한다.
(가중치, 바이어스, 옵티마이저(optimizer) 상태등을 포함한다.)

728x90
'AI' 카테고리의 다른 글
| [AI] 인코더 모델,디코더 모델,인코더-디코더 모델 (0) | 2025.01.07 |
|---|---|
| [AI] transformers 라이브러리, Pipeline란? (0) | 2025.01.06 |
| [AI] 파인튜닝(Fine-tuning) (0) | 2025.01.06 |