728x90
0.머신 러닝(Machine Learning)
데이터를 이용해 알고리즘이 스스로 학습하여, 명시적인 프로그래밍 없이 예측하거나 결정을 내리는 기술이다.
즉 데이터를 기반으로 학습하며, 그 학습 결과를 바탕으로 새로운 데이터를 처리하거나 예측하는 데 사용한다.
1.데이터셋 (Dataset)
머신 러닝에서 사용하는 데이터의 집합
일반적으로 훈련 데이터와 테스트 데이터로 나누어 사용
1-1.훈련 데이터 (Training Data)
모델이 학습하는 데 사용하는 데이터. 주어진 입력에 대한 정답이 포함된다.
1-2.테스트 데이터 (Test Data)
훈련된 모델의 성능을 평가하는 데 사용하는 데이터.
모델은 테스트 데이터의 정답을 모르며, 예측한 값을 실제 정답과 비교한다.
1-3.검증 데이터 (Validation Data)
모델의 하이퍼파라미터 조정이나 성능 최적화를 위해 사용하는 데이터.
훈련 데이터와 테스트 데이터와는 별도로 구분됨
2.알고리즘
2-1.회귀 (Regression)
머신 러닝에서 연속적인 숫자 값을 예측하는 문제를 다루는 기법
주어진 입력 변수(독립 변수)와 출력 변수(종속 변수) 간의 관계를 학습하여, 새로운 입력에 대해 예측값을 생성하는 것을 목표로 한다.
2-2.분류 (Classification)
주어진 입력 데이터가 어떤 카테고리나 클래스에 속하는지 예측하는 문제를 다루는 기법
분류 문제는 이산적인 값(Discrete Value)을 예측하는 문제로, 주어진 데이터를 두 개 이상의 클래스로 분류하는 작업이다.
3.모델 (Model)
머신 러닝에서 데이터를 분석하고 예측을 하기 위한 수학적, 알고리즘적인 구조
모델은 주어진 데이터를 학습하여 입력과 출력 간의 관계를 파악하고, 이를 기반으로 새로운 데이터에 대해 예측이나 결정을 내릴 수 있도록 만들어진다.
3-1.가중치 (Weights)
가중치는 모델이 학습하는 동안 데이터의 중요도를 반영하는 파라미터다.
신경망에서 각 뉴런 간의 연결 강도를 나타내며, 학습 과정에서 가중치는 조정되어 모델이 예측을 잘하도록 만든다.
3-2.오프셋(Offset)
머신 러닝에서 주로 모델의 예측값에 일정한 값을 더하는 개념으로 사용된다.
어떤 기준값에서 일정한 값을 더하거나 빼는 차이나 간격을 나타내는 용어
3-3.편향 (Bias)
편향은 모델의 출력에 일정한 오프셋을 추가하는 파라미터다.
가중치와 함께 모델의 출력을 조정하여 더 정확한 예측을 가능하게
3-4.하이퍼파라미터 (Hyperparameters)
모델 학습 전에 설정해야 하는 값
학습 과정을 제어하며, 모델의 성능에 큰 영향을 미친다.
4.학습 (Training)
훈련 데이터를 사용하여 모델이 데이터를 기반으로 패턴을 학습하는 과정
4-1.에포크 (Epoch)
전체 훈련 데이터셋을 모델이 한 번 학습하는 과정
하나의 에포크에서 모델은 훈련 데이터셋의 모든 샘플을 한 번씩 보고, 그에 대한 예측을 수행하고 가중치와 편향을 조정한다.
(훈련을 몇 번 반복할 것인지 결정함)
4-2.배치 (Batch)
훈련 데이터를 부분 집합으로 나누어 학습하는 방법
대규모 데이터를 한 번에 처리하는 것이 비효율적일 수 있기 때문에, 데이터를 작은 배치로 나누어 처리한다.
728x90
'AI' 카테고리의 다른 글
[AI]선형 회귀(Linear Regression) (1) | 2024.12.28 |
---|---|
[AI] 코사인 유사도 (0) | 2024.12.27 |
[AI] Bag of Words (1) | 2024.12.27 |