[AI] 머신러닝(Machine Learning) 핵심 정리

1 minute read

Machine Learning 개념

머신 러닝(Machine Learning)은 컴퓨터가 명시적으로 프로그래밍되지 않고 데이터를 통해 스스로 학습하고 예측하는 능력을 갖추는 기술입니다.
즉, 컴퓨터가 데이터를 분석하고 패턴을 인식하여 새로운 데이터에 대한 예측이나 결정을 내릴 수 있도록 하는 것입니다.

학습(Training): 알고리즘에 데이터를 입력하여 모델을 생성하는 과정입니다. 학습 데이터를 통해 모델의 파라미터를 조정하여 예측 성능을 향상시킵니다.
예측(Prediction): 학습된 모델에 새로운 데이터를 입력하여 결과를 예측하는 과정입니다.

크게 3가지 학습 방법으로 나누어집니다.

The-main-typesn <출처 researchgate="">

지도 학습(Supervised Learning): 입력 데이터와 정답(레이블) 쌍으로 이루어진 학습 데이터를 사용하여 모델을 학습시키는 방법입니다.
- 분류(Classification): 데이터를 여러 클래스로 분류하는 문제 (예: 스팸 메일 분류, 이미지 분류)
- 회귀(Regression): 연속적인 값을 예측하는 문제 (예: 주택 가격 예측, 온도 예측)

Supervised_Learning <출처 edushots="">

비지도 학습(Unsupervised Learning): 정답이 없는 데이터를 사용하여 데이터 속의 숨겨진 구조나 패턴을 찾는 방법입니다.
- 클러스터링(Clustering): 유사한 특징을 가진 데이터를 그룹으로 묶는 문제
- 차원 축소(Dimensionality Reduction): 고차원 데이터를 저차원 공간으로 변환하여 데이터를 시각화하거나 분석하는 문제

Unsupervised_Learning <출처 edushots="">

Reinforcement_Learning <출처 researchgate="">

선형 회귀(Linear Regression): 입력 변수와 출력 변수 사이의 선형 관계를 모델링하는 알고리즘
로지스틱 회귀(Logistic Regression): 분류 문제에 사용되는 알고리즘으로, 시그모이드 함수를 사용하여 확률 값을 예측합니다.
결정 트리(Decision Tree): 의사 결정 규칙을 나무 형태로 표현하여 데이터를 분류하거나 예측하는 알고리즘
랜덤 포레스트(Random Forest): 다수의 결정 트리를 결합하여 예측 성능을 향상시키는 알고리즘
서포트 벡터 머신(Support Vector Machine, SVM): 데이터를 분류하는 최적의 초평면을 찾는 알고리즘
k-최근접 이웃(k-Nearest Neighbors, k-NN): 새로운 데이터 포인트를 가장 가까운 k개의 이웃 데이터 포인트의 클래스로 분류하는 알고리즘

딥러닝은 머신 러닝의 한 분야입니다.
딥러닝은 인공 신경망을 기반으로 하여 더 복잡한 문제를 해결할 수 있도록 발전했습니다.
머신 러닝은 딥러닝 외에도 다양한 알고리즘과 기법을 포함합니다.

ml-whitepaper-1 <출처 nvidia="">