Skip to main content

머신러닝 용어집

머신 러닝의 용어, 프레임워크, 작업, 기술에 대한 용어집. 이 글은 AI로 번역된 기사입니다. 오역이 있을 수 있으니 댓글로 편하게 알려주세요.
Created on September 15|Last edited on September 15
이 용어집은 현재도 작업이 진행 중입니다. 지금은 내용이 제한적이지만, 지속적으로 업데이트되고 있습니다.

A



B

배치 정규화

머신 러닝에서 배치 정규화는 신경망의 깊은 층에 입력되는 값을 표준화(정규화)하여 내부 공분산 변화 문제를 방지하는 기법입니다.

BERT

B양방향 인코더 표현 from Transformers, 더 잘 알려진 BERT는, Google의 혁신적인 논문 여러 NLP 작업에서 최신 성능을 끌어올렸으며, 수많은 혁신적 아키텍처의 디딤돌이 되었다.


C

치명적 망각

신경망이 다른 작업으로 학습될 때, 이전 작업 수행 방법을 완전히 잊어버리는 경향.

분류

분류는 데이터를 예측하거나 범주화하는 데 초점을 둔 지도 학습 과제이다. 이는 데이터를 체계적으로 범주로 묶는 과정을 포함한다. 분류 알고리즘은 범주화해야 할 과거 데이터가 대량으로 존재하는 경우 특히 유용하다.

교차 엔트로피 손실

교차 엔트로피 손실은 머신러닝의 분류 모델이 얼마나 잘 동작하는지 평가하는 지표이다. 손실(또는 오류)은 0부터 1 사이의 숫자로 측정되며, 0은 완벽한 모델을 의미한다. 일반적으로 목표는 모델의 손실 값을 가능한 한 0에 가깝게 만드는 것이다. 더 알아보기 >

교차 검증

DataLoader

PyTorch의 DataLoader는 Dataset에서 데이터를 가져와 모델에 배치 단위로 제공하는 클래스이다. 일반적으로 학습을 위해 여러 배치를 생성하고, 테스트를 위해서는 하나의 배치를 만든다. 더 알아보기 >

드롭아웃

드롭아웃은 신경망의 일부 유닛을 제거(“드롭”)하여 동시에 매우 많은 아키텍처를 학습하는 효과를 내는 기계 학습 기법이다. 특히 학습 과정에서 과적합이 발생할 가능성을 크게 줄일 수 있다.

의사결정나무

의사결정나무는 분류와 회귀 문제에 사용되는 지도학습 모델이다. 의사결정나무는 데이터 포인트의 특징에 따라 서로 다른 예측으로 “가지”를 치는 규칙을 학습하여, 새로운 데이터 포인트의 값을 예측한다.




FinBERT

드롭아웃은 신경망의 일부 유닛을 제거(“드롭”)하여 동시에 매우 많은 아키텍처를 학습하는 효과를 내는 기계 학습 기법이다. 특히 학습 과정에서 과적합이 발생할 가능성을 크게 줄일 수 있다.




에이치



아이

이미지 분류

이미지 분류에서는 시스템이 객체를 감지하고 해당 이미지가 특정 클래스에 속하는지 여부를 참·거짓으로 판정한다. 분류의 목표는 각 이미지에 라벨을 할당하는 것이다.

이미지 분할

그림 1.2 이미지 분할: 이미지의 각 픽셀을 분류하기
이미지 분할에서는 시스템이 이미지의 모든 픽셀에 라벨을 할당한다. 각 픽셀에는 해당 픽셀의 의미와 어떤 객체에 속하는지를 시스템이 판단해 클래스를 부여한다.



k-겹 교차 검증

k-겹 교차 검증은 데이터셋을 k개의 폴드로 나누어 여러 개의 학습 세트와 검증 세트를 만드는 절차로, 하나의 학습/검증 세트만 선택했을 때 발생할 수 있는 우연한 편향으로부터 모델을 보호하는 데 도움을 준다.

k-평균 클러스터링

k-평균 클러스터링은 군집화 문제에 사용되는 비지도 학습 알고리즘이다. 목표는 데이터 포인트를 미리 지정된 수의 군집으로 분할하는 것이다. 군집의 개수이며, 각 데이터 포인트는 가장 가까운 중심을 가진 군집에 속한다.

k-최근접 이웃

k-최근접 이웃(k-NN)은 주로 분류 문제에 사용되는 지도 학습 알고리즘이다. 목표는 데이터 포인트들이 속한 클래스(들)를 바탕으로, 특정 데이터 포인트가 어떤 클래스에 속할 확률을 예측하는 것이다. 가까운 그것이 속한다

선형 회귀

선형 회귀는 회귀 문제에 사용되는 지도 학습 알고리즘이다. 목적은 지정된 데이터셋에서 두 개 이상의 특징 사이의 관계로부터 값을 가장 잘 예측하는 초평면을 찾아, 새로운 값을 예측하는 것이다.
선형 회귀에 대해 더 자세히 읽으려면 다음을 참조하세요 이 글.
수학적 정의를 읽을 수 있습니다 우리의 ML 수학 용어집에서.

로지스틱 회귀

로지스틱 회귀는 주로 분류에 사용되는 지도 학습 알고리즘이다. 목적은 입력이 어떤 클래스에 속할 확률을 가장 잘 예측하는 로지스틱 곡선을 찾는 것이며, 이렇게 얻은 확률을 바탕으로 입력을 실제 클래스에 매핑한다.

메타 러닝

신경망에서의 메타 러닝은 보상 및/또는 오류 체계를 활용해, 해당 체계가 학습된 영역 밖의 문제를 해결하도록 가르치는 접근을 의미한다. 데이터 자체를 직접 들여다보는 대신, 알고리즘의 출력에 주목하고 그 출력에 기반해 예측하도록 학습한다.


나이브 베이즈

나이브 베이즈 분류기는 분류 문제에 사용되는 지도 학습 모델이다. 이 모델은 베이즈 정리를 사용해 각 가능한 클래스에 속할 확률을 계산하고, 그중 가장 가능성이 높은 클래스를 식별한다.

신경망 가지치기

테스트 시 자원 요구량을 줄이는 데 널리 쓰이는 접근법 중 하나는 신경망 가지치기이다. 이는 기존 네트워크에서 매개변수(뉴런, 연결 등)를 체계적으로 제거해 모델의 크기를 줄이려는 것을 의미한다.


객체 감지

객체 감지는 소프트웨어가 비디오나 디지털 이미지에서 객체를 식별하고 위치를 찾아내도록 학습하는 컴퓨터 비전 기법이다. 객체가 식별되고 위치가 지정되면, 객체 감지 알고리즘은 해당 객체에 레이블을 부여할 수도 있다.

광학 문자 인식(OCR)

광학 문자 인식(OCR)은 이미지에서 텍스트를 추출하는 컴퓨터 비전 및 머신 러닝 기법으로, 일반적으로 이미지 검색이나 소프트웨어 기반 영수증 처리 등 다른 시스템에서 활용할 수 있도록 하기 위해 사용된다.

옵티마이저

딥러닝에서 옵티마이저는 신경망의 Weights & Biases에 의존하는 함수 또는 알고리즘이다. 옵티마이저는 손실을 최소한의 비용으로 줄이기 위해 이러한 매개변수를 수정한다.


순열 불변성

머신 러닝에서 순열 불변성은 입력의 순서를 바꾸어도 출력에 영향을 주지 않는 특성을 말한다.

정책

머신 러닝에서 정책은 현재 환경, 가능한 행동의 집합, 특정 행동이 상태 변화를 일으킬 확률, 그리고 보상 함수에 기반한 규칙이다. 정책은 모델이 최대 보상을 얻도록 유도하는 데 사용된다.

주성분 분석(PCA)

주성분 분석(PCA)은 비지도 차원 축소 알고리즘이다. 목적은 데이터셋의 주성분(PC)을 계산하는 것으로, 이는 기존 특성에서 파생된 새로운 특성이다. 보통 처음 두세 개의 주성분만 유지하여 데이터셋을 2차원 또는 3차원으로 재매핑할 수 있다.





에스

자가 조직화

신경망에서의 자가 조직화는, 자기지도 학습 시스템이 스스로의 무질서한 부분들 사이의 국소 상호작용을 바탕으로 일관된 정책을 형성하는 능력을 말한다.

감각 뉴런

신경망에서 감각 뉴런(또는 감각 입력 뉴런)은 “외부 세계”로부터 입력을 받아 활성화 함수를 통해 처리한 뒤, 그 결과 값을 다음으로 전달하는 노드이다.

서포트 벡터 머신(SVM)

서포트 벡터 머신(SVM)은 분류에 사용되는 지도학습 모델이다. SVM은 데이터셋에서 서로 다른 클래스를 가장 잘 분리하는 초평면을 찾으며, 새로운 데이터 포인트가 초평면의 어느 쪽(즉, 어느 클래스)에 속하는지를 판단해 분류한다.

토큰

자연어 처리에서 토큰은 단어, 단어의 부분(서브워드), 혹은 문자에 대한 표현이다. 텍스트를 처리할 때 토크나이저는 해당 텍스트를 토큰 단위로 분할하며, 이렇게 분할된 토큰들은 동일한 텍스트를 문자 단위로 처리하는 것보다 역사적으로 더 높은 효율로 시스템에서 처리될 수 있다.





가중치 초기화

가중치 초기화는 신경망 학습 과정에서 바람직하지 않은 동작을 방지하기 위한 “요령”으로 처음 논의되었다. 가중치의 초기값은 학습 과정에 상당한 영향을 미칠 수 있다. 더 알아보기 >


엑스



YOLO

YOLO는 다음의 약자를 의미한다 단일 합성곱 신경망을 사용한 매우 빠른 객체 감지 프레임워크이며, 전체 이미지를 한 번에 확인하는 방식으로 작동합니다. YOLO는 이미지를 픽셀 단위로 스캔하는 다른 객체 감지 시스템과 달리 한 번에 전체 이미지를 바라보기 때문에 더 빠른 경우가 많습니다.


제로샷 러닝

제로샷 러닝은 특정 과제에 대해 직접적인 학습을 받지 않았더라도, 다른 유형의 과제들로 학습된 모델이 그 과제에 적용될 수 있는 능력을 설명하는 머신러닝 용어입니다.

이 글은 AI로 번역된 문서입니다. 오역 가능성이 있다면 댓글로 알려주세요. 원문 보고서 링크는 다음과 같습니다: 원문 보고서 보기