Tagged

machine learning

A collection of 3 posts

machine learning

Linear Regression(선형회귀분석)

선형회귀분석은 변수들 사이의 관계를 분석하는 데 사용하는 통계학적 방법입니다. 이 방법의 장점은 알고리즘의 개념이 복잡하지 않고 다양한 문제에 폭넓게 적용할 수 있다는 점입니다. 선형회귀분석은 독립변수(혹은 설명변수) $x_i$, 상수항 $b$와 종속변수(혹은 반영변수) $y$ 사이의 관계를 모델링하는 방법입니다. $y = W * x + b$ 한 개의 독립변수에 기반한 경우 단순

machine learning

K-Means Algorithm(K-평균 알고리즘)

K-평균 알고리즘은 간단한 방법으로 주어진 데이터를 지정한 군집(cluster) 개수($K$)로 그룹화하는 방법으로 1957년 후고 스테인하우스에 의해 소개되었고 용어 자체는 1967년 제임스 매퀸에 의해 처음 사용되었다. 데이터를 한 개 이상의 데이터 오브젝트로 구성된 $K$개의 그룹으로 나누는 것으로 거리기반의 그룹간 비유사도(dissimilarity)와 같은 비용 함수을 최소화하는 방식으로 이루어집니다.

bayes

Naïve Bayes Classifier

나이브 베이즈(Naïve Bayes)는 1950년부터 활발히 연구되어 왔다. 1960년대 초반에는 텍스트 검색 커뮤니티(text retrieal community)에서 다른 이름으로 소개되었고, 단어의 빈도수를 특징으로 활용하여 하나의 범주 혹은 다른 범주(예를 들어 스팸, 스포츠, 정치 등)과 관련된 문서를 판별하는 텍스트 범주 분류(text categorization)를 하는 제일 유명한 방법이었다.