[텍스트 마이닝] 2. Machine Learning 1
기본 개념 p4. 예측 태스크의 유형 회귀(Regression): 입력이 주어졌을 때 연속적인 출력값을 예측하는 것 \[x \;\longrightarrow\; f \;\longrightarrow\; y \in \mathbb{R}\] 위치, 크기 ⟶ 주택 가격 주가, 날짜 ⟶ 미래 주가 ...
기본 개념 p4. 예측 태스크의 유형 회귀(Regression): 입력이 주어졌을 때 연속적인 출력값을 예측하는 것 \[x \;\longrightarrow\; f \;\longrightarrow\; y \in \mathbb{R}\] 위치, 크기 ⟶ 주택 가격 주가, 날짜 ⟶ 미래 주가 ...
p6. 랭킹 기반 검색 (Ranked Retrieval) Boolean Query의 장점과 한계 불리언 질의: 문서가 질의와 일치하거나, 그렇지 않거나 둘 중 하나 장점 자신의 요구사항과 문서 집합을 정확하게 이해하는 전문가에게 유용 애플리케이션이 수천 개의 결과를 쉽게 처리할...
p2. 정보 검색 개요 User task (사용자 과제) 사용자가 실제로 수행하려는 작업 예: 리포트 작성, 문제 해결, 특정 사실 확인 Info need (정보 요구) 사용자가 과제를 수행하는 과정에서 느끼는 정보의 필요성 내적이고 추상적인 개념이며, 명확히 표...
p2. 신뢰구간(CI) \((E, \left( P_{\theta} \right)_{\theta \in \Theta})\)는 관측치 $X_{1}, \dots, X_{n}$에 기반한 통계모델이라 하고, 모수 공간 $\Theta$는 $\mathbb{R}$의 부분집합이라고 가정하자. 정의 $\alpha \in (0,1)$이라고 하자. 모...
p2. (연속) 확률변수 확률변수(Random Variable) 는 데이터 공간의 임의의 부분집합 $B$에 대해 그 확률 법칙(Probability law) 이 음이 아닌 함수, 즉 확률밀도함수(PDF, Probability Density Function)(= 확률분포)로 표현될 수 있을 때 연속형 확률변수 라고 한다. \[P(X \in B) = ...