2. 일차결합과 생성(span)
1. 일차결합 벡터공간 $V$와 공집합이 아닌 부분집합 $S \subseteq V$를 생각하자. 유한개의 벡터 $u_1, u_2, \dots, u_n \in S$와 스칼라 $a_1, a_2, \dots, a_n \in F$에 대하여 \[v = a_1 u_1 + a_2 u_2 + \cdots + a_n u_n\] 의 꼴로 나타낼 수 있는 벡터 $...
1. 일차결합 벡터공간 $V$와 공집합이 아닌 부분집합 $S \subseteq V$를 생각하자. 유한개의 벡터 $u_1, u_2, \dots, u_n \in S$와 스칼라 $a_1, a_2, \dots, a_n \in F$에 대하여 \[v = a_1 u_1 + a_2 u_2 + \cdots + a_n u_n\] 의 꼴로 나타낼 수 있는 벡터 $...
1. 벡터공간의 정의 벡터공간(vector space) 또는 선형공간(linear space) $V$는 체(field) $F$ 위에서 정의된 집합으로, 다음 두 연산이 정의되어 있으며, 아래의 8가지 공리를 만족하는 대수적 구조이다. 합(sum): 집합 $V$의 두 원소 $x, y$에 대하여 유일한 원소 $x + y \in V$를 ...
논문 출처 Parth Sarthi, Salman Abdullah, Aditi Tuli, Shubh Khanna, Anna Goldie, Christopher D. Manning. RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval. Stanford University. psart...
p4. 바이인코더가 가질 수 있는 잠재적 문제점은 무엇인가? 일반적인 밀집 검색기(dense retrievers)는 쿼리와 문서를 서로 독립적으로(independently) 벡터로 인코딩한다. 이러한 접근 방식을 바이인코더(bi-encoder) 라고 부른다. 문서 벡터는 어떤 쿼리가 오더라도 항상 동일하게 유지된다...
논문 출처 Hao Liu, Zhengren Wang, Xi Chen, Zhiyu Li, Feiyu Xiong, Qinhan Yu, Wentao Zhang. HopRAG: 논리 기반 멀티홉 추론을 위한 검색 증강 생성(HopRAG: Multi-Hop Reasoning for Logic-Aware Retrieval-Augmented Generation)....
p3. 검색: 개요 우리는 실제(real-world) 검색 엔진을 작동시키는 핵심 기술들을 배우게 된다. 어휘 기반 검색 (Lexical retrieval) 쿼리와 문서를 단어 개수 기반의 희소 벡터(sparse vectors)로 표현한다. 쿼리와 문서 사이의 정확한 단어 일치(exact word matc...
p5. 검색: 개요 우리는 실제(real-world) 검색 엔진을 작동시키는 핵심 기술들을 배우게 된다. 어휘 기반 검색 (Lexical retrieval) 쿼리와 문서를 단어 개수 기반의 희소 벡터(sparse vectors)로 표현한다. 쿼리와 문서 사이의 정확한 단어 일치(exact word matc...
p2. 멀티모달 AI 개요 왜 멀티모달 AI가 필요할까? 인간의 정보 처리 방식 인간은 세상을 하나의 감각으로 이해하지 않고, 모든 감각이 통합되어 하나의 경험이 됨 기존 AI의 한계 단일 모달 AI의 문제점 텍...
p2. Motivation 강의 내용 지난 주에 GAN 모델을 공부했었는데 이어서 Normalizing Flow라는 새로운 종류의 생성 모델을 공부하도록 하겠습니다. GAN 같은 경우에는 generator와 discriminator가 서로 속이는 게임을 한다. 그래서 zero-sum, 게임이론에 의거해서 훈련을 했었고 그것에...
논문 출처 Zhengbao Jiang, Frank F. Xu, Luyu Gao, Zhiqing Sun, Qian Liu, Jane Dwivedi-Yu, Yiming Yang, Jamie Callan, Graham Neubig. 능동 검색 기반 생성(Active Retrieval Augmented Generation). 카네기멜런대학교 언어기술연구소¹,...