Why I use LlamaIndex

  • 조우철님 발표
  • Applied AI Researcer @POSCO E&C

LlamaIndex 장점

  • 코드가 쉽고 간결하다

  • 기본 RAG는 5 line code로 구현 가능할 정도로 간결하다
  • Well Documented
  • Well Maintained
  • 빠른 업데이트

LLM-as-a-Judge: A Futuristic Way of Evaluation Foundational Models

  • Jamin (Jay) Shin

Background: Standard Methods of Text Evaluation

Lexical-based Metrics

  • reference의 단어가 얼마나 겹쳤는가
  • semantic information을 고려하지 않음
  • ex) Accuracy, ROUGE, BLUE, CiDER, METEOR

Embedding-based Metrics

  • Cosine Similarity 비교
  • Expressiveness Bottlenect
  • ex) BERT-score, BART-score

Motivation: Why Evaluation is Hard

  • brevity, creativity, tone, cultural sensitivities 등 평가할 항목이 다양하다
  • NLP역사에 Human Evaluation가 항상 포함되어왔다
    • 하지만 Human Evaluation은 Bias에 취약할 수 밖에 없다
    • 비용이 너무 크고 재현하기 어렵다

Human Evaluation이 어려운 예시:

  • 우측 답변이 딱 봤을떄는 더 잘 써진 글 같지만, 사실은 왼쪽이 맞는 답변임

AI로 Evaluation을 대체하는 많은 시도가 있지만 한계가 있다

  • 자기 자신이 쓴 글에 대해 bias 존재
  • “좋은 답변” 자체가 모호하다

Prometheus

Building RAG Applications with LlamaIndex

  • Ravi Theja
    • developer advocate @ LlamaIndex

Why is RAG Needed?

Necessity of LlamaIndex

RAG Components

Use Cases

QA, Summarization

Document Comparisons

Recursive Rretrieval

Data Agents