Home 회의록 작성 어플 프로젝트
Post
Cancel

회의록 작성 어플 프로젝트

필요한 과정

1. 음성 인식 (ASR) 시스템 구축

  • 목표: 회의 중 발생하는 음성을 텍스트로 변환합니다.
  • 세부 작업:
    1. 음성 인식 API 선택: Google Speech-to-Text, IBM Watson Speech to Text 등을 선택합니다.
    2. API 통합: 선택한 API를 시스템에 통합하여 실시간으로 음성을 텍스트로 변환합니다.
    3. 테스트 및 최적화: 다양한 환경과 발언자로부터 음성 데이터를 테스트하여 성능을 확인하고 필요시 최적화합니다.

2. 키워드 및 주제 추출

  • 목표: 회의록 텍스트에서 핵심 키워드와 주제를 추출합니다.
  • 세부 작업:
    1. PLM 선택 및 Fine-tuning: BERT, RoBERTa 등의 모델을 선택하고, 키워드 및 주제 추출 작업에 맞게 Fine-tuning합니다.
    2. 키워드 추출: Fine-tuned 모델을 사용하여 회의록에서 핵심 키워드를 추출합니다.
    3. 주제 분류: 추출된 키워드를 바탕으로 주제를 분류합니다.

3. 문장 요약

  • 목표: 각 발언이나 문단을 요약합니다.
  • 세부 작업:
    1. 요약 모델 선택 및 학습: GPT-3, GPT-4, BERT 등을 선택하고 문장 요약 작업에 맞게 Fine-tuning합니다.
    2. 문장 요약 실행: 학습된 모델을 사용하여 회의록의 각 부분을 요약합니다.

4. 마크다운 형식 변환

  • 목표: 추출된 키워드, 주제, 및 요약문을 마크다운 형식으로 정리합니다.
  • 세부 작업:
    1. 템플릿 설계: 마크다운 문서의 템플릿을 설계합니다. (예: 제목, 부제목, Bullet Points 등)
    2. 문서 변환: 요약된 내용과 키워드를 사용하여 마크다운 문서를 생성합니다.

5. 사용자 인터페이스 (UI) 개발

  • 목표: 사용자가 쉽게 시스템을 사용하고 결과를 확인할 수 있는 인터페이스를 개발합니다.
  • 세부 작업:
    1. UI 설계: 사용자가 직관적으로 사용할 수 있는 인터페이스를 설계합니다.
    2. 웹/앱 개발: 설계된 UI를 바탕으로 웹 애플리케이션 또는 모바일 애플리케이션을 개발합니다.
    3. 시스템 통합: 개발된 애플리케이션과 PLM, ASR 시스템을 통합합니다.

6. 테스트 및 최적화

  • 목표: 전체 시스템의 성능을 테스트하고 필요에 따라 최적화합니다.
  • 세부 작업:
    1. 시스템 테스트: 다양한 케이스에 대해 시스템 테스트를 수행합니다.
    2. 버그 수정 및 최적화: 발견된 문제점을 수정하고, 성능을 최적화합니다.

데이터셋:

  1. AI Hub: 한국어 대화 요약
    • https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=117
  2. 논문자료 요약
    • https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=90
  3. 도서자료 요약
    • https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=93
  4. 논문자료 요약
    • https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=90

      DST와 Summarization의 차이

  5. 목적: DST는 대화 동안 사용자의 의도와 컨텍스트를 식별하고 추적하는 것을 목적으로 합니다.
  6. 기능: 대화 동안 제공되는 모든 정보(사용자의 의도, 제공된 세부 정보 등)를 식별하고 저장합니다.
  7. 활용: DST는 주로 목적 지향적 대화 시스템에서 사용되며, 시스템이 사용자의 요청에 적절하게 응답할 수 있도록 대화의 현재 상태를 지속적으로 업데이트합니다.

요약 (Summarization):

  1. 목적: 요약은 긴 텍스트나 내용을 짧고 핵심적인 정보만을 포함하는 형태로 변환하는 것을 목적으로 합니다.
  2. 기능: 주어진 텍스트의 핵심 내용을 추출하거나 생성하여 원문의 주요 내용을 간결하게 전달합니다.
  3. 활용: 뉴스 기사, 연구 논문, 긴 문서 등 다양한 텍스트 소스에서 핵심 내용을 빠르게 파악하기 위해 사용됩니다.

결론:

  • DST는 대화의 상태와 진행을 추적하며, 사용자의 의도와 요청을 지속적으로 업데이트하는 데 중점을 둡니다.
  • 요약은 긴 텍스트의 핵심 내용을 간결하게 전달하기 위한 과정입니다.

시도: KeyBert

참고 문헌: https://s-space.snu.ac.kr/bitstream/10371/193494/1/000000174061.pdf

https://journal-home.s3.ap-northeast-2.amazonaws.com/site/2023w/abs/0592-MDHAX.pdf

This post is licensed under CC BY 4.0 by the author.

Natural Language Process(자연어 처리)

[lvl2]삼각 달팽이