진행 순서
- 추진방향, 유의사항, 추진과제 등 소개
- 구축 예정 데이터 품질 관리방안 안내
- 헬프데스크 FAQ에 대한 설명 등
- Q&A
인사말:
- 지능데이터본부 신신애 본부장님
- NIA 문준석 수석님
추진방향, 유의사항, 추진과제 등 소개
1. 추진 의의 및 현황
챗 GPT의 등장 → AI 기술의 활용 일상화 → 기존의 분류형 중심 기술 → 생성형 AI로 대전황
- 핵심은 코딩이 아닌 데이터
- 보고 듣고 말할 수 있는 LLM 데이터 구축(신규)
- 다양한 분야의 합성 데이터 구축 활성화
- 데이터 구축 방향
- 산업에 특화된 sLLM 개발용 말뭉치 데이터 구축
- 법률
- 의료
- 교육 행정사무
- 교통 물류
- 제조로보틱스 콘텐츠
- 재난, 안전 환경
- 국방 농림축수산
- 산업에 특화된 sLLM 개발용 말뭉치 데이터 구축
- 초거대 AI확산 생태계 조성 사업 데이터 구축 현황
- 많이했다~
2. 2024년 사업 개요
- 사업 범위
- 사업 목적: AI 제품 서비스 및 기술 개발에 활용 가치가 높은 초거대 모델
- 공고 현황
- 2차 예정
- 분야: 2차 7종
- 비고(공고, 마감일): 미정
- 2차 예정
- 사업 지원내용
- 지원기간: 협약일로부터~12월 31일
- 과제의 협야일 시작일은 협약이 완료되는 월의 1일로 소급 적용하여 협약체결 예정
- 선정규모: 지정공무 41개 분야, 자유공모7개 데이터
- 지원예산: 정보지원금 6억원~18억원
- 참여 범위: 주관 또는 참여기관 자격으로 최대 5개(주관기관 자격으론 최대 3개)
- 지원기간: 협약일로부터~12월 31일
- 참여범위
- 동일 분야 중복 참여 불가
- 총괄책임자는 사업 수행 중에 참여 불가, 참여인원의 경우 중복투입이 가능하나한국지능정보사회진흥원의 타사업 및 외부기관의 사업을 포함하여 참여율 100% 초과 불가
- 제출 서류
- 사업비 지원 방식: 정부지원금 지원기준 및 민간부담금 중 현금부담 기준
- 주요 요구사항
- 초거대AI 데이터 구축 공정(방법, 절차 등)이 포함된 초거대AI 데이터 구축 계획서(이하 구축 계획서)를 세부 데이터별로 작성하여 제안서 신청 시 제출
- 데이터의 요구사항에 대한 부합성과 초기
- ~
- 주요 요구사항(데이터 품질)
- 품질관리 총괄 책임자를 지정, 자ㅏ체 품질 검사를 위해 품질관리 조직을 구성하여 운영
- 데이터 구축에 참여하는 모든 인원에 대해 교육 실시
- 데이터 법적권리
- 유의사항
- 외부 품질검증 지적사항, 사후 발견된 데이터 누락 및 오류사항 등에 대한 조치 계획을 마련하여 제출하고 그에 따른 보완 조치 결과 또한 제출하여야 하며 최소 3년 보완 의무 수행 필수
- 위탁용역비는 정부지원금의 최대 28.57% 이내로 산정 가능
- 동 사업은 비 R&D 사업으로 가전비 책정 불가
- 관련 지침
4. 데이터 구축
9.
11.
31. 국방
- 기재된 연락처 확인 바람
공통 사항
- 데이터 권리 휙득
- 종복 데이터 통제
- 비실별화
- 데이터 구축량 관리
- 데이터 품질 관리
5. 추진 일정
FAQ
- 신생기업도 주관기관 될 수 있음
- 컨소이엄 내 비영리기관이 있는데, 비영리기관이 내지 않는 자부담금을 영리 기업이 내야하는건가요?
- 없습니다
- 정부지원금 예산에서 사용할 수 없는 비목이나 필수적으로 사용해야 하는 항목
- 기금 사업비 산정 및 정산등에 관한 지침이 있음
- 모든 참여인력의 인건비는 정부지원금으로 책정 가능한가요?
- 2024.1.1. 기준 3년 이내 입사자는 정부지원금으로 인건비 전액 반영
- 입사 3년 초과 인력은 인건비의 최대 50%까지만 지원
- 총괄책임자 중복투입 불가는 본 과제 내에서만 적용되나요
- 총괄책임자의 경우 한국지능정보사회진흥원의 타사업 및 외부기관의 사업에서 중복으로 투입되실 수 없음
- 어떤 과제가 선정될 지 모르니 제안 단계에선 총괄책임자 중복투입 가능?
- 가능, 추후 과제조정위원회 단계에서 중복은 해소되어야 함
- 자쥬주제 헬스케어 IRB, DRB 결과