Skip to content

Latest commit

 

History

History
232 lines (177 loc) · 10.4 KB

README_ko.md

File metadata and controls

232 lines (177 loc) · 10.4 KB

GitHub Last Commit GitHub Top Language GitHub Tag GitHub license

GitHub stars GitHub forks GitHub contributors GitHub issues

X (Twitter) GitHub Tag Discord GitHub Sponsor

개요

이 저장소에는 주로 다음과 같은 2가지 기능이 있습니다.

  1. AI 캐릭터와 대화
  2. AITuber 스트리밍

아래 기사에 자세한 사용 방법을 작성했습니다.

오늘부터 당신도 AITuber 개발자|니케짱

개발 환경

이 프로젝트는 다음과 같은 환경에서 개발되었습니다:

  • Node.js: ^20.0.0
  • npm: 10.8.1

공통 사전 준비

  1. 리포지토리를 로컬에 클론합니다.
git clone https://github.com/tegnike/aituber-kit.git
  1. 폴더를 엽니다.
cd aituber-kit
  1. 패키지를 설치합니다.
npm install
  1. 개발 모드에서 애플리케이션을 시작합니다.
npm run dev
  1. URL을 엽니다. http://localhost:3000

AI 캐릭터와 대화

  • AI 캐릭터와 대화할 수 있는 기능입니다.
  • 이 저장소의 기반이 되는 pixiv/ChatVRM을 확장한 기능입니다.
  • 다양한 LLM의 API 키만 있으면 비교적 쉽게 시도해볼 수 있습니다.
  • 최근의 대화 문장을 기억으로 보존합니다.
  • 멀티모달로, 카메라에서의 영상이나 업로드한 이미지를 인식하여 답변을 생성할 수 있습니다.

사용 방법

  1. 설정 화면에서 다양한 LLM의 API 키를 입력합니다.
    • OpenAI
    • Anthropic
    • Google Gemini
    • Groq
    • Local LLM (API 키는 필요 없지만 로컬 API 서버를 실행해야 합니다.)
    • Dify Chatbot (API 키는 필요 없지만 로컬 API 서버를 실행해야 합니다.)
  2. 필요한 경우 캐릭터의 설정 프롬프트를 편집합니다.
  3. 필요한 경우 VRM 파일을 로드합니다.
  4. 음성 합성 엔진을 선택하고 필요한 경우 음성 설정을 구성합니다.
    • VOICEVOX의 경우 여러 옵션에서 스피커를 선택할 수 있습니다. 사전에 VOICEVOX 앱을 실행해야 합니다.
    • Koeiromap의 경우 음성을 세밀하게 조정할 수 있습니다. API 키가 필요합니다.
    • Google TTS의 경우 일본어 외의 언어도 선택할 수 있습니다. 자격 증명 정보가 필요합니다.
    • Style-Bert-VITS2의 경우 로컬 API 서버를 실행해야 합니다.
    • GSVI TTS의 경우 로컬 API 서버를 실행해야 합니다.
    • ElevenLabs는 다양한 언어 선택이 가능합니다. API 키를 입력하세요.
  5. 입력 양식에서 캐릭터와 대화를 시작합니다. 마이크 입력도 가능합니다.

AITuber 스트리밍

  • YouTube 스트리밍 댓글을 가져와서 캐릭터가 말하도록 할 수 있습니다.
  • YouTube API 키가 필요합니다.
  • '#'로 시작하는 댓글은 읽히지 않습니다.

사용 방법

  1. 설정 화면에서 YouTube 모드를 켭니다.
  2. YouTube API 키와 YouTube Live ID를 입력합니다.
  3. 다른 설정은 "AI 캐릭터와 대화"와 동일한 방식으로 구성합니다.
  4. YouTube에서 스트리밍을 시작하고 캐릭터가 댓글에 반응하는지 확인합니다.
  5. 대화 연속 모드를 켜면 댓글이 없어도 AI가 스스로 발언할 수 있습니다.

기타 기능

외부 통합 모드(베타 버전)

  • WebSocket을 통해 서버 앱에 메시지를 보내고 응답을 받을 수 있습니다.
  • 위의 두 가지와 달리 프론트엔드 앱 내에서 완료되지 않으므로 난이도가 약간 높습니다.
  • ⚠ 이 모드는 현재 완전히 유지보수되지 않아 작동하지 않을 수 있습니다.

사용 방법

  1. 서버 앱을 시작하고 ws://127.0.0.1:8000/ws 엔드포인트를 엽니다.
  2. 설정 화면에서 WebSocket 모드를 켭니다.
  3. 다른 설정은 "AI 캐릭터와 대화"와 동일한 방식으로 구성합니다.
  4. 서버 앱에서 메시지를 기다리고 캐릭터가 반응하는지 확인합니다.

관련 사항

슬라이드 모드

  • AI 캐릭터가 자동으로 슬라이드를 발표하는 모드입니다.
  • 사전에 슬라이드와 스크립트 파일을 준비해야 합니다.

사용 방법

  1. AI 캐릭터와 대화할 수 있는 단계까지 진행합니다.
  2. 지정된 폴더에 슬라이드 폴더와 스크립트 파일을 배치합니다.
  3. 설정 화면에서 슬라이드 모드를 켭니다.
  4. 슬라이드 시작 버튼을 눌러 발표를 시작합니다.

VRM 모델 및 배경 고정 방법

  • public/AvatarSample_B.vrm에서 VRM 모델 데이터를 변경합니다. 이름은 변경하지 마십시오.
  • public/bg-c.jpg에서 배경 이미지를 변경합니다. 이름은 변경하지 마십시오.

환경 변수 설정

  • 일부 구성 값은 .env 파일 내용에서 참조할 수 있습니다.
  • 설정 화면에 입력된 경우 해당 값이 우선적으로 적용됩니다.

기타

  • 대화 내역은 설정 화면에서 재설정할 수 있습니다.
  • 다양한 설정 항목은 브라우저에 저장됩니다.
  • 코드 블록으로 둘러싸인 요소는 TTS에서 읽히지 않습니다.

스폰서 모집

개발을 지속하기 위해 스폰서를 모집하고 있습니다.
여러분의 지원은 AITuber 키트의 개발과 개선에 크게 기여합니다.

GitHub Sponsor

협력자 여러분 (지원해 주신 순서)

morioki3 hodachi-axcxept coderabbitai ai-bootcamp-tokyo wmoto-ai JunzoKamahara darkgaldragon usagi917 ochisamu mo0013 tsubouchi bunkaich seiki-aliveland rossy8417 gijigae

그 외, 다수의 비공개 스폰서

이용 약관