덕성여자대학교 IT미디어공학과
개발기간 2023.06 ~ 2023.12
이가영, 박세연, 이시윤, 김가현, 손유빈
현존하는 대다수의 AI 서비스는 비장애인을 대상으로 만들어졌기에 신체적 제약이 존재하는 장애인은 서비스에 접근조차 어려운 경우가 대다수이다.
특히, 최근 눈부신 기술 발전을 보이는 이미지 생성 AI 역시Text-to-Image 인공지능 모델을 기반으로 하여 텍스트의 입력이 필수적이다.
때문에, 키보드나 마우스 같은 입력 장치를 사용하지 못하는 이들에게 있어 AI 활용의 장벽은 더욱 높아지고 있다.
본 애플리케이션은 이러한 문제를 해결하기 위해 마우스와 키보드 없이도 음성 인식을 통해 서비스를 자유롭게 이용할 수 있도록 하였다.
또한 디지털 기술에 취약한 이들도 디지털 이미지를 만들수 있도록 인공지능을 활용한 이미지 생성 기술에 접근하는 방법을 설명한다.
본 애플리케이션은 음성 인식 기술인 STT(Speech To Text)의 개인별 활용과더불어 AI 이미지 생성 서비스가 겪고 있는 문제점인 예술 창의성 지표를 높이는 것을 목적으로 하였다. STT로 기록된 텍스트는 번역 API를 통해 한 번 더 가공된다.
창작 이미지 생성에는 생성형 AI 모델 중스테이블 디퓨전 (Stable Diffusion)을 사용하였다.
예술 창의성 지표를높이기 위한 방법으로 OpenCV를 이용해 이미지 수정 및 편집이 가능하도록 하였다.
이 외에도 언리얼 엔진을 기반으로 한 메타버스 공간 구축및 콘텐츠 개발을 통해 대중의 접근성을 확장하고자 및 콘텐츠 개발을 통해 대중의 접근성을 확장하고자 한다.
사용자는 본인이 원하는 화풍 뿐만 아니라 그림의 모든 부분을 직접 선택 가능 하다.
사용자는 초보자, 전문가 단계 중 본인의 수준에 맞는 단계를 선택한다.
초보자 단계의 모든 과정은 선택지로 부여되어 번호 선택만으로 손쉽게 그림을 생성할 수 있다.
전문가 단계는 선택지 뿐만 아니라 직접 자신만의 문장으로 프롬프트를 적어볼 수 있다. 자신의 문장을 그림으로 만나보는 경험을 할 수 있다.
뿐만 아니라 배경과 분리된 별도의 사물 이미지를 생성하고 이를 조정, 편집하는 과정에서 본인의 자유도가 추가된 그림을 만들어볼 수 있다.
완성된 그림, 다른 사용자의 그림은 웹 페이지 상에서도 확인 가능하며, 언리얼로 구성된 두가지 테마의 가상 전시관을 통해서도 확인할 수 있다.
- 배경, 오브젝트 이미지 종류 선택
- 선택된 종류 내에서 랜덤 생성
- 화충, 그림 스타일, 보정 정도 선택
- 배경, 오브젝트의 프롬프트 직접 입력
- 이미지 추가, 삭제, 위치/크기 수정 등을 통하여 이미지 커스텀
- 필터 적용
- 커스텀 이미지 생성
- 웹 페이지 내의 갤러리 뿐만 아니라 언리얼엔진을 이용해 제작된 가상의 전시관을 통해서도 자신의 그림 / 다른 사용자의 그림 감상이 가능하다.
- 가상 공간 전시관은 기본 / 바다 두가지 테마로 제작되어 다양하게 이용 가능하다.