새로운 연구에서 AI가 생성한 이미지의 예술성과 결함이 밝혀졌습니다.

새로운 연구는 텍스트 프롬프트에서 이미지를 생성하는 AI 도구인 Midjourney와 DALL·E의 역량을 분석했습니다. 연구진은 이러한 AI 프로그램이 미적으로 만족스러운 이미지를 생성할 수 있지만, 기본적인 지시를 처리하는 데 어려움을 겪고 문화적 편견을 반영하는 경우가 많다는 것을 발견했습니다.

인공지능이 빠르게 발전하는 세상에서, 한 연구팀이 인기 AI 도구인 Midjourney와 DALL·E의 역량과 한계를 이해하기 위한 연구에 착수했습니다. 이러한 생성적 AI 프로그램은 글로 표현된 내용을 시각적 예술로 변환하는 능력으로 주목을 받았지만, 과연 우리 생각의 본질을 진정으로 포착할 수 있을까요?

벨기에 리에주 대학교, 로렌 대학교, 프랑스 EHESS의 과학자들이 참여한 공동 연구는 이 질문에 대한 답을 찾고자 했습니다. 연구진은 기호학, 컴퓨터 과학, 미술사 분야의 전문 지식을 결합하여 AI 시스템이 생성한 이미지를 모양, 색상, 요소 배열 등 다양한 기준에 따라 면밀히 분석했습니다.

리에주 대학교 기호학자이자 FNRS 연구 책임자인 공동 저자 마리아 줄리아 돈데로는 보도자료를 통해 "저희의 접근 방식은 일련의 엄격한 테스트를 기반으로 합니다."라고 밝혔습니다. "저희는 이 두 AI 시스템에 매우 구체적인 요청을 제출하고, 모양, 색상, 시선의 배열, 정지 이미지의 특정 역동성, 이미지 전개의 리듬 등 인문학적인 기준에 따라 생성된 이미지를 분석했습니다." 

발견, 출판 Semiotic Review 저널에 실린 연구에 따르면 Midjourney와 DALL·E와 같은 AI 도구는 시각적으로 매력적인 이미지를 생성할 수 있지만, 간단한 지침을 따르는 경우 종종 실수를 한다고 합니다.

예를 들어, "꼬리가 없는 개"와 같이 부정을 포함하는 프롬프트는 종종 꼬리가 달린 개 이미지나 기타 부정확한 이미지를 생성합니다. 마찬가지로, "문 뒤에 있는 두 여자"와 같이 복잡한 공간 관계를 묘사하는 것은 상당한 어려움을 수반합니다.

AI는 또한 동작과 시간적 순서를 처리하는 데 어려움을 겪으며, 때로는 "싸움"을 춤으로 해석하거나 "먹기 시작함" 또는 "먹음 완료"와 같은 동작의 진행을 표현하지 못합니다.

"이러한 GAI는 우리가 세상을 보고 표현하는 방식을 되돌아볼 수 있게 해줍니다."라고 로렌 대학교의 전 연구원이자 현재 로렌 대학교의 조교수인 엔조 다르메니오(Enzo D'Armenio)는 주저자로 덧붙였습니다. "이 GAI는 종종 서구의 이미지를 기반으로 구축된 데이터베이스에서 시각적 고정관념을 재현하고, 언어와 시각 언어 간 번역의 한계를 드러냅니다."

연구팀은 통계적 강건성을 보장하기 위해 프롬프트당 최대 50번의 세대를 반복하여 결과를 검증했습니다. 그 결과, 두 모델에서 뚜렷한 미적 특징을 발견했습니다. Midjourney는 장식적인 요소를 가미한 "미적" 이미지를 생성하는 경향이 있는 반면, DALL·E는 구성 제어력이 더 뛰어나지만 객체의 수와 방향이 다릅니다.

AI 모델은 그 매혹적인 기능에도 불구하고 본질적으로 통계적이며, 학습 데이터 세트와 개발자가 설정한 구성을 기반으로 가장 가능성 있는 결과를 생성합니다. 이는 종종 문화적 고정관념을 강화하는 결과를 초래합니다.

예를 들어, "CEO가 연설합니다"라는 프롬프트는 일부 모델에게서 주로 남성 이미지를, 다른 모델에게서 주로 여성 이미지를 생성할 수 있는데, 이는 훈련 데이터에 내재된 편향을 강조합니다.

공동 저자이자 ULiège의 수학자이자 Adrien Deliège는 "GAI는 훈련 데이터베이스와 설계자의 (때로는 편집) 설정에 따라 가장 그럴듯한 결과를 생성합니다."라고 덧붙였습니다. "이러한 선택은 시선을 표준화하고 고정관념을 전달하거나 재조정할 수 있습니다." 

연구자들은 이러한 기술을 평가하기 위해 인문학의 학제간 도구를 사용하는 것이 중요하다고 강조합니다.

"AI 도구는 단순한 자동 도구가 아닙니다."라고 D'Armenio는 결론지었습니다. "AI 도구는 데이터베이스와 알고리즘의 영향을 받아 자체 논리에 따라 우리의 말을 번역합니다. 인문학은 AI를 이해하고 평가하는 데 필수적인 역할을 합니다." 

이 연구는 AI 생성 이미지의 잠재력과 현재 한계를 모두 강조하며, 이러한 도구가 아이디어를 시각화하는 데 도움을 줄 수는 있지만 완벽한 번역에는 여전히 부족하다는 점을 시사합니다. 평가 과정에 인문학을 통합하는 것은 그 문화적, 상징적 의미를 포괄적으로 이해하는 데 필수적입니다.

출처: 리에 주 대학교