NYU Tandon 연구진은 사이버 보안 문제를 자율적으로 해결하는 AI 에이전트인 EnIGMA를 소개하면서, 실제 응용 프로그램을 혁신하고 보안 조치를 강화할 수 있는 잠재력을 강조했습니다.
뉴욕대 탠던 공과대학 연구진은 뉴욕대 아부다비 및 기타 협력 기관들과 함께 복잡한 사이버보안 문제를 자율적으로 해결하도록 설계된 고급 AI 에이전트를 공개했습니다. 수수께끼이 획기적인 발견은 2025년 국제 기계 학습 컨퍼런스(ICML)에서 발표되었으며, 해당 분야에서의 인상적인 진전을 보여주었습니다.
공동 저자이자 NYU Tandon 박사과정 학생인 Meet Udeshi는 보도자료를 통해 "EnIGMA는 사이버보안 애플리케이션에 대규모 언어 모델 에이전트를 사용하는 것입니다."라고 밝혔습니다.
EnIGMA는 NYU Tandon의 전기 및 컴퓨터 공학과(ECE) 의장이자 NYU 사이버보안 센터와 NYU 통신 첨단 기술 센터(CATT) 교수인 Ramesh Karri와 ECE 교수이자 CATT 교수인 Farshad Khorrami의 지도 하에 Udeshi가 주도한 협력적 노력의 결과입니다.
이 연구에는 NYU 아부다비, 프린스턴 대학, 스탠포드 대학의 다양한 학계 인사들이 참여했습니다.
기존의 AI 시스템은 소프트웨어 개발 및 웹 탐색과 같은 분야에서 이미 가치가 입증되었지만, 사이버 보안은 기존의 많은 AI 프레임워크로는 불충분한 고유한 과제를 안겨주었습니다.
그러나 EnIGMA는 "대화형 에이전트 도구"라는 특수 프레임워크를 활용하여 시각적 사이버 보안 프로그램을 AI 모델이 이해할 수 있는 텍스트 기반 형식으로 변환합니다.
"LLM에 제대로 반영되도록 인터페이스를 재구성해야 합니다. 그래서 몇몇 사이버 보안 도구에 대해 그렇게 했습니다."라고 우데시는 덧붙였습니다.
이 혁신적인 접근 방식을 통해 AI는 텍스트를 처리하여 디버거 및 네트워크 분석기와 같은 사이버 보안 도구에서 일반적으로 사용되는 기존 그래픽 인터페이스의 한계를 극복할 수 있습니다.
EnIGMA 개발의 핵심 요소는 맞춤형 깃발뺏기(Capture The Flag, CTF) 벤치마크 데이터셋 구축이었습니다. 실제 취약점을 시뮬레이션하고 학술 경진대회에 활용되는 이 CTF 챌린지는 AI 훈련에 중요한 역할을 했습니다.
"CTF는 학술 경진대회에서 사용되는 사이버 보안의 게임화된 버전과 같습니다. 현실 세계에서 직면하는 진정한 사이버 보안 문제는 아니지만, 매우 훌륭한 시뮬레이션입니다."라고 우데시는 덧붙였습니다.
이 연구는 EnIGMA가 네 가지 벤치마크에 걸쳐 390개의 CTF 과제에서 탁월한 성능을 보이며 최첨단 결과를 달성했음을 입증했습니다. 이 AI 에이전트는 이전 시스템보다 세 배 이상 많은 과제를 해결했습니다.
AI 모델의 진화를 되돌아보며 우데시는 "당시 Anthropic의 Claude 3.5 Sonnet이 가장 좋은 모델이었고, GPT-4o가 두 번째였다"고 말했습니다.
연구 과정에서 연구팀은 AI가 주변 환경과 실제로 상호작용하지 않고도 환각적인 관찰을 생성하는 "솔로퀴징(soliloquizing)"이라는 현상을 발견했습니다. 이 발견은 향후 AI의 안전성과 신뢰성에 중요한 영향을 미칠 수 있습니다.
학문적 성과를 넘어 EnIGMA의 의미는 실제 응용 분야에까지 확장됩니다.
우데시에 따르면, "이러한 CTF를 해결할 수 있는 자율적인 LLM 에이전트를 생각해 보면, 그 에이전트는 다른 사이버 보안 작업에도 사용할 수 있는 상당한 사이버 보안 기술을 보유하고 있습니다."
이러한 에이전트가 실제 취약성 평가에 역량을 적용하고 수백 가지의 다양한 접근 방식을 자율적으로 시도한다는 전망은 사이버 보안 운영에 있어 획기적인 변화를 예고합니다.
그러나 이 기술은 이중 용도(dual use)의 특성을 가지고 있어 사용에 주의해야 합니다. 사이버 보안 방어력을 강화할 수 있다는 장점이 있지만, 오용 가능성도 존재합니다.
이러한 점을 고려하여 연구진은 Meta, Anthropic, OpenAI를 포함한 주요 AI 회사에 연구 결과를 알렸습니다.
출처: NYU 탄돈 공학부
