A Study on the Utilization Strategies of Media Art in Urban Regeneration Projects
키워드(원어)
도시재생, 미디어아트, 새장르 공공예술, 유휴 산업시설, 장소성, 시민 참여
키워드(영어)
저자
김동조
초록(원어)
물리적 환경 개선 중심의 도시재생이 지닌 한계를 극복하기 위해 최근 지역의 고유한 문화를 활용하는 소프트웨어적 전략이 주목받고 있다. 디지털 기술과 예술이 융합된 미디어아트는 시공간의 제약을 넘는 유동성과 상호작용성을 바탕으로 쇠퇴한 도시 공간에 새로운 가치를 부여하는 핵심적인 도구로 부상하였다. 본 연구는 미디어아트를 사회적 메시지를 전달하고 대중과 소통하는 공공예술의 관점에서 재해석하고 이를 도시재생에 효과적으로 활용하기 위한 전략을 모색하는 데 목적이 있다. 미디어아트는 기술과 예술, 시민의 결합을 통해 쇠퇴한 도시에 심미적 가치와 사회적 활력을 불어넣는 지속 가능한 도시재생의 실질적 전략임을 시사한다.
A Study on the Core Loop and Evolutionary Aspects of Idle RPGs
키워드(원어)
방치형 RPG, 코어 루프, 자동 전투, 진화 양상
키워드(영어)
저자
김은정
초록(원어)
이 논문은 방치형 RPG를 현대적 라이프스타일에 최적화된 효율 기반 게임 경험으로 보고, 그 역사적 계보와 진화 양상을 고찰한다. 초기 자동 진행 패러디에서 클리커 게임, 모바일 방치형 RPG, IP 결합형, 하이브리드 RPG에 이르는 단계별 코어 루프와 규칙–동기–보상 구조를 비교 분석하였다. 분석 결과, 방치형 RPG는 ‘얼마나 자동화되었는가’가 아니라 ‘무엇을 자동화하고 어느 지점에서 플레이어의 주의를 다시 호출하는가’를 둘러싼 설계 전략을 중심으로 발전해 왔다. 방치형 RPG는 짧은 플레이 세션으로도 누적 성취를 제공하는 구조를 통해, 이용자의 분절된 시간과 제한된 인지 자원에 적합한 장르적 해법을 제시하는 것으로 해석된다.
Level Design for FPS Games Using Generative AI: Automated Generation of PvP Map Structures
키워드(원어)
게임, FPS, 생성형 AI, 레벨디자인, PVP
키워드(영어)
저자
박형준, 김정윤
초록(원어)
본 연구는 FPS 게임 개발 과정에서 요구되는 PVP 스테이지 레벨디자인 과정의 복잡성과 높은 제작 비용 문제를 해결하고자 생성형 AI의 활용 가능성을 탐구한다. 제시한 프롬프트를 기반으로 AI가 생성한 PVP 레벨 평면도를 분석하여 맵 구조, 주요 패턴, 핵심 디자인 요소의 적용 정도를 평가하였다. 분석 결과, 기본적인 공간구성은 구현되었으나 Choke Point, Flanking Route, Split Level 등 전략적 기능을 요구하는 레벨디자인 요소의 적용에서는 구조적 한계를 확인하였다. 이를 보완하기 위해 보다 정교한 프롬프트 설계와 학습용 레퍼런스 데이터 구축의 필요성을 제기한다. 본 연구는 생성형 AI가 FPS 레벨디자인의 프리프로덕션 단계에서 효율성과 다양성을 향상시킬 수 있는 방향성을 탐구한다.
ADL(Adversarial Distortion Learning) 모델 기반의 의료 이미지 데이터 품질 개선 연구
제목(영어)
A Study on Clinical Image Data Quality Improvement Based on Adversarial Distortion Learning (ADL) Model
키워드(원어)
Data Quality Management(DQM), Image Denoising, Magnetic Resonance Imaging(MRI), Denoising
키워드(영어)
저자
안도연, 김정윤, 이수현
초록(원어)
자기공명영상(MRI)은 검사 환경이나 피검사자의 움직임 등 다양한 요인에 의해 데이터 잡음(noise)이 빈번하게 발생한다. 이러한 잡음은 임상의의 정확한 진단에 영향을 미칠 수 있는 요인이 되므로 이에 대한 개선이 필수적이다. 이에 본 연구에서는 영상 잡음 저감을 위해 개발된 적대적 왜곡 학습(Adversarial Distortion Learning, ADL) 모델을 적용하여 MRI 이미지의 화질을 개선하고자 하였다. 연구 결과, 신경교종(glioma) MRI 이미지의 최대 신호 대 잡음비(PSNR)는 30.25±0.98로, 수막종(meningioma) MRI 이미지의 PSNR은 29.91±1.15로 도출되었다. 본 연구는 MRI 노이즈 제거 모델을 활용하여 이미지의 품질을 향상시켰으며, 이를 통해 화질 개선 방안에 대해 고찰하였다. 결론적으로 본 연구는 MRI 이미지의 품질관리의 중요성을 강조하며, 향후 해당 기법이 임상 의료 영상/이미지 분야에 적극적으로 적용될 필요가 있음을 시사한다.
문화유산과 실감영상의 상호작용을 통한 몰입 구조 연구- 국립중앙박물관 실감영상관을 중심으로 -
제목(영어)
A Study on the Structure of Immersion through the Interaction between Cultural Heritage and Immersive art
키워드(원어)
문화유산, 실감영상, 재매개, 몰입, 현실성
키워드(영어)
저자
박지현, 김연희
초록(원어)
최근 박물관에서 실감영상은 독립된 전시 형식으로 자리매김하고 있으나, 문화유산이라는 물질적 실재가 실감영상의 몰입 경험에 어떠한 영향을 미치는지에 대한 연구는 여전히 제한적이다. 본 연구는 볼터와 그루신(Bolter & Grusin)의 재매개(remediation) 이론과 선행연구의 환상성(fantasy) 분석틀을 적용하여 국립중앙박물관 실감영상관을 질적으로 분석하였다. 분석 결과, 유물의 실재성과 역사성은 영상 속 환상적 요소를 실제 세계에 견고하게 연결하는 기반으로 작용하며, 이를 통해 관람자의 몰입과 정서적 참여가 강화되는 요인으로 나타났다. 이러한 결과는 박물관 실감콘텐츠가 단순한 시청각적 자극을 넘어, 유물과 영상이 상호보완적으로 작동하며 독자적인 몰입 구조(immersive structure)를 형성함을 시사한다. 즉, 문화유산의 실재성은 실감영상의 환상성을 지탱하는 중요한 매개 요인으로 기능하며, 이를 통해 박물관 실감콘텐츠에 대한 새로운 유형의 해석 경험과 교육적 가능성을 제시한다.
A Study on AI-Integrated Service Design Models for Public Sector Innovation
키워드(원어)
AI, 서비스디자인, 더블다이아몬드, 공공정책서비스디자인, 공공혁신
키워드(영어)
저자
유해영
초록(원어)
본 연구의 목적은 공공부문 혁신을 위해 인공지능(AI)을 통합한 서비스디자인 모델을 제안하는 데 있다. 기존 공공서비스 개선은 주로 제도·절차 중심의 상향식 접근에 머물러 시민 경험과 데이터 기반 의사결정이 충분히 반영되지 못한 한계를 지니고 있다. 이에 본 연구는 AI 통합 서비스디자인 모델을 구성하고, 공공부문에 적용 가능한 구조적 특징과 기대효과를 탐색하였다. 연구 결과, AI는 문제 탐색과 정의 단계에서 데이터 기반 인사이트 제공, 아이디어 도출 단계에서 대안 생성, 프로토타입 및 검증 단계에서 시뮬레이션과 사용자 반응 분석의 역할을 수행함으로써 공공서비스 기획·실행의 효율성과 혁신성을 동시에 높일 수 있음이 도출되었다. 본 연구는 공공조직이 AI를 수단으로 활용하는 수준을 넘어, 서비스디자인과 결합한 통합 모델로 설계함으로써 시민 중심·데이터 기반·협력 거버넌스를 구현하는 실천적 프레임을 제시한다는 점에서 의의를 지닌다.
Color Workflow Integration in AI Image Production Education: Exploring an Integrated Instructional Model
키워드(원어)
생성형 인공지능, 컬러 워크플로, ICC 프로파일, 통합 교육 모형, 이미지 제작교육
키워드(영어)
저자
김현서
초록(원어)
생성형 인공지능(Generative AI) 기반 이미지 제작 도구는 창작 초기 단계에서 강력한 보조 수단으로 자리 잡았으나, 관련 교육은 아이디어 발상에 집중되어 최종 출력 환경까지 이어지는 컬러 워크플로(Color Workflow) 교육과 단절되는 실무적 문제를 야기하고 있다. 본 연구는 4년제 대학 그래픽/이미징 교과목 운영 경험에 대한 탐색적 고찰을 통해 이러한 학습 경험의 문제를 확인하고, 고품질 AI 생성 이미지의 최종 컬러 재현를 보장하기 위한 교육 방안을 모색하였다. 연구는 실제 작업 순서인 '생성>편집 및 검토>출력 및 게시' 흐름을 반영하여 컬러 워크플로의 기초 원리를 유기적으로 통합하는 3단계 교수 학습 모형을 제안한다. 제안된 모형은 1단계에서 컬러 팔레트 인식, 2단계에서 ICC 프로파일 및 색공간 지정 실습, 3단계에서 색상과 톤의 미세 조정 및 검토를 포함한다. 이 모형은 생성형 AI 제작 기술 교육을 컬러 매니지먼트 시스템과 더불어 최종 품질 관리 영역으로 확장하여 학습자의 실무 역량을 강화할 수 있는 방안이라는 점에서 의의를 갖는다. 향후 후속 연구로는 제안된 모형에 대한 실증적 학습 효과 검증이 요구된다.
Facial Emotion Recognition Using Incremental Learning with InceptionV3
제목(영어)
Facial Emotion Recognition Using Incremental Learning with InceptionV3
키워드(원어)
Facial emotion recognition, InceptionV3, Incremental learning, Deep learning, KDEF dataset.
키워드(영어)
저자
Taimoor Khan, Chang Choi
초록(원어)
Facial emotion recognition (FER) is a critical task in human-computer interaction and affective computing. This study investigates an incremental learning approach for FER using the InceptionV3 convolutional neural network on the KDEF dataset. Incremental learning allows the model to adapt to new classes and samples without retrainingscratch, improving efficiency and scalability. We describe the training pipeline, data preprocessing, and model adaptation strategies. Experimental results demonstrate the effectiveness of the proposed approach in maintaining classification performance while incrementally updating the network. This method offers a promising solution for real-time emotion recognition applications.
Accurate and precise segmentation of marine animals is essential for automated marine ecosystem monitoring, biodiversity assessment, and underwater exploration. The challenges in underwater imager, including color distortion, illumination variability, turbidity and low contrast, severely impar the effectiveness of established underwater imagery segmentation techniques. To overcome these challenges, in this study we developed an encoder-decoder based framework equipped with hybrid CNN-Transformer feature extractors and a Cross-stage Projection Mechanism (CPM). Additionally, the proposed hybrid model multi-scale hierarchical feature extraction is further enhanced with a preprocessing pipeline incorporating illumination transformation, which effectively addresses the impact of inconsistent underwater lighting conditions.
Text-to-Video Generation: Models and Core Challenges
키워드(원어)
텍스트-비디오 생성, 확산 모델, 멀티모달 학습, 생성형 인공지능
키워드(영어)
저자
공지양, 최창
초록(원어)
멀티모달 인공지능(AI) 분야에서 텍스트 기반 비디오(T2V) 생성은 유망한 연구 분야로 부상하여 최근 몇 년간 주목할 만한 발전을 이루어왔다. 트랜스포머 및 확산 모델과 같은 대규모 생성 모델을 기반으로 한 현재의 시스템들은 자연어 프롬프트로부터 짧고 고품질의 비디오 클립을 생성할 수 있다. 본 논문에서는 2021년 이후 텍스트 기반 비디오 생성 기술의 발전을 조사하였으며, CogVideo, Make-A-Video, Imagen Video, Phenaki, Gen-2 등 주요 모델을 아키텍처, 학습 데이터, 비디오 해상도 및 비디오 길이 측면에서 비교하였다. 아울러 본 분야의 핵심 기술적 도전과제인 시간적 일관성, 의미적 정합성, 멀티모달 조건부 생성, 연산 비용 등을 분석하였다. 또한 장기 비디오 생성, 제어 가능성, 오디오 통합, 대규모 언어 모델과의 연계 등 향후 연구 방향을 제시하였다. 본 논문은 연구자들에게 해당 분야에 대한 포괄적인 개관과 향후 발전 방향에 대한 구체적인 시사점을 제공하는 데 목적을 두고 있다.
Exhibiting Picturebook Original Illustrations: Exploring Their Artistic Value
키워드(원어)
그림책 원화, 예술적 가치, 전시환경, 그림책 미술관
키워드(영어)
저자
이호경, 김연희
초록(원어)
한국 그림책은 안데르센상, 아스트리드 린드그렌 추모상(ALMA), 라가치상 등을 통해 예술성과 독창성을 국제적으로 인정받았으나, 국내에서는 복제본·판화 중심 전시가 일반화되어 원화의 물성과 조형성이 충분히 전달되지 못하는 구조적 한계를 보인다. 이러한 전시 방식은 원화의 예술적 가치가 사회 전반에 확산되지 못하는 문제로 이어진다. 본 연구는 해외 그림책 전문 미술관의 운영 체계와 국내 전시 환경을 비교·분석하여 원화 중심 전시체계 구축의 필요성을 규명하고, 그림책 원화의 예술적 특성과 전시적 의미를 재조명하며, 전시 기획·보존·연출 기준과 운영 방향을 제시한다. 본 연구의 결과는 그림책 원화를 단순한 출판의 원본이 아닌 독립된 예술작품으로 재평가하고, 국내 그림책 전시의 질적 향상을 위한 정책적·실천적 시사점을 제공하는 데 기여할 것이다.
A Study on Developing Museum Education Programs Based on Local Cultural Heritage
키워드(원어)
지역문화유산, 박물관 교육프로그램, 교육방법론, 사례연구
키워드(영어)
저자
원정민, 김연희
초록(원어)
오늘날 오늘날 박물관은 지역사회 기반의 공공 교육 플랫폼으로 기능을 확장하고 있으며, 이 과정에서 지역문화유산은 핵심 학습 자원으로 활용되고 있다. 그러나 선행연구를 살펴보면, 박물관 교육프로그램의 콘텐츠 개발, 특히 지역문화유산을 교육적으로 활용하는 프로그램에 대한 체계적 분석은 여전히 부족한 실정이다. 본 연구는 이러한 문제의식을 바탕으로 지역문화유산을 기반으로 한 박물관 교육프로그램의 개발 방향을 탐색하고자 국내 세 박물관의 교육프로그램 사례를 조사·분석하였다. 그 결과, 지역성 기반의 스토리텔링, 체험 중심 참여 학습, 학습자의 능동적 참여, 지역사회와의 연계성 강화가 공통된 특징으로 도출되었다. 본 연구는 이러한 분석 결과를 토대로 프로그램 설계와 운영 전략에 대한 실천적 제언을 제시함으로써, 박물관이 지역사회와 긴밀히 연결되는 교육 플랫폼으로서의 역할 강화에 기여하는 것을 목표로 한다.
실사 드라마형 인터랙션 게임에 대한 이용자 인식 : ‘성세천하:여제의 탄생’ 텍스트 마이닝 연구
제목(영어)
User Perceptions of Live-Action Drama-Style Interactive Games:A Text Mining Study of ‘Road to Empress’
키워드(원어)
성세천하, 실사 인터렉션 게임, FMV 기반 서사, 인터랙티브 스토리텔링, 정서 상호작용
키워드(영어)
저자
이소진, 김정윤
초록(원어)
본 연구는 실사 기반 인터랙션 게임 ‘성세천하: 여제의 탄생’에 대한 이용자 인식을 분석하기 위해 온라인 커뮤니티 데이터를 텍스트 마이닝으로 분석하였다. 분석 결과, ‘스토리’, ‘선택지’, ‘감정’, ‘연기’ 등의 주요 키워드가 도출되어 이용자 반응은 서사 이해와 정서적 해석에 집중되는 경향을 보였다. 또한 ‘드라마 형식’, ‘플레이 영상’, ‘궁중 싸움’과 같은 조합은 해당 게임이 실사 연기와 장면 전개를 중심으로 감상과 참여가 결합된 경험으로 수용되고 있음을 나타냈다. 이와 같은 결과는 실사 표현의 정서적 리얼리티와 장면 단위 감정 리듬이 핵심 경험 요인으로 기능함을 시사한다.
한국 전통 건축물 구조 요소의 YOLO 기반 자동 검출: 프로젝션 맵핑 자동화를 위한 기초적 접근
제목(영어)
YOLO-Based Structural Element Detection in Korean Traditional Architecture for Projection Mapping Automation
키워드(원어)
Projection Mapping, Media Art, YOLO, Computer Vision, Traditional Architecture
키워드(영어)
저자
유정은, 김정윤
초록(원어)
본 연구는 한국 전통 건축물 정면 이미지에서 지붕, 편액, 기둥, 홍예문, 평개문, 전통 창살 무늬의 여섯 가지 구조 요소를 자동으로 검출하여, 프로젝션 맵핑 초기 단계에 필요한 구조 기반 정보화 구현을 목표로 한다. 이를 위해 YOLOv8 객체 탐지 모델을 적용하고, 총 343개의 정답 데이터(Ground Truth, GT)를 기준으로 탐지 성능을 정량적으로 분석하였다. 분석 결과, 전체 Precision은 0.8083, Recall은 0.5814로 나타났으며, 지붕, 홍예문과 같은 형태가 명확한 구조 요소에서 높은 탐지 능력을 보였다. 기둥과 전통 창살 무늬는 반복 패턴 특성으로 인해 일부 탐지 누락이 발생했으나, 소규모 데이터 환경에서도 YOLO 모델이 전통 건축 구조를 일정 수준 안정적으로 학습함을 확인하였다. 이러한 탐지 성능은 자동 탐지 결과를 프로젝션 맵핑의 영역 분리 기준점으로 활용할 수 있는 가능성을 시사하며, 향후 자동 가이드맵 생성 및 실시간 보정 시스템으로의 확장 기반을 마련하는 데 학술적 의의가 있다.
AI-based Generative Video for Cultural Storytelling
키워드(원어)
흥수아이, 지역문화, 선사시대, AI, 영상콘텐츠
키워드(영어)
저자
김금영, 최선아
초록(원어)
본 연구는 충북 지역의 역사·문화 자원을 생성형 인공지능(AI)을 활용한 영상콘텐츠로 재구성하는 교육 프로그램을 개발하고, 그 교육적 효과를 실증적으로 분석하는 데 목적을 두었다. 이를 위해 지역의 역사·문화·관광 자원에 대한 디지털 자료를 수집·분석하고, 생성형 AI 기반 영상 생성·편집 기술을 적용한 역사문화 스토리텔링 시나리오를 설계하여 시범 교육과정을 구성하였다. 프로그램 운영 결과, 학습자가 AI 도구를 활용해 지역 역사문화를 주제로 한 영상콘텐츠를 직접 제작하는 과정은 창의적 표현 능력과 미디어 리터러시를 향상시키는 동시에, 지역 역사·문화에 대한 이해와 정체성 인식을 효과적으로 증진시키는 것으로 나타났다. 특히 흥수아이와 두루봉 동굴 등 지역 고유의 역사문화 자원을 AI 영상콘텐츠로 구현하는 수업은 높은 흥미와 몰입을 유발하여 실습 중심 융합 교육모델로서의 가능성을 확인하였다. 본 연구는 역사문화 교육 영역에서 생성형 AI 기반 영상콘텐츠 제작이 학습자 중심의 실천적 미디어 교육 및 디지털 시대 지역 역사문화 교육의 혁신적 방향을 제시함을 시사하며, 향후 다양한 지역과 역사문화 소재로의 확장 및 학습자 성과를 정교하게 측정할 수 있는 평가지표 개발의 필요성을 제안한다.
VR 콘텐츠에서의 독백 연출 특성과 서사적 기능에 관한 연구: 사용자 몰입과 감정 이입을 중심으로
제목(영어)
A Study on the Characteristics of Monologue Direction and Narrative Function in VR Content: Focusing on User Immersion and Emotional Engagement
키워드(원어)
독백, 가상현실, 벽 속에 늑대들, 상호작용성, 내러티브
키워드(영어)
저자
김은주
초록(원어)
본 연구는 전통적 서사 장치인 독백이 가상현실 콘텐츠에서 상호작용성과 현전성을 극대화하는 방향으로 표현 방식에 변화를 주는지 분석하였다. 연극이나 영화에서 독백은 캐릭터의 내면을 드러내고 극적 긴장을 유도하는 주요한 서사 수단으로 기능해 왔으나, VR에서는 사용자와의 몰입을 높이고 상호작용성의 정도가 독백의 성격을 변화시키는 요인으로 작용하고 있다. 몰입도를 높이기 위해 VR 콘텐츠에서 독백이 사용자에게 직접 말을 거는 형식으로 구성되어, 감정적 소통과 참여 유도를 강화하는 표현 방식으로 활용되는 양상이 나타난다. 본 연구는 기존 매체와 VR의 독백 연출과 기능 비교를 통해 VR에서 독백이 반전 해설보다 발견과 체감 중심의 안내 역할로 운용됨을 확인하였다. 결과적으로 VR 독백은 정보 설명 중심에서 참여 유도·정서 동조 중심의 핵심 서사 요소로 기능전환을 확인할 수 있었다.
Do Vision Foundation Models Understand Volume Renderings?
키워드(원어)
Direct Volume Rendering, Vision Foundation Model, Feature Extraction
키워드(영어)
저자
강지윤, 안하일, 정윤현
초록(원어)
Direct Volume Rendering(DVR) 이미지는 3D 볼륨을 2D 공간으로 투영하고 Transfer function의 광학적 속성 매핑 등을 반영하는 시각화 기법으로 자연 이미지 보다 복합적인 정보를 포함하고 있다. 본 연구는, 자연 이미지를 통해 사전 학습된 Vision Foundaion Model(VFM)들이 DVR 이미지에 대해서도 의미있는 특징을 추출할 수 있는지를 분석한다. 대표적인 VFM모델인 DINO, CLIP, SAM의 Image Encoder를 분석 대상으로 한다. 볼륨 랜더링 이미지의 특징을 시각화하여 각 모델의 구조적 표현력을 비교 분석한다. 또한, 각 모델의 학습 방식이 시각화된 결과에 미치는 영향을 정의함으로써 각 모델간의 차이를 분석한다.
Analyzing Ray Sampling and Layer Normalization Contributions in NeRF-based CT Reconstrcution
키워드(원어)
희소 시점 CT 재구성, 신경 방사 필드, 광선 샘플링, 레이어 정규화
키워드(영어)
저자
추동혁, 안하일, 정윤현
초록(원어)
CT는 인체 내부의 3차원 해부학적 구조를 정밀하게 파악하는 데 유용하지만, 다수의 X선 이미지를 필요로 하여 환자가 높은 방사선량에 노출된다는 단점이 있다. 이에 따라 적은 수의 이미지로 CT 볼륨을 재구성하는 희소 시점 CT의 필요성이 지속적으로 증가하고 있다. NeRF의 등장은 이러한 희소 시점 CT 재구성을 보다 효율적으로 수행할 수 있는 가능성을 제시하였으며, 최근 연구들은 네트워크 구조의 고도화뿐 아니라 광선 샘플링 전략과 정규화 기법 등 학습 과정의 세부 설계를 통해 성능 향상을 도모하고 있다. 본 연구는 동일 조건에서 다양한 중요도 기반 광선 샘플링을 비교한 결과, 전역적 커버리지를 유지하는 광선 선택이 재구성 품질에 중요함을 확인하였다. 또한 레이어 정규화 적용 실험을 통해 내부 표현 스케일 안정화가 학습 안정성과 최종 재구성 성능 개선에 유의미하게 기여함을 검증하였다.
Voice-to-Mesh: Text-to-Mesh 모델 기반 실시간 3D 콘텐츠 생성을 위한 MR 파이프라인
제목(영어)
Voice-to-Mesh: A Mixed Reality Pipeline for Real-Time 3D Content Generation Using Text-to-Mesh Model
키워드(원어)
혼합 현실, Text-to-Mesh, 3D 콘텐츠 생성, 실시간 MR 상호작용
키워드(영어)
저자
김예진, 김수현, 정윤현
초록(원어)
최근 생성형 3D 기술의 발전으로 텍스트 기반 3D 메시 생성(Text-to-Mesh)이 가능해졌으나, Mixed Reality(MR) 환경에서는 여전히 사전 제작된 3D 에셋을 불러오는 방식에 의존하고 있어 새로운 객체를 실시간으로 생성, 활용하기 어렵다. 또한 Text-to-Mesh 모델이 생성하는 메시들은 크기, 중심축, 좌표계가 일관되지 않아 MR 공간에 바로 배치하기 위해서는 추가적인 정규화 과정이 필요하다. 이러한 제약은 콘텐츠 제작 과정의 흐름을 단절시킨다. 본 연구에서는 다국어 음성 명령을 기반으로 Text-to-Mesh 모델을 활용해 3D 객체를 생성하고, 이를 MR 환경에서 자동 정규화·배치·상호작용을 할 수 있는 end-to-end 파이프라인을 제안한다. 스토리텔링 시나리오를 통해 실시간 생성형 MR 콘텐츠 제작의 가능성을 확인하였다.
Assessment of Foundation Models’ Applicability to Visualization
키워드(원어)
시네마틱 렌더링, 직접 볼륨 렌더링, 파운데이션 모델, 비전 트랜스포머, 시각화
키워드(영어)
저자
최준서, 김수현, 정윤현
초록(원어)
Direct Volume Rendering (DVR)과 Cinematic Rendering (CR)은 3D 볼륨 데이터를 직관적인 이미지로 변환하는 대표적인 시각화 방식이다. 의료 영상 시각화 이미지는 복잡한 해부학적 구조를 효율적으로 이해할 수 있게 하지만, 전이 함수나 조명 등 사용자 설정에 따라 결과가 크게 달라지는 한계가 있다. 최근 점·박스와 같은 간단한 프롬프트만으로 분할을 수행하는 파운데이션 모델이 등장하면서 새로운 가능성이 열렸다. SAM은 자연 이미지에서, MedSAM은 의료 영상에서 우수한 분할 성능을 보이며 시각화 이미지에서도 관심 영역 표현을 간단하게 사용할 수 있는 가능성을 보였다. 그러나 시각화 이미지는 자연 이미지 속성과 의료 영상 속성이 결합된 혼합 도메인이므로 두 모델 중 어느 쪽이 더 적합한지는 명확하지 않다. 본 연구는 DVR·CR 기반 시각화 이미지에서 SAM과 MedSAM의 분할 성능을 비교·평가한다.
MetaTinyBERT: 메타 교사 기반 구조적 지식 증류를 이용한 경량 인코더 학습 기법
제목(영어)
MetaTinyBERT: Meta-Teacher Guided Structural Distillation for Compact BERT
키워드(원어)
지식 증류, TinyBERT, MetaDistill, 메타 학습, BERT 경량화
키워드(영어)
저자
김의진, 한일규, 김무철
초록(원어)
거대 언어 모델은 높은 성능을 보이지만 크기가 커 엣지 환경에서 활용하기 어렵다. 이를 완화하기 위해 지식 증류가 널리 사용되고 있다. 본 논문에서는 TinyBERT의 일반/태스크 특화 구조 증류를 유지하면서, 각 단계를 MetaDistill식 bi-level optimization으로 재구성한 MetaTinyBERT를 제안한다.
A Study on the Structure of Emotional Direction in AI Animation
키워드(원어)
인공지능애니메이션, 감정연출, 다중시점서사, 프레임보간, AI 스토리텔링
키워드(영어)
저자
최인호
초록(원어)
본 연구의 목적은 인공지능(AI)을 활용한 애니메이션 제작에서 효과적인 감정 전달 메커니즘을 탐구하는 데 있다. 기존의 AI 활용 논의가 주로 생산성 향상에 집중된 것과 달리, 본고는 AI가 어떻게 서사적 깊이와 감정적 울림을 창출할 수 있는지에 주목한다. 이를 위해 본 연구는 감정의 강도에 따라 초당 프레임(FPS)을 동적으로 제어하는 '감응형 프레임 연출'과, 1인칭 심리 묘사와 3인칭 관찰자 시점을 결합한 '다중 시점 서사' 구조를 핵심 방법론으로 제안한다. 이 두 요소가 상호작용하여 캐릭터의 복합적인 심리를 입체적으로 구축하고, 최종적으로 관객의 감정적 몰입을 극대화하는 통합 모델을 설계함으로써, AI를 단순한 기술적 수단을 넘어 감정 연출을 위한 창의적 파트너로 활용하는 실천적 프레임을 제시하는 데 연구의 의의가 있다.