지난 글에서 우리가 흔히 알고있는 ChatGPT가 과연 무엇이고 왜 사람들의 폭발적인 관심을 갖게 되었는지 알아보았습니다.
이번에는 우리가 열광할 수 있는 기폭제 역할을 해준 생성형 인공지능의 종류와 그에 관한 주요 요소들을 알아보죠.
그냥 인공지능도 아니고 굳이 '생성형' 인공지능이라 꿋꿋이 붙이는 이유는 기존의 인공지능이라 불리우는 녀석과는 목적이 약간 다르기 떄문인데요.
혹시 영화 터미네이터를 보신분이라면 '스카이넷'이라는 인공지능을 기억하실겁니다.
우리가 AI(Artificial Inteligence), 인공과 지능이라는 용어를 들으면 딱 떠올리는, 사람의 인지 능력을 모방해서 인간처럼 문제를 해결하고 판단하는 능력을 갖춘 프로그램인 '인지 인공지능(cognitive AI)'에서 폭력성을 몇스푼 추가하면 스카이넷이 되죠.
실제 활용되고 있는 영역으로는 자율 주행 분야 자연어 번역, 의료 이미지 세분화(PIS) 등이 있습니다.
어찌보면 인간의 사고와 인지 과정을 발전시켜 보다 효과적인 의사결정 및 작업을 하기 위한 목표를 갖는다고 볼 수 있습니다.
반면에 '생성형 인공지능(generative AI)'라고 불리는 녀석은 새로운 콘텐츠나 답변을 생성하는 데 중점을 둔 기술입니다.
'내 텍스트 읽어줘', '멋진 그림 그려줘', '귀여운 고양이 그려줘' 등 인간의 욕망을 해소하기 위해 맡은 역할을 충실히 해내는 이미지(?)로 이미 익숙하죠.
그 종류도 몇가지 예시로 말씀드리자면
이미지 생성 AI - Midjourney, CivitAI, StableDiffusion, WomboDream, 등 동영상 생성 AI - Wondershare Filmora, 딥브레인AI(국내), CapCut 등 오디오 생성 AI - Narakeet, 클로바더빙(국내), VoiceForge, typecast 등 국내외를 막론하고 상당히 다양합니다.
우리가 생성형 AI를 이용할 때 명령어(Prompt) 즉 Text를 입력하면 해당 AI가 결과물을 생성하잖아요?
그 매커니즘이 Encoder와 Decoder의 과정이라고 보시면 됩니다. 인코더의 경우 우리가 입력한 텍스트를 특정 단어가 아닌 맥락 전체로 해석을 하고 디코더는 그렇게 전달받은 맥락 정보를 바탕으로 결과물을 생성해내죠.