ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ChatGPT가 입문시킨 AI 서비스, 이해하고 쓰기_(생성형 인공지능이란)
    IT 시사 및 인사이트 2024. 3. 18. 16:00

     
     
    지난 글에서 우리가 흔히 알고있는 ChatGPT가
    과연 무엇이고 왜 사람들의 폭발적인 관심을 갖게 되었는지 알아보았습니다.
     
     
    이번에는 우리가 열광할 수 있는 기폭제 역할을 해준
    생성형 인공지능의 종류와 그에 관한 주요 요소들을 알아보죠.
     
     
    그냥 인공지능도 아니고 굳이 '생성형' 인공지능이라 꿋꿋이 붙이는 이유는
    기존의 인공지능이라 불리우는 녀석과는 목적이 약간 다르기 떄문인데요.
     
     
    혹시 영화 터미네이터를 보신분이라면 '스카이넷'이라는 인공지능을 기억하실겁니다.
     
    우리가 AI(Artificial Inteligence), 인공과 지능이라는 용어를 들으면 딱 떠올리는,
    사람의 인지 능력을 모방해서 인간처럼 문제를 해결하고 판단하는 능력을 갖춘 프로그램인
    '인지 인공지능(cognitive AI)'에서 폭력성을 몇스푼 추가하면 스카이넷이 되죠.
     
    실제 활용되고 있는 영역으로는 자율 주행 분야
    자연어 번역, 의료 이미지 세분화(PIS) 등이 있습니다.
     

    사진: Unsplash 의 Steve Johnson

     
    어찌보면 인간의 사고와 인지 과정을 발전시켜 보다 효과적인 의사결정 및 
    작업을 하기 위한 목표를 갖는다고 볼 수 있습니다.
     
     
    반면에 '생성형 인공지능(generative AI)'라고 불리는 녀석은 
    새로운 콘텐츠나 답변을 생성하는 데 중점을 둔 기술입니다.
     
    '내 텍스트 읽어줘', '멋진 그림 그려줘', '귀여운 고양이 그려줘' 등 인간의 욕망을
    해소하기 위해 맡은 역할을 충실히 해내는 이미지(?)로 이미 익숙하죠.
     
     
    그 종류도 몇가지 예시로 말씀드리자면
     
    이미지 생성 AI - Midjourney, CivitAI, StableDiffusion, WomboDream, 등
    동영상 생성 AI - Wondershare Filmora, 딥브레인AI(국내), CapCut 등    
    오디오 생성 AI - Narakeet, 클로바더빙(국내), VoiceForge, typecast 등  
    국내외를 막론하고 상당히 다양합니다.
     
     
    우리가 생성형 AI를 이용할 때 명령어(Prompt) 즉 Text를 입력하면
    해당 AI가 결과물을 생성하잖아요?
     
    그 매커니즘이 EncoderDecoder의 과정이라고 보시면 됩니다.
    인코더의 경우 우리가 입력한 텍스트를 특정 단어가 아닌 맥락 전체로 해석을 하고
    디코더는 그렇게 전달받은 맥락 정보를 바탕으로 결과물을 생성해내죠.
     
     
    그 처리 과정을 담당하는 네트워크도
    GAN,VAE,Flow-based Model, Diffusion Model 등 많으며
    이에 관해 쉽게 설명해놓은 글이 있어 아래 링크를 참고하시면 되겠습니다.
    (https://glanceyes.com/entry/Deep-Learning-Generative-Model)
     
     
    다시 본론으로 돌아와서,
    ChatGPT-3.5의 경우를 보면, 우리가 사용하는 언어를 이해하고
    그에 맞는 언어를 예측해 다시 우리에게 생성해주는 '언어 생성'의 단계를 거치는데요.
     
    그 과정을 거치기 위해 GPT 시리즈는 인간의 뇌 신경망을 모델링해
     '딥러닝' 기반의 '자연어 생성 네트워크'를 구성하죠.
     
     
    이 과정은 이전에 언급됐듯이 언어를 생성하는 작업에서
    기존에 입력된 공식이나 규칙을 따르는 것이 아니라 텍스트 전체의 맥락을 학습하고
    적절한 답을 예측하는 'Transformer'를 하고 있다는 말이죠.
     
     
     
    앞선 언어 생성뿐만 아니라
    우리는 현재 무수히 많은 가상의 이미지를 AI를 통해 생성해내고 있습니다.
     
    이 과정에서 다양한 모델이 활용되는데,
    대표적인 모델로 앞서 언급된 GAN과 VAE가 그 예라고 볼 수 있습니다.
    (앞선 링크의 내용 참조를 확인해주시길 바랍니다)
     
     
    우리가 간단히 텍스트만으로 사용하고 있는
    생성형 인공지능 서비스들이 이러한 모델을 바탕으로한 학습을 거쳐서
    시장에 제공되고 있다고 보시면 될 것 같습니다.
     
     
    사실 용어와 과정만 간단하게 보고 넘어가기 때문에
    그리 어렵게 느껴지지 않을 뿐
     
    그 내부의 알고리즘과 유의미한 데이터셋을
    세팅하기 위한 처리과정은 어마어마한 시간과 비용 및 노동력이 들어갑니다.
     
    당장 GPT 3.5 전 단계인 GPT 3만 하더라도 학습에 들어간 비용이
    한화로 약 500억원에 이를 것이라고 추정될 만큼 쉽지 않은 과정입니다.
     
    그러나 개인이 이러한 어려운 과정을 모두 이해하고
    또 이해할 수도 없기 때문에 적어도 내가 어떤 과정을 거쳐서 만들어진 프로그램을
    쓰고 있다라는 정도의 관심만 가지고 잘 활용할 수 있으면 된다고 봅니다.
     
    두서없는 내용이었지만 조금이라도 이해에 도움이 되셨길 바라며
    아래 링크는 삼성 SDS 데이터분석서비스팀에서 ChatGPT에 대해 실어놓은 글이니
    더 관심이 생기신 분들은 참고하시길 바랍니다.
     
    https://www.samsungsds.com/kr/insights/chatgpt_whitepaper1.html
     
     
     
     
    감사합니다.

Designed by Tistory.