ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ChatGPT보다 MZ한 AI의 미친 성능
    AI 도구와 서비스 플랫폼 2023. 12. 13. 21:45

    반갑습니다.
    벌써 2023년이 다 지나가고 연말을 보낼 준비들 많이 하고 계시죠?
     
    오늘은 Chatgpt보다 훨씬 MZ하고 신뢰가 가는 검색엔진 특화 챗봇을 가져왔습니다.
     
     
    대부분이 ChatGPT의 무료 버전인 3.5를 사용하고 계시고,
    해당 버전의 검색 결과와 출처 표기는 우리에게 그리 친절하지 못하다는 느낌을 줍니다.
    직접 출처를 클릭해 들어가서 확인하는 번거로움이 추가되기 때문이죠. 
     

    ChatGPT-3.5 검색 결과(출처-chat.openai.com)

     
    어떻게 쓰냐에 따라서 다소 다를 수는 있지만
    일반적인 검색엔진을 겸해서 사용하려고 하다보면
     
    제 개인적으로는 Source 나열해놓은 것도 그렇고 그렇게 직관적이진 못하다고 보입니다.
    더군다나 기본 ChatGPT는 2021년까지의 정보만 학습되어 가져올 수 있다는 약점 또한 존재하죠.
    (물론 WebChatGPT를 설치해 최신 정보 검색 결과를 가져올 수는 있습니다.)
     
     
     
     
     
     
    그래서 오늘은 기타 확장 프로그램 설치 없이,
    최신 정보를 직관적으로 가져오는 'Perplexity'를 소개해드리려 합니다.
     

    올해의 게임 정보 검색 by perplexity.ai(출처-perplextity.ai)

     
     
     

    Perplexity(출처-perplexity.ai)

     

    google play와 app store에서 앱도 지원하고 있는 PPLX라고도 불리는
    perplexity는 2022년 Aravind Srinivas가 서비스를 시작한 ChatGPT와 유사한 LLM입니다.
     
     
     
    단순히 ChatGPT보다 직관적이라는 이유만으로 PPLX가 AI 시장에서 살아남지는 못했을 것입니다.
     
    PPLX는 이미 AI 시장에서 이용자수 랭킹 10위권 내에 들어가는 유명한 녀석이지만 모르는 분들도 많으실 겁니다.
     

    대부분 국내에선 ChatGPT나 많이 쳐줘도 Bard 등과 같은 서비스의 인지도에 밀리기 때문이죠.

     
     
     
     
    그럼 어떻게 PPLX가 밀리는 인지도에도 아직까지 AI 시장에서 살아남을 수 있었는지
    핵심 포인트를 간단하게 짚고 가겠습니다.
     
     
     
     
     
    ChatGPT를 포함한 상당수 LLM(대규모 언어 모델)의 취약점은 대체로 2가지로 볼 수 있는데요.
     
    1. Freshness
    한마디로 추가 확장프로그램 설치 없이는 최신 정보를 그떄마다 불러오기 어렵다는 점.
     
    2. Hallucinations
    때때로 사용자의 질문에 전혀 관련이 없는 답변을 지어내는 신뢰성과 관련된 문제.
     
     
    ChatGPT같은 경우도 당시 AI 붐을 일으킬 정도로 혁신적이었지만
    2021년까지의 정보만 불러올 수 있다는 점과 질문과 관련없는 답변을 가끔 내놓는다는
    문제점을 안고 출시가 되었습니다.
     
     
     
     
     
    PPLX의 경우는 이 문제를 기본 오픈 소스 모델을 기반으로 구축한 mistral-7b를 사용하고,
     
    사내 검색, 인덱싱 및 크롤링 인프라를 활용해 관련성이 높고 최신 정보를 가져올 수 있도록
    정기적인 업데이트와 더불어 LLM을 강화시키는 방향으로 해결하려 했습니다.
     
    또한 "snippets"라 불리는 웹사이트 발췌 도구를 활용하여
    PPLX 모델이 지속적으로 크롤링할 사이트의 우선 순위와 품질을 조정하고 있다고 합니다.
     
     
     
    실제로 최신의 신뢰도 있는 답변 엔진을 구축하기 위해
    LLM에 현실적인 사용 사례를 반영할 수 있도록 평가 데이터 세트를 선별하여
    각 쿼리에 대해 계약업체에 두 가지 모델의 응답을 제공해 더 나은 성능을 발휘하는
    답변을 채택하도록 설계하였다고 합니다.
     
    쉽게 말해 시험지를 내주고 더 뛰어난 답을 적어낸 녀석을 골라오도록 하는 것이죠.
     
     
    이 때 평가 세트는 총 3가지로 구성되며
    (유용성, 사실성, 최신 정보)
    각각에 50개의 프롬프트를 포함하고 있습니다.
     

    (출처-perplexity.ai)

     
    위와 같이 서로 다른 평가지를 던져주고 신뢰도를 바탕으로 성능을 비교하는 작업을 거치고 있다고 합니다.
    (GPT 3.5 모델에 대한 평가도 같이 이뤄지고 있는 것을 알 수 있죠.)
     
    특히나 NVIDIA H100를 활용해서 더 빠르게 답변을 내놓을 수 있는 인프라를 구축하고 있죠.
     
     
     
    더 자세한 선별작업은 PPLX 공식 홈페이지에서 확인하실 수 있으니
    궁금하시면 한번 들어가셔서 참고하시길 바랍니다.
     
     
     
     
     
    그래서 그런지 앞선 ChatGPT와 PPLX의 검색 결과를 봐도,
    불과 몇 주 전에 열린 올해의 게임 시상식과 관련된 정보를 같은 명령어를 쓰더라도
     

    직관적인 Source 목록 (출처-perplexity.ai)

     
    Source도 직관적이고 자세하게
     

    부연 이미지 목록 (출처-perplexity.ai)

     
    시각적으로 참고할 수 있는 image들과 함께
     

    PPLX 답변 (출처-perplexity.ai)

     
    더욱 자세히 답변해주고 있죠.
     
     
    또한 답변과 관련해서 연관된 질문을 3가지 예시를 통해 제공하고 있습니다.

    연관된 질문 예시(출처-Perplexity.ai)

     
     

    뤼튼을 써보신 분들이라면 아마 익숙하시겠지만
    Chatgpt에는 아시다싶이 해당 기능이 없어서 아쉽다 느끼신 분들도 계실겁니다.
     
     
    참고로
    메인 화면에서는 사람들이 많이 질문한 내역을 확인할 수 있습니다.

     
     
     
    보시면 2024년도 골든 글러브 시상식에 관한 최신 정보도 확인할 수 있습니다.

    2024 Golden globe nomination(출처-perplexity.ai)

     
     
     

    ChatGPT의 답변과는 다르게 말이죠.

     
     
    기존 AI 챗봇 검색 결과에서 Source 출처 부분이 좀 직관적이지 않아 불편했던 분들,
     
    정확한 정보를 바탕으로하는 검색 엔진 기능 쪽을 더 많이 활용하려는 분들은
     
    ChatGPT보다 PPLX 쪽을 강력하게 추천드립니다.
     
     
     
     
    감사합니다.

Designed by Tistory.