개요
ChatGPT를 시작으로 여러가지 대화형 인공지능부터 생성형 인공지능, 추론, 분석 등 다양한 인공지능 기술이 빠르게 발전하고 있습니다.
1. 인공지능 꼭 만들어야 할까?
DRW - Don’t reinvent wheel
ChatGPT를 시작으로 여러가지 대화형 인공지능부터 생성형 인공지능, 추론, 분석 등 다양한 인공지능 기술이 빠르게 발전하고 있습니다. ChatGPT 이전에는 LLM(Large language Model) 기반으로 머신러닝이 주를 이루었지만, 이제는 고성능 파운데이션 모델(FM)으로 변화하고 있는 추세입니다.
즉, 이미 잘 만들어진 고성능 파운데이션 모델을 통해 새로운 비즈니스로의 확장을 기대할 수 있으며, 기존 서비스에 인공지능을 도입해 더욱 편리하고 빠른 서비스 확장을 기대할 수 있게 되었습니다. 이미 우리는 미드저니, DALL.E 등의 생성형 인공지능을 통해 라이센스 걱정 없는 이미지를 만들 수 있으며, openai 에서 최근 출시한 SORA 를 통해 영상까지 확장되고 있습니다.
이렇게 빠른 발전 속에서 우리가 할 수 있는 것은 잘 만들어진 바퀴를 통해 빠르게 서비스를 출시하고 테스트하며, 인공지능 시장에서 우리가 잘 할 수 있는 것과 융합해 새로운 비즈니스를 만들어내는 것이 중요하다 생각합니다.
1.1 고성능 파운데이션 모델
AWS에서 제공하는 고성능 파운데이션 모델 살펴보기
현재 AWS에서 제공하는 기초 고성능 파운데이션 모델의 공급자는 다음과 같습니다.
대다수 텍스트 기반으로 입력을 받으며, 출력 방식은 채팅, 텍스트, 이미지, 임베딩 등 다양하게 지원하고 있습니다. 그 중에서 몇 가지 모델에 대해 살펴보도록 하겠습니다.
1.1.1 아마존 Titan
Amazon Titan Foundation Model (FM) 은 대규모 데이터 세트를 AWS 기반으로 사전 학습된 FM 제품군으로, 다양한 사용 사례를 지원하도록 구축된 강력한 범용 모델입니다.
아마존 Titan은 4K~8K 입력 토큰을 지원하며 영어를 기본으로 하며 100개국의 언어를 지원합니다. 사용 사례로는 검색 증강 생성, 개방형 텍스트 생성, 브레인스토밍, 요약, 코드 생성, 테이블 생성, 데이터 형식 지정, 단락, 연쇄적 사고, 재작성, 추출, 질문 및 답변, 채팅 등에서 사용할 수 있습니다.
아마존 Titan 살펴보기
텍스트 프롬프트 엔지니어링 가이드
위 엔지니어링 가이드에는 다음의 지침이 있습니다.
- Chatbot
- Text2SQL
- 함수 직접 호출
- 검색 증강 생성(RAG)
우리가 ChatGPT에 사전에 정보를 입력하고 그에 맞는 결과물을 얻기 위해 설정했었던,
Custom Instructions
와 동일한 구조 입니다. 기본적으로 chatGPT 와 유사하게 설정할 수 있습니다.1.1.2 Anthropic
Anthropic 은 언어, 추론, 분석, 코딩 등 다양한 작업에 적합하며, 그 중에서
Claude3
모델은 최첨단 텍스트 및 비전 모델입니다.- 다국어 기능 Claude 3 모델은 스페인어, 일본어 등 영어가 아닌 언어에 대한 향상된 유창성을 제공하여 번역 서비스 및 글로벌 콘텐츠 생성과 같은 사용 사례를 지원합니다.
- 비전 및 이미지 처리 모든 Claude 3 모델은 시각적 입력을 처리 및 분석하고, 문서에서 통찰력을 추출하고, 웹 UI를 처리하고, 이미지 카탈로그 메타데이터를 생성하는 등의 작업을 수행할 수 있습니다.
- 사용 용이성 Claude 3 모델은 조종하기가 더 쉽고 방향을 따라가는 데 더 좋습니다. 이를 통해 모델 동작을 더 효과적으로 제어하고 더 예측 가능하며 더 높은 품질의 출력을 얻을 수 있습니다.
- 모델 업그레이드 Claude 3 제품군은 성능을 향상하고 기능을 확장하며 확인된 문제를 해결하기 위해 주기적으로 업데이트를 받습니다. 그러나 각 업데이트는 새 모델 버전에 고정되므로 한 모델 버전의 워크플로가 새 버전 출시로 인해 중단되지 않습니다.
Claude3 vs GPT-4
성능에 대한 차이는 꽤 차이가 나는 부분이 있습니다. 대학원 수준의 추론 영역 부분에서 약 15% 정도의 차이가 나는 것을 볼 수 있습니다. 즉, 전문적인 분석, 추론, 검색 부분에서 사용하면 좋은 모델입니다.
Claude3 Sonnet 살펴보기
다음 이미지를 분석해줘
별 다른 정보 없이도 이 정도로 분석을 해냅니다. 그렇다면 새로운 요청을 해보겠습니다. 이번에는 특정 이미지를 주고 코드를 작성해 달라고 해보겠습니다.
코드 보기
이미지만 보고 코드를 바로 출력해줄 수 있습니다. 또 다른 이미지를 통해 코드로 만들어보겠습니다.
코드보기
한국어 인식이 조금 부정확하지만, 이미지를 토대로 코드를 출력하는 모습이 인상적입니다. 아쉽게도 한국어로 작성된 PDF 파일을 분석할 수 없다는 단점이 있습니다. 영문으로 작성된 문서나 이미지는 그래도 정확도가 높습니다. 무료 버전은 하루 5개 정도 사용이 가능하며 가장 높은 모델을 사용할 수 없습니다. 유료 구독을 통해 가장 높은 모델을 사용할 수 있습니다.
1.1.3 AI21 Labs
AI21 Labs 에서 제공하는
Jurassic
모델은 특정 읽기 및 쓰기 작업에 초점이 맞춰져 있습니다.의역, 문법 오류 수정, 텍스트 개선, 요약, 텍스트 분할, 문맥 답변(텍스트 문서 기반), 상황 별 답변 등에 주로 사용할 수 있습니다. 이 중에서 문맥 답변과 상황 별 답변에 대해 살펴보겠습니다.
문맥 답변(단일 문서 기반)
문맥 답변(단일 문서 기반) 살펴보기
주어진 문서 정보(Context Input) 기반으로 질문을 하였을 때, 추론을 할 수 있습니다. 조금 더 복잡한 질문을 하게 된다면,
까지 추론할 수 있습니다.
상황 별 답변(RAG 엔진)
RAG 엔진은 주로 검색 증강 생성과 같이 사용자가 질의를 하였을 때 참고할 정보를 제공함으로써 응답에 대한 정확도를 올리기 위한 것 입니다.
Cohere 에서도 동일한 모델을 확인할 수 있습니다.
상황 별 답변(RAG 엔진)
사용자가 여러 문서(PDF, DOCX, HTML, TXT 등)을 RAG 엔진에 업로드할 수 있습니다. RAG 엔진에 업로드된 문서를 기반으로 질문을 할 수 있습니다.
문서 기반으로 질의를 하였을 때 답변을 받을 수 있습니다.
물론 해당 문서에서 정보가 없거나, 추론이 안될 경우도 가능합니다.
1.1.4 Meta - LLAMA2
메타(구 Facebook)에서 제공하는 AI 모델인 Llama 입니다. 무료로 공개된 만큼 데이터 수는 7B(70억) 에서 70B(700억)개 입니다. 또한 대다수 영어 기반으로 제공되고 있습니다. 한국어는 약 0.06% 정도 차지하고 있습니다. 0.06%의 한국어는 약 4.2억~420억 개입니다. 수치 상으로 꽤 많은 정보를 담고 있습니다.
주로 Langchain 기반으로 LLM 기반 애플리케이션을 구축하는데 사용하고 있습니다. 프라이빗 데이터와 통합하여 사용하기 위한 모델로 이해하면 됩니다.
1.1.5 Mistral AI
API 기반으로 사용할 수 있는 모델 중에 2위를 차지 했다고 합니다. 물론 Claude2 와 비교했기 때문에 최신 정보는 아닙니다.
1.1.6 Stablility.ai - 이미지와 비디오 생성하기
생성형 이미지부터 업스케일, 수정 등에서 강력한 모델을 제공합니다. 또한 최근 동영상까지 제공하고 있습니다.
이미 스테이블 디퓨전을 사용해본 경험이라면 위 이미지 정도는 예상했지만, SORA와 유사한 느낌의 영상도 출력이 가능합니다.
1.2 AWS에서 사용할 수 있는 여러 모델
현재 고성능 파운데이션 모델(FM)은
Python
언어를 통해 사용합니다.머신러닝으로 부터 시작해 현재 인공지능 모델까지 대다수
Python
언어를 지원하고 있습니다. 물론 API 기반으로 호출하는 형태이기 때문에 스크립트 언어는 모두 가능하리라 생각됩니다. 이를 통해 루와콘텐츠그룹에서는 Python
기반으로 AWS Bedrock 을 통해 다양한 실험을 해보려 합니다.확장 서비스 - 예시 모델
기존에 FAQ 또는 블로그에서 찾았던 정부 정책(청년 정책, 임대 주택 등)에 대해 챗봇 형태로 제공할 수 있게 되었습니다. 앞서 설명한 RAG 엔진을 통해 미리 문서를 업로드해서 해당 문서 내용을 토대로 답변을 받을 수 있게 됩니다.
- 사용 모델: Claude2.1 버전 사용
txt
확장자만 지원(PDF→txt 파일로 변환)
서비스 확장 하기
앞서 예시로 들었던 챗봇 형태 또한 기존에는 한국어 형태소 분석을 통해 특정 알고리즘으로 답변을 추론하는 방식을 사용해왔습니다. 하지만 이제는 잘 만들어진 모델(FM) 을 통해 답변을 추론하고 미세조정(FT)을 통해 정확도를 올리는 방향으로 흘러가고 있습니다.
1.3 AI eXperience, 기존 서비스 + AI 활용
서비스에 AI를 활용해 AX 전환하기
기존 서비스에 AI를 통해서 사용자에게 AX 전환으로 더 많은 유입과 전환을 높이기 위해, 적절한 AI 모델과 활용 방안에 대해 연구해야 합니다. 수 많은 기업들이 현재 디지털 전환(DX)에서 인공지능 전환(AI)로 나아가고 있습니다.
루와콘텐츠그룹이 나아가야 할 방향 또한, AX 전환을 위해 AI를 적극적으로 사용하고 이를 비즈니스와 융합해 새로운 시너지를 만들어나가야 합니다. 우리는 남들이 하지 못하는, 즉 다른 기업에서 시도하지 않았던 분야, 새로운 시장을 개척해나가야 합니다.
루와콘텐츠그룹은 현재 여러 기업과 공공 기관의 DX 전환을 해주었습니다. 이제는 더 나아가 AX 전환까지 이룰 수 있도록,
AI 기반의 ERP 에이전트
를 개발하고 있습니다. 기존 ERP 시스템에서 한 발 더 나아가 AI 기반 ERP로 사용자가 지정한 워크 플로우(Workflow)를 토대로 AI가 자동으로 데이터를 분석, 추론, 답변등을 제공하여 더 나은 가치를 창출 할 수 있게 합니다.AI 기반
ERP
의 미래, 루와콘텐츠그룹이 함께 하겠습니다.