[제208회 영림원CEO포럼] 비즈니스에서 AI 활용 사례

“‘AI 응용 전쟁’에서 누가 승리할 것인가

황승진 미국 스탠퍼드대학교 종신교수, ‘비즈니스에서 AI 활용사례’ 주제 강연

황승진 미국 스탠퍼드대학교 종신교수가 4일, 208회 영림원CEO포럼에서 ‘비즈니스에서의 AI 활용사례’를 주제로 강연했다.

황승진 교수는 ”2022년 말 오픈AI의 챗GPT 출시로 AI가 일상에 본격적으로 들어왔음을 실감하게 됐다. 대형언어모델(LLM)은 단순한 대화를 넘어, RAG·에이전트·다양한 도구와 결합할 때 업무 자동화, 제품 성능 향상, 신제품 개발 등 기업 경쟁력을 크게 높이는 혁신적인 기술로 발전한다. 이는 국가 경쟁력으로 직결되는데 중국은 국가 차원에서 AI 혁신을 주도하고 있어 우리도 발 빠르게 대응해야 할 것이다“라면서, 다양한 기업 사례를 통해 AI를 비즈니스에 어떻게 적용할 수 있을지를 소개했다. 다음은 강연내용.

◇ LLM의 등장 역사

지금 세상에서는 AI 전쟁이 요란하게 일어나고 있다. 오픈AI와 구글, 그리고 미국과 중국이 AI 패권을 놓고 다투고 있다. 이 요란한 전쟁 뒤에 또하나의 전쟁이 펼쳐지고 있다. 조용한 전쟁이다. 의료, 행정, 군사, 교육, 과학, 그리고 특히 비즈니스에서의 ‘AI 응용 전쟁’이 일어나고 있다. 이 두 전쟁의 결판은 아마 5년 후에 결정이 날 것이다.

LLM의 등장은 2012년에 토마스 미콜로프라는 체코의 한 젊은 박사로부터 시작됐다. 미콜로프는 한 논문에서 세상에 존재하는 각 사물 즉 명사를 516차원의 실수 벡터로 표현하자고 제안했다. 이것이 임베딩이라는 아이디어인데 LLM의 등장에 기폭제 역할을 했다. 수치화된 벡터 형태로 변환하는 이 임베딩의 과정에서 의미가 유사한 단어들이 벡터 공간에서 서로 가까운 곳에 위치하게 된다.

2017년 구글에서 이 임베딩이라는 아이디어를 채택해 트랜스포머 아키텍처를 개발했다. 트랜스포머에서 핵심은 어텐션이라는 메커니즘이다. 2022년 11월, 오픈AI가 이를 이용해 첫 LLM인 챗GPT를 발표했다. 이후 제미나이, 라마, 클로드, 딥시크, 그로크 등의 LLM이 나왔다.

LLM이 할 수 있는 일은 모두 8개이다. 먼저 6개의 기본 기능으로 글을 읽고 쓸 수 있을 뿐만 아니다 이미지도 읽고 쓰거나 그릴 수 있다. 그리고 음성도 읽고 쓸 수 있다. 이 6개의 기본 기능 외에 RAG와 에이전트가 있다. RAG(검색증강생성)는 기존의 LLM이 학습 데이터에만 의존하지 않고 실시간으로 외부 정보를 참조해 더욱 신뢰할 수 있고 구체적인 답변을 생성하도록 해주며, 에이전트는 정보의 흐름을 자동화하는 것으로, 내 의도만 얘기하면 AI가 구태여 이것저것 묻지않고 알아서 챙겨준다. 다시 말해 AI의 기술 세계는 6개의 LLM의 기본 기능과 RAG, 에이전트 등 8개이다. 제일 기초가 되는 것이 LLM이고, 그 위에 한층 얹은 것이 RAG이며 에이전트가 꼭대기에 있다. 이 에이전트는 밑에 여러 툴을 두고 있다. 에이전트의 세계에 일종의 위계 질서가 있는 셈이다.

◇ 1987년 애플의 꿈 ‘날리지 내비게이터’, 지금 실리콘밸리서 실현 중

1987년 애플은 자신이 그리는 기술의 장기적 비전을 담은 ‘날리지 내비게이터’라는 비디오를 만들어 발표했다. 이른바 애플의 꿈이었다. 그런데 사실 이 비디오는 애플의 꿈이 아니라 실리콘 밸리 전체의 꿈이었다. 1987년에 꿈꿨던 이 장기적 기술 비전이 지금 실리콘 밸리에서 일어나고 있다.

이 비디오에는 버클리대 교수의 어느 하루가 나온다. 교수는 자신의 가상 비서와 대화하며 강의 준비를 한다. 그 기술들은 놀랍도록 현재의 AI와 일치한다. 첫째, 가상 비서는 교수의 말을 이해하고 답한다. 둘째, 텍스트, 영상, 오디오 등 멀티모달 데이터의 자연스런 사용이다. 가상 비서는 입술을 움직이며 교수와 말을 주고받으며, 오는 전화를 받고, 놓친 전화에 대해 설명하며, 딴 교수에게 전화하며, 하루의 일정을 설명한다. 답하는 중에 논문, 도표와 지도도 사용한다. 시뮬레이션을 통해 비디오도 즉석에서 생성한다. 셋째, LLM 혼자가 아니라 RAG, 에이전트, API, 도구까지 등장한다. 교수의 지시사항에 맞춰 작업의 흐름 즉 워크플로우를 계획하고 실천한다. 리서치 네트워크 등 여러 데이터 소스가 비서에게 매끄럽게 연결되는데, 요새로 따지면 RAG가 할 일이다. 개인 일정표는 도구로 연결하면 된다. 넷째, 교수는 정확한 소스를 모르지만 대강 뜻하는 바를 밝힐 뿐이다. 흔히 말하는 인텐트 기반 AI가 있는 듯하다. 요새 같으면 ‘에이전틱 워크플로우’의 일부일 것이다.

1987년은 PC도 얼마 보급되지 않고 와이파이도 없고 인터넷도 없었다. 그 때 이런 상상을 했다는 게 놀랍다. 애플의 이 미래 청사진을 내놓은 사람은 애플 사장도 아니고 스티브 잡스도 아닌 어느 학자로 그의 이름은 앨런 케이였다.

앨런 케이는 원래 프로페셔널 기타리스트였는데 예술과 과학을 같이 추구하는 것이 꿈이었다. 유타 대학의 컴퓨터 사이언스의 박사 과정에 들어가 논문으로 기존의 프로그래밍 방식을 오브젝트 위주의 오퍼레이팅 시스템과 유저 인터페이스로 바꾸는 방법을 내놓았다. 이후 제록스 PARC에 들어가 현대적인 윈도우 기반의 그래픽 사용자 인터페이스의 설계와 객체 지향 프로그래밍 언어인 스몰토크의 개발을 주도했다. 앨런 케이는 스티브 잡스의 매킨토시 개발과 빌 게이츠의 윈도우 개발에 영향을 미쳤으며, 컴퓨터 사이언스계의 노벨상으로 불리는 튜링상을 받았다.

◇ 수요 예측

AI를 비즈니스에 적용하는 방안으로 먼저 수요 예측을 들 수 있다. 지금까지 수요 예측 방법으로 제일 많이 쓰는 것이 ‘지수평활법( exponential smoothing)’이다. 지수평활법은 최근의 데이터에 더 큰 가중치를 부여하면서 미래를 예측하는 기법이다. 이를테면 오늘 수요에 가중치 50%를 넣고, 어제 수요에 가중치 25%, 그제 수요에 12.5%를 넣는 방식으로 모두 합쳐 내일의 수요를 예측하는 것이다. 이 방법은 과거의 판매 실적만으로 내일의 수요를 예측한다는 점에서 한계가 있다. 내일 비가 온다든지, 크리스마스라든지, 어제 TV 광고를 했다는 등등 많은 외부 변수에 따라 내일의 수요는 달라지기 때문이다. 기업에서도 이를 알지만 어떤 데이터를 잡아서 어떤 수학 공식에 넣느냐가 관건이었다.

이제 LLM 기술이 이런 걱정을 해소해준다. LLM을 구성하는 신경망은 세상에 존재하는 모든 수학함수를 대신할 수 있다. 또한 LLM의 연결성 덕택에 여러 변수 데이터를 용이하게 융합할 수 있다.

현재 AI에 기반한 수요예측에 대해 많은 연구와 개발이 진행되고 있다. 그 중 하나는 구글이 개발한 TFT(Temporal Fusion Transformer)라는 기법이다. 이는 여러 변수 시계열을 입력해 그들의 숨겨진 상관관계를 이용하는 수요예측 기법이다. 판매량 뿐 아니라, 광고, 날씨, 판매 파이프라인, 웹 사이트 방문자수, 신제품 출시 등 수요 예측과 관계된 변수를 일별로 입력한다. 게다가, 요일, 날짜나 계절 등 예측 가능한 변수까지 시계열로 입력한다. 여기에 트랜스포머의 어텐션을 적용해 변수의 시간적 상관성을 예측한다.

유럽의 어느 대형 소매 업체에는 구글의 TFT를 적용해 놀라운 수요 예측 성과를 거뒀다. 또다른 예로 오스트리아에서 의사들이 발표한 페이퍼에 따르면 환자를 수술하는 동안 의사들이 가장 겁내는 것은 혈압이 떨어지는 거였다. 그래서 의사들은 환자의 혈압이나 맥박 등을 종합해 TFT에게 주고 환자의 혈압이 떨어질 가능성을 7분마다 예측해 달라고 했다. 7분 후에 어떤 사건이 일어날지를 예측할 수 있도록 한 것이다. 테스트 결과 성공률은 93.3%였다.

◇ 유방암 진단과 예측

AI가 제일 잘 발달되고 공개적으로 소개되는 사례는 의료 분야이다. 여러 가지 암의 종류 가운데 가장 크게 여성의 생명을 위협하는 암이 유방암이다. 그런데 유방암은 미리 알면 치료가 가능하다. 유방암에 대한 최선의 예방은 연간 또는 2년 간격으로 유방촬영을 통한 조기 발견이다. 촬영된 영상은 일반적으로 전문 방사선과 의사가 판독한다. 하지만 최근에는 AI가 사람보다 더 빠르고 비슷한 성능으로 판독하는 것으로 나타났다.

사람의 눈은 영상에서 선과 형체를 읽을 수 있는 반면, 기계는 이런 선과 형체의 구성요소인 픽셀을 읽는다. 기계에게 많은 이미지를 주어 픽셀 단위로 특성과 패턴을 볼 수 있도록 훈련시키면 전문가보다 섬세한 점을 더 잘 볼 수 있다.

기계가 인간에 비해 더 잘할 수 있는 것이 또 있다. 기계는 암의 발생을 ‘예측’할 수 있다. 코넬대 연구팀은 총 7,353명의 환자로부터 암 진단 결과가 나온 1,413건을 포함해 총 19,328건의 유방촬영 데이터 세트를 수집했다. 그리고 연구원들은 새로운 유방암 환자의 경우, 1년 이상 전에 찍은 옛 유방촬영 사진을 살펴뵜다. 당연히 당시에 찍은 유방촬영 사진은 깨끗했다. 즉 방사선과 의사의 눈에 암의 징후가 보이지 않았다.

하지만 학습된 AI의 눈은 달랐다. 이 새로운 유방암 환자와 비환자의 옛 촬영 사진을 구분해 기계에게 보여주면서, 기계는 암 발생을 예언하는 패턴을 학습시킬 수 있었다. 사실, 암 환자의 이전 유방촬영 사진은 비환자의 사진과 달랐다. 지도 학습을 통해 기계는 어제의 유방 영상과 내일의 암 간의 관계를 파악할 수 있었다. AI 기계만이 이러한 차이점을 인식할 수 있었다.

일본에서는 시마네대학 의학부, 시가의과대학, 주식회사 에리사가 공동으로 뇌이미지 분석 기술로 뇌 위축 상태를 검사해 미래의 치매 위험을 예측하는 서비스 ‘SupportBrain’을 개발했다. 미 메이요 클리닉은 췌장암 발병을 439일 전에 예측할 수 있는 실험 결과를 내놓기도 했다.

화제를 바꿔 징후 찾기에도 AI의 힘이 필요할 것이다. 예를 들어, 슈퍼마켓이 새로운 손님을 경쟁사에게서 빼앗기 가장 좋은 때는 손님들의 결혼, 임신, 출산, 이사, 새 직장 등 인생의 변곡점이 있을 때이다. 이 말은, 다른 슈퍼마켓 입장에서는 이때가 공격적으로 단골손님을 방어해야 할 때라는 것이다. 그 슈퍼마켓은 구매 데이터에서 그 패턴을 찾을 수 있다. 비타민, 애기 기저귀, 안 사던 브랜드의 맥주, 식품 종류나 양의 변화 등이다. 고객 이탈의 적신호를 얻는데 AI의 힘을 빌릴 수 있다.

우리가 100년 동안 신봉했던 통계적 품질관리 방식(SQC)을 AI로 재고해야 할 때가 왔다. 쉬하트에 의해 개발된 SQC의 핵심은 컨트롤 차트다. SQC는 평균을 중심으로 해 위 아래로 3시그마(표준편차) 만큼의 마진을 두고 박스권을 만든 후 그 밖에 나가는 경우 ‘불량’이란 라벨을 씌운다. 이 SQC의 주요 목적은 문제의 ‘탐지’에 있다. 하지만 최근 AI는 이러한 프로세스의 데이터를 이용해 탐지뿐 아니라 ‘예측’으로 활용할 수 있다. IoT 센서에서 계속 수집되는 종단적 데이터는 입력과 출력의 관계를 AI로 하여금 배우게 한다. 결국, 출력이 아니라 ‘입력’에서 불량을 예측할 수준에 이르게 한다.

또 불량이 일어나기 전에, 제조 프로세스를 통제할 수 있다. 설령 불량이 생기면 앞뒤 상황을 분석하고, 실시간으로 원인을 규명하고, 수정할 수 있는 조치를 제안한다. 이를 실현하기 위해서는 도메인 엔지니어, 프로세스 엔지니어, 장비관리사, 데이터 엔지니어 등의 전문 지식이 필요하다. 샌프란시스코에 위치한 스타트업 Facilis.ai는 AI멀티에이전트를 이용해 이런 기능을 자동화한다. SQC에서 시작해, TQC로, 그리고 100년 후 오늘 AIQC의 시대가 온 듯하다.

◇ 10년 고생

‘Reddit’라는 커뮤니티에 포스팅된 얘기다. 어떤 사람이 10년 동안 만성 피로, 허약한 근육, 구토, 체중 감소, 우울증, 손발 저림, 보행 불편 등으로 고생하다가 병원에 갔다. 수십 명의 전문의가 수백 번의 검사를 했지만 결과는 모두 정상이었다. 화가 난 이 사람은 모든 진료 기록과 검사 기록을 챗GPT에 제출했다. 챗GPT는 1분도 채 안 돼 ”당신은 비타민 B12가 모자란 사람“이라고 응답했다. 그래서 처방은 비타민 B12 보충의약제였다. 10년간 고생한 이유를 1분도 안돼 확인한 셈이다.

그런데 이 사람은 하나의 유전자 변형이 있었다. 이 변형은 미국 사람 10%가 갖고 있는데 이 유전자 변형을 갖고 있는 사람은 비타민 B12가 잘 공급되지 않는다고 한다. 이걸 알아낸 것은 유전학 전문가였다.

여기서 우리 의학 체제가 갖고 있는 약점이 드러난다. 지금 의료 체계는 전문화와 구획화 등으로 인해 복합형 질병에는 취약하다. AI는 여러 가지 지식을 규합해서 특히 희귀병을 잘 치료할 수 있다. 실제로 마이크로소프트가 AI 기반 의료 진단 시스템 ‘MAI-DxO(Microsoft AI Diagnostic Orchestrator)’를 개발했다. 마이크로소프트는 이 시스템이 인간 의사보다 4배 더 높은 정확도로 복잡한 질환을 진단할 수 있다고 했다.

◇ 속도와 AI

뇌신경외과 의사 크리스 맨시 박사는 2019년 TEDMED에서 연설을 했다. 그 연설 내용은 ”불과 4시간 전, 제인은 차에 치였습니다. 이제 수술실의 신경외과 의사인 저는 제인의 뇌를 구하는 것이었습니다. 저와 팀은 제인의 두개골에 구멍을 뚫고 혈전을 제거하여 압력을 완화했습니다. 수술은 완벽하게 성공했습니다. 우리는 젊은 여성의 생명을 구했습니다. 하지만 12시간 후 제인은 사망했습니다. 나중에 알게 된 것은 제인의 사망을 좌우한 결정적인 요소는 수술실에서 일어난 일이 아니었습니다. 바로 제인을 수술실에 데려오는 데 걸린 4시간이었습니다. 뇌혈전을 누군가가 확인하고, 해당 의사에게 알리고, 수술을 위한 조율을 하는 과정이 너무 늦었습니다. 제인의 뇌는 복구할 수 없는 수준으로 손상됐었습니다.”였다.

크리스 맨시 박사의 이 연설은 현대 의학이 뽐내는 첨단 의료시설과 유능한 의료진이 시간과의 경쟁에서 맥없이 나가떨어졌다는 지적이었다. 맨시 박사는 이 문제 해결을 위해 스탠포드 MBA를 취득한 후 창업을 했는데 회사 이름이 ‘viz.ai’였다.

맨시 박사가 생각한 것은 인명구조 프로세스에서의 병목인 ‘검사와 분석’ 단계를 AI로 자동화함으로써 귀중한 생명을 구할 찬스를 높일 수 있다는 것이었다. 특히 실력은 인간보다 뒤질지 모르지만 속도 면에서 앞서는 AI를 활용해 사진 해독과 이후 환자를 치료하고 돌보는 워크플로우를 자동화하고자 했다. 즉 환자가 도착하자마자 CT나 MRI 사진을 찍고, 심장마비나 뇌졸중, 폐색전증이 의심되면 곧바로 자동 워크플로우가 시작된다. 그 워크플로우는 가장 시급한 검사부터 하고, 이어 담당 의사들이 정보 공유를 하고 토의 및 행동에 들어가는 과정으로 이뤄진다. 이에 따라 사진을 찍고 팀한테 문제를 알리는데 걸리는 시간을 73%로 줄였고, 수술에 들어가는 시간을 42%를 줄여 전반적으로 약 40분을 절약했다.

맨시 박사의 ‘50 AI 워크플로우’는 FDA의 허가를 받았으며 지금부터 약 1년 반 전 기준으로 50대 대형 의료기관을 포함해 1,500개 병원에서 채택하고 있다. 이 사례가 시사하는 것은 AI는 비용과 기능이나 품질 뿐만 아니라 ‘프로세스 속도’ 면에서 크게 기여할 수 있다는 것이다.

◇ 지식 그래프

데이터를 그래프 형식으로 구조화한 DB인 지식 그래프가 최근 주목을 받고 있다. 지식 그래프의 기본 구성 요소는 ‘연결된 노드’다. 노드는 ‘개체’를 나타내고, 이들을 연결하는 엣지는 화살표로 두 노드 간 ‘관계’를 나타낸다. 많은 경우 ‘주어(S)+술어(P)+목적어(O)’로 표현되는 ‘SPO 삼자관계’를 그린다. 예를 들어, “히치콕은 ’새‘를 감독했다”라는 정보를 지식 그래프에 저장하자. ’히치콕‘이라는 노드는 ’새‘라는 노드를 향해 연결돼 있으며, 엣지는 ’감독하다‘라는 관계를 의미한다. 또한 ’새‘ 노드를 향해 ’로드 테일러‘라는 다른 노드가 연결되어 있고, 엣지는 ’출연하다‘다.

각 노드와 엣지는 ‘속성’을 지니고 있다. 예로, 히치콕의 노드에는 생년월일이나 국적 등의 속성을 기록한다. 구글 지도의 경우, ‘제일 음식점’이라는 노드에 주소, 영업시간이나 전화번호 같은 속성을 같이 보관하고 필요시 보여준다. 이 그래프 구조는 구글의 단순한 키워드 기반 검색을 넘어 단어 간 ‘맥락과 관계’를 이해하기 위해 다른 정보끼리를 연결한다. 검색 취지를 더 잘 이해하고, 연계된 의미 있는 답을 낼 수 있다. 예를 들어, “‘새’의 감독이 만든 다른 작품들은 무엇인가?”란 질문에 대해 새-감독-히치콕-감독-현기증의 ‘그래프 줄’을 타고 답을 내놓는다.

중국에서는 지식 그래프를 이용해 대두의 병충해 관리를 하고 있다. 콩의 줄기가 얼룩해지는 것은 바이러스 b에 걸렸다는 증상이며, 화학물 a가 b를 해결한다는 방식으로 데이터를 만들었다. 이를 통해 해충, 병, 특성, 치료법, 증상 등을 알 수 있도록 했다. 또 콜롬비아에서는 지식 그래프를 통해 사람과 범죄의 관계를 규명해 여러 사건에 개입한 범인을 잡을 수 있었다.

◇ 분야별 LLM 사례: 블룸버그GPT, 스탠포드 MUSK

요즘 제조, 금융, 의료 등 산업에 특화된 LLM이 대세로 떠오르고 있다. 대표적으로 블룸버그GPT와 스탠포드 MUSK를 소개한다.

블룸버그는 금융 및 비즈니스 정보, 뉴스 및 리서치를 제공하는 회사다. 금융정보 세계의 독보적인 위치를 활용해 일반형 LLM과 분야별 LLM을 병합한 블룸버그GPT를 만들었다. 이 새로운 LLM은 금융 데이터와 일반 데이터 세트를 결합해 내부 직원과 외부 금융업 종사자가 금융 시장을 탐색, 분석 및 예측하도록 지원한다. 또 인수합병이나 기업공개와 같은 금융 거래 준비에도 좋은 수단이 된다.

블룸버그 데이터 분석가들은 40년 동안 생성, 수집 및 정리한 그 분야 역대 최대 규모의 데이터 세트를 구축했다. 그 규모가 총 3630억 토큰에 달했고, 500억개 파라미터를 훈련하는데 62만 GPU 시간이 걸렸다. 그 결과, 블룸버그GPT는 금융 지식에서는 탁월하고, 일반 지식도 수준급이 됐다.

스탠포드 의대팀은 2025년 MUSK라는 암을 예측, 반응 및 치료하기 위한 임상용 기초모델을 개발했다. MUSK는 과거의 ‘진단’ 위주 AI가 아니라 ‘예측’의 도구가 된다. “이 환자에게 이 치료는 어떤 결과가 나올까”를 예측하고, 그 중에 가장 효과적인 치료법을 찾는데 쓸 수 있다.

MUSK는 많은 환자 케이스의 텍스트-이미지 멀티모달 데이터로 사전 훈련됐다. 들어간 데이터양이 거대하다. 5천만개의 의료 이미지와 10억개의 병리학 텍스트를 동원했다. 이 기초모델을 파인튜닝해 사용자 병원이 자기 나름대로의 새로운 응용을 개발할 수도 있다. MUSK의 목표는 의사들이 과거 세상 모든 의료 경험을 내 실력과 합쳐, 현재 내 환자의 성공 확률을 최대화하는 것이다.

◇ 홍콩 이야기

홍콩의 다국적 기업인 어느 금융사 직원이 2560만 달러의 외부 계좌 이체 요청을 받았다. 너무 금액이 크다보니 혼자 결정할 수 없어 자기 보스에게 알리니 이메일이 왔고 화상회의를 하자고 했다. 화상회의에 클릭해 들어가니 CFO를 비롯해 보스가 모여 있었다. 화상회의 끝에 내린 결론은 송금해도 괜찮다는 거였다. 그런데 보내고 나서 사기라는 걸 알게 됐다. 청구서가 사기였을 뿐만 아니라 화상회의에 등장하는 CFO 등의 얼굴과 목소리는 AI로 만든 것이었다. 최근 급증하고 있는 딥페이크 범죄의 한 사례다.

오늘 강의를 요약하면 비즈니스에서 AI는 읽고, 쓰고, 연결하며, 자동화하며, 예측하고, 찾으며, 식별하며, 코딩하며, 창작하며, 측정하며, 가속화하며, 극대화하며, 차원을 축소한다.

<박시현 기자> shpark@it-b.co.kr
영림원CEO포럼에서 강연된 내용은 아이티비즈 에 연재되고 있습니다.
< 저작권자 © 아이티비즈 무단전재 및 재배포 금지 >

Share your thoughts