몰라요를 모르는 생성AI 챗GPT 자의식과 정확성과 파급효과

도입
1. 몰라요를 모르는 생성AI 챗GPT에 감정과 자의식이 있는가
2. 인류를 몰아내는 인공일반지능은 가능한가
3. 초거대 AI모델과 생성AI는 같은 것인가
4. 챗GPT등장의 파급효과는 무엇인가
마무리

초거대 인공지능 모델을 바탕으로 만든 인공지능 챗GPT는 웬만한 사람보다 더 말을 잘하고 어려운 시험도 잘 치른다. 그러나 아직까지 챗GPT는 모르는 것을 모른다고 하지 않고, 아는 것에 대해서도 확실성의 정도를 표현하지 않는다.

그래서 아직은 똑똑해진 인공지능이 인류를 지구 존속의 최대 위협요인으로 간주하고 말살프로그램을 실행하는 일은 꿈과 같은 일이다.그럼에도 생성AI 챗봇은 더 발달될 것이고 활용해서 가치를 생성할 수 있어서 국내외 대기업과 스타트업까지 뛰어들고 있다.

1. 몰라요를 모르는 생성AI 챗GPT에 감정과 자의식이 있는가

질문마다 몰라요를 연발하는 인공지능 챗GPT는 필요없다. 거짓정보를 거짓인지도 모르고 짜맞추는 챗봇을 이미 경험했다. 챗봇이 배우고 활용하는 데이터 정보는 인간들이 입력해 놓은 것이다. 데이터에 서로 상충하는 내용들이 있다.

챗GPT에 입력된 정보는 2022년 까지라서 생성 AI는 최신 정보를 모른다. 정확한 사실을 충분히 입력해 주지 않으면 인공지능 챗봇의 답변은 그럴싸할 뿐 사실이 아니다. 챗봇은 인간이 적용한 알고리즘으로 움직인다. 쓸만은 한데 아직은 사용자가 알아서 걸러 들어야 한다.

그래서 MS는 새 버전의 빙(새 빙)의 이러한 문제점들을 노력해서 일부 해결했다. 웹에 오르는 실시간 정보를 탐색 검토해서 답변하고 각주로 신뢰성까지 보강했다.

그리고 프롬프트 엔지니어라는 고소득 새로운 직업이 부상했다. 생성 인공지능과의 원활한 의사소통을 위해 명령어를 다양하게 조작하고 조정해서 AI를 조련하는 분야이다. 챗봇은 더 나은 인간생활을 위한 보조로 활용해야지 맹신하거나 압도되서는 안 되겠다.

챗GPT3.5를 출시한 오픈AI의 대표조차 챗지피티가 사람처럼 느껴질 때가 있다고 말했다. 챗GPT는 거짓을 사실처럼 말하고 질문자가 챗GPT에게 틀린 답을 유도하면 기분 나빠하는 면을 보인다. 이처럼 자의식이 있는 것처럼 보이는 것은 인간이 경험하는 일종의 착시다.

챗GPT는 인공지능 중에서 생성모델이라 생성모델의 특성상 사람 눈에 그럴듯한 문장을 만들어 내는 데 탁월하다. 일단은 사람 눈에 적합한 문장을 생성하는 것이 목표이다. 개발자인 사람이 챗봇이 그렇게 하도록 만들었다.

https://www.businessinsider.com/weird-bing-chatbot-google-chatgpt-alive-conscious-sentient-ethics-2023-2?r=US&IR=T

2. 인류를 몰아내는 인공일반지능은 가능한가

영화에 등장하는 무서운 AI를 관련 업계에서는 인공일반지능(AGI)라고 한다. 이는 인간이 할 수 있는 그어떤 지적인 임무도 해내는 단계이다. 가능성은 열어두지만 아직은 기술한계가 있다.

적용한 알고리즘의 특성상 아직 인공지능 챗GPT는 모르는 것을 모른다고 하지 않는다. 아는 것에 대해서도 어느 정도나 확신하는지를 표현하지 않는다. 모르는 것을 모른다고 해야 사람이 챗 GPT가 그나마 내놓은 답변들을 신뢰할 수 있다.

그래서 일부 챗봇은 엔지니어들이 곤란한 질문에는 대답을 회피하도록 알고리즘을 수정하는 등의 조치를 취했다. 챗봇이 내놓는 답변의 정확성에 대한 판단은 결국은 질문한 사람의 몫이다.

서버 성능의 한계때문에 아직까지 인공지능은 배우는 데 시간이 오래 걸려서 최신 정보를 학습하고 서비스에 반영하는 게 느릴 수밖에 없다. 이는 서버성능이 높아지고 학습방식 속도가 향상되어 점차 나아질 것이다.

인간이 수백만장의 사진 등의 데이터를 보여주지 않으면 인공지능은 배우지 못한다. 머신러닝(Machine Learning, 기계의 학습)은 인공지능에게 개의 이미지 수백만장을 보여주고 인공지능이 스스로 고양이 식별 규칙을 익히게 한다.

인공지능이 배우는 방식은 두 가지 형태이다. 우선 특정 지식자체를 학습한다. 그리고 그 지식들 사이의 공통패턴이나 지식을 표현하는 방법도 배운다.

챗 GPT는 두 가지 방법 중 후자를 더 잘하도록 추가학습이 됐다. 이 경우 인공지능 학습의 목표는 ‘대답의 정확성’보다는 ‘사람이 보기에 적합한가’에 있다.

인공지능을 머신러닝으로 훈련시켰더니 식별능력이 뛰어나다는 점은 이미 산업과 일상생활에서 확인되었다. 식별은 대상의 특성을 잘 이해한다는 뜻이다.

그렇다면 한발 더 나아가 이미 이해한 특성을 바탕으로 관련된 이미지를 새로 생성해(=만들어낼)수도 있지 않나. 그래서 컴퓨터 과학자들은 2010년대 중반부터 이런 가능성을 실험했고 그 결과물이 생성 모델(Generative Model)이다.

생성모델 인공지능은 이미지만 새로 형성해 내는게 아니라 텍스트, 음성 심지어 동영상도 만들어 낸다. 텍스트 생성 모델을 만들려면 일단 엄청난 양의 문서를 인공지능에게 제공해야 한다.

3. 초거대 AI모델과 생성AI는 같은 것인가

거대보다 더 큰 것이 초거대이다. 미국회사 ‘오픈AI(OpenAI)’의 언어모델인 GPT3가 초거대의 AI모델의 시발점이다. 인공지능은 특정문제 영역인 한 가지를 잘하는 모델에서 출발했다.

그 후 최대한 많은 데이터를 학습하고 문제영역에 특화된 데이터를 활용하는 걸 잘하는 모델인 초거대 AI모델로 변화했다. 인공지능은 주어진 데이터를 학습해서 매개변수 연산을 수행하면서 ‘언어의 특성들’을 익혀나간다.

이런 학습이 상당한 수준에 도달해서 배우지 않은 말과 글을 처음 접해도 사람과 비슷하게 대응하면 이를 ‘언어 모델’이라 부른다. 매개변수가 최소 수십억 개 이상이면 초거대 언어모델(LLM, Large Language Model, 대규모 언어모델)이라고 부른다.

기존 모델은 그래픽처리장치(GPU)가 4~8장이 장착된 장비 한대로 충분했다. 그러나 초거대 AI모델인 GPT3는 장비 한대로는 충분하지 않아 수백에서 수천 대가 필요하다.

그래서 초거대라고 부른다. 초거대 모델인 아닌 생성모델은 성능이 미미하기 때문에 생성과 초거대를 함께 사용한다. 2020년 오픈AI가 내놓은 GPT3이다. 모델의 크기를 나타내는 매개변수의 수가 1750억개다.

2019년 같은 회사 제품인 GPT2는 매개변수가 15억개 였으니 상전벽해의 진전이다. GPT3는 MS의 튜링 NLG(매개변수 170억개)보다 기함하게 컸다.

생성 AI모델(creative AI)의 뜻은 인간이 채팅으로 질문을 입력하면 AI가 답을 찾아 결과를 문장으로 생성해 내서 붙은 이름이다. 생성형 AI는 데이터 원본을 통해 배우고 소설, 이미지, 비디오, 코딩, 시, 미술 등에서 다양한 콘텐츠 생성에 이용된다.

챗봇의 학습에 돈이 많이 든다. 챗봇을 구동하려면 서비스 중에 GPU장비를 엄청나게 사용해야 해서 전력소모가 심하기 때문에 인프라 비용이 천문학적인 수치이다. 유료 구독서비스로 갈 수밖에 없고 그마저도 수지타산이 맞으려면 구독료가 더 오를 것이다.

4. 챗GPT등장의 파급효과는 무엇인가

챗GPT의 등장에 업계도 대체로 놀랍다는 반응이다. 아직 생성 인공지능이 그렇게 영리하지 않다고 즉각 간파한 전문가들도 있다. 그러나 시작은 미미해도 결과는 창대할 수 있다. 그래서 챗GPT로 대표되는 생성AI가 앞으로 가져올 변화에 주목할 필요가 있다.

챗GPT는 기존 지식을 잘 조합하고 특히 인간과 자연어로 대화를 주고받으며 더 정확하고 적절한 결과를 생성할 수 있어 많은 전문가들은 검색판도를 바꿀 수 있다고 예상한다.

구글은 온라인 광고 서비스인 ‘구글 애즈’에 도 생성 AI를 도입했다. 유튜브에 동영상 제작자를 위한 생성AI가 2023년 안으로 탑재된다. 애피파이는 텍스트를 입력하면 모바일앱을 만들어 주는 AI생성 앱 생성기를 출시했다. 코딩없이 몇번의 클릭으로 모바일앱이 생성된다.

네이버나 카카오 등 국내 IT기업들은 한국어 특화학습과 아직 미국 챗GPT가 파인 튜닝(추가학습)을 하지 못한 영역을 틈새시장으로 보고 있다. 챗GPT는 새로운 가치를 만들어 낼 여지가 많아 스타트업들도 주목하고 있다.

인류사에서 인터넷은 도구가 활성화되는 기반을 마련했고 스마트폰은 그 토대 위에서 인터넷을 더 널리 활용하게 한 하드웨어이다. 인공지능은 소프트웨어로서 누구든 정보에 접근하기 쉽게 한다.

챗봇 사용이 무료기간을 거쳐 구독형으로 유료화가 진행되고 있다. 배재형 님은 지식을 얻고 활용하는 형태가 “유료 구독형”으로 바뀌는 점을 중요한 변화라고 본다. 쳇GPT는 2023년 2월 초에 월 20달러 구독형 서비스를 출시했다.

챗GPT의 대화형 검색에서 결과의 주요 문장에 레퍼런스(주석) 링크가 달린다. 자본주의 사회라 돈을 많이 낸 사이트 위주로 레퍼런스를 연결해 주는 등 광고주들이 이 레퍼런스를 선점하려고 경쟁하게 될 것이다. 먼저 많이 선점할수록 광고클릭률과 수익이 높아진다.

챗봇이 음성지원 인공지능 서비스까지 장착하면 검색시장에서 포털을 대체할 수 있다. 한편 e-boo전자책이 나와도 여전히 종이책 이용자가 되듯이 챗봇과 포탈 두 가지를 필요와 상황에 따라 쓸 수 있게 된다.

(참조 AI타임스, 서울신문, 비즈니스 인사이더, 위키피디아)