지금 우리는 AI의 시대에 살고 있다고 해도 과언이 아니다. 점점 빠른 속도로 발전해 나가고 있는 AI 기술이 가져다주는 생산성과 사람의 일자리를 대체할 것이란 두려움이 우리의 일상에 스며들고 있다. 그렇다면 이 인공지능 시대의 포문을 연 것은 무엇일까? 많은 사람들은 2023년에 OpenAI에서 정식 출시한 ChatGPT라 할 것이다. 실제 사람과 대화하고 있는 듯한 느낌을 주는 생성형 AI의 출시에 사회의 관심과 기술력, 자본이 모이기 시작했고, 곧 AI는 대화를 넘어 그림을 그리거나 영상을 제작하는 등의 창의력의 영역으로 넘어오기 시작했다.
이렇게 AI 개발 전쟁의 도화선을 제공한 OpenAI는 5월 13일 ChatGPT의 업그레이드 모델인 GPT-4o(지피티 포오)를 출시했다. 사용자가 입력한 텍스트를 기반으로 응답을 한 기존 모델과 달리, 사용자와 실시간으로 대화하며 질문과 답변을 이어 나가는 방식이다. 이에 더불어 실시간으로 이미지를 처리하는 기능도 추가되면서, 이젠 사용자와 영상통화를 하면서 사람의 말투와 표정을 이해하고 그에 상응하는 답변을 할 수 있다. 질문에 대한 반응속도는 심지어 인간보다도 빠른 수준으로 할 수 있고, 한국어 등 영어 외에 언어들의 작업 수행 능력도 빨라졌다. 이와 같은 대화 능력 때문에 사람들은 AI와 좀 더 깊은 소통을 하는 미래 모습을 보여주는 2013년 영화 “Her”가 현실이 됐다고도 말한다.
그렇다면 우리는 이 새로운 모델을 어떻게 사용할 수 있을까? 아직은 데모 버전으로만 사용을 할 수 있지만 OpenAI 측에서 선보인 향후 GPT-4o의 사용 방법은 무궁무진하다. 우선은 언어 관련 능력들이다. 50가지의 언어를 탑재한 만큼 이 모델을 사용하면 언어를 배우는 것은 물론, 대화하는 식으로 자신의 실력을 연습할 수도 있고, 이미지 처리능력과 오디오 입력 기능을 사용하면 실시간 통번역도 할 수 있을 것이다.
이러한 언어장벽이 낮아지는 것은 후에 사람들이 여행을 가는 것도 더 편리하게 해주고 국제적인 업무도 지장 없이 진행할 수 있게 해줄 것이다. 또한, 문제를 풀고 풀이에 대한 해설을 해주는 기능은 학생들의 자주적인 학습 능력의 향상에 도움을 줄 것이다. 이미지 처리 능력을 좀 더 활용하면 시각장애인의 눈이 되어, 혼자서도 더 안전하게 외출할 수 있을 것이다. 입시나 취업을 위한 면접 연습에도 GPT-4o를 사용할 수 있다. 이렇게 GPT-4o는 남녀노소를 불문하고 우리의 생활을 편리하게 만들어준다고 한다.
현재 GPT-4o는 월 20달러로 판매하는 ChatGPT Plus로 일부 기능을 사용 가능하다. 음성 시스템은 아직 애플의 제품으로 ChatGPT 앱을 깔았을 때만 사용 가능하다. 한편 GPT-4o가 출시되면서 이전까지는 유료로 서비스되던 GPT-4는 이제 무료로 사용할 수 있다.
학생기자 장준희(상해중학 11)
ⓒ 상하이방(http://www.shanghaibang.com), 무단전재 및 재배포 금지