사진과 동영상이 안보이시면 "차단된 콘텐츠 표시"를 클릭해주세요! |
|
|
AI에이전트:미래를 향한 인간과 AI의 동행
DX News letter 24년 06월호
김지훈 ✦ 디지털혁신(DX)팀
2024년 06월 01일 |
|
|
DX News Letter 구독자 여러분 안녕하세요?
싱그러운 초록빛이 여름의 시작을 알리는 6월이 찾아왔습니다. 😊
따스한 햇살과 시원한 바람이 우리의 마음을 설레게 하고
소중한 사람들과 함께 야외에서 즐거운 시간을 보내고 싶은 마음이 샘솟는 계절입니다.
이럴 때, 지금 하고 있는 일을 대신 해줄 누군가가 있다면 얼마나 좋을까요?
마치 아이언맨의 ‘자비스’가 모든 일을 척척 대신해주는 것처럼 말이죠.
그런데, 혹시 알고 계셨나요? 이런 바람이 더 이상 영화 속 이야기만이 아니라는 것을요.
이번 호에서는 여러분의 소원을 현실로 만들어줄 AI 개인비서, AI 에이전트에 대해 알아보겠습니다.
이 혁신적인 기술이 현재는 어떤 모습으로 우리 곁에 있으며 어떻게 우리의 일상과 업무를 변화시키고 있는지, 지금부터 함께 탐험해보시죠.
|
|
|
지난 달 AI의 5월은 한여름의 열기보다 더 뜨거웠습니다!!
AI 업계에서 둘째가라면 서운해 할 구글과 오픈AI가 나란히 보고, 듣고, 말하는 AI 모델을 세상에 공개했죠.
영화 속 아이언맨의 ‘자비스’나 그녀(Her)의 ‘사만다’ 같은 대화가 가능한 AI 에이전트가 눈앞으로 다가온 것입니다.
구글의 ‘프로젝트 아스트라’와 오픈AI의 ‘GPT-4o’는 모두 사람에 가까울 정도로 자연스러운 대화 및 시청각 인식 능력을 보여줬습니다. |
|
|
선두 업체의 AI 에이전트 기술이 공개되자 삼성전자 갤럭시와 애플 아이폰에 탑재될 ‘손 안의 AI 비서’에 대한 기대감도 커지고 있습니다.
현재도 갤럭시에는 Bixby(빅스비)가, 아이폰에는 Siri(시리)라는 음성 AI 에이전트가 탑재돼 있지만 아직까지는 AI라는 표현이 무색할 정도로 단순한 기능만 구현되는 것이 안타까운 사실이죠.
하지만 이러한 AI 에이전트에 아스트라나 GPT-4o가 결합되면 더 길고 복잡한 명령이 가능해질 전망입니다.
이번 구글 I/O 2024에서 진행된 시연회에서 아스트라는 사람에 준하는 시청각 인식 능력, 기억력, 창의력을 보여줬으며, 오픈AI가 아스트라보다 하루 앞서 공개한 GPT-4o도 자연스러운 음성 대화가 가능했습니다. |
|
|
[음성 AI 에이전트 ‘Siri’, Apple] |
|
|
사실, AI 에이전트는 새로운 개념이 아닙니다.
1950년대 인공지능 연구의 시작과 함께 이미 AI 에이전트에 대한 개념이 형성되으며,
30년도 전에 빌 게이츠는 자신의 저서 [The Road Ahead]를 통해 AI 에이전트와 함께하는 미래에 대해 이야기했죠.
“에이전트는 실은 소프트웨어지만 당신은 사람을 대하듯 이런저런 형태로 이야기를 나눌 수 있을 것이고, 그것은 마치 비서와 같이 당신의 과거활동을 기억하고 효과적으로 도울 수 있을 것이다.”
초기 AI 에이전트는 음성 인식과 간단한 명령 처리를 통해 우리의 일상을 더 편리하게 만드는데 중점을 두었습니다.
아이폰의 Siri로 대표되는 초기 AI 에이전트들은 음성 인식을 통해 날씨를 확인하거나, 음악을 재생하거나, 알람을 설정하는 등의 간단한 작업을 수행했습니다.
그러나 이러한 초기 AI 에이전트들은 사용자의 의도를 완전히 파악하고 정확히 반응하는데 한계가 있었죠.
생성형 AI의 등장은 이러한 한계를 크게 변화시켰습니다.
특히, 대형언어모델(Large Language Model, LLM)은 AI 에이전트의 능력을 혁신적으로 향상시켰습니다.
방대한 양의 텍스트 데이터를 학습하여 언어의 의미와 맥락을 이해하는 능력을 갖추게 되면서 보다 복잡하고 심층적인 대화를 이해하고 생성할 수 있게 되었습니다.
이제 AI 에이전트는 단순한 명령 처리에서 벗어나 다양한 디바이스와 통합되어 진정한 비서로서 거듭나게 된 것이죠.
|
|
|
그럼 Chat GPT가 발전한 모습이 AI 에이전트인 것이냐고 물으실 텐데요. 이말은 반은 맞고 반은 틀립니다.
우선 Chat GPT는 AI챗봇입니다.
우리가 질문하면 저장된 데이터베이스를 탐색하여 답변하는데 특화된 모델로 대화 이상의 상호작용은 기대할 수 없습니다.
하지만 AI 에이전트는 단순한 질의응답식의 대화를 넘어서 환경과 상호 작용하며 데이터를 수집하고 사용하여 목표를 달성하기 위해 필요한 작업을 스스로 결정해서 수행할 수 있는 소프트웨어 프로그램이라고 볼 수 있죠.
핵심은, Chat GPT를 포함한 여러 툴과의 상호작용(Interaction)과 자율성(autonomy)에 있으며 사용자의 요구를 더 정확하게 파악하고 만족시키는 것을 목표로 하고 있습니다.
예를 들어, 사용자가 "회의 일정을 잡아줘" 라고 명령하면, AI 에이전트가 참석자들의 가능한 시간을 조율하고, 최적의 회의 시간을 찾아내어 일정을 설정하고 참석자들에게 초대장을 보내는 과업까지 수행해내는 식으로 말이죠.
이러한 기능을 통해 AI 에이전트는 단순한 대화형 AI를 넘어, 복잡한 과업을 자율적으로 수행할 수 있는 진정한 의미의 AI 비서로 자리매김할 수 있는 것입니다.
|
|
|
[M365 Copilot, Microsoft] |
|
|
AI 에이전트는 다양한 모습으로 우리들에게 다가오고 있습니다.
대표적인 업무용 AI 에이전트의 사례로 MS사의 ‘코파일럿(Copilot)’이 있습니다.
코파일럿(=부조종수)라는 뜻처럼 우리의 업무를 보조해주는 업무용 AI 에이전트인데요, MS Office 문서나 PPT의 초안을 생성해주기도 하고, 메일과 회의 내용을 요약하고 번역하는 등의 작업을 자동으로 수행합니다.
- Word 문서에서 코파일럿을 호출하여 텍스트로 특정 정보 소스를 입력하면, 코파일럿이 문서 초안을 자동으로 작성해줍니다. 초안이 생성되면 사용자는 이를 편집하거나 스타일을 조정하거나 AI 도구에 전체 문서를 다시 작성하도록 할 수도 있죠.
- Powerpoint에서 코파일럿은 Word 문서를 슬라이드로 자동으로 변환하여 연관 이미지를 포함한 PPT 초안을 만들어줍니다. 초안 수정은 코파일럿에 자연어로 입력하면 알아서 수정해주며, 슬라이드에 어울리는 발표자 노트를 생성할 수도 있고 이미지를 더 추가할 수도 있습니다.
- Teams 화상회의 중에 사용자는 지금까지 대화한 내용을 요약해 달라고 요청하면 코파일럿은 요약한 내용을 실시간으로 제공하며, 아울러 AI 비서를 통해 회의에 참석하지 못한 사용자에게 회의 내용이나 이후에 해야 할 작업을 정리해 전달하는 기능도 제공합니다.
- Outlook의 코파일럿은 위의 사례가 전부 가능합니다. 메일의 내용을 요약하기도 하고, 회신 메일의 초안도 작성해줍니다.
건설업계는 AI 에이전트를 어떻게 활용하고 있을까요?
건설기계 분야의 현대HD ‘엑스에이전트(X-Agent)’는 장비 정보와 작업환경, 작업 계획 등을 AI가 스스로 인지하고 판단해 운전자에게 최적화된 장비 운영 가이드를 제공하는 머신 AI 에이전트입니다.
드론으로 현장을 3차원 스캔하여 데이터화하고, AI는 맞춤형 작업 계획을 수립합니다.
현장 정보를 분석해 최적의 작업 계획을 수립하고,
작업자의 성향과 작업 종류 등을 고려하여 효율을 극대화한 작업 순서, 경로 등을 제시해줍니다.
숙련기술자의 행동을 학습한 머신가이던스와 머신컨트롤 기술을 통해 초보 작업자도 기술자 못지 않은 생산성을 달성할 수 있게 도와주는 것이죠.
또한, ‘센서 융합 굴착기 충돌 방지 시스템'을 통해 안전 사고도 사전에 방지하고 있습니다. 카메라와 레이더 센서 두가지 기술을 융합하여 여러화면(메인 뷰, 대시보드 뷰, 사이트 뷰)으로 안전 정보를 한 눈에 확인할 수 있도록 제공하며, 장비 주변의 사람을 감지해 자동으로 장비를 정지시킴으로써 안전사고를 예방할 수 있습니다.
|
|
|
☑️ GS건설 현장의 AI 에이전트 : 건축시공 핸드북의 진화 |
|
|
우리 GS건설의 AI 에이전트로는 ‘건축시공 핸드북(Construction Handbook)’을 예로 들 수 있습니다.
현장에서 오래전부터 바이블로 사용하고 있던 기존의 건축시공 핸드북에 생성형 AI를 결합한 시공 AI 에이전트입니다.
기존 핸드북의 버전 관리 어려움과 검색 기능의 한계, 낮은 모바일 사용성을 개선하고, 다양한 기능을 더하여 진화를 모색하고 있습니다.
- 자연어로 질문하고 답변 (동료에게 물어보듯)
- 다양한 디지털 기기(모바일,PC)로 언제, 어디서든 활용 가능
- 알림기능 : 공정 관리 시스템과 연계하여, 필요한 시점에 필요한 내용을 제시
- 할루시네이션(그럴듯한 오답) 방지 : 당사 기준 내 정보로만 해답을 제시하도록 제한
- 시각자료 활용 : 연관된 다양한 이미지나 동영상을 추가하여 사용자의 이해도 향상
- 피드백 기능 : 관리자에게 문의하고 수정요청하며 양방향 소통
향후에는 현장 여러분들의 업무를 곁에서 도와주는 것 뿐만 아니라, 필요한 시점에 알아서 찾아가는 진정한 AI 에이전트의 모습으로 여러분과 함께할 예정입니다. |
|
|
[Construction Handbook Prototype, GS건설] |
|
|
조만간 디지털 세계와의 모든 상호 작용이 AI 로부터 시작되는 미래가 도래할 것입니다.
인간은 모든 곳에 존재하는 AI 에이전트와 사적인 대화를 통해 상호작용을 하고,
AI 에이전트는 우리를 대신하여 다른 여러 AI 에이전트와 상호작용을 하게 될 것입니다.
빌 게이츠는 5년 내로 컴퓨터를 사용하는 방식이 완전히 바뀔 것이라고 예고했습니다.
"작업마다 다른 앱을 사용할 필요가 없다. 하고 싶은 일을 일상 언어로 기기에 말하기만 하면 된다. 그리고 당신이 공유하기로 선택한 정보의 양에 따라 소프트웨어는 당신의 삶에 대해 풍부한 이해를 가지게 되므로 개인적으로 응답할 수 있다. 가까운 미래에는 누구나 현재 기술을 훨씬 뛰어넘는 AI 개인비서를 가질 수 있게 될 것이다."
그러나 아직은 해결해야하는 문제들이 있습니다. 데이터 보안 및 개인 정보 보호, 윤리적인 문제와 더불어 기술적인 한계를 극복해야 합니다.
- 사용자의 요구를 정확히 파악하고 적합한 도구를 선택해 수행할 수 있는 지능의 LLM의 개선이 요구되며,
- AI 에이전트가 사용자의 요구에 맞춰 적절한 도구를 선택하고 이러한 도구들 간의 상호작용을 조정할 수 있도록 지원하는 프레임워크의 개발도 필요합니다.
- 또한, AI 에이전트가 기업의 데이터 및 시스템과 원활하게 상호작용하기 위해 사용자 도구와의 통합할 수 있는 기술도 더 발전해야 하죠.
|
|
|
AI 에이전트는 디지털 세상과의 상호작용하는 방식을 혁신하며 비즈니스와 일상 생활 곳곳에 스며들고 있습니다.
정보에 기반한 의사 결정과 역동적인 환경 적응력, 끊임없는 학습 능력을 갖춘 AI 에이전트는 우리 삶을 더욱 풍요롭게 만들 차세대 디지털 시스템의 핵심입니다.
기술 발전과 함께 더욱 정교해지고 능력이 향상되는 AI 에이전트는 디지털 세계와의 상호작용 방식을 완전히 바꿔놓을 잠재력을 지니고 있습니다.
하지만 AI 에이전트의 발전은 우리에게 새로운 질문을 던집니다.
AI 에이전트로 인해 많은 사람들이 일자리를 잃고 희망 없는 삶을 살게 될까요?
아니면 강력한 AI 에이전트를 무기 삼아 더욱 활발한 경제 활동을 가능하게 할까요?
AI 에이전트와 함께하는 미래는 우리의 선택에 달려 있습니다.
여러분들이 AI 에이전트의 잠재력을 최대한 활용하여 더욱 풍요로운 미래를 만들어나가기를 기대합니다!!
|
|
|
|