Search

휴머노이드 로봇의 완성은 ‘청각인지능력’에 달려 있다

제가 초등학생일 때 미술 시간을 저는 좋아했습니다. 어제 본 디즈니 영화 속 공주님의 드레스를 입은 저를 그려보는 것도 좋았고, 한 번도 가보지 않았던 바다 속 세상을 그려보기도 했죠. 다들 한 번쯤은 ‘20년 뒤 미래의 모습’을 상상해서 그려본 적이 있으실 거예요. 그때 제가 그렸던 건 날아다니는 자동차랑 로켓을 타고 우주여행을 하는 제 모습과 로봇 친구들의 모습이었습니다. 먼 미래라고 생각했던 것들이 지금 우리의 현실에 존재한다는 점이 정말 신기합니다. 아직 날아다니기엔 좀 무리지만 운전자 없이 혼자서 운전하는 자율주행 차량도 도시 곳곳을 누비고 있고, SpaceX에서는 세계 최초 상용 우주선 발사하며 새로운 우주 개발의 지평을 열어가고 있습니다. 로봇도 마찬가지죠. Boston Dynamics에서 선보인 춤추는 로봇에서 놀랐던 게 엊그제 같은데 이제는 정말 인간의 모습에 가까운 휴머노이드 로봇들이 등장하고 있으니까요.
(Image: Waymo's autonomously driven Jaguar I-PACE electric SUV / 출처: Waymo 공식 홈페이지)
휴머노이드 로봇은 굉장히 빠른 속도로 발전하고 있고 많은 산업군에서 관심을 보입니다. Figure AI, NVIDIA, Tesla 등의 기업에서 본격적인 투자와 개발을 진행하고 있는 걸 보아 머지않은 미래에는 정말 내 곁에 휴머노이드 로봇이 한 명쯤은 있을 것 같습니다. 휴머노이드 로봇의 진화는 Figure AI가 최근 선보인 Helix의 데모 혹은 노르웨이와 실리콘밸리를 기반으로 한 스타트업 1X의 NEO Gamma 데모에서 그 모습을 엿볼 수가 있습니다.
Figure AI 사의 Helix
X1 사의 NEO Gamma
로봇은 사람이 하기 어려운 기피 업종에서 사람을 보조하거나 대신하는 역할로 적용된다고 국한 지어 생각되어 왔지만, 위 두 기업의 데모 영상에서 볼 수 있듯 이제는 인간과 함께 살아가는 삶을 보이며 우리의 일상에 휴머노이드 로봇은 자연스럽게 녹아들어 있습니다. 휴머노이드 로봇의 가장 중요한 부분 중 하나는 ‘자연스러움’인데요, 외적인 모습뿐만 아니라 휴머노이드 로봇이 사고하고 행동하는 과정에서도 자연스러움은 로봇의 성능을 결정짓는 큰 기준이 되었습니다. Figure AI 또한 최근 OpenAI와의 협업을 종료하고, Vision-Language-Action 자체 모델을 적용해 자연스러운 인공지능에 한 발짝 더 가까워지는 시도를 했거든요.
Figure AI의 창업자 Brett Adcock이 2월 5일 업데이트한 트위터
사람은 자연스럽게 감각 기관을 통해 주변 정보를 습득하고, 이를 활용하여 어떠한 행동을 끌어 냅니다. 로봇이 ‘사람’처럼 행동하고 소통하기 위해서는, 인간이 사고하는 과정처럼 다양한 정보를 외부로부터 수용하고, 정보를 바탕으로 의사결정을 내려야 합니다. 하지만 대부분의 로봇은 텍스트, 음성 명령, 시각 데이터, 혹은 레이더 등의 정보를 바탕으로 작동되고 있습니다. 사람이 받아들이는 정보에 비해 굉장히 제한적입니다. 사람은 단순한 음성 명령과 시각 정보로만 행동하고 판단하지 않잖아요? 청각, 촉각, 미각, 후각 등 다양한 기관을 이용하여 감각 정보를 받아들이고 판단하며 그중 청각은 매우 큰 부분을 차지하고 있습니다. 시각은 한정적인 환경에만 작동하여 우리가 흔히 말하는 ‘맹점’이 분명하게 존재합니다.
소리는 이와 반대로 벽 너머나 사각지대에서도 정보를 전달할 수 있어 공간의 한계를 넘을 수 있습니다. 현재의 휴머노이드 로봇은 ‘말’을 인식할 뿐, 소리 그 자체를 분석하거나 의미를 이해하고 행동하는 단계에는 이르지 못했습니다. 어떤 소리가 들렸을 때 이 소리가 어떤 소리인지 소리의 종류를 구분할 수 있는 고도화된 소리 인지 능력과, 인식된 소리를 기반으로 최적의 행동을 끌어낼 수 있는 Sound AI가 휴머노이드 로봇에 탑재된다면 우리가 생각하는 ‘사람과 자연스럽게 공존하는 로봇’에 가까워질 수 있습니다.
그럼 자연스럽게 인간과 같이 행동하는 휴머노이드 로봇은 어떤 장점이 있을까요? 인간 수준에 가까운 청각 인지가 가능하다면 휴머노이드 로봇은 이런 상황에서 더욱 적극적으로 적절하게 행동할 수 있습니다.
Sound AI가 휴머노이드 로봇에 탑재된다면?
위험 감지
화재 경보가 울리는 경우 이에 맞춰 사람들의 대피를 유도하고, 적절하게 소화 행위에 가담해 피해가 커지는 것을 막을 수 있습니다.
쇼핑몰 등에서 총 소리와 비명이 들리는 경우 총 소리의 방향을 파악하여 사람들을 반대 방향으로 대피 유도하고, 경찰에 신고, 우선적인 초기 대응에 나설 수 있습니다.
사회적 상호 작용
사람들의 싸우는 소리와 물건이 깨지는 소리가 들리면 상황을 녹화하고, 개입하여 싸움을 말리거나 신고하는 등의 액션을 취해 더 큰 피해를 막을 수 있습니다.
기침 소리가 평소 대비 자주 발생하면 기침 소리 주기와 발생 빈도를 확인하여 병원 예약을 잡거나 혹은 가정 내 난방 환경 등을 조절하는 방식으로 질병이 커지는 것을 예방할 수 있습니다.
환경 인식
초인종이 울렸을 때 주인을 대신해 손님을 응대하거나 혹은 집에 아무도 없을 시간대에 누군가가 문을 열고 들어오려고 할 때 적절하게 대응할 수 있습니다.
비가 내리는 소리를 듣고 가족들에게 우산을 챙겨주거나 열려있는 창문을 스스로 닫을 수도 있습니다.
일상생활 지원
부엌에서 물이 끓는 소리가 들리면 가스레인지 혹은 전기 인덕션이 켜진 상태를 인지하고 불을 대신해서 꺼 혹시 모를 화재를 예방합니다. 또는 잘 끓여진 커피나 차를 전달해 줄 수 있겠죠.
아기가 우는 시간대의 패턴을 분석해 어떤 행동을 요구하는지를 파악하고, 요구 사항에 맞춰 적절하게 대응하거나 혹은 긴급 상황 발생 시 부모를 깨워주는 역할을 할 수 있습니다.
Figure AI 사의 Helix 데모 영상에 달린 댓글 중 ‘My favorite part was how long the fridge was left open’ 이라는 댓글이 있습니다. 청각 인지 능력이 있는 로봇이라면 냉장고가 오래 열려있을 때 나는 소리를 인식하고 냉장고 문을 닫고 정리를 재개할 수도 있겠죠. 하지만 청각 인지 능력이 없는 로봇이라면 그저 ‘식자재 정리’라는 일차적인 목표에만 집중하겠지만요.
이처럼 지금의 휴머노이드 로봇은 사람과 자연스럽게 소통하는 데 있어 어쩔 수 없이 결정적인 한계를 가지고 있지만 그 한계는 절대 극복하지 못할 지점이 아니며, Sound AI 기술을 통해 해결할 수 있습니다. 휴머노이드 로봇이 상황을 주도적으로 판단하고 최적의 행동을 하기를 원하시나요? 그렇다면 Sound AI가 로봇이 인간과 공존할 수 있는 열쇠가 되어줄 것입니다. 더 똑똑한 로봇을 위한 Sound AI 기술을 만나고 싶다면, Cochl을 만나보세요!