티스토리 뷰

What is a Conversational User Interface (CUI)?

The Evolution of the CUI

많은 산업에서 고객과 직원은 빠르고 편리하게 상황에 맞는 정보에 접근해야 한다.
대화형 사용자 인터페이스(CUI)는 컴퓨터와 인간과 같은 직접적인 참여를 가능하게 하며, 우리가 시스템 및 응용 프로그램과 상호 작용하는 방식을 완전히 변화시키고 있다.  오늘날
CUI는 아마존, 구글 페이스북, 애플과 같은 통합 플랫폼을 제공하는 환경에서 더 인기 있는 도구가 되고 있으며, 올바른 접근 방식을 사용하면 동일한 작업을 효율적으로 수행할 수 있다.

대화형 사용자 인터페이스(CUI)는 시간이 지남에 따라 크게 발전해 왔습니다. 초기 단계에서는 단순한 텍스트 기반 명령어 처리 시스템(예: UNIX 쉘)에서 출발하여, 점차 더 복잡한 자연어 처리 기능을 통합하는 방향으로 발전하였습니다.

초기 단계:

  • 초기의 CUI는 주로 명령줄 인터페이스(CLI) 형태였으며, 사용자는 특정 명령어를 입력해 컴퓨터와 상호작용했습니다.
  • 검색엔진
  • 1960년대의 ELIZA와 같은 초기 챗봇은 패턴 매칭 기법을 사용하여 사용자의 입력에 반응했습니다.
  •  
ELIZA는 1966년에 MIT 교수인 Joseph Weizenbaum이 만든 컴퓨터 프로그램이야. 이건 인공지능 초기 형태 중 하나로, 사람과 컴퓨터가 자연스럽게 대화할 수 있게 하는 게 목적이었어. 특히 ELIZA는 심리치료 상황을 따라한 '로저리안 치료사' 스크립트로 유명한데, 여기서 ELIZA는 환자가 한 말을 되물어보거나 질문을 다시 던지면서 대화를 이어나가는 식이었지.

중간 단계:

  • 1980년대와 1990년대에 걸쳐 GUI(그래픽 사용자 인터페이스)가 대중화되면서 CUI의 발전은 잠시 주춤해졌습니다.
  • 텍스트 기반을 그래픽으로 대체
  • 하지만, 자연어 처리(NLP) 기술의 발전으로 2000년대 초반부터 다시 주목받기 시작했습니다.

매킨토시 데스크톱(Macintosh Desktop) - 1984 원문보기: https://www.ciokorea.com/news/10280#csidx3905383dba1a7ee90297587577712a0

최근 발전:

  • CUI : 인간 - 머신간의 새로운 상호작용 유형
  • 답변의 제공하는 봇은 사람이 아닌 컴퓨터 엔티티다.
  • 진정한 대화는 아니지만 인간-인간 상호 작용에 가장 가까운 자유롭고 자연스러운 경험을 제공한다  
  • 최근에는 인공지능(AI) 기술의 발전과 함께, 음성 인식과 자연어 이해(NLU) 기능이 향상되면서, Siri, Alexa, Google Assistant 등과 같은 음성 기반 CUI가 대중화되었습니다.
  • 이러한 시스템들은 사용자의 말을 이해하고, 맥락에 따라 적절한 반응을 할 수 있는 능력을 갖추고 있습니다.
  • 음성 인식 정확도는 구글, 사진 출처: 미스터후스더보스 유튜브 출처 : 문화뉴스(https://www.mhns.co.kr)


Practical Examples

Application Type Design Approach
Google Assistant VUI Empathetic tone, accurate speech recognition
Amazon Alexa VUI Context-aware responses, personalized skills
Slackbot CUI Context retention, task-oriented dialogues
Cortana VUI Seamless integration with Microsoft services, proactive assistance
IBM Watson Assistant CUI AI-driven responses, deep integration with enterprise systems

 

온디바이스AI

클라우드로 데이터를 전송하는 대신, 이용자가 소유한 기기 안에서 자체적으로 AI 연산을 처리하는 방식이다. 인터넷 연결 없이 활용할 수 있고 속도가 빠르며, 개인정보 보호, 비용 측면에서 유리하다. 이외에 개인의 사진이나 데이터와 접목할 수 있는 장점이 있지만 데이터의 수가 적어 산출되는 결과물의 완성도는 부족할 수 있다.

구글, 삼성전자에 이어 다수의 빅테크 기업들도 온디바이스AI 경쟁에 참전한 상태다. 대표적으로 애플은 2022년 10월 온디바이스AI 시대를 예고했다. 애플이 공개한 AI 칩 ‘M3’가 대표적이다. 애플은 M3 기반 맥북에 온디바이스AI를 탑재할 예정이다. 또 온디바이스AI 성능을 개선해 아이폰에 들어가는 AI 비서 ‘시리(Siri)’의 성능과 개인정보 보호를 강화할 방침이다. 애플은 음성인식 AI 비서 서비스 ‘시리’의 음성인식률을 높이기 위해 내년 출시되는 아이폰16 시리즈부터 마이크 성능을 대폭 개선할 계획이다. 애플은 AI 음성인식 정확도를 높이는 한편 iOS 업그레이드를 통해 AI 관련 각종 부가 기능을 제공할 예정이다.

vOn-Device AI

§디바이스 자체에 탑재되어 인터넷 연결 없이도 작동할 수 있는 인공지능 기술을 말합니다.
§이러한 AI는 데이터를 외부 서버로 보내지 않고 기기 내부에서 직접 처리하므로, 개인정보 보호가 강화되고 응답 속도가 향상
§예를 들어, 스마트폰에서 음성 인식 기능을 사용할 때 인터넷 연결 없이도 명령을 수행할 수 있다.
§인터넷 접속이 제한된 환경에서도 AI 기능을 사용할 수 있게 해 주어, 사용 범위가 넓어 짐.
§의료 기기, 스마트 홈 장비, 웨어러블 기기 등 다양한 분야에서 활용


1.What is Conversational User Interface?

 

대화형 사용자 인터페이스(CUI)는 사람과 컴퓨터가 텍스트나 음성을 통해 자연스러운 대화 흐름으로 상호작용할 수 있도록 설계된 인터페이스

대화 : conversation - 필자 '인간을 구분짓는 특징 > 인간은 사회적 동물이다 > 인간은 언어로 대화를 한다.'

위키피디아

대화(對話, dialogue, 다이얼로그)는 둘 이상의 실체 사이의 상호적인 언어 소통
이다.

- 의사소통의 유형
- 2명이상 사이에서
- 아이디어와 생각이 교환되는 대화형
- 사회화 과정의 일부
- 학습과 교육에 집중

대화형 사용자 인터페이스(CUI)는 사람과 컴퓨터가 텍스트나 음성을 통해 자연스러운 대화 흐름으로 상호작용할 수 있도록 설계된 인터페이스입니다. 자연어 이해(NLU) 기술을 활용하여 CUI는 사람의 말이나 타이핑 입력을 해석하고 응답하여 사용자에게 직관적이고 자연스러운 경험을 제공합니다.

이러한 인터페이스는 시리(Siri)나 알렉사(Alexa)와 같은 음성 비서에서 흔히 볼 수 있습니다. 사용자는 간단한 음성 명령을 통해 작업을 수행하거나 정보를 검색할 수 있습니다. 기술은 단순히 음성을 인식하는 것을 넘어, 대화의 맥락과 의도를 이해하여 더욱 동적이고 반응적인 상호작용을 가능하게 합니다.

CUI는 사용자가 특정 명령을 입력하거나 메뉴를 탐색해야 했던 전통적인 그래픽 사용자 인터페이스(GUI)에서 벗어나, 동료에게 도움을 요청하거나 고객 서비스에 전화하는 것처럼 간단하고 직관적인 방식으로 설계되었습니다. 이러한 변화는 디지털 시스템과의 상호작용 방식에서 중요한 진화를 나타냅니다. 이 시스템들은 상호작용에서 배우고 그 반응을 개선함으로써 시간이 지남에 따라 더 효율적이고 인간 같은 커뮤니케이션을 가능하게 합니다.

대화 정의에 반하는 CUI :
- 꼭 말이 아니어도 된다. 쓰기일 수 있다.
- 송 수신자가 사람이 아니어도 된다. (CUI에서는 둘이상의 참가자는 거의 없다)
- 상호작용이 적어 아이디어와 의도가 그대로 전달되는지 여부를 확인 하기 어렵다.
- 자연스러운 의사소통 수단이다.
- AI, ML, NLU 등의 기술 발전으로 계속 배우고 학습하고 있다.

vDifferentiating CUI & VUI Design

üInput Modality : 각 인터페이스에 선택된 입력 방식에 따라
§CUI (Conversational User Interface): 주로 텍스트 기반의 입력과 응답에 중점을 둠.
§VUI (Voice User Interface): 음성 입력과 청각 피드백을 사용함.
üUser Feedback Loop : (사용자 피드백 루프),
§CUI: 시각적 피드백 신호(: 텍스트, 아이콘 등)를 포함하는 디자인이 많음.
§VUI: 음성과 청각적 요소에 의존
 

CUI & VUI 디자인의 유사성

1. 사용자 중심 디자인 (User-Centric Design):

  • 설명: CUI(대화형 사용자 인터페이스)와 VUI(음성 사용자 인터페이스) 모두 사용자 중심의 디자인을 우선시한다. 이는 사용자가 직관적으로 상호작용할 수 있도록 하고, 가치 있는 사용자 경험을 제공하는 데 초점을 맞춘다.
  • 예시: 스마트폰의 음성 비서(예: Siri, Google Assistant)와 채팅형 고객 서비스 봇(예: 은행의 챗봇) 모두 사용자가 쉽게 접근하고 사용할 수 있도록 설계되어 있다. 사용자가 원하는 정보를 빠르고 효율적으로 얻을 수 있는 경험을 제공한다.

2. 컨텍스트 이해 (Contextual Understanding):

  • 설명: CUI와 VUI 디자인에서는 컨텍스트(상황) 이해가 중요한 역할을 한다. 컨텍스트를 이해하고, 사용자의 필요에 맞춘 반응과 상호작용을 제공함으로써 사용자 참여도와 사용성을 높인다.
  • 예시: 예를 들어, 사용자가 "내일 날씨 어때?"라고 물었을 때, 음성 비서가 위치와 시간을 고려해 적절한 답변을 제공한다. 또한, 채팅형 고객 서비스 봇은 사용자가 이전에 문의한 내용을 바탕으로 추가적인 정보를 제공하거나, 질문을 미리 예측해 빠르게 대답할 수 있다.

CUI의 주요 기능과 장점:
대화형 사용자 인터페이스(CUI)의 주요 장점은 말로 된 언어의 효율성을 최대한 활용하는 데 도움을 준다는 것

 

  • 자연어 이해(NLU): CUI는 자연어 처리(NLP) 기술을 기반으로 하며, 자연어 이해(NLU)를 통해 사용자의 발화에서 의도와 맥락을 파악합니다. 이를 통해 사용자의 요구사항을 정확히 이해하고 적절한 대응을 할 수 있습니다.
  • 대화 관리: CUI는 대화의 흐름을 관리하고 유지하는 기능을 갖추고 있습니다. 이는 사용자와의 상호작용을 지속적으로 이어갈 수 있게 해 주며, 필요한 정보를 추가로 요청하거나 응답을 조정할 수 있습니다.
  • 적응성 및 개인화: CUI는 사용자와의 대화를 통해 학습하고, 이를 바탕으로 개인화된 경험을 제공할 수 있습니다. 예를 들어, 사용자의 선호나 이전의 상호작용 내용을 기반으로 맞춤형 정보를 제공합니다.
  • 접근성 향상: CUI는 특히 시각 장애가 있는 사용자나 기술에 익숙하지 않은 사용자들에게 GUI보다 더 편리하게 접근할 수 있도록 돕습니다. 음성 명령만으로 정보를 검색하고, 명령을 실행할 수 있기 때문입니다.
  • 다양한 플랫폼 통합: CUI는 스마트폰, 스마트 스피커, 자동차 내 시스템 등 다양한 디바이스와 통합될 수 있으며, 이를 통해 사용자는 어떤 환경에서든 일관된 경험을 할 수 있습니다.
  • 자원의 효율적 사용 : 일부 작업을 CUI로 전환함으로써 직원의 기술을 최대한 활용할 수 있습니다. 직원들이 더 이상 일상적인 작업(예: 고객 지원 또는 리드 자격 확인)에 필요하지 않게 되면, 더 높은 가치의 고객 참여에 집중할 수 있습니다.
  • CUI를 사용할 수 있는 시간에 제한이 없습니다.

 


 

3. How Do CUIs Work?

CUI의 핵심 구성 요소를 알아보자


1. 음성 인식(음성-텍스트 변환) : Voice Recognization - speech to text

이 기술은 말한 단어를 글로 변환합니다. 언어 구조와 오디오 신호에 대한 지식을 활용하여 정확하게 음성을 텍스트로 전환합니다. 정확도와 효율성을 유지하기 위해 지속적인 업데이트와 개선이 필요합니다.

Voice Recognition의 주요 기능:

  1. 음성 데이터 수집:
    • 사용자의 음성 입력을 마이크로폰을 통해 수집합니다.
  2. 음성-텍스트 변환 (Speech-to-Text):
    • 수집된 음성 데이터를 디지털 신호 처리 기술을 사용하여 텍스트 데이터로 변환합니다. 이 과정은 음성 인식 엔진에서 처리되며, 사용자의 발화를 문자로 기록합니다.
  3. 음성 인식 정확성 향상:
    • 배경 소음 제거, 발음 차이 인식, 언어 및 방언의 구분 등을 통해 음성 인식의 정확성을 높입니다.
  4. 사용자 인증 (옵션):
    • 음성을 사용하여 사용자의 정체성을 확인하는 데 사용될 수 있습니다. 이는 보안을 필요로 하는 애플리케이션에서 중요한 기능입니다.

기술적 구현:예시:

  • 스마트 홈 어시스턴트:
    • 사용자가 "알렉사, 오늘 날씨 어때?"라고 말하면, 알렉사는 이 음성 명령을 텍스트로 변환합니다. 그 후 이 텍스트 데이터를 처리하여 오늘의 날씨 정보를 사용자에게 알려줍니다.
  • 모바일 앱:
    • 음성 명령을 사용하여 전화 걸기, 문자 보내기 등의 기능을 수행할 수 있는 스마트폰 앱. 예를 들어, "시리, 엄마에게 전화 걸어줘"라고 말하면, 시리는 이 명령을 인식하고 사용자의 '엄마'에 해당하는 연락처로 전화를 걸게 됩니다.

2. Semantic Level : 의미 수준


대화형 사용자 인터페이스(CUI) 스택에서 "Semantic Level"은 사용자의 입력을 해석하고 그 의미를 이해하는 단계를 의미합니다. 이 단계는 자연어 처리(NLP) 기술의 핵심 구성 요소 중 하나이며, 사용자의 언어와 그 의도를 분석하여 적절한 반응을 생성하는 데 중요한 역할을 합니다.
  • 자연어 처리(NLP)

NLP는 언어학, 컴퓨터 과학, 인공지능을 결합하여 인간의 언어를 이해하고 생성하는 기술입니다. 사용자 입력의 구문과 의미를 분석하여 복잡한 요청을 처리할 수 있도록 도와줍니다.

  • 자연어 이해(NLU)

NLP가 제공하는 광범위한 기초 위에 NLU는 사용자의 의도를 구체적으로 파악하는 데 집중합니다. 사용자의 발화를 분석하여 수행할 행동을 추론합니다.

예를 들어, 뉴욕에서 호텔 방을 예약하라는 요청을 분석할 때, NLU는 "호텔 방 예약"이라는 의도와 "뉴욕"이라는 위치를 식별합니다.

 

Semantic Level의 주요 기능:

  • 특정 알고리즘으로는 한계가 있다.
  1. 의미 분석 (Semantic Analysis):
    • 사용자의 입력에서 단어와 구문의 의미를 분석합니다. 예를 들어, "book"이라는 단어가 동사로서 "예약하다"의 의미인지, 명사로서 "책"을 의미하는지 구분합니다.
  2. 의도 파악 (Intent Recognition):
    • 사용자의 발화에서 의도를 파악합니다. 예를 들어, "내일 뉴욕으로 가는 비행기 예약해 줘"라는 문장에서 "비행기 예약"이라는 의도를 식별합니다.
    • 예 : 나는 서울로 날아가야 해 > 비행기 티켓 예약을 원한다. 
      봇은 비행이라는 단어가 없어도 예약 의도를 파악해야한다.
  3. 엔티티 추출 (Entity Extraction):
    • 입력된 문장에서 중요한 정보를 추출하는 과정입니다. 예를 들어, "내일 뉴욕으로 가는 비행기"에서 "내일", "뉴욕", "비행기"와 같은 엔티티를 인식하고 분류합니다.
  4. 대화 맥락 이해 (Context Understanding):
    • 사용자의 발화를 이전 대화의 맥락 속에서 해석합니다. 이는 대화가 연속적이고 일관되게 유지될 수 있도록 도와줍니다.
  5. 문장 생성 (Response Generation):
    • 분석된 의미와 맥락을 바탕으로 적절한 대응 문장을 생성합니다. 이 과정에서 AI는 사용자의 요구에 맞는 응답을 제시하기 위해 학습된 데이터를 활용합니다.

3. 대화수준 (Conversational Level) :

  • 사전/샘플 : 사람들이 비슷한 의도를 다양한 방식으로 표현할 수 있기 때문에, CUI는 광범위한 사전이나 샘플 데이터베이스를 유지합니다. 이는 인터페이스가 다양한 표현과 동의어를 이해하고 처리할 수 있도록 보장합니다.
    문장의 모믐(샘플리스트)가 필요하다.
  • 컨텍스트 관리 (상황인식) : 가장 힘든 과제 - 대화의 연결 즉 요청의 연결이 가능하다. 단순한 Q&A와는 다르다.
    ' 상황을 이해 할 수 있다는 것은 봇의 상호작용이 인간화 되었다는 것을 의미한다.
    컨텍스트 관리, 즉 상황인식은 대화형 사용자 인터페이스(CUI)에서 가장 중요하고 복잡한 과제 중 하나입니다. 이 기능은 CUI가 과거의 대화를 기억하고, 현재 진행 중인 상황에 이를 적용함으로써 사용자와의 상호작용을 인간처럼 자연스럽게 만듭니다. 컨텍스트 관리의 효과적인 구현은 CUI가 일관되고 관련성 있는 응답을 제공하도록 하며, 반복적인 질문 없이도 지속적인 대화의 흐름을 유지할 수 있게 합니다.
    - 모든 흐름을 처리 할 수 있어야 한다.
    - '항공편을 예약 할 수 있어?" 질문 > 봇은 예라고 답변한 다음 국내선과 국제선 항공편 어떤것을 원하는가? 라는 추가 질문이 가능해야 한다.
예시: 항공편 예약 대화

CUI의 컨텍스트 인식: 사용자가 '항공편 예약'이라는 목적을 가지고 있다는 것을 인식하고, 추가적인 정보를 요구하여 대화를 진행합니다.
CUI: "네, 예약 도와드리겠습니다. 국내선과 국제선 중 어떤 항공편을 원하시나요?"
CUI의 응답: CUI는 사용자의 요청에 바탕을 둔 적절한 응답을 제공하고, 사용자의 필요에 맞추어 구체적인 선택지를 제시함으로써 대화를 유도합니다.
사용자: "국제선으로 예약하고 싶어요."
CUI의 연속된 컨텍스트 처리: 사용자의 답변을 토대로 국제선 항공편에 관한 정보를 제공하고 예약 절차를 안내합니다.
CUI: "어느 도시로 가시나요? 원하시는 출발 날짜와 돌아오는 날짜를 알려주세요."
컨텍스트 기반 대화 유지: CUI는 이전 대화의 정보를 기억하면서 관련된 추가 정보를 요청합니다. 이를 통해 사용자는 반복적으로 같은 정보를 제공할 필요 없이 원활하게 예약 절차를 진행할 수 있습니다.
사용자: "항공편을 예약하고 싶어요."

  • 비즈니스 로직과 동적데이터 :  
    비즈니스 로직 계층은 CUI를 특정 애플리케이션에 연결하여 관련 규칙, 절차 및 제약 조건을 정의합니다. 이는 CUI가 원하는 프레임워크 내에서 작동하고 의도된 결과를 달성하도록 보장합니다.
    - 비즈니스 로직 계층은 페이스북 메신저 봇과 같은 대화형 사용자 인터페이스(CUI)에 적용할 때 중요한 역할을 합니다. 이 계층은 봇이 특정 애플리케이션 내에서 의도된 대로 작동하도록 하며, 관련된 규칙, 절차 및 제약 조건을 정의합니다. 이를 통해 사용자의 요구에 부합하는 적절한 반응과 서비스를 제공할 수 있습니다.
    - 실시간 데이터 연동을 통한 서비스가 이루어져한다.

 


페이스북 메신저 봇 예시: 고객 지원 서비스

1. 비즈니스 로직 정의

페이스북 메신저 봇을 사용하여 고객 지원 서비스를 제공하는 경우, 비즈니스 로직은 다음과 같은 요소를 포함할 수 있습니다:

  • 고객 질문 분류: 사용자의 질문을 자동으로 분류하여 적절한 응답 또는 서비스 팀으로 연결합니다.
  • 응답 자동화: 특정 키워드나 문제에 대한 미리 설정된 자동 응답을 제공합니다.
  • 서비스 요청 처리: 사용자가 서비스나 상품에 대해 문의할 때 적절한 작업을 수행하도록 합니다.

2. 동적 데이터 활용

메신저 봇은 사용자와의 상호작용 중에 생성되는 동적 데이터를 활용하여 서비스를 개선합니다. 예를 들어:

  • 사용자 선호 분석: 대화를 통해 얻은 데이터로 사용자의 선호도와 행동 패턴을 분석합니다.
  • 맞춤형 추천: 분석된 데이터를 기반으로 사용자에게 맞춤형 상품이나 서비스를 추천합니다.

3. 규칙과 제약 조건 적용

  • 개인정보 보호: 사용자의 데이터를 처리할 때는 개인정보 보호법을 준수해야 합니다.
  • 응답 시간 제한: 사용자의 요청에 빠르게 응답하기 위해 설정된 시간 제한을 준수합니다.

이러한 비즈니스 로직은 봇이 사용자의 요구에 효과적으로 대응하도록 하며, 동시에 조직의 목표와 정책에 부합하게 운영되도록 합니다. 페이스북 메신저 봇은 이러한 비즈니스 로직을 바탕으로 동적인 상황에서도 사용자와의 대화를 유지하고 적절한 서비스를 제공하는 중요한 도구가 됩니다.


컨텍스트 관리(상황인식)

컨텍스트 관리(상황인식)는 사용자와의 대화에서 이전 상호작용을 기반으로 적절한 응답을 제공하는 과정

1. 상태 머신 방법론 (State Machine Approach)

개념:

상태 머신 방법론은 대화의 각 상태를 명확하게 정의하고, 각 상태에서 가능한 이벤트(사용자 입력)에 따라 다음 상태로의 전환을 정의합니다. 이 방식은 대화의 흐름을 체계적으로 관리하고자 할 때 유용합니다.

사례:

온라인 주문 시스템에서 사용자가 피자를 주문하는 과정을 상태 머신으로 관리할 수 있습니다.

  • 상태 1: 주문 시작 - 사용자가 "피자 주문하기"라고 요청
  • 이벤트: 사용자가 주문 유형 선택 (예: "베지테리언 피자")
  • 상태 2: 피자 유형 선택 - 시스템이 피자 유형에 따른 옵션을 제시
  • 이벤트: 사용자가 특정 피자 크기 선택 (예: "대")
  • 상태 3: 피자 크기 선택 - 시스템이 추가 토핑 선택을 제안
  • 이벤트: 사용자가 추가 요청 완료 (예: "주문 완료")
  • 상태 4: 주문 확인 - 시스템이 주문 요약 제공 및 확인 요청

이 방법은 각 단계에서 사용자의 입력을 명확하게 예측하고 대응할 수 있도록 돕습니다.

2. 이벤트 기반 상황 인식 접근법 (Event-Driven Context Awareness)

이벤트 기반 접근법은 이벤트가 발생할 때마다 반응하는 좀 더 동적인 방식이에요. 이 방법은 예측하기 어렵고 복잡한 상호작용이 필요한 환경에 적합해요.

개념:

이벤트 기반 접근법은 사용자의 입력이나 시스템의 변경 사항을 이벤트로 간주하고, 이러한 이벤트에 반응하여 동적으로 대화를 조정합니다. 이 방식은 더 유연하고 동적인 대화 흐름을 제공하여 복잡한 상호작용에 적합합니다.

사례:

고객 지원 챗봇에서 고객의 문제 해결 과정을 이벤트 기반으로 처리할 수 있습니다.

  • 이벤트: 사용자가 "인터넷 연결이 안 돼요"라고 문제 제기
  • 반응: 시스템이 네트워크 상태를 자동으로 확인하고, 관련 진단 정보를 요청
  • 이벤트: 사용자가 추가 정보 제공 (예: "모든 라이트가 꺼져 있어요")
  • 반응: 시스템이 가능한 원인과 해결 방안을 동적으로 제시
  • 이벤트: 사용자가 해결책을 적용하고 피드백 제공
  • 반응: 시스템이 추가 지원을 제공하거나 문제 해결 확인

이벤트 기반 접근법은 사용자의 입력과 시스템 상태의 변화에 따라 유연하게 대응할 수 있으며, 복잡한 상황에서도 사용자와의 상호작용을 지속적으로 유지할 수 있습니다.
상담원은 누락된 질문을 분석하고 요구할 뿐 특정부분에 관한 세부사항을 요구하지 않느다.

두 접근법은 각각의 장단점이 있으며, 특정 애플리케이션의 요구 사항에 따라 적절히 선택하여 사용되어야 합니다. 상태 머신은 구조화된 대화에 강점을 보이는 반면, 이벤트 기반 방식은 동적이고 예측하기 어려운 상황에서의 대화 관리에 유리합니다.

상태 머신 방법론을 적용한 예

설계 개요

스마트홈 조명 시스템에서 상태 머신 방법론을 사용하여 각 조명의 상태(켜짐, 꺼짐, 조도 조절)를 관리할 수 있습니다. 사용자의 명령에 따라 상태가 전환되며, 각 상태는 특정 조명 설정으로 연결됩니다.

예시 흐름

  1. 초기 상태 (꺼짐): 모든 조명이 꺼져 있습니다.
  2. 사용자 입력: "조명 켜줘"
  3. 상태 전환: 꺼짐 → 켜짐
  4. 사용자 입력: "조명 밝기를 50%로 조절해줘"
  5. 상태 전환: 켜짐 → 조도 조절 (밝기 50%)
  6. 시스템 반응: 조명 밝기가 50%로 조절됩니다.

이 방법은 사용자의 명령을 체계적으로 처리할 수 있게 하며, 각 상태를 명확히 관리할 수 있습니다.

이벤트 기반 상황 인식 방법론을 적용한 예

설계 개요

이벤트 기반 상황 인식 방법론은 사용자의 명령이나 환경 변화를 실시간으로 감지하고 반응하는 데 초점을 맞춥니다. 조명 조절 시스템에서는 사용자의 요구나 외부 요인(예: 자연광 변화)에 따라 조명 상태를 동적으로 조절합니다.

예시 흐름

  1. 사용자 입력: "거실 조명을 밤 모드로 설정해줘"
  2. 이벤트 처리: 사용자의 명령에 따라 거실 조명의 설정을 밤 모드(낮은 조도, 따뜻한 색상)로 조정합니다.
  3. 외부 이벤트: 창문 센서가 자연광 감소를 감지
  4. 이벤트 반응: 자연광 감소에 따라 자동으로 조명 밝기를 증가시킵니다.

이 접근법은 보다 유연하고 상황에 적합한 반응을 제공하여 사용자 경험을 향상시킬 수 있습니다. 시스템이 다양한 상황과 사용자 요구에 즉각적으로 반응할 수 있어 스마트홈 환경에서 매우 유용합니다.


구현 예시:

사용자가 "1월 10일부터 15일까지 뉴욕에서 호텔 방을 예약해야 해요."라고 말할 때, CUI는 NLU를 사용하여 의도("호텔 방 예약"), 위치("뉴욕"), 시작 날짜("1월 10일"), 종료 날짜("1월 15일")를 파악합니다. 이후 필요한 정보를 구조화하여 호텔 예약 과정을 진행할 수 있도록 합니다. 이 과정에서 CUI는 대화의 맥락을 유지하고, 연관된 추가 질문에 대해 자연스럽게 응답할 수 있습니다.

실습 : 샘플 리스트 만들기

  • 도메인과 언어에 특화된 각각의 구성
  • use case의 연결
과제 ㅣ 여행 사례를 들어 사용자 요청고 의도 샘플을 만들어 보자.
사용자 요청 의도
"내일 뉴욕으로 가는 비행기 티켓을 예약하고 싶어." 비행기 티켓 예약
"방콕에서의 추천 관광지는 어디야?" 관광지 추천
"가족과 함께 갈 수 있는 유럽 여행 패키지가 있을까?" 여행 패키지 정보
"비자가 필요한 국가 목록을 알려줘." 비자 필요 국가 정보
"현재 환율은 얼마야?" 환율 정보
"짐을 얼마나 가져갈 수 있어?" 수하물 규정 정보
"여행 보험에 가입하고 싶은데, 어떻게 하면 돼?" 여행 보험 가입 방법
"가장 저렴한 시기에 일본 여행을 가고 싶어." 여행 저렴한 시기 정보
"공항까지의 가장 빠른 교통편은 무엇인가?" 공항 교통편 정보
"비행 상태를 알려줄 수 있어?" 비행 상태 정보
요청 의도
여행을 예약하고 싶다 Booking Flight
비행기를 예약하고 싶다.
비행기가 필요하다
호텔 방을 예약 해 주세요 Booking Room
숙소가 필요하다.

과제2 ㅣ 다양한 사례를 조사 해 보자.

  1. 과제 목표: 학생들이 사용자 요청과 의도를 분석하고 테이블을 만드는 능력을 개발하는 것을 목표로 합니다.
  2. 샘플을 준비 : 실습에 사용할 다양한 사용자 요청 샘플을 준비합니다. 이 샘플은 일상 대화, 특정 주제(예: 여행, 의료, 금융 서비스) 등 다양할 수 있습니다.
  3. 실습 지침 제공 ; 실습에 필요한 도구 설명 (예, 구를시트 또는 포스트잇 card Sorting), 의도 분류 지침
  4. 분류 작업: 학생들은 제공된 사용자 요청을 분석하고, 각 요청의 의도를 파악하여 테이블에 기록
    키워드 식별: 사용자의 요청에서 중심이 되는 키워드나 구(phrase)를 식별
    문맥 이해: 요청의 문맥을 분석하여 요청의 배경이나 상황을 이해합니다. 예를 들어, "비행기 티켓을 예약하고 싶어"라는 문장에서 "예약"은 키워드이며, "비행기 티켓"은 해당 요청의 맥락을 제공합니다.
  5. 학생들은 완성된 테이블을 제출
  6. 평가 및 피드백: 각 팀의 접근 방식과 결과에 대해 피드백을 제공

4.Types of Conversational User Interfaces

대화형 사용자 인터페이스(CUI) 디자인에는 두 가지 구별되는 유형이 있습니다. 

하나는 텍스트 형식으로 상호작용하는 봇이고,
다른 하나는 음성으로 대화하는 음성 어시스턴트입니다.


여기서 주의해야 할 점은 단순히 "챗봇"이라는 용어를 유행어로 사용하는 소위 '가짜 챗봇'도 있다는 것입니다. 이러한 가짜 챗봇은 실제 CUI가 아닌, 일반적인 포인트 앤 클릭 그래픽 사용자 인터페이스를 CUI인 것처럼 가장하고 광고합니다. 우리가 살펴볼 것은 구문 특정 명령에 의존하지 않는 두 가지 유형의 대화형 인터페이스입니다.

챗봇(Chatbots)

챗봇은 오래전부터 존재해 왔습니다. 예를 들어, 1960년대로 거슬러 올라가는 컴퓨터 프로그램 ELIZA가 있었습니다. 그러나 최근의 기계 학습, 인공지능, NLP 기술 발전으로 챗봇은 실제로 사용자 문제를 해결하는 데 큰 기여를 하기 시작했습니다.

대부분의 사람들이 이미 메시징에 익숙하기 때문에, 봇에게 메시지를 보내는 것은 큰 노력이 필요하지 않습니다. 챗봇은 일반적으로 앱 내 메신저 형태이거나 웹 브라우저에 특수 창으로 존재합니다. 사용자는 문제를 서술하거나 질문을 서면으로 합니다. 챗봇은 정확한 명령 없이도 후속 질문을 하거나 의미 있는 답변을 제공합니다.

챗봇은 텍스트 기반의 대화 인터페이스로, 사용자가 텍스트 메시지를 통해 질문하거나 명령을 입력할 수 있습니다. 이러한 봇은 웹사이트, 모바일 앱, 소셜 미디어 플랫폼 등 다양한 디지털 환경에서 활용됩니다. 챗봇의 기본 작업은 다음과 같습니다:

  • 사용자 의도 파악: 사용자의 입력을 분석하여 의도를 이해하고 적절한 반응을 생성합니다.
  • 대화 유지: 사용자와의 대화를 지속적으로 이어 가며 필요에 따라 추가 정보를 요청하거나 응답을 제공합니다.
  • 프로세스 자동화: 간단한 고객 서비스 요청, 예약, 구매와 같은 작업을 자동으로 처리합니다.
  • 개인화된 경험 제공: 이전 대화를 기반으로 사용자에게 맞춤화된 정보와 서비스를 제공합니다.

음성 인식 시스템 (VUI)

ⓒ게티이미지뱅크

출처 : 스타트업투데이(STARTUPTODAY)(https://www.startuptoday.kr)

사용자는 음성 어시스턴트에게 스마트폰, 인터넷 또는 호환 가능한 앱에서 찾을 수 있는 모든 정보를 요청할 수 있습니다. 음성 시스템의 유형과 진보 정도에 따라, 활성화를 위해 특정 행동, 프롬프트 또는 키워드가 필요할 수 있습니다. 연결된 제품과 서비스가 더 많아질수록, 어시스턴트는 더 복잡하고 다양해집니다.

음성 인식 시스템의 주요 기능은 다음과 같습니다:

  • 음성-텍스트 변환: 사용자의 음성을 텍스트 데이터로 변환하여 처리합니다.
  • 명령 실행: 음성 명령을 해석하고 관련된 작업을 수행합니다.
  • 정보 검색 및 제공: 음성 명령을 통해 인터넷에서 정보를 검색하거나, 날씨, 뉴스 업데이트 등을 제공합니다.
  • 디바이스 제어: 스마트 홈 기기를 제어하거나, 차량 내 시스템을 조작하는 등의 기능을 수행합니다.

5. Business Use Cases

챗봇과 음성 사용자 인터페이스(VUI)는 다양한 산업에서 효율성을 높이고 사용자 경험을 변화시키며 중요한 발전을 이루고 있습니다. 다음은 이러한 기술이 중요한 차이를 만들어내고 있는 주요 비즈니스 사례입니다:

Natural Language Processing (NLU) for Conversational IVR
Read more at: https://masterofcode.com/blog/9-key-predictions-for-the-future-of-voice-assistants

1. 소매 및 전자상거래

  • 고객 상호작용: 챗봇과 VUI는 제품에 대한 고객 문의 처리, 불만 관리 및 구매, 배송, 청구에 대한 업데이트 제공을 처리할 수 있습니다.
  • 내비게이션 지원: 이 인터페이스는 고객이 온라인 플랫폼을 통해 원하는 섹션 또는 제품에 빠르게 접근할 수 있도록 도와줍니다.
  • 개인화된 추천: 고객의 선호도와 과거 상호작용을 분석하여 관심이 있을 만한 제품이나 서비스를 제안함으로써 판매 가능성을 높일 수 있습니다.

2. 건설 산업

  • 정보 접근: 건축가, 엔지니어, 건설 작업자는 매뉴얼, 설계도, 기타 중요 문서에서 정보를 빠르게 검색할 수 있도록 CUI를 사용할 수 있습니다.
  • 프로젝트 관리: 챗봇은 팀 성과, 프로젝트 이정표, 기계 상태에 대한 업데이트를 제공하여 대규모 건설 프로젝트를 효율적으로 관리할 수 있도록 도와줍니다.
  • 안전 준수: 건설 현장에서 높은 안전 기준을 유지하기 위해 VUI를 통해 정기적인 안전 점검과 안전 확인을 자동화할 수 있습니다.

3. 응급 대응자

  • 신속 대응 조정: CUI는 사건 현장, 긴급 수준, 사용 가능한 자원을 분석하여 비상 상황에서의 의사 결정을 개선하는 데 도움을 줄 수 있습니다.
  • 정보 전파: 현장 팀에 중요한 정보를 빠르게 전달하는 것을 자동 음성 명령을 통해 촉진할 수 있습니다.

4. 의료

  • 환자 모니터링: 챗봇과 음성 어시스턴트는 원격으로 환자의 건강 지표를 모니터링하고, 의료진에게 중요한 변화를 알리며, 일상적인 문의를 관리할 수 있습니다.
  • 행정 효율성: 예약 스케줄링, 환자 등록, 공중 보건 발표를 자동화함으로써 의료 전문가의 소중한 시간을 절약할 수 있습니다.

5. 은행, 금융 서비스 및 보험

  • 고객 지원: 계좌 관리, 거래 처리, 분실된 카드 신고와 관련된 문의를 실시간으로 처리하여 고객 만족도를 높일 수 있습니다.
  • 운영 자동화: 데이터 입력 및 보고서 생성과 같은 일상적인 백오피스 작업을 대화형 인터페이스를 통해 자동화함으로써 운영 비용을 줄일 수 있습니다.

6. Conversational UI Challenges (기술적 도전과 고려 사항):

다음은 설계 과정에서 해결해야 할 몇 가지 주요 도전 과제와 덜 명확한 고려 사항들입니다:

Accuracy level  : 단일 요청과 의도를 정확하게 이해하기 위해 여러 가지 변형을 인식

대화의 자연스러움: 기계가 인간처럼 자연스러운 대화를 이끌어내는 것은 여전히 큰 도전입니다. 의도나 감정을 정확히 파악하고, 이에 적합한 응답을 하는 것은 복잡한 기술적 문제입니다. 더 복잡한 요청에서는 많은 매개변수가 관여되며, 이는 도구를 구축하는 매우 시간 소모적인 부분이 됩니다.

Implicit requests(암시적요청) : 

사용자가 요청을 명시적으로 하지 않으면 예상한 결과를 얻지 못할 수 있습니다.
예를 들어, 여행 대리점에 "계산해줘"라고 말할 수 있지만, 대화형 UI는 그 구절을 풀어내지 못할 수 있습니다.

프라이버시와 보안:

  • 음성 데이터는 매우 개인적이며 민감할 수 있습니다. 따라서 사용자 데이터를 안전하게 처리하고 보호하는 것은 매우 중요합니다.

Cognitive load : 언어 및 방언의 다양성:

전 세계적으로 다양한 언어와 방언이 존재하기 때문에, 이를 모두 지원하는 CUI를 개발하는 것은 큰 도전 중 하나입니다. 사용자가 처리해야 하는 정보의 양과 그 복잡성을 나타내는 용어입니다. 음성만을 출력으로 사용하는 상황에서는 인지 부담이 특히 중요한 문제가 될 수 있습니다.

  • 예시: 의사의 지시 사항 듣기
    1. 정보의 양: 의사가 한 번에 많은 정보를 제공할 수 있습니다. 예를 들어, "하루에 세 번, 식사 후 30분 이내에 한 알씩 복용하세요. 약과 함께 자몽을 먹지 마시고, 다른 약품과 함께 복용할 경우 의사와 상의해야 합니다."
    2. 인지 부담: 이 정보를 모두 기억하는 것은 사용자에게 상당한 인지적 부담을 줄 수 있습니다. 각 지시 사항은 복잡하며, 특히 중요한 주의사항은 건강에 직접적인 영향을 줄 수 있기 때문에 정확히 기억하는 것이 중요합니다.
    3. 집중 요구: 사용자는 의사의 지시를 정확히 이해하고 기억하기 위해 높은 수준의 집중력을 발휘해야 합니다. 이는 특히 환경이 시끄럽거나 사용자가 다른 일에 정신이 팔릴 경우 더욱 어려울 수 있습니다.
    이러한 상황에서 대화형 UI가 제공하는 음성 출력만으로는 사용자가 모든 정보를 충분히 처리하고 기억하는 데 한계가 있을 수 있습니다. 따라서 중요 정보를 텍스트로도 제공하거나, 사용자가 나중에 다시 들을 수 있도록 음성 메모를 저장하는 기능을 제공하는 것이 도움이 될 수 있습니다. 이와 같은 보조 수단은 인지 부담을 줄이고 정보 처리 능력을 향상시키는 데 기여할 수 있습니다.
  • 상황: 사용자가 새로운 약을 처방받았고, 의사가 약의 복용 방법과 주의사항을 음성으로 설명해 줍니다.

대화형 인터페이스는 계속해서 발전하고 있으며, 그 가능성은 매우 큽니다. 사용자 경험을 향상시키고, 접근성을 높이며, 다양한 환경에서의 편리함을 제공하는 것이 CUI의 주요 목표입니다.

Discomfort of talking in public : 공공장소에서의 대화 불편함

  • 일부 사람들은 주변 사람들이 들을 수 있는 곳에서 정보를 공유하는 것을 선호하지 않습니다. 따라서 사용자가 음성을 통해 입력하고 싶지 않은 경우 다른 입력 옵션이 있어야 합니다.

언어 제한 Language restrictions

  • 국제 사용자를 지원하려면 다양한 언어로 대화할 수 있는 CUI가 필요합니다. 일부 자산은 재사용에 적합하지 않을 수 있어 다른 버전이 원활하게 공존할 수 있도록 완전히 재구축해야 할 수도 있습니다.

데이터 보호 규정(보안과 프라이버시)

  • 상호작용을 개인화하기 위해 사용자에 대한 데이터를 검색하고 저장해야 할 수 있습니다. 조직이 규제 및 법률을 준수하도록 하는 방법에 대한 우려가 있습니다. 불가능한 것은 아니지만 주의가 필요합니다.

이러한 도전 과제들을 이해하는 것은 특정 대화형 UI 디자인을 개발할 때 중요합니다. 과거의 경험에서 많은 것을 배울 수 있으며, 이를 통해 이러한 격차가 최대한 발휘되는 것을 방지할 수 있습니다.

전 세계적으로 개인 데이터 보호 및 처리와 관련된 다양한 법률과 규정이 시행되고 있습니다. 이러한 법률은 지역에 따라 차이가 있으며, 기업이 사용자 데이터를 수집, 저장, 처리하는 방법에 엄격한 지침을 제공합니다. 여기 몇 가지 주요 예시를 들어 설명하겠습니다:

  1. 일반 데이터 보호 규정(GDPR): 유럽 연합(EU)에서 시행 중인 GDPR은 개인 데이터 보호와 관련된 가장 포괄적인 규정 중 하나입니다. 이 규정은 EU 내 모든 회원국 및 EU 시민의 데이터를 처리하는 모든 기업에 적용되며, 강력한 개인 정보 보호와 데이터 이전의 투명성을 요구합니다.
  2. 법적 문제와 이슈
    1. 개인정보 보호:
      • AI 시스템이 사용자 데이터를 처리할 때, 개인정보 보호법을 준수해야 합니다. 예를 들어, AI가 데이터를 수집하고 저장할 때 사용자 동의를 받는 절차가 필요합니다​ (Legal Tech Solutions).
    2. 윤리적 문제:
      • AI 비서가 생성한 데이터가 부정확하거나 편향될 수 있습니다. 이는 잘못된 정보 제공으로 이어질 수 있으며, 사용자가 이에 따라 잘못된 결정을 내릴 위험이 있습니다.
    3. 책임 할당:
      • AI가 자율적으로 결정을 내릴 때 발생하는 문제에 대한 책임을 누구에게 할당할지 명확하지 않은 경우가 많습니다. 예를 들어, AI가 잘못된 법률 자문을 제공하여 피해가 발생하면 그 책임이 누구에게 있는지 불분명할 수 있습니다.

 


7.The Future of Conversational UI

대화형 사용자 인터페이스(CUI)의 미래에 대해 살펴보면, 챗봇과 음성 어시스턴트 시장은 사용 빈도와 기술 복잡성 측면에서 성장할 것으로 예상됩니다. 향후 몇 년간의 전망을 보면 점점 더 많은 사용자와 기업이 이러한 기술을 도입할 것이며, 이는 더욱 고급 음성 기술의 기회를 열어줄 것입니다.

보다 구체적인 예측으로는, 챗봇 시장은 2016년 이후 지속적인 높은 성장을 보일 것으로 추정됩니다. 이러한 성장은 모바일 기기의 증가된 사용, 클라우드 인프라 및 관련 기술의 채택이 주요 원인으로 꼽힙니다.

음성 어시스턴트의 미래에 대해서도 전 세계적인 관심이 증가할 것으로 예상됩니다. 사물 인터넷에서의 음성 제어, 스마트 홈 기술의 채택, 모바일 검색 쿼리에 대한 음성 검색, 자가 서비스 애플리케이션에 대한 수요가 이러한 발전의 주요 동력이 될 수 있습니다. 또한, 음성 기술에 대한 인식이 성장하고 있으며, 구식 커뮤니케이션 방법보다 음성을 선택하는 사람들의 수도 증가하고 있습니다.

자연스럽게, 소비 증가는 더 고급 기술의 필요성과 짝을 이룹니다. 현재 사용자는 CUI와 상호작용할 때 비교적 정확해야 하며 요청을 모호하지 않게 해야 합니다. 그러나 미래의 UI는 기술이 사용자 요구에 맞춰 적응하도록 가르치는 원칙으로 나아갈 수 있습니다. 이는 사용자가 학습 곡선 없이 자신에게 가장 적합한 방식으로 애플리케이션을 운영할 수 있음을 의미합니다.

CUI 플랫폼이 사용자의 요청을 모호하게 찾고 실행 가능한 매개변수로 변환할 수 없는 경우, 후속 질문을 할 것입니다. 이는 대화 기술의 범위를 크게 확장시켜 다양한 채널과 기업에 더 적응할 수 있게 만들 것입니다. CUI를 위한 노력이 적어지면 사용자에게 더 큰 편의성을 제공하게 되며, 이는 아마도 궁극적인 목표일 것입니다.

대화 데이터의 재사용은 고객 및 사용자의 마음을 이해하는 데 도움이 될 것입니다. 그 정보는 닫힌 루프 머신 러닝 환경의 일부로 대화 시스템을 개선하는 데 사용될 수 있습니다.

 

AI Integration

Integrating AI capabilities enhances the intelligence and responsiveness of CUI & VUI systems. AI-driven solutions enable more personalized and context-aware interactions.

IoT Integration

Connecting CUI & VUI with IoT devices expands the scope of voice-controlled interactions. Leveraging IoT integration opens up new possibilities for seamless smart home and connected device experiences.


8.Checklist for Making a Conversational UI for your Applications

대화형 사용자 인터페이스(CUI)를 웹사이트, 애플리케이션, 마케팅 전략에 추가하는 이유는 다양합니다. 예를 들어 Alan과 같은 음성 AI 플랫폼을 사용하면 기존 애플리케이션 또는 서비스에 CUI를 쉽게 추가할 수 있습니다. 그러나 CUI 설치가 서비스의 기능을 개선할 것이라 확신한다 하더라도, 사전 계획을 세우고 몇 가지 지침을 따라야 합니다.


디지털 시대가 발전함에 따라 인간과 컴퓨터 간의 상호작용 방식도 급격히 변화하고 있다. 오늘날, 대화형 사용자 인터페이스(CUI)는 단순한 명령어 입력을 넘어, 자연스러운 대화를 통해 사용자 경험을 향상시키는 핵심 도구로 자리 잡고 있다. CUI는 음성 비서, 챗봇, 그리고 다양한 고객 서비스 애플리케이션에 통합되어, 사용자에게 보다 직관적이고 효율적인 상호작용을 제공하고 있다.

하지만, 성공적인 CUI를 설계하기 위해서는 기술적 요소뿐만 아니라, 사용자 중심의 접근과 세심한 계획이 필수적이다. 사용자 요구를 이해하고, 대화의 맥락을 유지하며, 사용자의 피드백에 즉각적으로 대응할 수 있는 시스템을 구축해야만, 진정으로 사용자에게 가치를 제공할 수 있다.

이 체크리스트는 CUI 설계 과정에서 고려해야 할 주요 사항들을 체계적으로 정리한 것이다. 목적 설정에서부터 사용자 연구, 플랫폼 선택, 그리고 테스트와 개선에 이르기까지, 모든 단계에서 필요한 가이드라인을 제공한다. 이 체크리스트를 통해, 디자이너와 개발자들은 사용자 중심의, 신뢰할 수 있는 CUI를 설계하는 데 필요한 모든 요소를 점검할 수 있을 것이다.

CUI는 미래의 사용자 경험을 선도하는 기술이다. 이 체크리스트를 통해, 더욱 효율적이고 인간적인 디지털 상호작용을 설계하는 첫걸음을 내딛길 바란다.

다음은 적절한 구성으로 대화형 인터페이스를 도입하는 단계입니다:

1. CUI의 목표 정의

  • 유용한 도구를 구축하는 데 있어 핵심 요소는 그것이 해결하고자 하는 사용자 문제를 결정하는 것입니다.
  • 예시: 온라인 쇼핑몰에서 CUI를 도입하여 고객 지원 효율성을 높이려고 합니다. 이 경우, 목표는 고객 문의에 대한 응답 시간을 단축하고, 주문 처리와 관련된 질문에 자동으로 답변할 수 있는 시스템을 구축하는 것입니다.

2. 대화 흐름 설계

  • 봇과의 커뮤니케이션 방식을 고려하세요. 인사말, 사용자의 필요를 파악하는 방법, 제안할 옵션, 가능한 대화 결과 등을 생각해 보세요.
  • 예시: 사용자가 "반품 방법이 궁금합니다"라고 질문할 때, CUI는 "구매하신 제품을 반품하시려는 이유가 무엇인가요?", "반품 주소를 안내해 드리겠습니다" 등과 같은 후속 질문으로 대화를 이어갈 수 있어야 합니다.

3. 대체 표현 제공

  • 사용자가 요청을 다양한 방식으로 표현할 수 있으며 때로는 속어를 사용하기도 합니다. 따라서 봇이 의도를 인식할 수 있도록 다양한 유형의 단어를 포함시켜야 합니다.
  • 예시: 사용자가 "환불 받고 싶어요"와 같이 말할 때, CUI는 "환불", "돈 돌려받기", "반품" 등과 같은 관련 단어나 표현을 인식하여 동일한 응답을 제공할 수 있도록 준비되어야 합니다.

4. 특정 동작을 유발하는 문장 설정

  • 사용자가 봇이 상황에 적절하게 반응하도록 하기 위해 무엇을 말해야 할지 결정하세요. 이 시점에서 단어 토큰화를 사용하여 의미를 할당하는 것이 유용합니다.
  • 예시: 사용자가 "날씨 알려줘"라고 말했을 때, CUI는 해당 위치의 날씨 정보를 제공하기 위해 외부 API를 호출할 수 있어야 합니다. 이를 위해서는 사용자의 위치 데이터 접근 권한 요청이 필요할 수 있습니다.

5. 시각적 및 텍스트 단서 및 힌트 추가

  • 사용자가 길을 잃은 것 같을 때 다른 매체(음성 이외의)를 통해 안내하세요. 이렇게 하면 서비스의 발견 가능성을 높일 수 있습니다.
  • 예시: 사용자가 메뉴 선택에 어려움을 겪을 때, 화면에 "여기를 클릭하여 전체 메뉴 보기"와 같은 가이드 텍스트나 버튼을 제공하여 사용자가 쉽게 다음 단계로 넘어갈 수 있도록 도와줍니다.

6. 대화 막다른 길 방지

  • 봇의 오해는 "죄송합니다, 이해하지 못했습니다"와 같은 폴백 메시지를 유발해야 합니다. 근본적으로, 사용자가 피드백 없이 대기하는 상황을 만들지 마세요.
  • 예시: 사용자가 "XYZ"라고 말했을 때 CUI가 이해하지 못하는 경우, "죄송합니다, 이해하지 못했습니다. 다시 한 번 말씀해 주시겠어요?"와 같은 폴백 메시지를 제공하여 대화가 중단되지 않도록 합니다.

전반적으로, CUI가 사용자를 어떻게 지원할 수 있는지 연구하면, CUI 유형을 결정하고 애플리케이션을 통한 사용자의 여정을 계획하는 데 도움이 됩니다. 이는 사용자의 필요를 효과적으로 충족시키고,

제품이나 서비스에 대한 충성도를 유지시키며, 그들의 일상적인 작업을 간소화하는 데 도움이 될 것입니다.

또한, 봇이나 어시스턴트에 개성을 부여하여 자연스럽고 진정성 있게 만드세요. 그것은 허구의 캐릭터일 수도 있고, 현재 인간을 모방하려고 시도하는 것일 수도 있습니다. 귀하의 특정 사용자에게 적합한 인상을 줄 수 있는 개성을 만드세요.

참고 : 풀백 메세시

폴백 메시지는 사용자의 입력을 이해하지 못했을 때 제공되는 응답으로, 사용자와의 대화를 원활하게 이어갈 수 있도록 돕습니다. 좋은 폴백 메시지는 명확하고, 도움이 되며, 때로는 유머를 포함해 사용자의 실망을 완화할 수 있어야 합니다. 여기 몇 가지 좋은 사용 예를 제공합니다:

1. 명확하고 도움이 되는 폴백 메시지

  • "죄송합니다, 이해하지 못했습니다. '예약 변경', '주문 확인' 또는 '도움말 받기' 중에서 선택해 주시겠어요?"
    • 이 메시지는 사용자에게 구체적인 옵션을 제공하여 다음 단계로 안내합니다.

2. 문제 해결을 돕는 폴백 메시지

  • "제가 정확히 이해하지 못했네요. 더 간단한 키워드나 짧은 문장으로 다시 말씀해 주실 수 있나요?"
    • 사용자가 더 명확하게 질문을 재구성할 수 있도록 요청함으로써 문제 해결을 촉진합니다.

3. 유머를 포함한 폴백 메시지

  • "인간 언어는 여전히 어렵네요! 다시 한 번 말씀해 주시겠어요?"
    • 유머를 사용하여 상황을 가볍게 만들고, 사용자의 실망감을 완화할 수 있습니다.

4. 추가 정보를 요청하는 폴백 메시지

  • "그 부분은 잘 모르겠어요. 조금 더 구체적인 정보를 제공해 주실 수 있나요?"
    • 사용자로부터 더 많은 정보를 요청하여 정확한 응답을 준비할 수 있도록 합니다.

이러한 예제들은 사용자가 불편을 느끼지 않고 대화를 지속할 수 있도록 하는 동시에, CUI가 사용자의 요구를 더 잘 이해하고 적절히 응답할 수 있는 기회를 제공합니다. 폴백 메시지는 사용자와의 상호 작용 중 중요한 부분을 차지하며, 효과적인 커뮤니케이션과 고객 만족도 향상에 기여할 수 있습니다.


Keywords

대화형 사용자 인터페이스 (CUI), 자연어 이해 (NLU),자연어 처리 (NLP) 음성 어시스턴트 챗봇  음성 인식  사전/샘플 컨텍스트 관리  비즈니스 로직 접근성 통합 플랫폼 개인화 자동화 API 호출 토큰화  폴백 메시지 데이터 보호 및 규제 준수

 


과제 

 

챗봇 설계  : 간단한 시나리오를 기반으로 챗봇의 대화 흐름도 작성 해 보자.

  • 예: "커피 주문", "날씨 조회", "간단한 FAQ" ,"영화 추천 챗봇", "일정 관리 챗봇" 등

챗봇 구현

  • 선택한 시나리오를 바탕으로 실제 챗봇 만들기 (예: Dialogflow, Microsoft Bot Framework 등을 사용)
  • 기본 대화 흐름 구현: 인사말, 주요 기능 실행, 폴백 메시지 설정
  • 사용자가 자주 묻는 질문에 답변할 수 있는 FAQ 챗봇 구현

 

728x90
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
반응형