# 대화 AI 봇이 이제 음성에 응답할 수 있습니다

## 대화 AI 봇이 이제 음성에 응답할 수 있습니다

고객에게 타이핑 대신 말할 수 있는 선택권을 제공하세요. Hyperclass의 대화 AI(Conversations AI)는 왓츠앱, 페이스북 메신저, 인스타그램, SMS/MMS에서 음성 메모와 오디오 파일을 이해합니다. 봇이 음성을 텍스트로 변환하고 기존 학습과 설정을 활용해 지능적으로 응답하여 대화를 빠르고 자연스럽게 유지합니다. 이 문서에서는 지원되는 오디오 형식, 채널 호환성, 설정 방법, 문제 해결에 대해 다룹니다.

***

목차

* [대화 AI의 음성 응답이란?](#대화-ai의-음성-응답이란)
* [음성 응답의 주요 장점](#음성-응답의-주요-장점)
* [지원되는 오디오 형식](#지원되는-오디오-형식)
* [채널 호환성](#채널-호환성)
* [음성 응답 설정 방법](#음성-응답-설정-방법)
* [동작 방식 및 제한사항](#동작-방식-및-제한사항)
* [자주 묻는 질문](#자주-묻는-질문)

***

## **대화 AI의 음성 응답이란?**

음성 응답(Audio Response)은 Hyperclass 대화 AI 봇이 고객의 음성을 "들을" 수 있게 해주는 기능입니다. 연락처가 음성 메모나 오디오 파일을 보내면, Hyperclass가 음성을 텍스트로 변환하여 봇에 전달하고, 상황에 맞는 지능적인 답변을 반환하여 고객이 타이핑 없이 자연스럽게 대화할 수 있도록 합니다.

대화 AI는 이제 인기 있는 메시징 채널에서 수신 음성을 지원합니다. 변환은 백그라운드에서 이루어지며, 봇은 기존 봇 설정(학습, 프롬프트, 응답 모드, 타이밍)을 따라 일관된 결과를 제공합니다.

### **음성 응답의 주요 장점**

이러한 장점들은 고객 경험과 운영 효율성에 초점을 맞추며, 음성 입력을 봇의 기존 작동 방식과 직접 연결합니다.

* **자연스러운 대화**: 연락처가 타이핑 대신 말하여 더 인간적인 경험을 제공합니다.
* **빠른 문제 해결**: 자동 변환이 학습된 봇에 정보를 제공하여 정확한 답변을 빠르게 작성합니다.
* **다중 오디오 처리**: 고객이 하나 또는 여러 개의 오디오 파일을 보낼 수 있으며, 봇이 이를 단일 상호작용으로 처리합니다.
* **옴니채널 도달**: 왓츠앱, 페이스북 메신저, 인스타그램, SMS/MMS에서 작동하여 하나의 일관된 워크플로우를 제공합니다.
* **일관된 관리**: 음성 답변은 텍스트와 마찬가지로 대기 시간(Wait Time) 및 메시지 제한 설정을 준수합니다.

### **지원되는 오디오 형식**

허용되는 형식이 봇이 안정적으로 변환할 수 있는 파일을 결정합니다.

| 카테고리                   | 지원 항목                                      | 참고사항                                                    |
| ---------------------- | ------------------------------------------ | ------------------------------------------------------- |
| **음성 메모 (플랫폼 네이티브)**   | 왓츠앱 음성 메모, 페이스북 음성 메모, 인스타그램 음성 메모         | 각 앱의 마이크 버튼을 사용하여 녹음; Hyperclass로 전달되는 오디오 객체로 봇이 변환 가능 |
| **파일 형식 (업로드/첨부파일)**   | OGG, MP3, **MP4 (오디오 전용)**, AAC, M4A, MPEG | 파일이 오디오 전용인지 확인하세요. 비디오 MP4는 오디오 입력으로 지원되지 않습니다.        |
| **한 번의 상호작용에서 다중 오디오** | **지원됨** (여러 파일)                            | 짧은 시간 내에 보낸 여러 오디오 파일은 단일 상호작용으로 처리됩니다.                 |

### 채널 호환성

음성 응답은 대화 AI가 이미 작동하는 채널에 연결됩니다. 음성 응답을 기대하기 전에 각 채널이 Hyperclass에서 올바르게 연결되어 있는지 확인하세요.

* 페이스북 메신저
* 인스타그램 다이렉트 메시지
* 왓츠앱
* SMS (MMS)

### **음성 응답 설정 방법**

적절한 설정을 통해 음성 메시지가 변환되고 적절한 채널에서 올바른 봇에 의해 처리되도록 합니다.

* 하위 계정(Sub-Account)에서 AI Agents → Conversation AI → Agent List로 이동한 다음, 구성하려는 봇 옆의 세 점(⋮)을 클릭하고 Edit을 선택하여 봇 설정을 엽니다.

![설정 메뉴](https://s3.amazonaws.com/cdn.freshdesk.com/data/helpdesk/attachments/production/155055792623/original/GeVER88sjur3v_MG4l6pf89rG8t4ppbmJg.png?1760261682)

* **음성 응답 활성화**: "Also allow this bot to respond to: Voice Notes." 토글을 켜고 변경사항을 저장합니다.

![음성 응답 활성화](https://s3.amazonaws.com/cdn.freshdesk.com/data/helpdesk/attachments/production/155055792681/original/zbYz6Ja-1saNdWYH81ulILXZAEYeeNanhA.png?1760261903)

* **연결된 채널에서 테스트**: 왓츠앱이나 소셜 채널에서 음성 메모를 보내 답변이 음성을 참조하는지 확인합니다.

![테스트 화면 1](https://s3.amazonaws.com/cdn.freshdesk.com/data/helpdesk/attachments/production/155055792764/original/sDRqxAQ5Z0H9_YXyMl0InCMNe_bIzTAEKg.png?1760262151)

![테스트 화면 2](https://s3.amazonaws.com/cdn.freshdesk.com/data/helpdesk/attachments/production/155055792792/original/mx4b4af8F44RlmUvmGvVCE0wP2TaJ_KAUw.png?1760262250)

### 동작 방식 및 제한사항

타이밍과 메시지 처리를 이해하면 음성 우선 고객을 위한 올바른 경험을 설계하는 데 도움이 됩니다.

* **대기 시간 집계**: 봇은 설정된 응답 전 대기 시간(Wait Time Before Responding)을 기다려 여러 수신 메시지(음성 + 텍스트 포함)를 수집하고 하나의 통합된 답변을 보냅니다.
* **메시지 제한**: 봇은 최대 메시지 제한(Maximum Message Limit)을 따릅니다. 제한에 도달하면 표준 플로우에 따라 재설정될 때까지 봇이 일시정지됩니다.
* **대화 기록 및 투명성**: 대화(Conversations)의 AI 응답 정보 사이드바에서 프롬프트, 출처, 응답 정보를 포함한 AI 세부사항을 검토할 수 있습니다.
* **채널 정책**: Meta 채널에서의 전송은 정책 윈도우(예: 메신저/인스타그램의 24시간 윈도우)를 준수해야 합니다. 이에 따라 플로우를 계획하세요.

***

### 자주 묻는 질문

**Q: 음성 응답에 추가 비용이 발생하나요?** 사용량은 표준 대화 AI(Conversations AI) 사용량과 채널의 메시징 요금(예: SMS/MMS, 왓츠앱)으로 청구됩니다. 에이전시는 대화 AI 사용량에 대한 재청구를 구성할 수 있습니다. 가격 및 재청구와 SMS/MMS 비용을 참조하세요. 왓츠앱은 별도 가격 정책이 있습니다.

**Q: 봇이 음성 또는 텍스트로 답변하나요?** 봇은 최대 호환성을 위해 표준 채널 메시지를 보냅니다. 대부분의 답변은 텍스트이므로 이에 따라 플로우를 설계하세요.

**Q: 특정 채널에서만 음성 처리를 제한할 수 있나요?** 봇 설정(Bot Settings)에서 봇이 사용할 채널만 할당하세요. 봇은 할당된 채널에서만 듣기/응답합니다.

**Q: 여러 오디오 파일은 어떻게 처리되나요?** 짧은 시간 내에 여러 오디오는 대기 시간(Wait Time) 윈도우 동안 변환되고 처리되어 봇이 하나의 상황 인식 답변을 작성할 수 있습니다.

**Q: 봇이 "본" 것과 응답한 이유를 어디서 검토할 수 있나요?** 대화에서 AI 응답 정보 사이드바를 열어 응답, 프롬프트, 학습 출처를 검토하세요.

***

*원문 최종 수정: Thu, 11 Dec, 2025 at 4:11 PM* *Hyperclass 사용 가이드 — hyperclass.ai*


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://hyperclass.gitbook.io/hyperclass-docs/ai-ai-employee/conversations-ai-bots-can-now-respond-to-audio.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.