감정인식
M_000101.wav
감정인식 방식
- 음성으로부터 다양한 특징을 추출합니다.
- 스펙트럼 분석을 기본으로 하고 있고, 발화속도, 말소리 크기, 주파수, 명료도, 떨림 등 다양한 음성 특징으로터 감정인식을 할 수 있는 Vocal biomarker를 추출합니다.
- 훈련된 AI 모델을 통해 감정인식으로 하고 있고, Vocal biomarker 분석을 통해 감정 분석에 대한 이해를 높일 수 있습니다.
감정인식 결과 및 음성 주요 특징

감정 상태 분석
- Pitch(주파수, f0):
f0_mean
이 155Hz로 비교적 중간 주파수대를 나타냅니다. 일반적으로 피치가 높으면 흥분 또는 긍정적인 감정, 낮으면 슬픔이나 우울함을 나타낼 수 있습니다.
- Loudness(소리 크기):
22.78dB
로 다소 조용한 톤을 유지하고 있습니다.
- *Shimmer(목소리 불안정도)**와 HNR(소리 대 잡음 비율):
localShimmer
가 0.088로 다소 불안정한 음성의 특성을 나타냅니다. 일반적으로 목소리의 불안정도와 잡음 비율이 높으면 우울감이나 불안감이 있을 가능성이 있습니다.
- 주어진 **평균값(1.529 kHz)**과 **표준편차(1.291 kHz)**는 상대적으로 높은 수준으로, 스펙트럼이 고주파수에 분포되어 있고 변동이 큰 편입니다.
- 이는 차분한 상태보다는 기쁨에 가까울 가능성이 있습니다. 높은 표준편차는 음성 신호가 다소 격렬하게 변동함을 나타내고 있습니다.
Audion에서 감정인식 데모