본문 바로가기
가이드/Python

[Python] STT SpeechRecognition 한국어 인식 가이드

by 루엔_vivid 2023. 4. 4.

STT란 Speech-to-Text의 약자로 대화를 글로 변환하는 과정을 말한다.

쉽게 생각해서 빅스비나 시리가 우리가 하는 말을 글로 바꾸는걸 생각하면 되며

 음성 인식 소프트웨어나 음성 비서 등 다양한 분야에서 사용된다.

 

Python에서 STT를 사용할 수 있게 하는 라이브러리로 SpeechRecognition가 있어

해당 라이브러리로 한국어를 인식하는 방법에 대해 소개할 예정이다.

 

먼저 마이크 사용을 위한 PyAudio 라이브러리와

STT를 위한 SpeechRecognition 라이브러리를 설치해 준다.

 

공식 api 문서를 참고하여 작성한 한국어 인식 예제는 다음과 같다

https://pythonspot.com/speech-recognition-using-google-speech-api/

 

speech recognition api

speech recognition api Python hosting: Host, run, and code Python in the cloud! Google has a great Speech Recognition API. This API converts spoken text (microphone) into written text (Python strings), briefly Speech to Text. You can simply speak in a micr

pythonspot.com

import speech_recognition as sr

r = sr.Recognizer()
with sr.Microphone() as source:
    print("Say something!")
    audio = r.listen(source)

print("You said: " + r.recognize_google(audio, language='ko-KR'))

위와 같이 작성 후 실행을 하게 되면

 

생각보다 준수한 인식 성능을 보이며

문제없이 잘 작동하는 모습을 확인할 수 있다.

반응형

댓글