본문으로 바로가기

파일의 IT 블로그

  1. Home
  2. 프로그래밍/C#
  3. [C#] 음성인식 검색기 만들기 0편. 구상

[C#] 음성인식 검색기 만들기 0편. 구상

· 댓글개 · KRFile

<해당 프로젝트는 완성까지 완료했으나 실용성 문제 및 소스코드 분실로 잠정 폐쇠합니다.>

더보기

안녕하세요 파일입니다. 오랜만에 C# 프로그래밍을 할 기회가 생겼습니다. 

아이디어가 들어왔다고 해도 좋은데요 ^^

 

바로 음성인식 검색기입니다. 저희 아버지가 컴퓨터 세대가 아니셔서 독수리 타자를 하시는데 신문 검색이나 인터넷 검색 등을 할 때 타자가 느려서 너무 고생이라고 하십니다.

 

말로 하는게 타자 입력보다 빠를거 같다며

음성인식으로 검색하면 좋을거 같다는 말을 듣고 바로 제작을 시행하였습니다.

 

우선 프로그램의 단계는 다음과 같이 구성했습니다.

1. 음성인식을 한다 (라이브러리 이용)

2. 음성인식한 값을 저장한다

3. Selenium 을 이용하여 웹을 제어하거나 인터넷 창을 연다

4. 중간중간 작업은 무료 TTS 엔진으로 읽어준다.

 

일단 들어보면 극히 간단해 보입니다. 저도 쉽게 될 줄 알았거든요.

근데 직접 해보니 1번부터 막힐줄은 상상도 못 했습니다.

 

 

 

우선 음성인식을 하기 위한 라이브러리를 생각해보던 중 제일 먼저 떠오른 게 구글 어시스턴트였습니다.

솔직히 잘 사용은 안 하지만 음성인식률이 꽤나 괜찮습니다.

PC에는 아쉽게도 구글 어시스턴트 같은 게 따로 없죠. 솔직히 구현하기도 애매하고 큰 쓸모가 없어서 그런 거 같습니다.

 

구글은 자신들이 만든 기술들을 웬만해서 사용할 수 있게끔 제공하므로 음성인식 기술을 찾아보았습니다.

(마이크로 소프트에서 제공하는 간편한 기능도 있으나 제가 써보질 않아서 제외했습니다)

 

 

 

찾아보니 역시나 제공을 하네요 ~

우리가 흔히 말하는 Text를 읽어주는 Text to Speech(TTS)의 역과정인 Speech to Text입니다. 

확인해보니 60분 무료에 그 이상 사용 시 초당 몇 달러씩 크레디트 형식으로 지불하는 형식인 거 같습니다.

솔직히 음성 파일을 다룰 것도 아니고 짧은 단어로 이루어진 검색 기능을 구현할 거기 때문에 큰 문제는 없을 거 같고

몇 달 동안 테스트 겸 Credit 300달러(ㅎㄷㄷ) 이상을 제공한다고 합니다.

 

이렇게 되면 테스트에 문제는 없겠군요 ^^

 

서론은 여기까지 하고 다음 편에선 C#으로 구글 클라우드 Speech to Text의 예제 실행을 한번 해보겠습니다.

감사합니다 ^^

 

 

 

SNS 공유하기
💬 댓글 개
이모티콘창 닫기
울음
안녕
감사해요
당황
피폐

이모티콘을 클릭하면 댓글창에 입력됩니다.