알 수 없는 영역

Reference: http://kaldi-asr.org/doc/kaldi_for_dummies.html


해당 포스팅은 내 만족을 위해 작성되었다.

상기 페이지에 있는 글을 읽으며(?) 내 이해를 돕기 위해 작성되었다.

구글 translate 초벌 번역 본 확인 후 필요시 일부 수정 예정


Kaldi for Dummies tutorial - Environment


Environment

Rule number 1 - use Linux. Although it is possible to use Kaldi on Windows, most people I find trustworthy convinced me that Linux will do the job with the less amount of problems. I have chosen Ubuntu 14.10. This was (in 2014/15) a rich and stable Linux representation which I honestly recommend. When you finally have your Linux running properly, please open a terminal and install some necessary stuff (if you do not already have it): 규칙 번호 1 - Linux를 사용합니다. Windows에서 Kaldi를 사용하는 것이 가능하지만 대부분의 사람들은 Linux가 문제가 적은 작업을 수행 할 것이라고 확신했습니다. 나는 우분투 14.10을 선택했다. 이것은 (2014/15 년에) 내가 정직하게 권장하는 풍부하고 안정적인 Linux 표현이었습니다. 마침내 리눅스가 정상적으로 돌아 왔을 때, 터미널을 열고 필요한 것들을 설치하십시오 (아직 가지고 있지 않다면) :

→ 일단 리눅스부터 설치해야겠네...   요기 포스팅 따라해볼 듯. http://recipes4dev.tistory.com/112



(has to be installed)

atlas – automation and optimization of calculations in the field of linear algebra,

autoconf – automatic software compilation on different operating systems,

automake – creating portable Makefile files,

git – distributed revision control system,

libtool – creating static and dynamic libraries,

svn – revision control system (Subversion), necessary for Kaldi download and installation,

wget – data transfer using HTTP, HTTPS and FTP protocols,

zlib – data compression,


아틀라스 - 선형 대수학 분야의 계산 자동화 및 최적화,

autoconf - 다른 운영 체제에서의 자동 소프트웨어 컴파일,

automake - 휴대용 Makefile 파일 만들기,

자식 - 분산 개정 관리 시스템,

libtool - 정적 및 동적 라이브러리 생성,

svn - Kaldi 다운로드 및 설치에 필요한 개정 제어 시스템 (Subversion)

wget - HTTP, HTTPS 및 FTP 프로토콜을 사용한 데이터 전송,

zlib - 데이터 압축,

→ 꼭 설치하라네...


(probably has to be installed)

awk – programming language, used for searching and processing patterns in files and data streams,

bash – Unix shell and script programming language,

grep – command-line utility for searching plain-text data sets for lines matching a regular expression,

make – automatically builds executable programs and libraries from source code,

perl – dynamic programming language, perfect for text files processing.


awk - 파일 및 데이터 스트림에서 패턴을 검색하고 처리하는 데 사용되는 프로그래밍 언어,

bash - 유닉스 쉘 및 스크립트 프로그래밍 언어,

grep - 일반 표현식과 일치하는 행에 대해 일반 텍스트 데이터 세트를 검색하는 명령 줄 유틸리티,

make - 소스 코드에서 실행 가능한 프로그램과 라이브러리를 자동으로 빌드하고,

Perl - 동적 프로그래밍 언어로 텍스트 파일 처리에 적합합니다.

→ 가급적 설치하라네...


Done. Operating system and all the necessary Linux tools are ready to go.

끝난. 운영 체제와 필요한 모든 Linux 도구를 사용할 준비가되었습니다.

→ 설치를 하고 다음 포스팅을 해야하나...




'Basic Concepts > Speech Recognition' 카테고리의 다른 글

Kaldi for Dummies tutorial - Introduction  (0) 2017.12.31
마르코프 연쇄 (Markov Chain)  (0) 2017.12.02

Reference: http://kaldi-asr.org/doc/kaldi_for_dummies.html


해당 포스팅은 내 만족을 위해 작성되었다.

상기 페이지에 있는 글을 읽으며(?) 내 이해를 돕기 위해 작성되었다.

구글 translate 초벌 번역 본 확인 후 필요시 일부 수정 예정


Kaldi for Dummies tutorial - Introduction


This is a step by step tutorial for absolute beginners on how to create a simple ASR (Automatic Speech Recognition) system in Kaldi toolkit using your own set of data.  이것은 자신의 데이터 세트를 사용하여 Kaldi 툴킷에서 간단한 ASR (자동 음성 인식) 시스템을 만드는 방법에 대한 절대적인 초보자를위한 단계별 자습서입니다. 

→ 즉, 이걸로 뭘 하려고 한다고 해도 내 데이터가 없으면 안된다는 말인데... Kaldi로 구축한다고 하더라도 데이터는 알아서 구해야겠네...


I really would have liked to read something like this when I was starting to deal with Kaldi. Kaldi를 다루기 시작했을 때 나는 이와 같은 것을 정말로 읽었을 것입니다. → 이런게 없어서 만들어주시다니... 감사할 따름입니다.


This is all based on my experience as an amateur in case of speech recognition subject and script programming as well. 아마추어로서의 나의 경험에 기초합니다. → 겸손하십니다.


If you have ever delved through Kaldi tutorial on the official project site and felt a little bit lost, well, my piece of art might be the choice for you. Kaldi 튜토리얼을 통해 공식 프로젝트 사이트를 탐구하고 조금 잃어버린 느낌이 든다면, 제 예술 작품이 당신을위한 선택일지도 모릅니다.

→ 구글님 번역이 이상함. 공홈 튜터리얼이 어려워 보이니 이것부터 읽을께요-


You will learn how to install Kaldi, how to make it work and how to run an ASR system using your own audio data. As an effect you will get your first speech decoding results. It was created by Wit Zielinski. Kaldi 설치 방법, 작동 방법 및 자체 오디오 데이터를 사용하여 ASR 시스템을 실행하는 방법을 배우게됩니다. 결과로 첫 번째 음성 해독 결과를 얻을 수 있습니다. 그것은 Wit Zielinski에 의해 만들어졌습니다.

→ 일단 설치부터 할 수 있었으면 좋겠습니다. 오디오 데이터는 나중에 어디서 구하겠죠 ㅠㅠ Wit Zielinski 감사합니다.


First of all - get to know what Kaldi actually is and why you should use it instead of something else. In my opinion Kaldi requires solid knowledge about speech recognition and ASR systems in general. 우선, 칼디가 실제로 무엇인지, 그리고 왜 다른 것 대신에 그것을 사용해야하는지 알게됩니다. Kaldi는 일반적으로 음성 인식 및 ASR 시스템에 대한 확실한 지식이 필요합니다.

→ 다행히 조금은 알고 있습니다.



It is also good to know the basics of script programming languages (bash, perl, python). C++ might be useful in the future (probably you will want to make some modifications in the source code).  또한 스크립트 프로그래밍 언어 (bash, perl, python)의 기초를 아는 것도 좋습니다. C ++은 앞으로 유용 할 것입니다 (아마도 소스 코드에서 약간의 수정을 원할 것입니다).

→ Basic skill로 충분할 지 모르겠지만... 일단 시작하시죠-




일단 시작하겠다는 다짐의 포스팅.

다행해(?) 메모가 필요해 보이는 내용은 없어보이네?

'Basic Concepts > Speech Recognition' 카테고리의 다른 글

Kaldi for Dummies tutorial - Environment  (0) 2017.12.31
마르코프 연쇄 (Markov Chain)  (0) 2017.12.02

Markov Chain.

내가 생각하기에 Markov chain의 
가장 중요한 포인트(?!)는 다음과 같다.

“The future is independent of past given present.”

미래의 상태를 결정하는 데 있어 '현재의 상태가 주어질 때'
과거의 상태에는 영향을 받지 않는다. (memorylessness)

간단한 그림으로 표현해보면 이렇게? 이렇게!



Markov Chain은 와 같은 식으로 
연속적으로 진행되는 확률변수이며, 

이 변수들의 범위, 즉 그 변수들이 가질 수 있는 조합을 
상태 공간(state space)이라 한다. 

이는 n번 째 단계에서 
마르코프 절차에 의한 변수 의 값이 된다.

위 그림을 수식으로 표현해보면 이런 것?! 

(discrete time markov chain)


                                                                       

제한점?

Markov Chain의 제한점은 
시스템의 정확한 실제 상태를 
완전히 관측할 수는 없다는 것.


해결책?

한 가지 방법은 우리가 보지 못하는 
감춰진 정보(hidden information)가 있다고 인정하는 것.

관측이 가능한 상태(observed state)와 
감춰진 상태(hidden state)로 시스템을 나눠놓고-

이것을 해결하기 위해 우리는 

감춰진 변수(hidden variables)로 

감춰진 정보를 모델링 하는 것?!



그게 바로 HMM?!의 접근법.
(Hidden Markov Model)