Facebook AI 다국어 음성 AI 개발을 위한 오픈소스 데이터 셋 공개

Archive/News

Tae_bbang 2021. 2. 28. 21:25

[AI 리뷰] 페이스북 AI, 다국어 음성 AI 개발 위한 '8개 언어, 5만시간 오디오 세트' 오픈 소스로 공

페이스북 AI가 자동 음성인식(Automatic Speech Recognition. 이하, ASR) 연구 선진화를 위해 설계된 대규모 데이터 세트인 다국어 리브리스피치(LibriSpeech. 이하, MLS)를 오픈 소스로 최근 공개했다. MLS는 음.

www.aitimes.kr

Facebook이 자동 음성인식(Automatic Speech Recognition; ASR) 연구 선진화를 위해 설계된 대규모 데이터 셋인 다국어 리브리스피치(LibriSpeech; MLS)를 오픈 소스로 최근 공개함.

MLS Corpus는 8개 언어로 50,000시간 이상의 오디오 세트를 제공함.
제공된 언어: 영어, 독일어, 네덜란드어, 프랑스어, 스페인어, 이탈리아어, 포르투갈어, 폴란드어
ASR 시스템을 비교하는데 도움이 되는 criterion과 함께 train/validation 데이터 셋과 baseline language model을 제공함.
페이스북 AI의 오픈소스: github.com/facebookresearch/wav2letter/?fbclid=IwAR2sMFKqMe8Y2kOm09Dg8t7njGXBPstmNoqdMLjuOuKT5Io5e7Ipe6pvi10
LibriSpeech에 있는 교육데이터보다 MLS의 영어 데이터 셋의 size는 약 47배 더 큼.

facebookresearch/wav2letter

Facebook AI Research's Automatic Speech Recognition Toolkit - facebookresearch/wav2letter

github.com