Archive/News
Facebook AI 다국어 음성 AI 개발을 위한 오픈소스 데이터 셋 공개
Tae_bbang
2021. 2. 28. 21:25
출처: www.aitimes.kr/news/articleView.html?idxno=20198
[AI 리뷰] 페이스북 AI, 다국어 음성 AI 개발 위한 '8개 언어, 5만시간 오디오 세트' 오픈 소스로 공
페이스북 AI가 자동 음성인식(Automatic Speech Recognition. 이하, ASR) 연구 선진화를 위해 설계된 대규모 데이터 세트인 다국어 리브리스피치(LibriSpeech. 이하, MLS)를 오픈 소스로 최근 공개했다. MLS는 음.
www.aitimes.kr
- Facebook이 자동 음성인식(Automatic Speech Recognition; ASR) 연구 선진화를 위해 설계된 대규모 데이터 셋인 다국어 리브리스피치(LibriSpeech; MLS)를 오픈 소스로 최근 공개함.

MLS
- MLS Corpus는 8개 언어로 50,000시간 이상의 오디오 세트를 제공함.
- 제공된 언어: 영어, 독일어, 네덜란드어, 프랑스어, 스페인어, 이탈리아어, 포르투갈어, 폴란드어
- ASR 시스템을 비교하는데 도움이 되는 criterion과 함께 train/validation 데이터 셋과 baseline language model을 제공함.
- 페이스북 AI의 오픈소스: github.com/facebookresearch/wav2letter/?fbclid=IwAR2sMFKqMe8Y2kOm09Dg8t7njGXBPstmNoqdMLjuOuKT5Io5e7Ipe6pvi10
- LibriSpeech에 있는 교육데이터보다 MLS의 영어 데이터 셋의 size는 약 47배 더 큼.
facebookresearch/wav2letter
Facebook AI Research's Automatic Speech Recognition Toolkit - facebookresearch/wav2letter
github.com
