Audio Course documentation

실습 과제

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

실습 과제

이 과제는 평가의 대상은 아닙니다. 단지 나머지 코스를 위해 여러분이 라이브러리와 툴에 익숙해지는 것을 목적으로 합니다. 구글 코랩, 🤗 Datasets, librosa, 🤗 Transformers에 이미 익숙하시다면 과제를 건너뛰셔도 좋습니다.

  1. 구글 코랩 노트북을 생성해보세요.
  2. 🤗 Datasets을 이용해 여러분이 원하시는 언어의 facebook/voxpopuli 데이터셋 학습 데이터를 스트리밍 모드로 불러와보세요.
  3. 데이터셋의 train 부분에서 세번째 데이터를 불러와 보세요. 이 데이터의 feature를 고려할 때, 어떤 오디오 작업에 이 데이터셋을 쓸 수 있으실 것 같나요?
  4. 이 데이터의 파형과 스펙트로그램을 그려보세요.
  5. 🤗 허브에서 사전학습된 모델을 둘러보고 여러분이 고른 언어의 자동 음성 인식 모델을 선택해보세요. 그에 맞는 파이프라인을 인스턴스화 하시고 음성 데이터를 텍스트로 바꿔보세요.
  6. 여러분이 파이프라인에서 얻은 출력 텍스트와 실제 데이터의 텍스트를 비교해보세요.

과제를 푸는데 어려움이 있다면 풀이 예시를 살펴보는 것도 좋습니다. 뭔가 흥미로운 것을 발견하셨나요? 멋진 모델을 찾으셨나요? 아름다운 스펙트로그램을 얻으셨나요? 트위터에 여러분의 작업 결과와 발견들을 공유해보세요!

다음 챕터에선 여러 오디오 트랜스포머의 구조에 대해 알아보고 여러분만의 모델을 학습해봅시다!

< > Update on GitHub