Skip to content

doma17/svm-fmcc-machine-learning

Repository files navigation

μΈμ²œλŒ€ν•™κ΅ 2023 κΈ°κ³„ν•™μŠ΅ 기말 ν”„λ‘œμ νŠΈ

μš”μ•½ : λ³Έ ν”„λ‘œμ νŠΈλŠ” μž‘μŒμ„ ν¬ν•¨ν•˜λŠ” 남녀 μŒμ„± 데이터λ₯Ό μ΄μš©ν•˜μ—¬ 효율적으둜 λ‚¨λ…€μ˜ μŒμ„±μ„ λΆ„λ₯˜ν•˜λŠ” λΆ„λ₯˜λͺ¨ 델을 μƒμ„±ν•˜λŠ” 것이닀.

  • FMCC 문제 / νŒ€λͺ… : κΈ°ν•˜ν•˜ν•˜ν•™
  • Dataset -> Train : λ…Έμ΄μ¦ˆ μžˆλŠ” μŒμ„± 데이터 10000개 / Test : λ…Έμ΄μ¦ˆ μžˆλŠ” μŒμ„± 데이터 900개
  • sklearn SVM λͺ¨λΈ
  • Test Dataset Accuracy : 95.56%
  • Evaluation Dataset Accuracy : 95.44%
  • μ΅œμ’… SVM/기타 λΆ„μ•Όμ—μ„œ 2λ“± λ³΄κ³ μ„œ λ‹€μš΄λ‘œλ“œ
  • λ‚˜λ¨Έμ§€λŠ” ν•œκΈ€ 파일둜 기제된 μžμ„Έν•œ λ³΄κ³ μ„œ λ‚΄μš© μ°Έμ‘° -> οΏ½λ‹€μš΄λ‘œλ“œ

1. μ½”λ“œ μ‹€ν–‰ μ„€λͺ…

(1) 경둜 μ„€μ •

μœ„μ™€ 같은 train data, test data의 ctl 파일 κ²½λ‘œμ™€ 디렉토리 경둜λ₯Ό μ§€μ •ν•΄μ€˜μ•Ό ν•©λ‹ˆλ‹€.

(2) νŠΉμ§• μΆ”μΆœ 및 μ „μ²˜λ¦¬

μ½”λ“œμ— μ ν˜€ μžˆλŠ” μ£Όμ„μ˜ μˆœμ„œλŒ€λ‘œ μ°¨λ‘€λ‘œ μ‹€ν–‰ν•˜λ©΄ λ©λ‹ˆλ‹€. 쀑간에 데이터 셋을 μ €μž₯ν•˜λŠ” 곡간을 λ§Œλ“€μ–΄μ„œ μ‹œκ°„μ΄ 였래 κ±Έλ¦¬λŠ” 과정을 반볡적으둜 μˆ˜ν–‰ν•˜μ§€ μ•Šμ•„λ„ λ˜λ„λ‘ λ§Œλ“€μ—ˆμŠ΅λ‹ˆλ‹€.

(3) λͺ¨λΈ ν…ŒμŠ€νŠΈ / 예츑

μ €μž₯된 λͺ¨λΈμ„ 경둜λ₯Ό μ„€μ •ν•˜μ—¬ λΆˆλŸ¬μ˜΅λ‹ˆλ‹€.

2. νŒ¨ν‚€μ§€, 라이브러리의 μ„€μΉ˜ 및 μ‚¬μš© 방법에 λŒ€ν•œ μ„€λͺ…

  • matplotlib: 이 λΌμ΄λΈŒλŸ¬λ¦¬λŠ” 데이터 μ‹œκ°ν™”λ₯Ό μœ„ν•œ λ„κ΅¬μž…λ‹ˆλ‹€. λ‹€μ–‘ν•œ κ·Έλž˜ν”„μ™€ 차트λ₯Ό μƒμ„±ν•˜κ³  데이터λ₯Ό μ‹œκ°μ μœΌλ‘œ λΆ„μ„ν•˜λŠ” 데 μ‚¬μš©λ©λ‹ˆλ‹€.

  • pandas: 이 λΌμ΄λΈŒλŸ¬λ¦¬λŠ” 데이터 μ‘°μž‘ 및 뢄석을 μœ„ν•œ 효과적인 λ„κ΅¬μž…λ‹ˆλ‹€. ν…Œμ΄λΈ” ν˜•νƒœμ˜ 데이터λ₯Ό λ‹€λ£¨λŠ” 데 μœ μš©ν•˜λ©°, 데이터 ν”„λ ˆμž„μ΄λΌλŠ” 자료 ꡬ쑰λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

  • wave: 이 λΌμ΄λΈŒλŸ¬λ¦¬λŠ” WAV νŒŒμΌμ„ 닀루기 μœ„ν•œ κΈ°λŠ₯을 μ œκ³΅ν•©λ‹ˆλ‹€. RAW νŒŒμΌμ„ WAV 파일둜 λ³€ν™˜ν•˜κΈ° μœ„ν•΄μ„œ μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€.

  • numpy: 이 λΌμ΄λΈŒλŸ¬λ¦¬λŠ” 과학적 계산을 μœ„ν•œ κ°•λ ₯ν•œ λ„κ΅¬μž…λ‹ˆλ‹€. 닀차원 λ°°μ—΄κ³Ό ν–‰λ ¬ 연산을 μ§€μ›ν•˜λ©°, 수치 계산과 κ΄€λ ¨λœ λ‹€μ–‘ν•œ ν•¨μˆ˜λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

  • noisereduce: λ‹€μ–‘ν•œ λ…Έμ΄μ¦ˆ κ°μ†Œ μ•Œκ³ λ¦¬μ¦˜μ„ μ‚¬μš©ν•˜μ—¬ μ˜€λ””μ˜€ μ‹ ν˜Έμ—μ„œ λ…Έμ΄μ¦ˆλ₯Ό μ œκ±°ν•˜κΈ° μœ„ν•œ λΌμ΄λΈŒλŸ¬λ¦¬μž…λ‹ˆλ‹€. β€˜Noise Gateβ€™μ˜ ν˜•νƒœμΈ β€˜Spectral Gating’ μ•Œκ³ λ¦¬μ¦˜μ„ μ‚¬μš©ν•©λ‹ˆλ‹€.

  • librosa: 이 λΌμ΄λΈŒλŸ¬λ¦¬λŠ” μ˜€λ””μ˜€ μ‹ ν˜Έ μ²˜λ¦¬μ— νŠΉν™”λœ κΈ°λŠ₯을 μ œκ³΅ν•©λ‹ˆλ‹€. μ˜€λ””μ˜€ 파일의 λ‘œλ”©, μ˜€λ””μ˜€ νŠΉμ„± μΆ”μΆœ κΈ°λŠ₯을 μ œκ³΅ν•©λ‹ˆλ‹€. νŠΉμ„± μΆ”μΆœ μ€‘μ—μ„œ β€˜Mel-Spectrogram’ μΆ”μΆœ κΈ°λŠ₯κ³Ό, β€˜MFCC’ μΆ”μΆœ κΈ°λŠ₯을 μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€.

  • sklearn: 이 λΌμ΄λΈŒλŸ¬λ¦¬λŠ” λ¨Έμ‹  λŸ¬λ‹ 및 데이터 뢄석에 널리 μ‚¬μš©λ˜λŠ” 도ꡬ λͺ¨μŒμž…λ‹ˆλ‹€. λ‹€μ–‘ν•œ λ¨Έμ‹  λŸ¬λ‹ μ•Œκ³ λ¦¬μ¦˜, 데이터 μ „μ²˜λ¦¬ κΈ°λŠ₯, 평가 도ꡬ 등을 ν¬ν•¨ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. β€˜Support Vector Machines’ 지도 ν•™μŠ΅ λͺ¨λΈ, β€˜MinMaxScaler’ μŠ€μΌ€μΌλŸ¬, β€˜PCA’ 차원 μΆ•μ†Œ 기법 클래슀λ₯Ό μ‚¬μš©ν•˜κΈ° μœ„ν•΄μ„œ μ„€μΉ˜ν–ˆμŠ΅λ‹ˆλ‹€.

About

INU. CS. Machine Learning Class Finals Project

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published