ทำให้คอมเข้าใจเสียงพูด (Wav2Vec2)

Share it with your friends Like

Thanks! Share it with your friends!

Close

ในวันนี้เราจะพูดถึงการทำ Speech Recognition คือทำให้คอมเอาเสียงพูดมาทำเป็น text เหมือน google translate, google speech api นั้นแหล่ะ
การทำ Speech Recognition มักถูกเรียกว่า Speech to text ได้เหมือนกัน แต่มักจะเข้าใจผิดกับอีกคำนั้นก็คือ Voice Recognition ซึ่งเป็นการจำแนกว่าใครเป็นคนพูด

ในครั้งนี้ Mission ของเราคือการทำ Speech Recognition ให้ดีกว่า Google โดยใช้ Model Wav2vec2 จากทาง Facebook มาลองใช้กับ ภาษาไทย

การทำโปรเจคในครั้งนี้ จะมีส่วนที่ลึกมากๆ และ เข้าใจยาก
สำหรับคนที่อยากศึกษาด้านนี้เพิ่ม สามารถไปหาความรู้ต่อยอดได้ใน Skooldio เลย

— Skooldio —
ศึกษา Deep learning: https://bit.ly/3yI5FQs

— คอร์สสำหรับมือใหม่ พร้อมส่วนลด 15% ด้วย code “Techcast” —
เริ่มเขียนโปรแกรม ด้วย Python ( https://bit.ly/3sf1ut6 )
เริ่มสร้างเว็ป แบบพื้นฐาน ( https://bit.ly/3iz5UYw )
Intro to UX ( https://bit.ly/3AzGdgn )
Design Thinking ( https://bit.ly/3s8gngB )

คอร์สด้านบน ผมได้ลองเรียนเองมาหมดแล้ว และ ผมค่อนข้างแนะนำสำหรับมือใหม่มากๆ เลยครับ

เนื่องจากมีหลายๆคนที่อยากจะเริ่มศึกษาต่อด้าน programming คอร์สพวกนี้จะช่วยคุณได้แน่นอนครับ

ช่องทางติดตาม
facebook : https://www.facebook.com/TechcastNeedSponsor

support me
promptpay : https://bit.ly/3m3uH5p
crypto: https://bit.ly/2RdvtTF

มาเป็น Member และ Sponsor ให้ Techcast ได้แล้ววันนี้
ด้วยการสมัครเป็นสมาชิกเพื่อเข้าถึงสิทธิพิเศษอีกมากมาย
https://www.youtube.com/channel/UCZ1xUPnSDPRtz76nGNBcaIA/join

ref.
wav2vec2 repo
https://github.com/pytorch/fairseq/blob/master/examples/wav2vec/README.md

wav2vec2 fine-tune ENG
https://huggingface.co/blog/fine-tune-wav2vec2-english

wav2vec2 fine-tune thai by sakares
https://huggingface.co/sakares/wav2vec2-large-xlsr-thai-demo

wav2vec2 fine-tune thai by chompk
https://huggingface.co/chompk/wav2vec2-large-xlsr-thai-tokenized

skooldio
https://www.skooldio.com/

รวมทุกอย่างของ deep learning
https://github.com/ChristosChristofidis/awesome-deep-learning

การตัดคำไทย
https://www.bualabs.com/archives/3740/python-word-tokenize-pythainlp-example-algorithm-deepcut-newmm-longest-python-pythainlp-ep-2/

common voice
https://commonvoice.mozilla.org/

ช่วง Bitcoin มีใครบ้าง
Paul Pattarapon
https://www.youtube.com/watch?v=oBhgk5Atla0

I Learn A Lot
https://www.youtube.com/watch?v=VrGItuU4yRs

Crypto Dog (ชอบช่องนี้มากบอกเลย)
https://www.youtube.com/channel/UC2JQKOnnNbw5QnbiFXHIQAw

Extreme IT
https://www.youtube.com/channel/UC1l9NQ__kCp9JoBnuZsaUjA

LDA World
https://www.youtube.com/user/FLDfaunglada

THE STANDARD
https://www.youtube.com/watch?v=iIKNmmX5wW0

Comments

ZABATUN says:

ผมโคตรติดใจช่องนี้เลยครับ พอดีเรียนจบคอมมา แต่ดันมาแต่งเพลง5555

Stephen Fernandes says:

Huge respect sir, great video. Only wished I knew Thai.

ปาณัสม์ พิพัฒน์พงศ์ says:

11:17 คือ ยิ ป ต์ อะไรนะ (เ ก ม เ จ ม ส์ ลั ก ลั่ น)???
11:38 นิ สิทธิ์ ???
11:50 มันจะรู้สึก แ ป ก แปลก ???
12:50 ??????????

The Game tv says:

ต่อไปใช้เสียงเล่น มายคราฟ หน่อยครับ

pboonwang_DIY says:

ลึกจิง จะพยายามแกะมาเน้นการใช้งาน

FutanariNN says:

สุดจัด

Wongsakorn Samoon says:

พะ-ระ-ฮับ😂

Naki Ch says:

จะได้เงินไหม(คนผิวเงิน)

EnJoy Land says:

ไหว้ อายุรนิ 5555555555555555555555

fat cat gamer says:

พี่ต้อง train ภาษาอังกฤษอีกใช้ใหมครับ……

Li says:

ไหว้ อยุรนิ 55555555+

K.Jaysun says:

คลิปดีมากครับ ไม่รู้เรื่องโปรแกรม แต่ดูแล้วไม่เบื่อไม่กรอ และน่าดูมากครับ

กีรติ จันพิรักษ์ says:

โครตลงทุน😅

[PK]​AKE Channel says:

เรียนที่Skooldioแพงใหมครับ

Ritthikan Chaikantrong says:

แล้วอย่างของ Apple หล่ะค่ะ รู้สึกว่าฟังเสียงดีมาก (แป้นพิมพ์ Apple)

project ZERO says:

ดีนะผมไม่ทำ 555 GTX660 ไหม้แน่นนอน 555

The red Heavy says:

1:25 ตาย ยิ่งกว่า ultra nightmare ในดูม

ธัญญรตน์ ผ่านพินิจ says:

7:36

KOREM FF says:

ลงคลิปตอนไหนอีกครับบบบ

7n5v says:

1:35 วิธีกวงติงอิเบย์

CMD says:

Fc ช่องนี้ครับ

Write a comment

*

Area 51
Ringing

Answer