พื้นที่เก็บข้อมูลนี้เป็นที่ตั้งของการแก้ปัญหาการทำให้เป็นปกติของข้อความของ Google - ภาษาอังกฤษ เวทมนตร์ส่วนใหญ่เกิดขึ้นภายในไดเรกทอรีตัวแปลงซึ่งรับผิดชอบการแปลงจริงจากอินพุตเป็นโทเค็นเอาต์พุต ข้างรหัสเป็นกระดาษที่เขียนเกี่ยวกับการแก้ปัญหาของฉัน บทคัดย่อสำหรับบทความนี้มีดังนี้:
บทความนี้เสนอวิธีการแก้ปัญหาเช่นเดียวกับการแก้ปัญหาการทำให้เป็นมาตรฐานแบบข้อความเป็นคำพูดซึ่งมุ่งเน้นไปที่การแปลงข้อความจากนิพจน์ที่เป็นลายลักษณ์อักษรเป็นรูปแบบการพูด วิธีการวิเคราะห์อินพุตโทเค็นผ่านแบบจำลองการไล่ระดับสีที่เพิ่มขึ้นซึ่งการจำแนกโทเค็นเป็นหนึ่งใน 16 ประเภทของโทเค็นที่แตกต่างกัน โทเค็นจะถูกแปลงตามประเภทโทเค็นที่คาดการณ์ไว้ส่งผลให้ผลลัพธ์ปกติของรูปแบบการพูด เมื่อเข้าสู่การแข่งขันการทำให้เป็นมาตรฐานแบบข้อความที่เกี่ยวข้องกับการพูดโซลูชันได้รับความแม่นยำ 99.590% โดยวางอันดับที่ 12 จาก 260 ทีมหรืออยู่ใน 5% สูงสุด ของการส่งทั้งหมด
ในการเรียกใช้ไฟล์ Python ใด ๆ โฟลเดอร์ data/raw จะต้องมีการฝึกอบรมดิบและข้อมูลการทดสอบจากการแข่งขัน เนื่องจากข้อกำหนดและเงื่อนไขของการแข่งขันข้อมูลนี้ไม่สามารถแบ่งปันได้ในที่เก็บนี้
ที่เก็บนี้ทำหน้าที่เป็นที่เก็บถาวรและไม่ได้มีวัตถุประสงค์เพื่ออัปเดต
ฉันไม่ได้มีส่วนร่วมสำหรับพื้นที่เก็บข้อมูลนี้เนื่องจากได้รับการออกแบบให้เป็นที่เก็บถาวร
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT - ดูไฟล์ License.md สำหรับรายละเอียด