APIAUDIO เป็น API.AUDIO PYTHON 3 SDK SDK นี้ให้การเข้าถึง API.Audio API ได้ง่ายสำหรับแอปพลิเคชันที่เขียนใน Python
ที่เก็บนี้ได้รับการดูแลอย่างแข็งขันโดย Aflorithmic Labs ตัวอย่างเช่นสูตรและการอ้างอิง API ดูเอกสาร API.AUDIO อย่าลังเลที่จะติดต่อกับคำถามหรือข้อเสนอแนะใด ๆ !
คุณสามารถดูการเปลี่ยนแปลงที่อัปเดตของเราได้ที่นี่
เริ่มต้นด้วยสูตร quickstart ของเรา
คุณไม่ต้องการซอร์สโค้ดนี้เว้นแต่คุณต้องการแก้ไข หากคุณต้องการใช้แพ็คเกจเพียงแค่เรียกใช้:
pip install apiaudio -U
# or
pip3 install apiaudio -Uติดตั้งจากแหล่งที่มาพร้อม:
python setup.py install
# or
python3 setup.py installPython 3.6+
สร้างไฟล์ hello.py
touch hello . py ไลบรารีนี้ต้องได้รับการกำหนดค่าด้วย API-KEY ของบัญชีของคุณซึ่งมีอยู่ในคอนโซล API.AUDIO ของคุณ นำเข้าแพ็คเกจ apiaudio และตั้งค่า apiaudio.api_key กับ api-key ที่คุณได้รับจากคอนโซล:
import apiaudio
apiaudio . api_key = "your-key"มาสร้างสินทรัพย์เสียงแรกของเรา
✍สร้างสคริปต์ใหม่ scriptText ของเราจะเป็นข้อความที่สังเคราะห์ในภายหลัง
script = apiaudio . Script . create ( scriptText = "Hello world" )
print ( script )- แสดงผล ScriptText ที่สร้างขึ้นในขั้นตอนก่อนหน้า ให้ใช้ Aria Voice
response = apiaudio . Speech . create ( scriptId = script [ "scriptId" ], voice = "Aria" )
print ( response )ตอนนี้เรามาร่วมคำพูดที่เราเพิ่งสร้างด้วยเทมเพลตเสียง
response = apiaudio . Mastering . create (
scriptId = script . get ( "scriptId" ),
soundTemplate = "jakarta"
)
print ( response )ดาวน์โหลดสินทรัพย์เสียงสุดท้ายไปยังไดเรกทอรีการทำงานปัจจุบันของคุณ:
filepath = apiaudio . Mastering . download ( scriptId = script [ "scriptId" ], destination = "." )
print ( filepath ) ง่ายใช่มั้ย - นี่คือไฟล์ hello.py สุดท้าย
import apiaudio
apiaudio . api_key = "your-key"
# script creation
script = apiaudio . Script . create ( scriptText = "Hello world" )
# speech creation
response = apiaudio . Speech . create ( scriptId = script [ "scriptId" ], voice = "Aria" )
print ( response )
# mastering process
response = apiaudio . Mastering . create (
scriptId = script . get ( "scriptId" ),
soundTemplate = "jakarta"
)
print ( response )
# download
filepath = apiaudio . Mastering . download ( scriptId = script [ "scriptId" ], destination = "." )
print ( filepath )ตอนนี้ขอเรียกใช้รหัส:
python hello.py
# or
python3 hello.pyเมื่อสิ่งนี้เสร็จสิ้นแล้วให้ค้นหาสินทรัพย์เสียงที่ดาวน์โหลดและเล่นได้!
import apiaudio ห้องสมุดจะต้องกำหนดค่าด้วยคีย์ลับของบัญชีของคุณซึ่งมีอยู่ในแผงควบคุม Aflorithmic ของคุณ ตั้งค่า apiaudio.api_key ด้วย api-key ที่คุณได้รับจากแดชบอร์ด:
apiaudio . api_key = "your-key" นอกจากนี้คุณยังสามารถตรวจสอบความถูกต้องโดยใช้ตัวแปรสภาพแวดล้อม apiaudio_key และ Apiaudio SDK จะใช้งานโดยอัตโนมัติ ในการตั้งค่าให้เปิดเทอร์มินัลและพิมพ์:
export apiaudio_key= < your-key > หากคุณให้ทั้งตัวแปรสภาพแวดล้อมและ apiaudio.api_key ค่าการตรวจสอบค่า apiaudio.api_key จะถูกใช้แทน
ในการควบคุมองค์กรเด็กของคุณโปรดใช้วิธีการต่อไปนี้เพื่อ สมมติว่า รหัสองค์กรนั้น
ตั้งค่ารหัสองค์กรลูกของคุณให้ None เพื่อหยุดการสมมติว่าองค์กร การโทรไปยัง API ครั้งต่อไปจะใช้รหัสองค์กรของคุณเอง
import apiaudio
apiaudio . set_assume_org_id ( 'child_org_id' )
# Stop using
apiaudio . set_assume_org_id ( None )ดูทรัพยากรองค์กรสำหรับการดำเนินงานเพิ่มเติมที่คุณสามารถดำเนินการเกี่ยวกับองค์กรของคุณ
มีสองวิธีในการใช้ทรัพยากร
วิธีการที่แนะนำคือการนำเข้าทรัพยากรทั้งหมดโดยตรงจาก Apiaudio:
import apiaudio
apiaudio . Script . create () หรือคุณสามารถนำเข้าคลาสทรัพยากรที่คุณต้องการใช้ก่อนจากนั้นใช้วิธีการทรัพยากร ตัวอย่างเช่นในการใช้ Script เราสามารถทำได้:
from apiaudio import Script
Script . create () ตรรกะเดียวกันนี้ใช้สำหรับแหล่งข้อมูลอื่น ๆ ( Speech , Voice , Sound ... )
Organizationทรัพยากร/คลาสขององค์กรช่วยให้คุณสามารถทำการดึงข้อมูลเกี่ยวกับองค์กรและองค์กรลูกของคุณ
วิธีการขององค์กรคือ:
get_org_data() - รับข้อมูลองค์กรรวมถึง orgid, orgname ฯลฯ org_data = apiaudio . Organization . get_org_data ()list_child_orgs() - แสดงรายการองค์กรลูกของคุณ child_orgs = apiaudio . Organization . list_child_orgs ()get_secrets() - รับคีย์ API ของคุณ, URL WebHook และ WebHook Secret secrets = apiaudio . Organization . get_secrets ()Scriptทรัพยากรสคริปต์/คลาสอนุญาตให้คุณสร้างดึงและแสดงรายการสคริปต์ เรียนรู้เพิ่มเติมเกี่ยวกับสคริปต์ที่นี่
วิธีการสคริปต์คือ:
create() - สร้างสคริปต์ใหม่
scriptText * [จำเป็น] (สตริง) - ข้อความสำหรับสคริปต์ของคุณ สคริปต์สามารถมีหลายส่วนและแท็ก SSML เรียนรู้เพิ่มเติมเกี่ยวกับรายละเอียด scriptText ที่นี่projectName (String) - ชื่อโครงการของคุณ ค่าเริ่มต้นคือ "เริ่มต้น" (สูงสุด 60 อักขระ)moduleName (String) - ชื่อของโมดูลของคุณ ค่าเริ่มต้นคือ "เริ่มต้น" (สูงสุด 60 อักขระ)scriptName (String) - ชื่อสคริปต์ของคุณ ค่าเริ่มต้นคือ "เริ่มต้น" (สูงสุด 60 อักขระ)scriptId (String) - ตัวระบุที่กำหนดเองสำหรับสคริปต์ของคุณ หากมีการจัดเตรียมพารามิเตอร์ ScriptId แล้ว ProjectName, Modulename และ ScriptName จะถูกตั้งค่าเป็นค่าเดียวกับ ScriptIdversions (พจนานุกรม) - พจนานุกรมที่มีข้อความสคริปต์เวอร์ชันที่แตกต่างกันโดยคีย์คือชื่อเวอร์ชันและค่าของมันคือ scriptText ที่เกี่ยวข้อง ชื่อเวอร์ชัน v0 ถูกสงวนไว้เป็น scriptText เริ่มต้น ค่าเริ่มต้นคือ "{}"metadata (พจนานุกรม) - ข้อมูลเมตาสำหรับสคริปต์ของคุณ ขนาดนี้ จำกัด เพียง 2KB text = """
<<sectionName::hello>> Hello {{username|buddy}}
<<sectionName::bye>> Good bye from {{location|barcelona}}
"""
script = apiaudio . Script . create (
scriptText = text ,
projectName = "myProject" ,
moduleName = "myModule" ,
scriptName = "myScript" ,
scriptId = "id-1234" ,
metadata = { "author" : "sam" , "tags" : [ "demo" , "intro" ]}
)
# example 2 with versions
script = apiaudio . Script . create (
scriptText = "Default text" ,
versions = { "es" : "Hola" , "en" : "hello" }
) retrieve() - ดึงสคริปต์ตาม ID
scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์ที่คุณต้องการเรียกคืน โดยค่าเริ่มต้นดึงเวอร์ชันหลัก (v0)version (สตริง) - เวอร์ชันสคริปต์ที่คุณต้องการดึงข้อมูล script = apiaudio . Script . retrieve ( scriptId = "id-1234" , version = "abc" ) preview - ส่งคืนสคริปต์ด้วยการเน้นพจนานุกรม ดู Lexi สำหรับตัวอย่างเพิ่มเติมเกี่ยวกับวิธีการใช้คุณสมบัติพจนานุกรม
พารามิเตอร์:
scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์ที่คุณต้องการใช้voice * [จำเป็น] (สตริง) - เสียงที่จะใช้ในการพูด สิ่งนี้จำเป็นเนื่องจากผลลัพธ์อาจขึ้นอยู่กับเสียงรหัสภาษาหรือผู้ให้บริการตัวอย่าง:
text = """
The author of this repo has lived in two places in the
UK, <!location>Bude<!> and <!location>Bristol<!>.
"""
r = apiaudio . Script . create ( scriptText = text )
scriptId = r [ "scriptId" ]
preview = apiaudio . Script . preview ( scriptId = scriptId , language = "en-gb" ) list() - แสดงรายการสคริปต์ทั้งหมดที่มีอยู่ในองค์กรของคุณ วิธีนี้รองรับการกรอง
projectName (String) - ส่งคืนสคริปต์ใด ๆ ด้วยชื่อโครงการนี้moduleName (String) - ส่งคืนสคริปต์ใด ๆ ด้วย modulename นี้ Note projectName ยังต้องจัดหาscriptName (String) - ส่งคืนสคริปต์ใด ๆ ด้วย ScriptName นี้ไม่ใช่ทั้ง projectName และ moduleNamescriptId (String) - ส่งคืนสคริปต์ใด ๆ ด้วย scriptId นี้verbose (บูล) - สคริปต์รายการในโหมด verbose ( True ตามค่าเริ่มต้น) ตั้งค่านี้เป็น False เพื่อส่งคืนเฉพาะฟิลด์ projectName , moduleName , scriptName และ scriptId scripts = apiaudio . Script . list () delete() - ลบสคริปต์ โดยค่าเริ่มต้นสิ่งนี้จะลบสคริปต์ทุกเวอร์ชัน
scriptId * [จำเป็น] (สตริง) - รหัสของสคริปต์ที่จะลบversion (สตริง) - ลบเวอร์ชันเฉพาะ #deletes version 'en' from scriptId 'myworkout'
scripts = apiaudio . Script . delete ( scriptId = "myworkout" , version = "en" ) delete_multiple() - ลบสคริปต์หลายรายการ
พารามิเตอร์:
projectName * [จำเป็น] (สตริง) - ลบสคริปต์ทั้งหมดภายในชื่อโครงการนี้moduleName (String) - ลบสคริปต์ทั้งหมดภายใน Modulename นี้ Note projectName จะต้องจัดหาด้วยscriptName (String) - ลบสคริปต์ทั้งหมดภายในชื่อสคริปต์นี้หมายเหตุทั้ง projectName และ moduleName จะต้องจัดส่งตัวอย่าง:
#deletes all scripts within the project 'awesome_demos'
scripts = apiaudio . Script . delete_multiple ( projectName = "awesome_demos" ) get_random_text() - ดึงข้อความแบบสุ่มจากรายการหมวดหมู่
category (สตริง) - หมวดหมู่ที่ดึงข้อความแบบสุ่ม หากไม่ได้ระบุหมวดหมู่ฟังก์ชันจะเริ่มต้นเป็น "FunFact" text = apiaudio . Script . get_random_text ( category = "BibleVerse" )"BibleVerse" , "FunFact" , "InspirationalQuote" "Joke" , " "MovieSynopsis" ", "Poem" , "PhilosophicalQuestion" , "Recipe" , "TriviaQuestion" Script.Directory ทรัพยากรไดเรกทอรีแสดงรายการโครงสร้างไดเรกทอรีของสคริปต์ของคุณเช่น ProjectName/modulename/scriptName
Script.directory วิธีการคือ:
list_projects() - แสดงรายการโครงการทั้งหมด
พารามิเตอร์:
ตัวอย่าง:
#Lists all project names
projects = apiaudio . Script . Directory . list_projects ()
print ( projects )
# example output: ["projectX", "projectY"] list_modules() - แสดงรายการโมดูลทั้งหมดภายใน ProjectPrefix
พารามิเตอร์:
projectPrefix * [จำเป็น] - จะแสดงรายการโมดูลเริ่มต้นด้วย ProjectPrefix นี้ตัวอย่าง:
#Lists all module names
modules = apiaudio . Script . Directory . list_modules ( projectPrefix = "workout" )
print ( modules )
# example output: ["workout_1/over60s", "workout_2/morning_routine"] list_script_names() - แสดงรายการโมดูลทั้งหมดภายใน ProjectPrefix
พารามิเตอร์:
projectPrefix * [จำเป็น] - จะแสดงรายการชื่อสคริปต์ที่เริ่มต้นด้วย ProjectPrefix นี้modulePrefix * [จำเป็น] - จะแสดงรายการ ScriptNames ที่เริ่มต้นด้วย modulePreFix นี้ตัวอย่าง:
#Lists all script names
scriptNames = apiaudio . Script . Directory . list_script_names ( projectPrefix = "workout_1" , modulePrefix = "over60s" )
print ( scriptNames )
# example output: ["workout_1/over60s/routine_1", "workout_1/over60s/routine_2", "workout_1/over60s/routine_3"]Speechคำพูดช่วยให้คุณทำข้อความเป็นคำพูด (TTS) ด้วย API ของเราโดยใช้เสียงทั้งหมดที่มีอยู่ ใช้เพื่อสร้างไฟล์เสียงพูดจากสคริปต์ของคุณ
วิธีการพูดคือ:
create() ส่งคำขอข้อความเป็นคำพูดไปยังบริการข้อความเป็นคำพูดของเรา
พารามิเตอร์:
scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์version (สตริง) - เวอร์ชันของสคริปต์ที่จะผลิต ค่าเริ่มต้นคือ ""voice (สตริง) - ชื่อเสียง ดูรายการเสียงที่มีอยู่โดยใช้ทรัพยากรเสียง เสียงเริ่มต้นคือ "Joanna"speed (สตริง) - ความเร็วเสียง ความเร็วเริ่มต้นคือ 100effect (สตริง) - ใส่เอฟเฟกต์ตลกในเสียงของคุณ คุณสามารถลองสิ่งต่อไปนี้: dark_father , chewie , 88b , 2r2d ,silencePadding (จำนวนเต็ม) - เพิ่มช่องว่างความเงียบลงในแทร็กคำพูดของคุณ (เป็นมิลลิวินาที) ค่าเริ่มต้นคือ 0 (ไม่มีช่องว่างภายใน)audience (dict) - ระบุค่าของพารามิเตอร์ในสคริปต์ของคุณ ตัวอย่างเช่นถ้าในทรัพยากรสคริปต์คุณมี scriptText="Hello {{name}} {{lastname}}, welcome to {{location}}" ผู้ชมควรเป็น: {"name": "Elon", "lastname": "Musk", "location": "Istanbul"} หากไม่ได้จัดเตรียมแทร็กทางเลือกจะถูกสร้างขึ้นsync (บูลีน) - อนุญาตให้ Sync หรือ Async Speech Creation ค่าเริ่มต้นเป็น True หาก sync=False คำพูดสร้างการโทรจะส่งคืนข้อความความสำเร็จเมื่อการสร้างคำพูดถูกทริกเกอร์ ในการดึงไฟล์ตรวจสอบ Speech.retrieve()sections (DICT) - ระบุพารามิเตอร์สำหรับส่วนที่เฉพาะเจาะจงในสคริปต์ คีย์คือชื่อส่วนและค่าเป็นพจนานุกรมอื่นที่มีการกำหนดค่าส่วน (พารามิเตอร์ที่ถูกต้องคือ: เสียงความเร็ว, เอฟเฟกต์, silence_padding) หากไม่พบส่วนที่นี่ส่วนจะสืบทอดเสียงความเร็วความเร็วและ silence_padding โดยอัตโนมัติที่คุณกำหนดไว้ข้างต้น (หรือค่าเริ่มต้นหากคุณไม่ได้ให้ไว้) ดูตัวอย่างด้านล่างด้วย 2 ส่วนและใช้พารามิเตอร์การกำหนดค่าที่แตกต่างกันuseDictionary (บูล) - ใช้พจนานุกรมการออกเสียงกับข้อความสคริปต์useTextNormalizer (BOOL) - ใช้การทำให้เป็นมาตรฐานของข้อความซึ่งสามารถช่วยแก้ไขข้อผิดพลาดทางไวยากรณ์ด้วยการออกเสียง TTS เช่น 11:12 UHR -> 11 UHR 12 หมายเหตุ - ใช้งานได้เฉพาะกับเสียงเยอรมันในปัจจุบัน sections = {
"firstsection" : {
"voice" : "Matthew" ,
"speed" : 110 ,
"silence_padding" : 100
},
"anothersection" : {
"voice" : "en-GB-RyanNeural" ,
"speed" : 100
}
}ตัวอย่างง่ายๆ:
response = apiaudio . Speech . create (
scriptId = "id-1234" ,
voice = "Joanna"
)ตัวอย่างที่สมบูรณ์:
response = apiaudio . Speech . create (
scriptId = "id-1234" ,
version = "abc" ,
voice = "Matthew" ,
speed = 100 ,
effect = "dark_father" ,
silencePadding = 1000 ,
sync = True ,
audience = { "username" : "Elon" , "lastname" : "Musk" },
sections = {
"firstsection" : {
"voice" : "Matthew" ,
"speed" : 110 ,
"silence_padding" : 100 ,
},
"anothersection" : {
"voice" : "Liam" ,
}
}
) retrieve() ดึง URL ไฟล์คำพูด
พารามิเตอร์:
scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์ที่คุณต้องการเรียกคืนversion (สตริง) - เวอร์ชันของสคริปต์ที่จะดึง ค่าเริ่มต้นคือ ""section (สตริง) - ชื่อส่วนสคริปต์ที่คุณต้องการเรียกคืน หากไม่ได้ให้ไว้ส่วนสคริปต์ทั้งหมดจะถูกส่งคืนparameters (DICT) - DICT ที่มีพารามิเตอร์การตั้งค่าส่วนบุคคลของสคริปต์ของคุณ หากไม่ได้จัดเตรียมแทร็กทางเลือกจะถูกเรียกคืน ฟิลด์นี้ขึ้นอยู่กับพารามิเตอร์ที่คุณใช้ในส่วนทรัพยากรของสคริปต์ ในการดึงชุดพารามิเตอร์เฉพาะคุณต้องสร้างคำพูดด้วยพารามิเตอร์ชุดเดียวกันตัวอย่าง:
audio_files = apiaudio . Speech . retrieve ( scriptId = "id-1234" ) download() ดาวน์โหลดไฟล์คำพูดในโฟลเดอร์ที่คุณต้องการ
พารามิเตอร์:
scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์ที่คุณต้องการดาวน์โหลดversion (สตริง) - เวอร์ชันของสคริปต์ที่จะดาวน์โหลด ค่าเริ่มต้นคือ ""section (สตริง) - ชื่อส่วนสคริปต์ที่คุณต้องการเรียกคืน หากไม่ได้ให้ไว้ส่วนสคริปต์ทั้งหมดจะถูกส่งคืนparameters (DICT) - DICT ที่มีพารามิเตอร์การตั้งค่าส่วนบุคคลของสคริปต์ของคุณ หากไม่ได้จัดเตรียมแทร็กทางเลือกจะถูกเรียกคืน ฟิลด์นี้ขึ้นอยู่กับพารามิเตอร์ที่คุณใช้ในส่วนทรัพยากรของสคริปต์ ในการดึงชุดพารามิเตอร์เฉพาะคุณต้องสร้างคำพูดด้วยพารามิเตอร์ชุดเดียวกันdestination (สตริง) - เส้นทางปลายทางโฟลเดอร์ ค่าเริ่มต้นคือ "." (โฟลเดอร์ปัจจุบัน)ตัวอย่าง:
audio_files = apiaudio . Speech . download ( scriptId = "id-1234" , destination = "." )Voiceเสียงช่วยให้คุณสามารถดึงรายการเสียงที่มีอยู่จาก API ของเรา
วิธีการเสียงคือ:
list() แสดงรายการเสียงที่มีอยู่ทั้งหมดใน API ของเรา พารามิเตอร์ล้วนเป็นตัวเลือกและสามารถใช้ร่วมกันเพื่อให้ได้เสียงที่สมบูรณ์แบบสำหรับการใช้งานของคุณ
provider (สตริง) - ลองหนึ่งใน: Google, Polly, Azure, MSNR (Aflorithmic), IBM, Yandex, Retro (Aflorithmic), Vocalid, คล้ายกับlanguage (สตริง) - เช่นภาษาอังกฤษ, สเปน, ฝรั่งเศส, เยอรมัน ฯลฯaccent (สตริง) - เช่นอเมริกัน, อังกฤษ, เป็นกลาง, โปรตุเกส/บราซิล, อเมริกันนุ่ม, เม็กซิกัน, ออสเตรเลียgender (สตริง) - ลองกับหนึ่งใน: ชายหญิงageBracket (String) - ลองกับหนึ่งใน: ผู้ใหญ่, เด็ก, อาวุโสtags (String)-ลองใช้หนึ่งหรือมากกว่านั้น (คั่นด้วยเครื่องหมายจุลภาค) ของ: มั่นคง, มั่นใจ, สมดุล, ให้ข้อมูล, จริงจัง, การสอน, ช้า, การเล่าเรื่อง, สงบ, ชัดเจน, ลึก, เป็นทางการ, เศร้า, ผอม, เร็ว, upbeat, ความสนุกสนาน, ความสัมพันธ์, ความสัมพันธ์ มีความรู้มุ่งเน้น, จดหมายข่าว, ผู้ประกาศข่าว, ผู้สัมภาษณ์, น่าเชื่อถือ, เป็นมิตร, เป็นมิตร, ดีสำหรับการแจกข้อมูล, เป็นมิตรเล็กน้อยindustryExamples (String) - ลองใช้หนึ่งหรือมากกว่าหนึ่ง (แยกจากกันโดย Commas) ของ: Fitness, ธุรกิจ, เชิงพาณิชย์, แฟชั่น, การเดินทาง, หนังสือเสียง, อสังหาริมทรัพย์, ศรัทธา, อุตสาหกรรมสุขภาพ, Comercial, Realestate, Kids Entertainment, เกม, การบริการลูกค้า, การศึกษา, การเล่าเรื่อง, ความบันเทิง, เด็ก ๆtimePerformance (String) - ประสิทธิภาพเวลาของเสียง มีสามประเภท: ช้ากลางเร็วsectionCharacterLimit (String) - จำนวนอักขระสูงสุดที่เสียงสามารถประมวลผลต่อส่วนสคริปต์ ผู้ให้บริการที่ได้รับการสนับสนุนทั้งหมดยกเว้น Vocalid มีขีด จำกัด 4,000 all_voices = apiaudio . Voice . list () french_voices = apiaudio . Voice . list ( language = "french" , tags = "steady, fun" ) list_parameters() วิธีนี้ช่วยให้คุณเห็นคุณลักษณะใดที่คุณสามารถกรองเสียงได้ด้วยค่าที่อนุญาตสำหรับแต่ละแอตทริบิวต์ ในภายหลังคุณสามารถใช้พารามิเตอร์และค่าเหล่านี้เพื่อกรองเสียงที่คุณต้องการแสดงรายการ
พารามิเตอร์:
ตัวอย่าง:
parameters = apiaudio . Voice . list_parameters ()Soundเสียงช่วยให้คุณออกแบบเทมเพลตเสียงของคุณเองจากสคริปต์และแทร็กพื้นหลัง เพื่อให้ได้เทมเพลตเสียง/โครงการตรวจสอบให้แน่ใจว่าคุณขอคำพูดสำหรับทรัพยากรสคริปต์ของคุณก่อน
วิธีการเสียงคือ:
list() แสดงรายการเทมเพลตเสียงที่มีอยู่ทั้งหมดใน API ของเรา พารามิเตอร์ล้วนเป็นตัวเลือกและสามารถใช้ร่วมกันเพื่อให้ได้เสียงที่สมบูรณ์แบบสำหรับ USECASE ของคุณ
industryExamples (String) - ลองใช้หนึ่งหรือมากกว่าหนึ่ง (คั่นด้วยเครื่องหมายจุลภาค) ของ: ข่าว, การเดินทาง, ธุรกิจ, การผ่อนคลาย, การออกกำลังกาย, ผ่อนคลาย, เรื่องราวเด็ก ๆcontents (สตริง) - ลองใช้หนึ่ง (คั่นด้วยเครื่องหมายจุลภาค) ของ: อินโทร, หลัก, outro, effect1, effect2, main outro, droid_main, chewie_main, effect3, บรรยากาศ, เอฟเฟกต์เท่านั้นgenre (สตริง) - ลองกับหนึ่งใน: อิเล็กทรอนิกส์, อะคูสติก, บรรยากาศ, บทคัดย่อ, ร็อคtempo (String) - ลองกับหนึ่งใน: mid, up, down, uptempotags (String) - ลองใช้หนึ่งหรือมากกว่าหนึ่ง (คั่นด้วยเครื่องหมายจุลภาค) ของ: รุนแรง, น้อยที่สุด, สะท้อน, ไพเราะ, มีความสุข, ความคิดถึง, โฟกัส, พลัง, การยกระดับ, การผ่อนคลาย, ผ่อนคลาย, บรรยากาศ, ลึกลับ, บวก, ข้อมูล, การออกกำลังกาย, การทำสมาธิ sound_templates = apiaudio . Sound . list () list_parameters() วิธีนี้ช่วยให้คุณเห็นคุณลักษณะใดที่คุณสามารถกรองเทมเพลตเสียงได้โดยพร้อมกับค่าที่อนุญาตสำหรับแต่ละแอตทริบิวต์ ในภายหลังคุณสามารถใช้พารามิเตอร์และค่าเหล่านี้เพื่อกรองเทมเพลตเสียงที่คุณต้องการแสดงรายการ
พารามิเตอร์:
ตัวอย่าง:
parameters = apiaudio . Sound . list_parameters ()MasteringMastering ช่วยให้คุณสร้างและดึงไฟล์เสียงที่เชี่ยวชาญของสคริปต์ของคุณ เวอร์ชันที่เชี่ยวชาญมีคำพูดของสคริปต์แทร็กพื้นหลังพารามิเตอร์ส่วนบุคคลสำหรับผู้ชมของคุณและกระบวนการควบคุมเพื่อปรับปรุงคุณภาพเสียงของแทร็กทั้งหมด เพื่อให้ได้ไฟล์เสียงที่เชี่ยวชาญตรวจสอบให้แน่ใจว่าคุณได้ร้องขอคำพูดสำหรับทรัพยากรสคริปต์ของคุณก่อน
วิธีการเรียนรู้คือ:
create() สร้างสคริปต์รุ่นที่เชี่ยวชาญและเลือกรูปแบบเสียง
พารามิเตอร์:
scriptId * [จำเป็น] (สตริง) - รหัสทรัพยากรสคริปต์version (สตริง) - เวอร์ชันของสคริปต์ที่จะผลิต ค่าเริ่มต้นคือ ""soundTemplate (สตริง) - ชื่อเทมเพลตเสียง สำหรับรายการเทมเพลตเสียงที่มีอยู่ให้ตรวจสอบ apiaudio.Sound.list_sound_templates() การโทรpublic (บูลีน) - ธงบูลีนที่อนุญาตให้จัดเก็บไฟล์ที่เชี่ยวชาญในโฟลเดอร์สาธารณะ S3 ค่าเริ่มต้นเป็น False คำเตือน - สิ่งนี้จะทำให้ไฟล์ที่เชี่ยวชาญของคุณเป็นสาธารณะต่อทุกคนในอินเทอร์เน็ต ใช้สิ่งนี้ด้วยความเสี่ยงของคุณเองvast (บูลีน) - ธงบูลีนที่อนุญาตให้สร้างไฟล์ขนาดใหญ่ของไฟล์ที่เชี่ยวชาญของคุณ ธง vast จะใช้งานได้ก็ต่อเมื่อ public เป็น True ค่าเริ่มต้นเป็น FalseendFormat (รายการ) - รายการรูปแบบเสียงที่จะผลิต รูปแบบที่ถูกต้องคือ: ["wav", "mp3" (default), "flac", "ogg", "mp3_very_low", "mp3_low", "mp3_medium", "mp3_high", "mp3_very_high", "mp3_alexa"]forceLength (int) - บังคับความยาวเสียงของแทร็กที่เชี่ยวชาญ (ในไม่กี่วินาที)audience (DICT) - พจนานุกรมที่มีพารามิเตอร์การปรับเปลี่ยนส่วนบุคคล พารามิเตอร์นี้ขึ้นอยู่กับจำนวนพารามิเตอร์ที่คุณใช้ในทรัพยากรสคริปต์ของคุณ ในตัวอย่างเอกสารสคริปต์ด้านบนเราใช้พารามิเตอร์ 2 ตัว: username และ location และในตัวอย่างต่อไปนี้เราต้องการสร้างสคริปต์สำหรับชื่อผู้ใช้ salih กับตำแหน่ง Barcelona หากไม่ได้ให้ผู้ชมแทร็กทางเลือกจะถูกสร้างขึ้นmediaFiles (รายการ) - รายการคำสั่งที่มีไฟล์สื่อ พารามิเตอร์นี้ขึ้นอยู่กับแท็กไฟล์สื่อที่ใช้ในทรัพยากรสคริปต์และไฟล์สื่อที่คุณมีในบัญชีของคุณ ตัวอย่างเช่นหากสคริปต์มี <<media::myrecording>> บวก <<media::mysong>> และคุณต้องการที่จะแนบ myrecording กับ mediaid = "12345" และ mySong to mediaid = "67890" จากนั้น mediaFiles = [{"myrecording":"12345", "mysong":"67890"}]mediaVolumeTrim (Float) - ตัวแปรจุดลอยตัวที่ช่วยให้คุณสามารถตัดระดับเสียงของไฟล์สื่อที่อัปโหลดได้ (เป็น db) แอตทริบิวต์นี้มีช่วงที่ถูกต้อง -12 ถึง 12 เดซิเบลและนำไปใช้กับไฟล์สื่อทั้งหมดที่รวมอยู่ในการเรียกเรียนรู้ครั้งเดียว การป้องกันการตัดไม่ได้ให้การปรับที่เพิ่มขึ้นเท่านั้นconnectors (รายการ) - รายการคำสั่งระบุการกำหนดค่าสำหรับการเชื่อมต่อบุคคลที่สามโดยเฉพาะ สำหรับแนวทางในบริบทของแอปพลิเคชันบุคคลที่ 3 ที่รองรับดูเอกสารประกอบการเชื่อมต่อmasteringPreset (String) - การตั้งค่าล่วงหน้าที่จะใช้สิ่งนี้ช่วยให้คุณสมบัติเช่นการบีบอัด sidechain 'IE ducking' ดู apiaudio.Mastering.list_presets() สำหรับรายการที่ตั้งไว้ล่วงหน้าและคำอธิบายของพวกเขาshare (บูลีน) - หากคุณต้องการมีลิงก์ที่แชร์ได้สร้างขึ้นด้วยไฟล์เสียงของคุณให้ใช้ธงนี้ หากคุณใส่ share: True การตอบสนองจะมีพารามิเตอร์ shareUrl ส่งคืน (หมายเหตุ: หากคุณใส่ธงนี้ไฟล์ส่วนตัวของคุณจะถูกแปลงเป็นไฟล์สาธารณะ)ตัวอย่าง:
response = apiaudio . Mastering . create (
scriptId = "id-1234" ,
soundTemplate = "jakarta" ,
audience = { "username" : "salih" , "location" : "barcelona" }
) create_media_timeline() สร้างคำขอการเรียนรู้ตามไฟล์สื่อที่อัปโหลดอย่างหมดจด ไฟล์สื่อจะต้องอัปโหลดก่อนเรียกใช้ฟังก์ชันนี้ ดูสื่อ
พารามิเตอร์:
timeline * [จำเป็น] (รายการ) - วัตถุไทม์ไลน์ วัตถุไทม์ไลน์เป็นรายการพจนานุกรมโดยแต่ละรายการแสดงถึงแทร็กของไฟล์เสียง แต่ละแทร็กจะต้องมี files สองปุ่มต่อไปนี้และ contentType ต่อไปนี้
files * [จำเป็น] (รายการ) ไฟล์เป็นรายการของพจนานุกรมโดยแต่ละรายการจะต้องมี 3 ปุ่มต่อไปนี้, mediaId , startAt และ endAt
files * [จำเป็น] (str) สื่อกลางของไฟล์ที่อัปโหลดแล้วstartAt * [จำเป็น] (ลอย) เวลาที่ไฟล์สื่อนี้ควรเริ่มในไม่กี่วินาทีendAt * [จำเป็น] (ลอย) เวลาที่ไฟล์สื่อนี้ควรสิ้นสุดในไม่กี่วินาที contentType * [จำเป็น] (สตริง) - ประเภทของเนื้อหาที่แทร็กนี้มีควรเป็น sound หรือ speech
endFormat (รายการ) - รายการรูปแบบเสียงที่จะผลิต รูปแบบที่ถูกต้องคือ: ["wav", "mp3" (default), "flac", "ogg", "mp3_very_low", "mp3_low", "mp3_medium", "mp3_high", "mp3_very_high", "mp3_alexa"]
masteringPreset (String) - การตั้งค่าล่วงหน้าที่จะใช้สิ่งนี้ช่วยให้คุณสมบัติเช่นการบีบอัด sidechain 'IE ducking' ดู apiaudio.Mastering.list_presets() สำหรับรายการที่ตั้งไว้ล่วงหน้าและคำอธิบายของพวกเขา
ตัวอย่าง:
backgroundId = apiaudio . Media . upload ( file_path = "background.wav" )[ "mediaId" ]
speechId = apiaudio . Media . upload ( file_path = "speech1.wav" )[ "mediaId" ]
timeline = [
{
"files" : [
{
"mediaId" : speechId ,
"startAt" : 2 ,
"endAt" : 14 ,
}
],
"contentType" : "speech"
},
{
"files" : [
{
"mediaId" : backgroundId ,
"startAt" : 0 ,
"endAt" : 45 ,
}
],
"contentType" : "sound"
}
]
response = apiaudio . Mastering . create_media_timeline ( timeline = timeline , masteringPreset = "lightducking" ) retrieve() ดึง URL ไฟล์ที่เชี่ยวชาญ
พารามิเตอร์:
scriptId * [จำเป็น] (สตริง) - รหัสทรัพยากรสคริปต์versions (สตริง) - เวอร์ชันของสคริปต์ที่จะเรียกคืน ค่าเริ่มต้นคือ ""parameters (DICT) - พจนานุกรมที่มีรายการผู้ชมที่คุณต้องการเรียกคืน หากไม่ได้ให้พารามิเตอร์แทร็กทางเลือกจะถูกเรียกคืนpublic (บูลีน) - ธงบูลีนที่อนุญาตให้ดึงไฟล์ที่เชี่ยวชาญจากถังสาธารณะ ใช้สิ่งนี้หากคุณต้องการดึงไฟล์ที่มีความเชี่ยวชาญที่สร้างขึ้นโดยใช้ public=True ค่าเริ่มต้นเป็น Falsevast (บูลีน) - ธงบูลีนที่อนุญาตให้ดึงไฟล์ขนาดใหญ่ของไฟล์ที่เชี่ยวชาญของคุณ ธง vast จะใช้งานได้ก็ต่อเมื่อ public เป็น True ค่าเริ่มต้นเป็น FalseendFormat (รายการ) - รายการรูปแบบเสียงที่จะเรียกคืน รูปแบบที่ถูกต้องคือ: ["wav", "mp3" (default), "flac", "ogg", "mp3_very_low", "mp3_low", "mp3_medium", "mp3_high", "mp3_very_high", "mp3_alexa"]ตัวอย่าง:
mastered_files = apiaudio . Mastering . retrieve (
scriptId = "id-1234" ,
parameters = { "username" : "salih" , "location" : "barcelona" }
) download() ดาวน์โหลดไฟล์ Mastered ในโฟลเดอร์ที่คุณต้องการ
พารามิเตอร์:
scriptId * [จำเป็น] (สตริง) - รหัสทรัพยากรสคริปต์version (สตริง) - เวอร์ชันของสคริปต์ที่จะดาวน์โหลด ค่าเริ่มต้นคือ ""parameters (DICT) - พจนานุกรมที่มีรายการผู้ชมที่คุณต้องการเรียกคืน หากไม่มีการจัดเตรียมพารามิเตอร์แทร็กทางเลือกจะถูกดาวน์โหลดdestination (สตริง) - เส้นทางปลายทางโฟลเดอร์ ค่าเริ่มต้นคือ "." (โฟลเดอร์ปัจจุบัน)public (บูลีน) - ธงบูลีนที่อนุญาตให้ดึงไฟล์ที่เชี่ยวชาญจากถังสาธารณะ ใช้สิ่งนี้หากคุณต้องการดึงไฟล์ที่มีความเชี่ยวชาญที่สร้างขึ้นโดยใช้ public=True ค่าเริ่มต้นเป็น Falsevast (บูลีน) - ธงบูลีนที่อนุญาตให้ดึงไฟล์ขนาดใหญ่ของไฟล์ที่เชี่ยวชาญของคุณ ธง vast จะใช้งานได้ก็ต่อเมื่อ public เป็น True ค่าเริ่มต้นเป็น Falseตัวอย่าง:
mastered_files = apiaudio . Mastering . download (
scriptId = "id-1234" ,
parameters = { "username" : "salih" , "location" : "barcelona" }
destination = "."
) list_presets() แสดงรายการที่ตั้งไว้ล่วงหน้าที่มีอยู่
ตัวอย่าง:
presets = apiaudio . Mastering . list_presets ()
print ( presets )Mediaสื่อช่วยให้คุณสามารถดึงไฟล์ทั้งหมดที่มีอยู่ใน API.Audio สำหรับองค์กรของคุณ
วิธีการสื่อคือ:
upload() - อัปโหลดไฟล์ไปยังฐานข้อมูลของเรา
พารามิเตอร์:
file_path * [จำเป็น] (สตริง) - พา ธ สัมพัทธ์ไปยังไฟล์เสียงtags (สตริง) - แท็กคั่นด้วยเครื่องหมายจุลภาคที่คุณต้องการเพิ่มในไฟล์ที่อัปโหลดของคุณ สิ่งนี้จะทำให้การดึงข้อมูลง่ายขึ้นตัวอย่าง:
apiaudio . Media . upload (
file_path = "./my_file.mp3" ,
tags = "tag1,tag2,tag3"
) list() - แสดงรายการไฟล์ทั้งหมดภายในองค์กร
พารามิเตอร์:
mediaId (String) - ถ้าผ่านจะส่งคืนไฟล์นั้นหรือวัตถุที่ว่างเปล่าหากไม่มีอยู่tags (สตริง) - แท็กคั่นด้วยเครื่องหมายจุลภาคที่คุณต้องการเพิ่มในไฟล์ที่อัปโหลดของคุณ หากผ่านไปจะส่งคืนไฟล์ทั้งหมดที่มีแท็กเหล่านั้นอย่างน้อยdownloadUrl (บูลีน): ถ้าเป็นจริงจะมีการเพิ่ม URL ที่กำหนดไว้ในแต่ละรายการในอาร์เรย์ นี่เป็นไฟล์ที่ช้าสำหรับไฟล์จำนวนมาก (ประมาณ 1 วินาที)public (บูลีน): ถ้าเป็นจริงไฟล์สื่อที่ระบุไว้จะเป็นไฟล์สื่อสาธารณะที่จัดทำโดย API.Audio ค่าเริ่มต้นเป็นเท็จตัวอย่าง:
# lists all files
files = apiaudio . Media . list ()
# lists files with tag="tag1"
files = apiaudio . Media . list ( tags = "tag1" )
# lists file with specific id
files = apiaudio . Media . list ( mediaId = "some_mediaId" )
# lists files with tag="tag1" and with a downloadurl
files = apiaudio . Media . list ( tags = "tag1" , downloadUrl = True ) list_tags() สิ่งนี้จะส่งคืนรายการด้วยแท็กที่กำหนดเฉพาะผู้ใช้ทั้งหมด
ตัวอย่าง:
tags = apiaudio . Media . list_tags ()
print ( tags ) get_download_url() - วิธีนี้ส่งคืน URL ที่กำหนดไว้สำหรับการดาวน์โหลดไฟล์เสียงเฉพาะ
mediaId * [จำเป็น] (String): Media ID สำหรับไฟล์ที่จะดาวน์โหลดตัวอย่าง
url = apiaudio . Media . get_download_url ( mediaId = "some-mediaId" )
print ( url ) download() - วิธีนี้ดาวน์โหลดไฟล์เสียงเฉพาะ
mediaId * [จำเป็น] (String): Media ID สำหรับไฟล์ที่จะดาวน์โหลดdestination (สตริง): พา ธ ไปยังไดเรกทอรีที่จะดาวน์โหลดไฟล์ ค่าเริ่มต้นคือ "."ตัวอย่าง
apiaudio . Media . download (
mediaId = "some_mediaId" ,
destination = "/my_destination_folder"
)SyncTTS ทรัพยากรSynctts ช่วยให้คุณทำแบบซิงโครนัสเป็นคำพูด (TTS) ด้วย API ของเราโดยใช้เสียงทั้งหมดที่มีอยู่ ใช้เพื่อสร้างไฟล์เสียงพูดจากข้อความและชื่อเสียง การตอบสนองประกอบด้วย Bytes Wave พร้อมที่จะเล่นหรือเขียนลงในไฟล์
วิธีการของ Synctts คือ:
create() สร้างไฟล์คำพูด TTS
พารามิเตอร์:
voice * [จำเป็น] (สตริง) - ชื่อเสียง ดูรายการเสียงที่มีอยู่โดยใช้ทรัพยากรเสียงtext * [จำเป็น] (สตริง) - ข้อความที่คุณต้องการทำ TTS ด้วย ขีด จำกัด คือ 800 อักขระสำหรับไฟล์คลื่นmetadata [ไม่บังคับ] ("เต็ม" หรือ "ไม่มี") - ระดับของข้อมูลเมตาที่คุณต้องการ ส่งคืนรายการ Phoneme (ใช้ได้เฉพาะสำหรับเสียง MSNR บางส่วนเท่านั้น)ตัวอย่าง:
sync_tts = apiaudio . SyncTTS . create (
voice = "joanna" ,
text = "This is me creating synchronous text to speech" ,
metadata = "full"
)BirdcacheBirdCache เป็นบริการแคชที่จัดทำโดย API.Audio ที่ให้เลเยอร์แคชสำหรับลูกค้าโดยการจัดเก็บข้อมูลในเซิร์ฟเวอร์ API.Audio เพื่อการใช้งานในอนาคต สิ่งนี้ช่วยให้คุณสามารถเรียกคืนไฟล์คำพูดของคุณได้ทันที
วิธีการนกเบิร์ดคือ:
create() สร้างไฟล์คำพูด TTS
พารามิเตอร์:
type * [จำเป็น] (สตริง) - ประเภทของเหตุการณ์ ประเภทที่รองรับคือ mastering และ speechtext * [จำเป็น] (สตริง) - ข้อความที่คุณต้องการทำคำพูด/การเรียนรู้ด้วย ดูตัวอย่างสำหรับพารามิเตอร์การตั้งค่าส่วนบุคคลvoice * [จำเป็น] (สตริง) - เสียงสำหรับการสร้างคำพูดaudience * [ไม่บังคับ] (DICT) - วัตถุคู่คีย์สำหรับพารามิเตอร์การปรับเปลี่ยนส่วนบุคคล ดูตัวอย่างด้านล่างsoundTemplate [ไม่บังคับ] (สตริง) - เทมเพลตเสียงสำหรับการสร้างการเรียนรู้ จำเป็นเฉพาะเมื่อประเภทคือการเรียนรู้ตัวอย่าง:
birdcache = apiaudio . Birdcache . create (
type = "mastering" ,
voice = "linda" ,
text = "This is {{username|me}} creating synchronous text to speech" ,
audience = { "username" : [ "salih" , "sam" , "timo" ]},
soundTemplate = "electronic"
)Pronunciation Dictionaryบ่อยครั้งเมื่อทำงานกับ TTS โมเดลสามารถล้มเหลวในการออกเสียงคำเฉพาะได้อย่างถูกต้องเช่นแบรนด์ชื่อและสถานที่มักจะออกเสียงผิดพลาด เป็นความพยายามครั้งแรกในการแก้ไขปัญหานี้เราได้แนะนำธง Lexi ของเราซึ่งทำงานในลักษณะเดียวกันกับ SSML ตัวอย่างเช่นการเพิ่ม <! peadar> แทนที่จะเป็น Peadar (ซึ่งเป็นหนึ่งในผู้ก่อตั้งของเรา) ลงในสคริปต์ของคุณจะทำให้แบบจำลองสร้างการออกเสียงทางเลือกของชื่อนี้ สิ่งนี้มีประโยชน์อย่างยิ่งในกรณีที่คำพูดสามารถออกเสียงได้หลายอย่างเช่นเมือง 'อ่าน' และ 'ดี' ในอินสแตนซ์นี้การวาง <! การอ่าน> และ <! nice> จะทำให้แน่ใจว่าสิ่งเหล่านี้ออกเสียงได้อย่างถูกต้องได้รับสคริปต์:
" The city of <!nice> is a really nice place in the south of france."
หากโซลูชันนี้ไม่ได้ผลสำหรับคุณคุณสามารถใช้ประโยชน์จากคุณสมบัติ Lexi ที่กำหนดเอง (Self-Serve) ของเราแทน
สิ่งนี้สามารถใช้เพื่อให้ได้หนึ่งในสองสิ่งแก้ไขคำเดียวหรือขยายตัวย่อ ตัวอย่างเช่นคุณสามารถแทนที่สิ่งที่เกิดขึ้นทั้งหมดของคำว่า aflorithmic ด้วย "AF ต่ำจังหวะ" หรือการเกิดขึ้นของคำว่า 'BMW' ด้วย "Bayerische Motoren Werke" คำแทนที่สามารถให้เป็นข้อความธรรมดาหรือการออกเสียง IPA
วิธีพจนานุกรม PRONONCIATION คือ:
list() แสดงรายการพจนานุกรมที่เปิดเผยต่อสาธารณะและคำพูดของพวกเขา
พารามิเตอร์:
noneตัวอย่าง:
# returns a list of public dictionaries
dictionaries = apiaudio . Lexi . list () list_custom_dicts() แสดงรายการพจนานุกรมที่กำหนดเองและคำที่เกี่ยวข้อง
พารามิเตอร์:
noneตัวอย่าง:
# returns a list of custom dictionaries
types = apiaudio . Lexi . list_custom_dicts () register_custom_word เพิ่มคำใหม่ให้กับพจนานุกรมที่กำหนดเอง
lang [จำเป็น] (String) - ตระกูลภาษาเช่น en หรือ es .Dictionary - ใช้ global เพื่อลงทะเบียนคำทั่วโลกword [จำเป็น] (สตริง) - คำที่จะถูกแทนที่replacement [จำเป็น] (สตริง) - โทเค็นทดแทน สามารถเป็นสตริงธรรมดาหรือโทเค็น IPAcontentType [ไม่บังคับ] (สตริง) - ประเภทเนื้อหาของการเปลี่ยนที่ให้มาอาจเป็น basic (ค่าเริ่มต้น) หรือ ipa สำหรับการเปลี่ยนการออกเสียงspecialization [ตัวเลือก] (สตริง) - โดยค่าเริ่มต้นการเปลี่ยนที่ให้มาจะใช้โดยไม่คำนึงถึงเสียงรหัสภาษาหรือผู้ให้บริการที่ให้มา อย่างไรก็ตามสามารถจัดหากรณีขอบได้สิ่งเหล่านี้อาจเป็นสิ่งที่ถูกต้อง ชื่อผู้ให้บริการรหัสภาษา (เช่น en-gb) หรือชื่อเสียง # correct the word sapiens
r = apiaudio . Lexi . register_custom_word ( word = "sapiens" , replacement = "saypeeoons" , lang = "en" )
print ( r ) สำหรับแต่ละภาษาอนุญาตให้มีการป้อนคำเดียวเท่านั้น อย่างไรก็ตามแต่ละคำสามารถมี specializations หลายอย่าง เมื่อมีการลงทะเบียนคำแรก specialization default จะถูกสร้างขึ้นเสมอซึ่งจะตรงกับสิ่งที่ผ่านเข้ามาการโทรที่ตามมาด้วยความเชี่ยวชาญเฉพาะด้านที่แตกต่างกันจะอัปเดตเฉพาะความเชี่ยวชาญที่กำหนดเท่านั้น การกำหนดค่าที่แน่นอนที่จะใช้จะถูกกำหนดโดยลำดับต่อไปนี้ของการตั้งค่า:
voice name > language dialect > provider name > default
ตัวอย่างเช่นการเปลี่ยนที่ระบุไว้สำหรับชื่อเสียง sara จะถูกเลือกผ่านการเปลี่ยนที่ระบุไว้สำหรับ azure ผู้ให้บริการ
list_custom_words() แสดงรายการคำทั้งหมดที่มีอยู่ในพจนานุกรมที่กำหนดเอง
พารามิเตอร์:
lang [จำเป็น] (String) - ตระกูลภาษาเช่น en หรือ es - ใช้ global เพื่อเขียนคำศัพท์ภาษาไม่เชื่อเรื่องภาษา
ตัวอย่าง:
# lists all words in the dictionary along with their replacements
words = apiaudio . Lexi . list_custom_words ( lang = "en" ) ผลกระทบของการใช้พจนานุกรมการออกเสียงสามารถดูได้ด้วยวิธี script.preview() ดูเอกสารสคริปต์สำหรับรายละเอียดเพิ่มเติม
ตัวอย่าง:
text = """
The author of this repo has lived in two places in the
UK, <!Bude> and <!Bristol>
"""
r = apiaudio . Script . create ( scriptText = text )
scriptId = r [ "scriptId" ]
# preview the script in en-gb
preview = apiaudio . Script . preview ( scriptId = scriptId , voice = "Joanna" )
print ( preview )การตอบสนอง:
{ "preview" : "The author of this repo has lived in two places in the UK, bude and <phoneme alphabet= " ipa " ph= " ### " > bristol </phoneme>" } ในตัวอย่างนี้ Bristol จะได้รับการออกเสียงเพื่อให้แน่ใจว่ามีการออกเสียงอย่างถูกต้อง แต่เนื่องจาก Bude ไม่ได้อยู่ในพจนานุกรมของเรามันก็เหลืออยู่ โทเค็น IPA ที่แน่นอนสำหรับคำในพจนานุกรมภายในของเรามีการศึกษา
Connector ทรัพยากรที่ใช้สำหรับการตรวจสอบการรวมกลุ่มที่ 3 ผลลัพธ์สุดท้ายของทรัพยากรการเรียนรู้สามารถกระจายไปยังแอปพลิเคชันภายนอกผ่านฟิลด์ connectors ดูเอกสารประกอบการเชื่อมต่อ รายการแอปพลิเคชันที่รองรับในปัจจุบัน:
วิธีการที่มีอยู่:
retrieve() หลังจากลงทะเบียนตัวเชื่อมต่อใน API.Console ให้ใช้วิธีนี้เพื่อตรวจสอบว่าการเชื่อมต่อนั้นสำเร็จโดยใช้ข้อมูลรับรองที่ให้ไว้หรือไม่
พารามิเตอร์:
name * [จำเป็น] (สตริง) - ชื่อของตัวเชื่อมต่อที่ระบุในคอนโซลตัวอย่าง:
status = apiaudio . Connector . retrieve (
name = "julep"
) connection() ตรวจสอบสถานะของการเชื่อมต่อโดยให้ connectionId ที่ส่งคืนในการตอบกลับการเรียนรู้
พารามิเตอร์:
connection_id * [จำเป็น] (สตริง) - การเชื่อมต่อที่ส่งคืนโดยทรัพยากรการเรียนรู้ตัวอย่าง:
status = apiaudio . Connector . connection (
connection_id = "af2fe14a-aa6b-4a97-b430-a072c38b11ff"
)OrchestratorOrchestrator ใช้เพื่อให้ทำงานกับบริการเสียงที่หลากหลายได้ง่ายเช่นเดียวกับการส่งคำขอ API เดียว แต่ละเส้นทางที่นี่ได้รับการกำหนดค่าอย่างระมัดระวังเพื่อสร้างสินทรัพย์เสียงที่มีคุณภาพสูงและง่ายต่อการเข้าถึง
วิธีการออเคสตร้าคือ:
create_audio() สร้างคำขอคำพูด TTS อย่างง่ายและเพิ่มเทมเพลตเสียงผ่านการเรียนรู้
พารามิเตอร์:
scriptText * [จำเป็น] (STR) - ข้อความเพื่อสังเคราะห์ (TTS)soundTemplate (STR) - เทมเพลตเสียงที่จะใช้voice * [จำเป็น] (str) - ชื่อของเสียงที่จะใช้ create_three_sections() สร้างคำขอพูด TTS ด้วย 3 ส่วนและเพิ่มเทมเพลตเสียงลงในการเรียนรู้
พารามิเตอร์:
introText * [จำเป็น] (str) - ข้อความเพื่อสังเคราะห์ในส่วนอินโทรmainText * [จำเป็น] (str) - ข้อความเพื่อสังเคราะห์ในส่วนหลักoutroText * [จำเป็น] (Str) - ข้อความเพื่อสังเคราะห์ในส่วน OutrosoundTemplate (STR) - เทมเพลตเสียงที่จะใช้voice * [จำเป็น] (str) - ชื่อของเสียงที่จะใช้ media_with_sound() รวมไฟล์สื่อที่มีอยู่แล้ว (เช่นเสียงที่บันทึกไว้ล่วงหน้า) เข้ากับเทมเพลตเสียง
พารามิเตอร์:
mediaId * [จำเป็น] (STR) - MediaId ของไฟล์สื่อที่จะใช้เป็นอินพุตsoundTemplate * [จำเป็น] (STR) - เทมเพลตเสียงที่จะใช้SDK นี้เป็นวิธีที่ง่ายในการตรวจสอบส่วนหัวความปลอดภัยของ Apiaudio Webhook ขอแนะนำให้คุณตรวจสอบส่วนหัวเพื่อปกป้องเซิร์ฟเวอร์ของคุณจากการโจมตีที่เป็นอันตราย
วิธีคือ:
apiaudio . Webhooks . verify ( payload , sig_header , secret , tolerance ) มันจะส่งคืนจริงถ้าส่วนหัวนั้นถูกต้องมิฉะนั้นจะทำให้เกิดข้อผิดพลาด พารามิเตอร์ที่จะผ่านคือ; payload เป็นวัตถุร่างกายที่ส่งโดย apiaudio, sig_header เป็น X-Aflr-Secret ในส่วนหัวคำขอที่ส่งโดย Apiaudio, secret เป็นความลับของเว็บฮุคของคุณ (คุณสามารถรับได้ในคอนโซล Apiaudio) และ tolerance อดทนในไม่กี่วินาทีสำหรับการตรวจสอบส่วนหัว
โดยค่าเริ่มต้นคำเตือนที่ออกโดย API จะถูกบันทึกไว้ในเอาต์พุตคอนโซล นอกจากนี้พฤติกรรมบางอย่างจะถูกบันทึกไว้ในระดับข้อมูล (เช่น "อยู่ระหว่างดำเนินการ ... " ตัวบ่งชี้ในช่วงเวลาการประมวลผลที่ยาวนานขึ้น) ระดับการบันทึกสามารถควบคุมได้โดยเลือกจากระดับมาตรฐานในไลบรารี logging ของ Python
apiaudio . set_logger_level ( "INFO" )
# apiaudio.set_logger_level("CRITICAL") - set the highest level to disable logs มีเบ็ดล่วงหน้าที่จะทำงานก่อนที่คุณจะส่งไฟล์ นี่คือการรักษามาตรฐานรหัสให้สูง เพื่อเปิดใช้งานคุณควรเรียก make จากนั้นมันจะตั้งค่าเบ็ดล่วงหน้าสำหรับ Git นั่นทั้งหมด! ตอนนี้ทุกครั้งก่อนที่คุณจะกระทำมันจะวิ่งเพื่อบอกคุณเกี่ยวกับมาตรฐาน
หากคุณใช้ VSCODE สำหรับการสร้างไฟล์คุณอาจชนเข้ากับ pre-commit command not found ข้อผิดพลาด ไม่เป็นไรเพียงแค่เรียกใช้ brew install pre-commit หรือผู้จัดการแพ็คเกจโปรดของคุณจากรายการที่นี่
หากคุณชนเข้ากับ your pip version is old เพียงเพิกเฉยและใช้เทอร์มินัล
หากมีปัญหาและคุณกำลังเร่งรีบคุณสามารถเพิ่ม --no-verify git commit -m 'your commit message' --no-verify ตอนท้ายของคำสั่ง commit
โครงการนี้ได้รับใบอนุญาตภายใต้ข้อกำหนดของใบอนุญาต MIT