ดาวน์โหลด apiaudio python - apiaudio python Source Source Download

ภาษาไทย

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

หน้าแรก>การเขียนโปรแกรมที่เกี่ยวข้อง>โค้ดแหล่งที่มา AI

apiaudio python

โค้ดแหล่งที่มา AI

SyncTTS features, _post_request_raw deprecated

ดาวน์โหลด

repo นี้ไม่ได้อยู่ในการพัฒนาเปิดใช้งานอีกต่อไปโปรดใช้ Audiostack SDK เพื่อใช้ API.Audio ต่อไป

Apiaudio - Python SDK

APIAUDIO เป็น API.AUDIO PYTHON 3 SDK SDK นี้ให้การเข้าถึง API.Audio API ได้ง่ายสำหรับแอปพลิเคชันที่เขียนใน Python

สารบัญ

การเปลี่ยนแปลง
เกี่ยวกับ
การเปลี่ยนแปลง
quickstarts
เริ่มต้น
สวัสดีโลก
เอกสาร
- นำเข้า
- การรับรองความถูกต้อง
- การรับรองความถูกต้องด้วยตัวแปรสภาพแวดล้อม
- องค์กรระดับสูง
- การใช้ทรัพยากร
- องค์กร
- สคริปต์
  - ไดเรกทอรี
- คำพูด
- เสียง
- เสียง
- การเรียนรู้
- สื่อ
- การรวมตัวกัน
- กระเจี๊ยบ
- พจนานุกรมการออกเสียง
- ตัวเชื่อมต่อ
- เครื่องแต่งกาย
- webhooks
- การตัดไม้
ผู้ดูแล
ใบอนุญาต

- เกี่ยวกับ

ที่เก็บนี้ได้รับการดูแลอย่างแข็งขันโดย Aflorithmic Labs ตัวอย่างเช่นสูตรและการอ้างอิง API ดูเอกสาร API.AUDIO อย่าลังเลที่จะติดต่อกับคำถามหรือข้อเสนอแนะใด ๆ !

การเปลี่ยนแปลง

คุณสามารถดูการเปลี่ยนแปลงที่อัปเดตของเราได้ที่นี่

- quickstarts

เริ่มต้นด้วยสูตร quickstart ของเรา

- เริ่มต้น

การติดตั้ง

คุณไม่ต้องการซอร์สโค้ดนี้เว้นแต่คุณต้องการแก้ไข หากคุณต้องการใช้แพ็คเกจเพียงแค่เรียกใช้:

pip install apiaudio -U
# or
pip3 install apiaudio -U

ติดตั้งจากแหล่งที่มาพร้อม:

python setup.py install
# or
python3 setup.py install

ข้อกำหนดเบื้องต้น

Python 3.6+

สวัสดีโลก

สร้างไฟล์ hello.py

 touch hello . py

การรับรองความถูกต้อง

ไลบรารีนี้ต้องได้รับการกำหนดค่าด้วย API-KEY ของบัญชีของคุณซึ่งมีอยู่ในคอนโซล API.AUDIO ของคุณ นำเข้าแพ็คเกจ apiaudio และตั้งค่า apiaudio.api_key กับ api-key ที่คุณได้รับจากคอนโซล:

 import apiaudio
apiaudio . api_key = "your-key"

สร้างข้อความเป็นเสียงใน 4 ขั้นตอน

มาสร้างสินทรัพย์เสียงแรกของเรา

✍สร้างสคริปต์ใหม่ scriptText ของเราจะเป็นข้อความที่สังเคราะห์ในภายหลัง

 script = apiaudio . Script . create ( scriptText = "Hello world" )
print ( script )

- แสดงผล ScriptText ที่สร้างขึ้นในขั้นตอนก่อนหน้า ให้ใช้ Aria Voice

 response = apiaudio . Speech . create ( scriptId = script [ "scriptId" ], voice = "Aria" )
print ( response )

ตอนนี้เรามาร่วมคำพูดที่เราเพิ่งสร้างด้วยเทมเพลตเสียง

 response = apiaudio . Mastering . create (
	scriptId = script . get ( "scriptId" ),
	soundTemplate = "jakarta"
	)
print ( response )

ดาวน์โหลดสินทรัพย์เสียงสุดท้ายไปยังไดเรกทอรีการทำงานปัจจุบันของคุณ:

 filepath = apiaudio . Mastering . download ( scriptId = script [ "scriptId" ], destination = "." )
print ( filepath )

ง่ายใช่มั้ย - นี่คือไฟล์ hello.py สุดท้าย

 import apiaudio
apiaudio . api_key = "your-key"

# script creation
script = apiaudio . Script . create ( scriptText = "Hello world" )

# speech creation
response = apiaudio . Speech . create ( scriptId = script [ "scriptId" ], voice = "Aria" )

print ( response )

# mastering process
response = apiaudio . Mastering . create (
	scriptId = script . get ( "scriptId" ),
	soundTemplate = "jakarta"
	)
print ( response )

# download
filepath = apiaudio . Mastering . download ( scriptId = script [ "scriptId" ], destination = "." )
print ( filepath )

ตอนนี้ขอเรียกใช้รหัส:

python hello.py
# or
python3 hello.py

เมื่อสิ่งนี้เสร็จสิ้นแล้วให้ค้นหาสินทรัพย์เสียงที่ดาวน์โหลดและเล่นได้!

- เอกสาร

นำเข้า

 import apiaudio

การรับรองความถูกต้อง

ห้องสมุดจะต้องกำหนดค่าด้วยคีย์ลับของบัญชีของคุณซึ่งมีอยู่ในแผงควบคุม Aflorithmic ของคุณ ตั้งค่า apiaudio.api_key ด้วย api-key ที่คุณได้รับจากแดชบอร์ด:

 apiaudio . api_key = "your-key"

การรับรองความถูกต้องด้วยตัวแปรสภาพแวดล้อม (แนะนำ)

นอกจากนี้คุณยังสามารถตรวจสอบความถูกต้องโดยใช้ตัวแปรสภาพแวดล้อม apiaudio_key และ Apiaudio SDK จะใช้งานโดยอัตโนมัติ ในการตั้งค่าให้เปิดเทอร์มินัลและพิมพ์:

 export apiaudio_key= < your-key >

หากคุณให้ทั้งตัวแปรสภาพแวดล้อมและ apiaudio.api_key ค่าการตรวจสอบค่า apiaudio.api_key จะถูกใช้แทน

องค์กรระดับสูง

ในการควบคุมองค์กรเด็กของคุณโปรดใช้วิธีการต่อไปนี้เพื่อ สมมติว่า รหัสองค์กรนั้น

ตั้งค่ารหัสองค์กรลูกของคุณให้ None เพื่อหยุดการสมมติว่าองค์กร การโทรไปยัง API ครั้งต่อไปจะใช้รหัสองค์กรของคุณเอง

 import apiaudio

apiaudio . set_assume_org_id ( 'child_org_id' )

# Stop using
apiaudio . set_assume_org_id ( None )

ดูทรัพยากรองค์กรสำหรับการดำเนินงานเพิ่มเติมที่คุณสามารถดำเนินการเกี่ยวกับองค์กรของคุณ

การใช้ทรัพยากร

มีสองวิธีในการใช้ทรัพยากร

วิธีการที่แนะนำคือการนำเข้าทรัพยากรทั้งหมดโดยตรงจาก Apiaudio:

 import apiaudio
apiaudio . Script . create ()

หรือคุณสามารถนำเข้าคลาสทรัพยากรที่คุณต้องการใช้ก่อนจากนั้นใช้วิธีการทรัพยากร ตัวอย่างเช่นในการใช้ Script เราสามารถทำได้:

 from apiaudio import Script
Script . create ()

ตรรกะเดียวกันนี้ใช้สำหรับแหล่งข้อมูลอื่น ๆ ( Speech , Voice , Sound ... )

ทรัพยากร `Organization`

ทรัพยากร/คลาสขององค์กรช่วยให้คุณสามารถทำการดึงข้อมูลเกี่ยวกับองค์กรและองค์กรลูกของคุณ

วิธีการขององค์กรคือ:

get_org_data() - รับข้อมูลองค์กรรวมถึง orgid, orgname ฯลฯ
- พารามิเตอร์:
  - ไม่มี.
- ตัวอย่าง:
```
 org_data = apiaudio . Organization . get_org_data ()
```
list_child_orgs() - แสดงรายการองค์กรลูกของคุณ
- พารามิเตอร์:
  - ไม่มี.
- ตัวอย่าง:
```
 child_orgs = apiaudio . Organization . list_child_orgs ()
```
get_secrets() - รับคีย์ API ของคุณ, URL WebHook และ WebHook Secret
- พารามิเตอร์:
  - ไม่มี.
- ตัวอย่าง:
```
 secrets = apiaudio . Organization . get_secrets ()
```

ทรัพยากร `Script`

ทรัพยากรสคริปต์/คลาสอนุญาตให้คุณสร้างดึงและแสดงรายการสคริปต์ เรียนรู้เพิ่มเติมเกี่ยวกับสคริปต์ที่นี่

วิธีการสคริปต์คือ:

create() - สร้างสคริปต์ใหม่
- พารามิเตอร์:
  - scriptText * [จำเป็น] (สตริง) - ข้อความสำหรับสคริปต์ของคุณ สคริปต์สามารถมีหลายส่วนและแท็ก SSML เรียนรู้เพิ่มเติมเกี่ยวกับรายละเอียด scriptText ที่นี่
  - projectName (String) - ชื่อโครงการของคุณ ค่าเริ่มต้นคือ "เริ่มต้น" (สูงสุด 60 อักขระ)
  - moduleName (String) - ชื่อของโมดูลของคุณ ค่าเริ่มต้นคือ "เริ่มต้น" (สูงสุด 60 อักขระ)
  - scriptName (String) - ชื่อสคริปต์ของคุณ ค่าเริ่มต้นคือ "เริ่มต้น" (สูงสุด 60 อักขระ)
  - scriptId (String) - ตัวระบุที่กำหนดเองสำหรับสคริปต์ของคุณ หากมีการจัดเตรียมพารามิเตอร์ ScriptId แล้ว ProjectName, Modulename และ ScriptName จะถูกตั้งค่าเป็นค่าเดียวกับ ScriptId
  - versions (พจนานุกรม) - พจนานุกรมที่มีข้อความสคริปต์เวอร์ชันที่แตกต่างกันโดยคีย์คือชื่อเวอร์ชันและค่าของมันคือ scriptText ที่เกี่ยวข้อง ชื่อเวอร์ชัน v0 ถูกสงวนไว้เป็น scriptText เริ่มต้น ค่าเริ่มต้นคือ "{}"
  - metadata (พจนานุกรม) - ข้อมูลเมตาสำหรับสคริปต์ของคุณ ขนาดนี้ จำกัด เพียง 2KB
- ตัวอย่าง:
```
 text = """
  <<sectionName::hello>> Hello {{username|buddy}} 
  <<sectionName::bye>> Good bye from {{location|barcelona}}
"""

script = apiaudio . Script . create (
    scriptText = text ,
    projectName = "myProject" ,
    moduleName = "myModule" ,
    scriptName = "myScript" ,
    scriptId = "id-1234" ,
    metadata = { "author" : "sam" , "tags" : [ "demo" , "intro" ]}
    )
# example 2 with versions
script = apiaudio . Script . create (
    scriptText = "Default text" ,
    versions = { "es" : "Hola" , "en" : "hello" }
    )
```
retrieve() - ดึงสคริปต์ตาม ID
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์ที่คุณต้องการเรียกคืน โดยค่าเริ่มต้นดึงเวอร์ชันหลัก (v0)
  - version (สตริง) - เวอร์ชันสคริปต์ที่คุณต้องการดึงข้อมูล
- ตัวอย่าง:
```
 script = apiaudio . Script . retrieve ( scriptId = "id-1234" , version = "abc" )
```
preview - ส่งคืนสคริปต์ด้วยการเน้นพจนานุกรม ดู Lexi สำหรับตัวอย่างเพิ่มเติมเกี่ยวกับวิธีการใช้คุณสมบัติพจนานุกรม
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์ที่คุณต้องการใช้
  - voice * [จำเป็น] (สตริง) - เสียงที่จะใช้ในการพูด สิ่งนี้จำเป็นเนื่องจากผลลัพธ์อาจขึ้นอยู่กับเสียงรหัสภาษาหรือผู้ให้บริการ
- ตัวอย่าง:
```
  text = """
    The author of this repo has lived in two places in the
    UK, <!location>Bude<!> and <!location>Bristol<!>.
  """

r = apiaudio . Script . create ( scriptText = text )
scriptId = r [ "scriptId" ]

preview = apiaudio . Script . preview ( scriptId = scriptId , language = "en-gb" )
```
list() - แสดงรายการสคริปต์ทั้งหมดที่มีอยู่ในองค์กรของคุณ วิธีนี้รองรับการกรอง
- พารามิเตอร์:
  - projectName (String) - ส่งคืนสคริปต์ใด ๆ ด้วยชื่อโครงการนี้
  - moduleName (String) - ส่งคืนสคริปต์ใด ๆ ด้วย modulename นี้ Note projectName ยังต้องจัดหา
  - scriptName (String) - ส่งคืนสคริปต์ใด ๆ ด้วย ScriptName นี้ไม่ใช่ทั้ง projectName และ moduleName
  - scriptId (String) - ส่งคืนสคริปต์ใด ๆ ด้วย scriptId นี้
  - verbose (บูล) - สคริปต์รายการในโหมด verbose ( True ตามค่าเริ่มต้น) ตั้งค่านี้เป็น False เพื่อส่งคืนเฉพาะฟิลด์ projectName , moduleName , scriptName และ scriptId
- ตัวอย่าง:
```
 scripts = apiaudio . Script . list ()
```
delete() - ลบสคริปต์ โดยค่าเริ่มต้นสิ่งนี้จะลบสคริปต์ทุกเวอร์ชัน
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสของสคริปต์ที่จะลบ
  - version (สตริง) - ลบเวอร์ชันเฉพาะ
- ตัวอย่าง:
```
 #deletes version 'en' from scriptId 'myworkout'
scripts = apiaudio . Script . delete ( scriptId = "myworkout" , version = "en" )
```
delete_multiple() - ลบสคริปต์หลายรายการ
- พารามิเตอร์:
  - projectName * [จำเป็น] (สตริง) - ลบสคริปต์ทั้งหมดภายในชื่อโครงการนี้
  - moduleName (String) - ลบสคริปต์ทั้งหมดภายใน Modulename นี้ Note projectName จะต้องจัดหาด้วย
  - scriptName (String) - ลบสคริปต์ทั้งหมดภายในชื่อสคริปต์นี้หมายเหตุทั้ง projectName และ moduleName จะต้องจัดส่ง
- ตัวอย่าง:
```
 #deletes all scripts within the project 'awesome_demos'
scripts = apiaudio . Script . delete_multiple ( projectName = "awesome_demos" )
```
get_random_text() - ดึงข้อความแบบสุ่มจากรายการหมวดหมู่
- พารามิเตอร์:
  - category (สตริง) - หมวดหมู่ที่ดึงข้อความแบบสุ่ม หากไม่ได้ระบุหมวดหมู่ฟังก์ชันจะเริ่มต้นเป็น "FunFact"
- ตัวอย่าง:
```
 text = apiaudio . Script . get_random_text ( category = "BibleVerse" )
```
  - หมวดหมู่ปัจจุบันมีอยู่: "BibleVerse" , "FunFact" , "InspirationalQuote" "Joke" , " "MovieSynopsis" ", "Poem" , "PhilosophicalQuestion" , "Recipe" , "TriviaQuestion"
Script.Directory ทรัพยากรไดเรกทอรี
แสดงรายการโครงสร้างไดเรกทอรีของสคริปต์ของคุณเช่น ProjectName/modulename/scriptName
Script.directory วิธีการคือ:
- list_projects() - แสดงรายการโครงการทั้งหมด
- พารามิเตอร์:
  - ไม่มี
- ตัวอย่าง:
```
 #Lists all project names
projects = apiaudio . Script . Directory . list_projects ()
print ( projects )
# example output: ["projectX", "projectY"]
```
- list_modules() - แสดงรายการโมดูลทั้งหมดภายใน ProjectPrefix
- พารามิเตอร์:
  - projectPrefix * [จำเป็น] - จะแสดงรายการโมดูลเริ่มต้นด้วย ProjectPrefix นี้
- ตัวอย่าง:
```
 #Lists all module names
modules = apiaudio . Script . Directory . list_modules ( projectPrefix = "workout" )

print ( modules )
# example output: ["workout_1/over60s", "workout_2/morning_routine"]
```
- list_script_names() - แสดงรายการโมดูลทั้งหมดภายใน ProjectPrefix
- พารามิเตอร์:
  - projectPrefix * [จำเป็น] - จะแสดงรายการชื่อสคริปต์ที่เริ่มต้นด้วย ProjectPrefix นี้
  - modulePrefix * [จำเป็น] - จะแสดงรายการ ScriptNames ที่เริ่มต้นด้วย modulePreFix นี้
- ตัวอย่าง:
```
 #Lists all script names
scriptNames = apiaudio . Script . Directory . list_script_names ( projectPrefix = "workout_1" , modulePrefix = "over60s" )

print ( scriptNames )
# example output: ["workout_1/over60s/routine_1", "workout_1/over60s/routine_2", "workout_1/over60s/routine_3"]
```

ทรัพยากร `Speech`

คำพูดช่วยให้คุณทำข้อความเป็นคำพูด (TTS) ด้วย API ของเราโดยใช้เสียงทั้งหมดที่มีอยู่ ใช้เพื่อสร้างไฟล์เสียงพูดจากสคริปต์ของคุณ

วิธีการพูดคือ:

create() ส่งคำขอข้อความเป็นคำพูดไปยังบริการข้อความเป็นคำพูดของเรา
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์
  - version (สตริง) - เวอร์ชันของสคริปต์ที่จะผลิต ค่าเริ่มต้นคือ ""
  - voice (สตริง) - ชื่อเสียง ดูรายการเสียงที่มีอยู่โดยใช้ทรัพยากรเสียง เสียงเริ่มต้นคือ "Joanna"
  - speed (สตริง) - ความเร็วเสียง ความเร็วเริ่มต้นคือ 100
  - effect (สตริง) - ใส่เอฟเฟกต์ตลกในเสียงของคุณ คุณสามารถลองสิ่งต่อไปนี้: dark_father , chewie , 88b , 2r2d ,
  - silencePadding (จำนวนเต็ม) - เพิ่มช่องว่างความเงียบลงในแทร็กคำพูดของคุณ (เป็นมิลลิวินาที) ค่าเริ่มต้นคือ 0 (ไม่มีช่องว่างภายใน)
  - audience (dict) - ระบุค่าของพารามิเตอร์ในสคริปต์ของคุณ ตัวอย่างเช่นถ้าในทรัพยากรสคริปต์คุณมี scriptText="Hello {{name}} {{lastname}}, welcome to {{location}}" ผู้ชมควรเป็น: {"name": "Elon", "lastname": "Musk", "location": "Istanbul"} หากไม่ได้จัดเตรียมแทร็กทางเลือกจะถูกสร้างขึ้น
  - sync (บูลีน) - อนุญาตให้ Sync หรือ Async Speech Creation ค่าเริ่มต้นเป็น True หาก sync=False คำพูดสร้างการโทรจะส่งคืนข้อความความสำเร็จเมื่อการสร้างคำพูดถูกทริกเกอร์ ในการดึงไฟล์ตรวจสอบ Speech.retrieve()
  - sections (DICT) - ระบุพารามิเตอร์สำหรับส่วนที่เฉพาะเจาะจงในสคริปต์ คีย์คือชื่อส่วนและค่าเป็นพจนานุกรมอื่นที่มีการกำหนดค่าส่วน (พารามิเตอร์ที่ถูกต้องคือ: เสียงความเร็ว, เอฟเฟกต์, silence_padding) หากไม่พบส่วนที่นี่ส่วนจะสืบทอดเสียงความเร็วความเร็วและ silence_padding โดยอัตโนมัติที่คุณกำหนดไว้ข้างต้น (หรือค่าเริ่มต้นหากคุณไม่ได้ให้ไว้) ดูตัวอย่างด้านล่างด้วย 2 ส่วนและใช้พารามิเตอร์การกำหนดค่าที่แตกต่างกัน
  - useDictionary (บูล) - ใช้พจนานุกรมการออกเสียงกับข้อความสคริปต์
  - useTextNormalizer (BOOL) - ใช้การทำให้เป็นมาตรฐานของข้อความซึ่งสามารถช่วยแก้ไขข้อผิดพลาดทางไวยากรณ์ด้วยการออกเสียง TTS เช่น 11:12 UHR -> 11 UHR 12 หมายเหตุ - ใช้งานได้เฉพาะกับเสียงเยอรมันในปัจจุบัน
```
 sections = {
    "firstsection" : {
        "voice" : "Matthew" ,
        "speed" : 110 ,
        "silence_padding" : 100
    },
    "anothersection" : {
        "voice" : "en-GB-RyanNeural" ,
        "speed" : 100
    }
}
```
- ตัวอย่างง่ายๆ:
```
 response = apiaudio . Speech . create (
    scriptId = "id-1234" ,
    voice = "Joanna"
    )
```
- ตัวอย่างที่สมบูรณ์:
```
 response = apiaudio . Speech . create (
    scriptId = "id-1234" ,
version = "abc" ,
    voice = "Matthew" ,
    speed = 100 ,
    effect = "dark_father" ,
    silencePadding = 1000 ,
    sync = True ,
    audience = { "username" : "Elon" , "lastname" : "Musk" },
    sections = {
        "firstsection" : {
            "voice" : "Matthew" ,
            "speed" : 110 ,
            "silence_padding" : 100 ,
        },
        "anothersection" : {
            "voice" : "Liam" ,
        }
    }
)
```
retrieve() ดึง URL ไฟล์คำพูด
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์ที่คุณต้องการเรียกคืน
  - version (สตริง) - เวอร์ชันของสคริปต์ที่จะดึง ค่าเริ่มต้นคือ ""
  - section (สตริง) - ชื่อส่วนสคริปต์ที่คุณต้องการเรียกคืน หากไม่ได้ให้ไว้ส่วนสคริปต์ทั้งหมดจะถูกส่งคืน
  - parameters (DICT) - DICT ที่มีพารามิเตอร์การตั้งค่าส่วนบุคคลของสคริปต์ของคุณ หากไม่ได้จัดเตรียมแทร็กทางเลือกจะถูกเรียกคืน ฟิลด์นี้ขึ้นอยู่กับพารามิเตอร์ที่คุณใช้ในส่วนทรัพยากรของสคริปต์ ในการดึงชุดพารามิเตอร์เฉพาะคุณต้องสร้างคำพูดด้วยพารามิเตอร์ชุดเดียวกัน
- ตัวอย่าง:
```
 audio_files = apiaudio . Speech . retrieve ( scriptId = "id-1234" )
```
download() ดาวน์โหลดไฟล์คำพูดในโฟลเดอร์ที่คุณต้องการ
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสสคริปต์ที่คุณต้องการดาวน์โหลด
  - version (สตริง) - เวอร์ชันของสคริปต์ที่จะดาวน์โหลด ค่าเริ่มต้นคือ ""
  - section (สตริง) - ชื่อส่วนสคริปต์ที่คุณต้องการเรียกคืน หากไม่ได้ให้ไว้ส่วนสคริปต์ทั้งหมดจะถูกส่งคืน
  - parameters (DICT) - DICT ที่มีพารามิเตอร์การตั้งค่าส่วนบุคคลของสคริปต์ของคุณ หากไม่ได้จัดเตรียมแทร็กทางเลือกจะถูกเรียกคืน ฟิลด์นี้ขึ้นอยู่กับพารามิเตอร์ที่คุณใช้ในส่วนทรัพยากรของสคริปต์ ในการดึงชุดพารามิเตอร์เฉพาะคุณต้องสร้างคำพูดด้วยพารามิเตอร์ชุดเดียวกัน
  - destination (สตริง) - เส้นทางปลายทางโฟลเดอร์ ค่าเริ่มต้นคือ "." (โฟลเดอร์ปัจจุบัน)
- ตัวอย่าง:
```
 audio_files = apiaudio . Speech . download ( scriptId = "id-1234" , destination = "." )
```

ทรัพยากร `Voice`

เสียงช่วยให้คุณสามารถดึงรายการเสียงที่มีอยู่จาก API ของเรา

วิธีการเสียงคือ:

list() แสดงรายการเสียงที่มีอยู่ทั้งหมดใน API ของเรา พารามิเตอร์ล้วนเป็นตัวเลือกและสามารถใช้ร่วมกันเพื่อให้ได้เสียงที่สมบูรณ์แบบสำหรับการใช้งานของคุณ
- พารามิเตอร์:
  - provider (สตริง) - ลองหนึ่งใน: Google, Polly, Azure, MSNR (Aflorithmic), IBM, Yandex, Retro (Aflorithmic), Vocalid, คล้ายกับ
  - language (สตริง) - เช่นภาษาอังกฤษ, สเปน, ฝรั่งเศส, เยอรมัน ฯลฯ
  - accent (สตริง) - เช่นอเมริกัน, อังกฤษ, เป็นกลาง, โปรตุเกส/บราซิล, อเมริกันนุ่ม, เม็กซิกัน, ออสเตรเลีย
  - gender (สตริง) - ลองกับหนึ่งใน: ชายหญิง
  - ageBracket (String) - ลองกับหนึ่งใน: ผู้ใหญ่, เด็ก, อาวุโส
  - tags (String)-ลองใช้หนึ่งหรือมากกว่านั้น (คั่นด้วยเครื่องหมายจุลภาค) ของ: มั่นคง, มั่นใจ, สมดุล, ให้ข้อมูล, จริงจัง, การสอน, ช้า, การเล่าเรื่อง, สงบ, ชัดเจน, ลึก, เป็นทางการ, เศร้า, ผอม, เร็ว, upbeat, ความสนุกสนาน, ความสัมพันธ์, ความสัมพันธ์ มีความรู้มุ่งเน้น, จดหมายข่าว, ผู้ประกาศข่าว, ผู้สัมภาษณ์, น่าเชื่อถือ, เป็นมิตร, เป็นมิตร, ดีสำหรับการแจกข้อมูล, เป็นมิตรเล็กน้อย
  - industryExamples (String) - ลองใช้หนึ่งหรือมากกว่าหนึ่ง (แยกจากกันโดย Commas) ของ: Fitness, ธุรกิจ, เชิงพาณิชย์, แฟชั่น, การเดินทาง, หนังสือเสียง, อสังหาริมทรัพย์, ศรัทธา, อุตสาหกรรมสุขภาพ, Comercial, Realestate, Kids Entertainment, เกม, การบริการลูกค้า, การศึกษา, การเล่าเรื่อง, ความบันเทิง, เด็ก ๆ
  - timePerformance (String) - ประสิทธิภาพเวลาของเสียง มีสามประเภท: ช้ากลางเร็ว
  - sectionCharacterLimit (String) - จำนวนอักขระสูงสุดที่เสียงสามารถประมวลผลต่อส่วนสคริปต์ ผู้ให้บริการที่ได้รับการสนับสนุนทั้งหมดยกเว้น Vocalid มีขีด จำกัด 4,000
- ตัวอย่าง:
```
 all_voices = apiaudio . Voice . list ()
```
- ตัวอย่าง:
```
 french_voices = apiaudio . Voice . list ( language = "french" , tags = "steady, fun" )
```
list_parameters() วิธีนี้ช่วยให้คุณเห็นคุณลักษณะใดที่คุณสามารถกรองเสียงได้ด้วยค่าที่อนุญาตสำหรับแต่ละแอตทริบิวต์ ในภายหลังคุณสามารถใช้พารามิเตอร์และค่าเหล่านี้เพื่อกรองเสียงที่คุณต้องการแสดงรายการ
- พารามิเตอร์:
  - ไม่จำเป็นต้องมีพารามิเตอร์
- ตัวอย่าง:
```
 parameters = apiaudio . Voice . list_parameters ()
```

ทรัพยากร `Sound`

เสียงช่วยให้คุณออกแบบเทมเพลตเสียงของคุณเองจากสคริปต์และแทร็กพื้นหลัง เพื่อให้ได้เทมเพลตเสียง/โครงการตรวจสอบให้แน่ใจว่าคุณขอคำพูดสำหรับทรัพยากรสคริปต์ของคุณก่อน

วิธีการเสียงคือ:

list() แสดงรายการเทมเพลตเสียงที่มีอยู่ทั้งหมดใน API ของเรา พารามิเตอร์ล้วนเป็นตัวเลือกและสามารถใช้ร่วมกันเพื่อให้ได้เสียงที่สมบูรณ์แบบสำหรับ USECASE ของคุณ
- พารามิเตอร์:
  - industryExamples (String) - ลองใช้หนึ่งหรือมากกว่าหนึ่ง (คั่นด้วยเครื่องหมายจุลภาค) ของ: ข่าว, การเดินทาง, ธุรกิจ, การผ่อนคลาย, การออกกำลังกาย, ผ่อนคลาย, เรื่องราวเด็ก ๆ
  - contents (สตริง) - ลองใช้หนึ่ง (คั่นด้วยเครื่องหมายจุลภาค) ของ: อินโทร, หลัก, outro, effect1, effect2, main outro, droid_main, chewie_main, effect3, บรรยากาศ, เอฟเฟกต์เท่านั้น
  - genre (สตริง) - ลองกับหนึ่งใน: อิเล็กทรอนิกส์, อะคูสติก, บรรยากาศ, บทคัดย่อ, ร็อค
  - tempo (String) - ลองกับหนึ่งใน: mid, up, down, uptempo
  - tags (String) - ลองใช้หนึ่งหรือมากกว่าหนึ่ง (คั่นด้วยเครื่องหมายจุลภาค) ของ: รุนแรง, น้อยที่สุด, สะท้อน, ไพเราะ, มีความสุข, ความคิดถึง, โฟกัส, พลัง, การยกระดับ, การผ่อนคลาย, ผ่อนคลาย, บรรยากาศ, ลึกลับ, บวก, ข้อมูล, การออกกำลังกาย, การทำสมาธิ
- ตัวอย่าง:
```
 sound_templates = apiaudio . Sound . list ()
```
list_parameters() วิธีนี้ช่วยให้คุณเห็นคุณลักษณะใดที่คุณสามารถกรองเทมเพลตเสียงได้โดยพร้อมกับค่าที่อนุญาตสำหรับแต่ละแอตทริบิวต์ ในภายหลังคุณสามารถใช้พารามิเตอร์และค่าเหล่านี้เพื่อกรองเทมเพลตเสียงที่คุณต้องการแสดงรายการ
- พารามิเตอร์:
  - ไม่จำเป็นต้องมีพารามิเตอร์
- ตัวอย่าง:
```
 parameters = apiaudio . Sound . list_parameters ()
```

ทรัพยากร `Mastering`

Mastering ช่วยให้คุณสร้างและดึงไฟล์เสียงที่เชี่ยวชาญของสคริปต์ของคุณ เวอร์ชันที่เชี่ยวชาญมีคำพูดของสคริปต์แทร็กพื้นหลังพารามิเตอร์ส่วนบุคคลสำหรับผู้ชมของคุณและกระบวนการควบคุมเพื่อปรับปรุงคุณภาพเสียงของแทร็กทั้งหมด เพื่อให้ได้ไฟล์เสียงที่เชี่ยวชาญตรวจสอบให้แน่ใจว่าคุณได้ร้องขอคำพูดสำหรับทรัพยากรสคริปต์ของคุณก่อน

วิธีการเรียนรู้คือ:

create() สร้างสคริปต์รุ่นที่เชี่ยวชาญและเลือกรูปแบบเสียง
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสทรัพยากรสคริปต์
  - version (สตริง) - เวอร์ชันของสคริปต์ที่จะผลิต ค่าเริ่มต้นคือ ""
  - soundTemplate (สตริง) - ชื่อเทมเพลตเสียง สำหรับรายการเทมเพลตเสียงที่มีอยู่ให้ตรวจสอบ apiaudio.Sound.list_sound_templates() การโทร
  - public (บูลีน) - ธงบูลีนที่อนุญาตให้จัดเก็บไฟล์ที่เชี่ยวชาญในโฟลเดอร์สาธารณะ S3 ค่าเริ่มต้นเป็น False คำเตือน - สิ่งนี้จะทำให้ไฟล์ที่เชี่ยวชาญของคุณเป็นสาธารณะต่อทุกคนในอินเทอร์เน็ต ใช้สิ่งนี้ด้วยความเสี่ยงของคุณเอง
  - vast (บูลีน) - ธงบูลีนที่อนุญาตให้สร้างไฟล์ขนาดใหญ่ของไฟล์ที่เชี่ยวชาญของคุณ ธง vast จะใช้งานได้ก็ต่อเมื่อ public เป็น True ค่าเริ่มต้นเป็น False
  - endFormat (รายการ) - รายการรูปแบบเสียงที่จะผลิต รูปแบบที่ถูกต้องคือ: ["wav", "mp3" (default), "flac", "ogg", "mp3_very_low", "mp3_low", "mp3_medium", "mp3_high", "mp3_very_high", "mp3_alexa"]
  - forceLength (int) - บังคับความยาวเสียงของแทร็กที่เชี่ยวชาญ (ในไม่กี่วินาที)
  - audience (DICT) - พจนานุกรมที่มีพารามิเตอร์การปรับเปลี่ยนส่วนบุคคล พารามิเตอร์นี้ขึ้นอยู่กับจำนวนพารามิเตอร์ที่คุณใช้ในทรัพยากรสคริปต์ของคุณ ในตัวอย่างเอกสารสคริปต์ด้านบนเราใช้พารามิเตอร์ 2 ตัว: username และ location และในตัวอย่างต่อไปนี้เราต้องการสร้างสคริปต์สำหรับชื่อผู้ใช้ salih กับตำแหน่ง Barcelona หากไม่ได้ให้ผู้ชมแทร็กทางเลือกจะถูกสร้างขึ้น
  - mediaFiles (รายการ) - รายการคำสั่งที่มีไฟล์สื่อ พารามิเตอร์นี้ขึ้นอยู่กับแท็กไฟล์สื่อที่ใช้ในทรัพยากรสคริปต์และไฟล์สื่อที่คุณมีในบัญชีของคุณ ตัวอย่างเช่นหากสคริปต์มี <<media::myrecording>> บวก <<media::mysong>> และคุณต้องการที่จะแนบ myrecording กับ mediaid = "12345" และ mySong to mediaid = "67890" จากนั้น mediaFiles = [{"myrecording":"12345", "mysong":"67890"}]
  - mediaVolumeTrim (Float) - ตัวแปรจุดลอยตัวที่ช่วยให้คุณสามารถตัดระดับเสียงของไฟล์สื่อที่อัปโหลดได้ (เป็น db) แอตทริบิวต์นี้มีช่วงที่ถูกต้อง -12 ถึง 12 เดซิเบลและนำไปใช้กับไฟล์สื่อทั้งหมดที่รวมอยู่ในการเรียกเรียนรู้ครั้งเดียว การป้องกันการตัดไม่ได้ให้การปรับที่เพิ่มขึ้นเท่านั้น
  - connectors (รายการ) - รายการคำสั่งระบุการกำหนดค่าสำหรับการเชื่อมต่อบุคคลที่สามโดยเฉพาะ สำหรับแนวทางในบริบทของแอปพลิเคชันบุคคลที่ 3 ที่รองรับดูเอกสารประกอบการเชื่อมต่อ
  - masteringPreset (String) - การตั้งค่าล่วงหน้าที่จะใช้สิ่งนี้ช่วยให้คุณสมบัติเช่นการบีบอัด sidechain 'IE ducking' ดู apiaudio.Mastering.list_presets() สำหรับรายการที่ตั้งไว้ล่วงหน้าและคำอธิบายของพวกเขา
  - share (บูลีน) - หากคุณต้องการมีลิงก์ที่แชร์ได้สร้างขึ้นด้วยไฟล์เสียงของคุณให้ใช้ธงนี้ หากคุณใส่ share: True การตอบสนองจะมีพารามิเตอร์ shareUrl ส่งคืน (หมายเหตุ: หากคุณใส่ธงนี้ไฟล์ส่วนตัวของคุณจะถูกแปลงเป็นไฟล์สาธารณะ)
- ตัวอย่าง:
```
 response = apiaudio . Mastering . create (
    scriptId = "id-1234" ,
    soundTemplate = "jakarta" ,
    audience = { "username" : "salih" , "location" : "barcelona" }
)
```
create_media_timeline() สร้างคำขอการเรียนรู้ตามไฟล์สื่อที่อัปโหลดอย่างหมดจด ไฟล์สื่อจะต้องอัปโหลดก่อนเรียกใช้ฟังก์ชันนี้ ดูสื่อ
- พารามิเตอร์:
  - timeline * [จำเป็น] (รายการ) - วัตถุไทม์ไลน์ วัตถุไทม์ไลน์เป็นรายการพจนานุกรมโดยแต่ละรายการแสดงถึงแทร็กของไฟล์เสียง แต่ละแทร็กจะต้องมี files สองปุ่มต่อไปนี้และ contentType ต่อไปนี้
    - files * [จำเป็น] (รายการ) ไฟล์เป็นรายการของพจนานุกรมโดยแต่ละรายการจะต้องมี 3 ปุ่มต่อไปนี้, mediaId , startAt และ endAt
      - files * [จำเป็น] (str) สื่อกลางของไฟล์ที่อัปโหลดแล้ว
      - startAt * [จำเป็น] (ลอย) เวลาที่ไฟล์สื่อนี้ควรเริ่มในไม่กี่วินาที
      - endAt * [จำเป็น] (ลอย) เวลาที่ไฟล์สื่อนี้ควรสิ้นสุดในไม่กี่วินาที
    - contentType * [จำเป็น] (สตริง) - ประเภทของเนื้อหาที่แทร็กนี้มีควรเป็น sound หรือ speech
  - endFormat (รายการ) - รายการรูปแบบเสียงที่จะผลิต รูปแบบที่ถูกต้องคือ: ["wav", "mp3" (default), "flac", "ogg", "mp3_very_low", "mp3_low", "mp3_medium", "mp3_high", "mp3_very_high", "mp3_alexa"]
  - masteringPreset (String) - การตั้งค่าล่วงหน้าที่จะใช้สิ่งนี้ช่วยให้คุณสมบัติเช่นการบีบอัด sidechain 'IE ducking' ดู apiaudio.Mastering.list_presets() สำหรับรายการที่ตั้งไว้ล่วงหน้าและคำอธิบายของพวกเขา
- ตัวอย่าง:
```
 backgroundId = apiaudio . Media . upload ( file_path = "background.wav" )[ "mediaId" ]
speechId = apiaudio . Media . upload ( file_path = "speech1.wav" )[ "mediaId" ]

timeline = [
  {
      "files" : [
          {
              "mediaId" : speechId ,
              "startAt" : 2 ,
              "endAt" : 14 ,
          }
      ],
      "contentType" : "speech"
  },
  {

      "files" : [
          {
              "mediaId" : backgroundId ,
              "startAt" : 0 ,
              "endAt" : 45 ,
          }
      ],
      "contentType" : "sound"
  }
]
response = apiaudio . Mastering . create_media_timeline ( timeline = timeline , masteringPreset = "lightducking" )
```
retrieve() ดึง URL ไฟล์ที่เชี่ยวชาญ
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสทรัพยากรสคริปต์
  - versions (สตริง) - เวอร์ชันของสคริปต์ที่จะเรียกคืน ค่าเริ่มต้นคือ ""
  - parameters (DICT) - พจนานุกรมที่มีรายการผู้ชมที่คุณต้องการเรียกคืน หากไม่ได้ให้พารามิเตอร์แทร็กทางเลือกจะถูกเรียกคืน
  - public (บูลีน) - ธงบูลีนที่อนุญาตให้ดึงไฟล์ที่เชี่ยวชาญจากถังสาธารณะ ใช้สิ่งนี้หากคุณต้องการดึงไฟล์ที่มีความเชี่ยวชาญที่สร้างขึ้นโดยใช้ public=True ค่าเริ่มต้นเป็น False
  - vast (บูลีน) - ธงบูลีนที่อนุญาตให้ดึงไฟล์ขนาดใหญ่ของไฟล์ที่เชี่ยวชาญของคุณ ธง vast จะใช้งานได้ก็ต่อเมื่อ public เป็น True ค่าเริ่มต้นเป็น False
  - endFormat (รายการ) - รายการรูปแบบเสียงที่จะเรียกคืน รูปแบบที่ถูกต้องคือ: ["wav", "mp3" (default), "flac", "ogg", "mp3_very_low", "mp3_low", "mp3_medium", "mp3_high", "mp3_very_high", "mp3_alexa"]
- ตัวอย่าง:
```
 mastered_files = apiaudio . Mastering . retrieve (
  scriptId = "id-1234" ,
  parameters = { "username" : "salih" , "location" : "barcelona" }
)
```
download() ดาวน์โหลดไฟล์ Mastered ในโฟลเดอร์ที่คุณต้องการ
- พารามิเตอร์:
  - scriptId * [จำเป็น] (สตริง) - รหัสทรัพยากรสคริปต์
  - version (สตริง) - เวอร์ชันของสคริปต์ที่จะดาวน์โหลด ค่าเริ่มต้นคือ ""
  - parameters (DICT) - พจนานุกรมที่มีรายการผู้ชมที่คุณต้องการเรียกคืน หากไม่มีการจัดเตรียมพารามิเตอร์แทร็กทางเลือกจะถูกดาวน์โหลด
  - destination (สตริง) - เส้นทางปลายทางโฟลเดอร์ ค่าเริ่มต้นคือ "." (โฟลเดอร์ปัจจุบัน)
  - public (บูลีน) - ธงบูลีนที่อนุญาตให้ดึงไฟล์ที่เชี่ยวชาญจากถังสาธารณะ ใช้สิ่งนี้หากคุณต้องการดึงไฟล์ที่มีความเชี่ยวชาญที่สร้างขึ้นโดยใช้ public=True ค่าเริ่มต้นเป็น False
  - vast (บูลีน) - ธงบูลีนที่อนุญาตให้ดึงไฟล์ขนาดใหญ่ของไฟล์ที่เชี่ยวชาญของคุณ ธง vast จะใช้งานได้ก็ต่อเมื่อ public เป็น True ค่าเริ่มต้นเป็น False
- ตัวอย่าง:
```
 mastered_files = apiaudio . Mastering . download (
  scriptId = "id-1234" ,
  parameters = { "username" : "salih" , "location" : "barcelona" }
  destination = "."
)
```
- list_presets() แสดงรายการที่ตั้งไว้ล่วงหน้าที่มีอยู่
  - พารามิเตอร์:
    - ไม่จำเป็นต้องมีพารามิเตอร์
- ตัวอย่าง:
```
 presets = apiaudio . Mastering . list_presets ()
print ( presets )
```

ทรัพยากร `Media`

สื่อช่วยให้คุณสามารถดึงไฟล์ทั้งหมดที่มีอยู่ใน API.Audio สำหรับองค์กรของคุณ

วิธีการสื่อคือ:

upload() - อัปโหลดไฟล์ไปยังฐานข้อมูลของเรา
- พารามิเตอร์:
  - file_path * [จำเป็น] (สตริง) - พา ธ สัมพัทธ์ไปยังไฟล์เสียง
  - tags (สตริง) - แท็กคั่นด้วยเครื่องหมายจุลภาคที่คุณต้องการเพิ่มในไฟล์ที่อัปโหลดของคุณ สิ่งนี้จะทำให้การดึงข้อมูลง่ายขึ้น
- ตัวอย่าง:
```
 apiaudio . Media . upload (
  file_path = "./my_file.mp3" ,
  tags = "tag1,tag2,tag3"
)
```
list() - แสดงรายการไฟล์ทั้งหมดภายในองค์กร
- พารามิเตอร์:
  - mediaId (String) - ถ้าผ่านจะส่งคืนไฟล์นั้นหรือวัตถุที่ว่างเปล่าหากไม่มีอยู่
  - tags (สตริง) - แท็กคั่นด้วยเครื่องหมายจุลภาคที่คุณต้องการเพิ่มในไฟล์ที่อัปโหลดของคุณ หากผ่านไปจะส่งคืนไฟล์ทั้งหมดที่มีแท็กเหล่านั้นอย่างน้อย
  - downloadUrl (บูลีน): ถ้าเป็นจริงจะมีการเพิ่ม URL ที่กำหนดไว้ในแต่ละรายการในอาร์เรย์ นี่เป็นไฟล์ที่ช้าสำหรับไฟล์จำนวนมาก (ประมาณ 1 วินาที)
  - public (บูลีน): ถ้าเป็นจริงไฟล์สื่อที่ระบุไว้จะเป็นไฟล์สื่อสาธารณะที่จัดทำโดย API.Audio ค่าเริ่มต้นเป็นเท็จ
- ตัวอย่าง:
```
 # lists all files
files = apiaudio . Media . list ()

# lists files with tag="tag1"
files = apiaudio . Media . list ( tags = "tag1" )

# lists file with specific id
files = apiaudio . Media . list ( mediaId = "some_mediaId" )

# lists files with tag="tag1" and with a downloadurl
files = apiaudio . Media . list ( tags = "tag1" , downloadUrl = True )
```
list_tags() สิ่งนี้จะส่งคืนรายการด้วยแท็กที่กำหนดเฉพาะผู้ใช้ทั้งหมด
- พารามิเตอร์:
  - ไม่จำเป็นต้องมีพารามิเตอร์

ตัวอย่าง:

 tags = apiaudio . Media . list_tags ()
print ( tags )

get_download_url() - วิธีนี้ส่งคืน URL ที่กำหนดไว้สำหรับการดาวน์โหลดไฟล์เสียงเฉพาะ
- params:
  - mediaId * [จำเป็น] (String): Media ID สำหรับไฟล์ที่จะดาวน์โหลด

ตัวอย่าง

 url = apiaudio . Media . get_download_url ( mediaId = "some-mediaId" )
print ( url )

download() - วิธีนี้ดาวน์โหลดไฟล์เสียงเฉพาะ
- params:
  - mediaId * [จำเป็น] (String): Media ID สำหรับไฟล์ที่จะดาวน์โหลด
  - destination (สตริง): พา ธ ไปยังไดเรกทอรีที่จะดาวน์โหลดไฟล์ ค่าเริ่มต้นคือ "."

ตัวอย่าง

 apiaudio . Media . download (
  mediaId = "some_mediaId" ,
  destination = "/my_destination_folder"
)

`SyncTTS` ทรัพยากร

Synctts ช่วยให้คุณทำแบบซิงโครนัสเป็นคำพูด (TTS) ด้วย API ของเราโดยใช้เสียงทั้งหมดที่มีอยู่ ใช้เพื่อสร้างไฟล์เสียงพูดจากข้อความและชื่อเสียง การตอบสนองประกอบด้วย Bytes Wave พร้อมที่จะเล่นหรือเขียนลงในไฟล์

วิธีการของ Synctts คือ:

create() สร้างไฟล์คำพูด TTS
- พารามิเตอร์:
  - voice * [จำเป็น] (สตริง) - ชื่อเสียง ดูรายการเสียงที่มีอยู่โดยใช้ทรัพยากรเสียง
  - text * [จำเป็น] (สตริง) - ข้อความที่คุณต้องการทำ TTS ด้วย ขีด จำกัด คือ 800 อักขระสำหรับไฟล์คลื่น
  - metadata [ไม่บังคับ] ("เต็ม" หรือ "ไม่มี") - ระดับของข้อมูลเมตาที่คุณต้องการ ส่งคืนรายการ Phoneme (ใช้ได้เฉพาะสำหรับเสียง MSNR บางส่วนเท่านั้น)
- ตัวอย่าง:
```
 sync_tts = apiaudio . SyncTTS . create (
  voice = "joanna" ,
  text = "This is me creating synchronous text to speech" ,
  metadata = "full"
)
```

แหล่งข้อมูล `Birdcache`

BirdCache เป็นบริการแคชที่จัดทำโดย API.Audio ที่ให้เลเยอร์แคชสำหรับลูกค้าโดยการจัดเก็บข้อมูลในเซิร์ฟเวอร์ API.Audio เพื่อการใช้งานในอนาคต สิ่งนี้ช่วยให้คุณสามารถเรียกคืนไฟล์คำพูดของคุณได้ทันที

วิธีการนกเบิร์ดคือ:

create() สร้างไฟล์คำพูด TTS
- พารามิเตอร์:
  - type * [จำเป็น] (สตริง) - ประเภทของเหตุการณ์ ประเภทที่รองรับคือ mastering และ speech
  - text * [จำเป็น] (สตริง) - ข้อความที่คุณต้องการทำคำพูด/การเรียนรู้ด้วย ดูตัวอย่างสำหรับพารามิเตอร์การตั้งค่าส่วนบุคคล
  - voice * [จำเป็น] (สตริง) - เสียงสำหรับการสร้างคำพูด
  - audience * [ไม่บังคับ] (DICT) - วัตถุคู่คีย์สำหรับพารามิเตอร์การปรับเปลี่ยนส่วนบุคคล ดูตัวอย่างด้านล่าง
  - soundTemplate [ไม่บังคับ] (สตริง) - เทมเพลตเสียงสำหรับการสร้างการเรียนรู้ จำเป็นเฉพาะเมื่อประเภทคือการเรียนรู้
- ตัวอย่าง:
```
 birdcache = apiaudio . Birdcache . create (
  type = "mastering" ,
  voice = "linda" ,
  text = "This is {{username|me}} creating synchronous text to speech" ,
  audience = { "username" : [ "salih" , "sam" , "timo" ]},
  soundTemplate = "electronic"
)
```

ทรัพยากร `Pronunciation Dictionary`

บ่อยครั้งเมื่อทำงานกับ TTS โมเดลสามารถล้มเหลวในการออกเสียงคำเฉพาะได้อย่างถูกต้องเช่นแบรนด์ชื่อและสถานที่มักจะออกเสียงผิดพลาด เป็นความพยายามครั้งแรกในการแก้ไขปัญหานี้เราได้แนะนำธง Lexi ของเราซึ่งทำงานในลักษณะเดียวกันกับ SSML ตัวอย่างเช่นการเพิ่ม <! peadar> แทนที่จะเป็น Peadar (ซึ่งเป็นหนึ่งในผู้ก่อตั้งของเรา) ลงในสคริปต์ของคุณจะทำให้แบบจำลองสร้างการออกเสียงทางเลือกของชื่อนี้ สิ่งนี้มีประโยชน์อย่างยิ่งในกรณีที่คำพูดสามารถออกเสียงได้หลายอย่างเช่นเมือง 'อ่าน' และ 'ดี' ในอินสแตนซ์นี้การวาง <! การอ่าน> และ <! nice> จะทำให้แน่ใจว่าสิ่งเหล่านี้ออกเสียงได้อย่างถูกต้องได้รับสคริปต์:

" The city of <!nice> is a really nice place in the south of france."

หากโซลูชันนี้ไม่ได้ผลสำหรับคุณคุณสามารถใช้ประโยชน์จากคุณสมบัติ Lexi ที่กำหนดเอง (Self-Serve) ของเราแทน

สิ่งนี้สามารถใช้เพื่อให้ได้หนึ่งในสองสิ่งแก้ไขคำเดียวหรือขยายตัวย่อ ตัวอย่างเช่นคุณสามารถแทนที่สิ่งที่เกิดขึ้นทั้งหมดของคำว่า aflorithmic ด้วย "AF ต่ำจังหวะ" หรือการเกิดขึ้นของคำว่า 'BMW' ด้วย "Bayerische Motoren Werke" คำแทนที่สามารถให้เป็นข้อความธรรมดาหรือการออกเสียง IPA

วิธีพจนานุกรม PRONONCIATION คือ:

list() แสดงรายการพจนานุกรมที่เปิดเผยต่อสาธารณะและคำพูดของพวกเขา
- พารามิเตอร์:
  - none
- ตัวอย่าง:
```
 # returns a list of public dictionaries
dictionaries = apiaudio . Lexi . list ()
```
list_custom_dicts() แสดงรายการพจนานุกรมที่กำหนดเองและคำที่เกี่ยวข้อง
- พารามิเตอร์:
  - none
- ตัวอย่าง:
```
 # returns a list of custom dictionaries
types = apiaudio . Lexi . list_custom_dicts ()
```
register_custom_word เพิ่มคำใหม่ให้กับพจนานุกรมที่กำหนดเอง
- lang [จำเป็น] (String) - ตระกูลภาษาเช่น en หรือ es .Dictionary - ใช้ global เพื่อลงทะเบียนคำทั่วโลก
- word [จำเป็น] (สตริง) - คำที่จะถูกแทนที่
- replacement [จำเป็น] (สตริง) - โทเค็นทดแทน สามารถเป็นสตริงธรรมดาหรือโทเค็น IPA
- contentType [ไม่บังคับ] (สตริง) - ประเภทเนื้อหาของการเปลี่ยนที่ให้มาอาจเป็น basic (ค่าเริ่มต้น) หรือ ipa สำหรับการเปลี่ยนการออกเสียง
- specialization [ตัวเลือก] (สตริง) - โดยค่าเริ่มต้นการเปลี่ยนที่ให้มาจะใช้โดยไม่คำนึงถึงเสียงรหัสภาษาหรือผู้ให้บริการที่ให้มา อย่างไรก็ตามสามารถจัดหากรณีขอบได้สิ่งเหล่านี้อาจเป็นสิ่งที่ถูกต้อง ชื่อผู้ให้บริการรหัสภาษา (เช่น en-gb) หรือชื่อเสียง
- ตัวอย่าง:
```
  # correct the word sapiens
  r = apiaudio . Lexi . register_custom_word ( word = "sapiens" , replacement = "saypeeoons" , lang = "en" )
  print ( r )
```
สำหรับแต่ละภาษาอนุญาตให้มีการป้อนคำเดียวเท่านั้น อย่างไรก็ตามแต่ละคำสามารถมี specializations หลายอย่าง เมื่อมีการลงทะเบียนคำแรก specialization default จะถูกสร้างขึ้นเสมอซึ่งจะตรงกับสิ่งที่ผ่านเข้ามาการโทรที่ตามมาด้วยความเชี่ยวชาญเฉพาะด้านที่แตกต่างกันจะอัปเดตเฉพาะความเชี่ยวชาญที่กำหนดเท่านั้น การกำหนดค่าที่แน่นอนที่จะใช้จะถูกกำหนดโดยลำดับต่อไปนี้ของการตั้งค่า:
voice name > language dialect > provider name > default
ตัวอย่างเช่นการเปลี่ยนที่ระบุไว้สำหรับชื่อเสียง sara จะถูกเลือกผ่านการเปลี่ยนที่ระบุไว้สำหรับ azure ผู้ให้บริการ
list_custom_words() แสดงรายการคำทั้งหมดที่มีอยู่ในพจนานุกรมที่กำหนดเอง
- พารามิเตอร์:
- lang [จำเป็น] (String) - ตระกูลภาษาเช่น en หรือ es - ใช้ global เพื่อเขียนคำศัพท์ภาษาไม่เชื่อเรื่องภาษา
- ตัวอย่าง:
```
 # lists all words in the dictionary along with their replacements
words = apiaudio . Lexi . list_custom_words ( lang = "en" )
```

ดูตัวอย่าง

ผลกระทบของการใช้พจนานุกรมการออกเสียงสามารถดูได้ด้วยวิธี script.preview() ดูเอกสารสคริปต์สำหรับรายละเอียดเพิ่มเติม

ตัวอย่าง:

  text = """
    The author of this repo has lived in two places in the
    UK, <!Bude> and <!Bristol>
  """

r = apiaudio . Script . create ( scriptText = text )
scriptId = r [ "scriptId" ]

# preview the script in en-gb
preview = apiaudio . Script . preview ( scriptId = scriptId , voice = "Joanna" )
print ( preview )

การตอบสนอง:
```
{ "preview" : "The author of this repo has lived in two places in the UK, bude and <phoneme alphabet= " ipa " ph= " ### " > bristol </phoneme>" }
```
ในตัวอย่างนี้ Bristol จะได้รับการออกเสียงเพื่อให้แน่ใจว่ามีการออกเสียงอย่างถูกต้อง แต่เนื่องจาก Bude ไม่ได้อยู่ในพจนานุกรมของเรามันก็เหลืออยู่ โทเค็น IPA ที่แน่นอนสำหรับคำในพจนานุกรมภายในของเรามีการศึกษา

ทรัพยากรตัว `Connector`

ทรัพยากรที่ใช้สำหรับการตรวจสอบการรวมกลุ่มที่ 3 ผลลัพธ์สุดท้ายของทรัพยากรการเรียนรู้สามารถกระจายไปยังแอปพลิเคชันภายนอกผ่านฟิลด์ connectors ดูเอกสารประกอบการเชื่อมต่อ รายการแอปพลิเคชันที่รองรับในปัจจุบัน:

Julep.de

วิธีการที่มีอยู่:

retrieve() หลังจากลงทะเบียนตัวเชื่อมต่อใน API.Console ให้ใช้วิธีนี้เพื่อตรวจสอบว่าการเชื่อมต่อนั้นสำเร็จโดยใช้ข้อมูลรับรองที่ให้ไว้หรือไม่
- พารามิเตอร์:
  - name * [จำเป็น] (สตริง) - ชื่อของตัวเชื่อมต่อที่ระบุในคอนโซล
- ตัวอย่าง:
```
 status = apiaudio . Connector . retrieve (
  name = "julep"
)
```
connection() ตรวจสอบสถานะของการเชื่อมต่อโดยให้ connectionId ที่ส่งคืนในการตอบกลับการเรียนรู้
- พารามิเตอร์:
  - connection_id * [จำเป็น] (สตริง) - การเชื่อมต่อที่ส่งคืนโดยทรัพยากรการเรียนรู้
- ตัวอย่าง:
```
 status = apiaudio . Connector . connection (
  connection_id = "af2fe14a-aa6b-4a97-b430-a072c38b11ff"
)
```

ทรัพยากร `Orchestrator`

Orchestrator ใช้เพื่อให้ทำงานกับบริการเสียงที่หลากหลายได้ง่ายเช่นเดียวกับการส่งคำขอ API เดียว แต่ละเส้นทางที่นี่ได้รับการกำหนดค่าอย่างระมัดระวังเพื่อสร้างสินทรัพย์เสียงที่มีคุณภาพสูงและง่ายต่อการเข้าถึง

วิธีการออเคสตร้าคือ:

create_audio() สร้างคำขอคำพูด TTS อย่างง่ายและเพิ่มเทมเพลตเสียงผ่านการเรียนรู้
- พารามิเตอร์:
  - scriptText * [จำเป็น] (STR) - ข้อความเพื่อสังเคราะห์ (TTS)
  - soundTemplate (STR) - เทมเพลตเสียงที่จะใช้
  - voice * [จำเป็น] (str) - ชื่อของเสียงที่จะใช้
create_three_sections() สร้างคำขอพูด TTS ด้วย 3 ส่วนและเพิ่มเทมเพลตเสียงลงในการเรียนรู้
- พารามิเตอร์:
  - introText * [จำเป็น] (str) - ข้อความเพื่อสังเคราะห์ในส่วนอินโทร
  - mainText * [จำเป็น] (str) - ข้อความเพื่อสังเคราะห์ในส่วนหลัก
  - outroText * [จำเป็น] (Str) - ข้อความเพื่อสังเคราะห์ในส่วน Outro
  - soundTemplate (STR) - เทมเพลตเสียงที่จะใช้
  - voice * [จำเป็น] (str) - ชื่อของเสียงที่จะใช้
media_with_sound() รวมไฟล์สื่อที่มีอยู่แล้ว (เช่นเสียงที่บันทึกไว้ล่วงหน้า) เข้ากับเทมเพลตเสียง
- พารามิเตอร์:
  - mediaId * [จำเป็น] (STR) - MediaId ของไฟล์สื่อที่จะใช้เป็นอินพุต
  - soundTemplate * [จำเป็น] (STR) - เทมเพลตเสียงที่จะใช้

webhooks

SDK นี้เป็นวิธีที่ง่ายในการตรวจสอบส่วนหัวความปลอดภัยของ Apiaudio Webhook ขอแนะนำให้คุณตรวจสอบส่วนหัวเพื่อปกป้องเซิร์ฟเวอร์ของคุณจากการโจมตีที่เป็นอันตราย

วิธีคือ:

 apiaudio . Webhooks . verify ( payload , sig_header , secret , tolerance )

มันจะส่งคืนจริงถ้าส่วนหัวนั้นถูกต้องมิฉะนั้นจะทำให้เกิดข้อผิดพลาด พารามิเตอร์ที่จะผ่านคือ; payload เป็นวัตถุร่างกายที่ส่งโดย apiaudio, sig_header เป็น X-Aflr-Secret ในส่วนหัวคำขอที่ส่งโดย Apiaudio, secret เป็นความลับของเว็บฮุคของคุณ (คุณสามารถรับได้ในคอนโซล Apiaudio) และ tolerance อดทนในไม่กี่วินาทีสำหรับการตรวจสอบส่วนหัว

การตัดไม้

โดยค่าเริ่มต้นคำเตือนที่ออกโดย API จะถูกบันทึกไว้ในเอาต์พุตคอนโซล นอกจากนี้พฤติกรรมบางอย่างจะถูกบันทึกไว้ในระดับข้อมูล (เช่น "อยู่ระหว่างดำเนินการ ... " ตัวบ่งชี้ในช่วงเวลาการประมวลผลที่ยาวนานขึ้น) ระดับการบันทึกสามารถควบคุมได้โดยเลือกจากระดับมาตรฐานในไลบรารี logging ของ Python

ลดระดับการบันทึกสำหรับบันทึกรายละเอียดเพิ่มเติม:
```
 apiaudio . set_logger_level ( "INFO" )
# apiaudio.set_logger_level("CRITICAL") - set the highest level to disable logs
```

ผู้ดูแล

https://github.com/sjhunt93
https://github.com/martinezpl

การพัฒนา

มีเบ็ดล่วงหน้าที่จะทำงานก่อนที่คุณจะส่งไฟล์ นี่คือการรักษามาตรฐานรหัสให้สูง เพื่อเปิดใช้งานคุณควรเรียก make จากนั้นมันจะตั้งค่าเบ็ดล่วงหน้าสำหรับ Git นั่นทั้งหมด! ตอนนี้ทุกครั้งก่อนที่คุณจะกระทำมันจะวิ่งเพื่อบอกคุณเกี่ยวกับมาตรฐาน

หากคุณใช้ VSCODE สำหรับการสร้างไฟล์คุณอาจชนเข้ากับ pre-commit command not found ข้อผิดพลาด ไม่เป็นไรเพียงแค่เรียกใช้ brew install pre-commit หรือผู้จัดการแพ็คเกจโปรดของคุณจากรายการที่นี่

หากคุณชนเข้ากับ your pip version is old เพียงเพิกเฉยและใช้เทอร์มินัล

หากมีปัญหาและคุณกำลังเร่งรีบคุณสามารถเพิ่ม --no-verify git commit -m 'your commit message' --no-verify ตอนท้ายของคำสั่ง commit

ใบอนุญาต

โครงการนี้ได้รับใบอนุญาตภายใต้ข้อกำหนดของใบอนุญาต MIT

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน SyncTTS features, _post_request_raw deprecated
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-08-23
ขนาด 7.98MB
มาจาก Github

แอปที่เกี่ยวข้อง

Python Portfolio

2024-11-10
datamule python

2024-11-08
stripe python

2024-11-05
automaited python

2024-11-03
หลามซอร์สโค้ด ระบบการจัดการหลาม หลาม ซอร์สโค้ดหลาม กรณีระบบหลาม

2023-01-11
หลาม

2009-07-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด

apiaudio python

repo นี้ไม่ได้อยู่ในการพัฒนาเปิดใช้งานอีกต่อไปโปรดใช้ Audiostack SDK เพื่อใช้ API.Audio ต่อไป

Apiaudio - Python SDK

สารบัญ

- เกี่ยวกับ

การเปลี่ยนแปลง

- quickstarts

- เริ่มต้น

การติดตั้ง

ข้อกำหนดเบื้องต้น

สวัสดีโลก

การรับรองความถูกต้อง

สร้างข้อความเป็นเสียงใน 4 ขั้นตอน

- เอกสาร

นำเข้า

การรับรองความถูกต้อง

การรับรองความถูกต้องด้วยตัวแปรสภาพแวดล้อม (แนะนำ)

องค์กรระดับสูง

การใช้ทรัพยากร

ทรัพยากร Organization

ทรัพยากร Script

Script.Directory ทรัพยากรไดเรกทอรี

ทรัพยากร Speech

ทรัพยากร Voice

ทรัพยากร Sound

ทรัพยากร Mastering

ทรัพยากร Media

SyncTTS ทรัพยากร

แหล่งข้อมูล Birdcache

ทรัพยากร Pronunciation Dictionary

ดูตัวอย่าง

ทรัพยากรตัว Connector

ทรัพยากร Orchestrator

webhooks

การตัดไม้

ผู้ดูแล

การพัฒนา

ใบอนุญาต

ทรัพยากร `Organization`

ทรัพยากร `Script`

`Script.Directory` ทรัพยากรไดเรกทอรี

ทรัพยากร `Speech`

ทรัพยากร `Voice`

ทรัพยากร `Sound`

ทรัพยากร `Mastering`

ทรัพยากร `Media`

`SyncTTS` ทรัพยากร

แหล่งข้อมูล `Birdcache`

ทรัพยากร `Pronunciation Dictionary`

ทรัพยากรตัว `Connector`

ทรัพยากร `Orchestrator`