ดาวน์โหลด june - ดาวน์โหลดซอร์สโค้ด june

june

ซอร์สโค้ดอื่น ๆ

v0.0.1

ดาวน์โหลด

มิถุนายน

Local Voice Chatbot: Ollama + HF Transformers + Coqui TTS Toolkit

ภาพรวม
การติดตั้ง
การใช้งาน
การปรับแต่ง
คำถามที่พบบ่อย

ภาพรวม

มิถุนายน เป็นแชทบ็อตเสียงในท้องถิ่นที่รวมพลังของ Ollama (สำหรับความสามารถของโมเดลภาษา), กอด Transformers Face (สำหรับการจดจำคำพูด) และชุดเครื่องมือ Coqui TTS (สำหรับการสังเคราะห์แบบข้อความถึงคำพูด) มันเป็นโซลูชันที่มีความยืดหยุ่นและมุ่งเน้นความเป็นส่วนตัวสำหรับการโต้ตอบด้วยเสียงช่วยในเครื่องในเครื่องของคุณเพื่อให้มั่นใจว่าไม่มีข้อมูลใดถูกส่งไปยังเซิร์ฟเวอร์ภายนอก

การโต้ตอบแบบสาธิตข้อความเท่านั้น

โหมดการโต้ตอบ

อินพุต/เอาต์พุตข้อความ: ระบุอินพุตข้อความไปยังผู้ช่วยและรับการตอบกลับข้อความ
เอาต์พุตอินพุตเสียง/ข้อความ: ใช้ไมโครโฟนของคุณเพื่อให้อินพุตเสียงและรับการตอบกลับข้อความจากผู้ช่วย
เอาต์พุตอินพุตข้อความ/เสียง: ระบุอินพุตข้อความและรับทั้งข้อความและการตอบสนองเสียงสังเคราะห์จากผู้ช่วย
เอาต์พุตเสียง/เสียง (ค่าเริ่มต้น): ใช้ไมโครโฟนของคุณสำหรับอินพุตเสียงและรับการตอบกลับทั้งในรูปแบบข้อความและเสียงสังเคราะห์

การติดตั้ง

สิ่งที่ต้องมีก่อน

โอลลา
Python 3.10 ขึ้นไป (พร้อม PIP )
แพ็คเกจการพัฒนา Python (เช่น apt install python3-dev สำหรับ Debian)- เฉพาะสำหรับ GNU/Linux
แพ็คเกจการพัฒนา Portaudio (เช่น apt install portaudio19-dev สำหรับ Debian)- เฉพาะสำหรับ GNU/Linux
Portaudio (เช่น brew install portaudio โดยใช้ Homebrew) - เฉพาะสำหรับ macOS
Microsoft Visual C ++ 14.0 หรือมากกว่า - สำหรับ Windows เท่านั้น

จากแหล่งกำเนิด

วิธีที่ 1: การติดตั้งโดยตรง

ในการติดตั้ง มิถุนายน โดยตรงจากที่เก็บ GitHub:

pip install git+https://github.com/mezbaul-h/june.git@master

วิธีที่ 2: โคลนและติดตั้ง

หรือคุณสามารถโคลนพื้นที่เก็บข้อมูลและติดตั้งในเครื่อง:

git clone https://github.com/mezbaul-h/june.git
cd june
pip install .

การใช้งาน

ดึงโมเดลภาษา (ค่าเริ่มต้นคือ llama3.1:8b-instruct-q4_0 ) กับ Ollama ก่อนถ้าคุณยังไม่ได้:

ollama pull llama3.1:8b-instruct-q4_0

ถัดไปรันโปรแกรม (ด้วยการกำหนดค่าเริ่มต้น):

june-va

สิ่งนี้จะใช้ LLAMA3.1: 8B-Instruct-Q4_0 สำหรับความสามารถ LLM, OpenAI/Whisper-Small.en สำหรับการรู้จำเสียงพูดและ tts_models/en/ljspeech/glow-tts สำหรับการสังเคราะห์เสียง

นอกจากนี้คุณยังสามารถปรับแต่งพฤติกรรมของโปรแกรมด้วยไฟล์กำหนดค่า JSON:

june-va --config path/to/config.json

บันทึก

ไฟล์การกำหนดค่าเป็นทางเลือก หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับโครงสร้างของไฟล์กำหนดค่าดูส่วนการปรับแต่ง

การปรับแต่ง

แอปพลิเคชันสามารถปรับแต่งได้โดยใช้ไฟล์กำหนดค่า ไฟล์กำหนดค่าจะต้องเป็นไฟล์ JSON การกำหนดค่าเริ่มต้นมีดังนี้:

{
    "llm" : {
        "disable_chat_history" : false ,
        "model" : " llama3.1:8b-instruct-q4_0 "
    },
    "stt" : {
        "device" : " torch device identifier (`cuda` if available; otherwise `cpu` " ,
        "generation_args" : {
            "batch_size" : 8
        },
        "model" : " openai/whisper-small.en "
    },
    "tts" : {
        "device" : " torch device identifier (`cuda` if available; otherwise `cpu` " ,
        "model" : " tts_models/en/ljspeech/glow-tts "
    }
}

เมื่อคุณใช้ไฟล์การกำหนดค่ามันจะแทนที่การกำหนดค่าเริ่มต้น แต่ไม่ได้เขียนทับ ดังนั้นคุณสามารถแก้ไขการกำหนดค่าบางส่วนหากคุณต้องการ ตัวอย่างเช่นหากคุณไม่ต้องการใช้การจดจำคำพูดและต้องการให้ข้อความแจ้งเตือนผ่านข้อความเท่านั้นคุณสามารถปิดการใช้งานได้โดยใช้ไฟล์กำหนดค่าที่มีการกำหนดค่าต่อไปนี้:

{
  "stt" : null
}

ในทำนองเดียวกันคุณสามารถปิดใช้งานเครื่องสังเคราะห์เสียงหรือทั้งสองอย่างเพื่อใช้ผู้ช่วยเสมือนในโหมดข้อความเท่านั้น

หากคุณต้องการแก้ไขอุปกรณ์ที่คุณต้องการโหลดโมเดลประเภทใดประเภทหนึ่งโดยไม่ต้องเปลี่ยนแอตทริบิวต์เริ่มต้นอื่น ๆ ของโมเดลคุณสามารถใช้:

{
  "tts" : {
    "device" : " cpu "
  }
}

แอตทริบิวต์การกำหนดค่า

`llm` - การกำหนดค่าโมเดลภาษา

llm.device : ตัวระบุอุปกรณ์คบเพลิง (เช่น cpu , cuda , mps ) ซึ่งจะจัดสรรท่อส่งข้อมูล
llm.disable_chat_history : บูลีนระบุว่าจะปิดการใช้งานหรือเปิดใช้งานประวัติการแชท การเปิดใช้งานประวัติการแชทจะทำให้การมีปฏิสัมพันธ์แบบไดนามิกมากขึ้นเนื่องจากโมเดลจะสามารถเข้าถึงบริบทก่อนหน้าได้ แต่จะใช้พลังการประมวลผลมากขึ้น การปิดใช้งานจะส่งผลให้การสนทนาแบบโต้ตอบน้อยลง แต่จะใช้ทรัพยากรการประมวลผลน้อยลง
llm.model : ชื่อของแท็กโมเดลรุ่นข้อความบน Ollama ตรวจสอบให้แน่ใจว่านี่เป็นแท็กโมเดลที่ถูกต้องที่มีอยู่ในเครื่องของคุณ
llm.system_prompt : ให้ระบบพร้อมกับโมเดล หากโมเดลพื้นฐานไม่รองรับพรอมต์ระบบจะมีข้อผิดพลาดเกิดขึ้น

`stt` การกำหนดค่าโมเดลคำพูดเป็นข้อความ

tts.device : ตัวระบุอุปกรณ์คบเพลิง (เช่น cpu , cuda , mps ) ซึ่งจะจัดสรรท่อส่งข้อมูล
stt.generation_args : วัตถุที่มีอาร์กิวเมนต์การสร้างที่ยอมรับโดยการกอดไปป์ไลน์การรู้จำเสียงพูดของใบหน้า
stt.model : ชื่อของรูปแบบการรู้จำเสียงพูดบนใบหน้ากอด ตรวจสอบให้แน่ใจว่านี่เป็นรหัสโมเดลที่ถูกต้องที่มีอยู่บนใบหน้ากอด

`tts` การกำหนดค่าโมเดลข้อความเป็นคำพูด

tts.device : ตัวระบุอุปกรณ์คบเพลิง (เช่น cpu , cuda , mps ) ซึ่งจะจัดสรรท่อส่งข้อมูล
tts.generation_args : วัตถุที่มีอาร์กิวเมนต์การสร้างที่ยอมรับโดย TTS API ของ Coqui
tts.model : ชื่อของโมเดลข้อความเป็นคำพูดที่รองรับโดยชุดเครื่องมือ TTS ของ Coqui ตรวจสอบให้แน่ใจว่านี่เป็นรหัสโมเดลที่ถูกต้อง

คำถามที่พบบ่อย

ถาม: อินพุตเสียงทำงานอย่างไร?

หลังจากเห็น [system]> Listening for sound... ข้อความคุณสามารถพูดลงในไมโครโฟนได้โดยตรง ซึ่งแตกต่างจากผู้ช่วยเสียงทั่วไปไม่จำเป็นต้องใช้คำสั่ง Wake เพียงเริ่มพูดและเครื่องมือจะตรวจจับและประมวลผลการป้อนข้อมูลของคุณโดยอัตโนมัติ เมื่อคุณพูดเสร็จให้รักษาความเงียบเป็นเวลา 3 วินาทีเพื่อให้ผู้ช่วยสามารถประมวลผลเสียงของคุณได้

ถาม: ฉันสามารถโคลนเสียงได้หรือไม่?

หลายรุ่น (เช่น tts_models/multilingual/multi-dataset/xtts_v2 ) ได้รับการสนับสนุนโดย TTS Toolkit ของ Coqui รองรับการโคลนนิ่งเสียงการโคลนนิ่ง คุณสามารถใช้โปรไฟล์ลำโพงของคุณเองด้วยคลิปเสียงขนาดเล็ก (ประมาณ 1 นาทีสำหรับรุ่นส่วนใหญ่) เมื่อคุณมีคลิปแล้วคุณสามารถสั่งให้ผู้ช่วยใช้งานด้วยการกำหนดค่าที่กำหนดเองดังต่อไปนี้:

{
  "tts" : {
    "model" : " tts_models/multilingual/multi-dataset/xtts_v2 " ,
    "generation_args" : {
      "language" : " en " ,
      "speaker_wav" : " /path/to/your/target/voice.wav "
    }
  }
}

ถาม: ฉันสามารถใช้อินสแตนซ์ Ollama ระยะไกลกับมิถุนายนได้หรือไม่?

ใช่คุณสามารถรวมอินสแตนซ์ของ Ollama ที่โฮสต์จากระยะไกลกับเดือนมิถุนายนได้อย่างง่ายดายแทนที่จะใช้อินสแตนซ์ท้องถิ่น นี่คือวิธีการทำ:

ตั้งค่าตัวแปรสภาพแวดล้อม OLLAMA_HOST เป็น URL ที่เหมาะสมของอินสแตนซ์ Ollama ระยะไกลของคุณ
เรียกใช้โปรแกรมตามปกติ

ตัวอย่าง:

หากต้องการใช้อินสแตนซ์ Ollama ระยะไกลคุณจะใช้คำสั่งเช่นนี้:

OLLAMA_HOST=http://localhost:11434 june-va

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.0.1
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-24
ขนาด 4.55MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด

june