ดาวน์โหลด pragYantra - ดาวน์โหลดซอร์สโค้ด pragYantra

pragYantra

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

Pragyantra

Pragyantra เป็นโครงการซอฟต์แวร์ง่าย ๆ ที่ออกแบบมาเพื่อจำลองหุ่นยนต์มนุษย์ด้วยการมองเห็นการได้ยินการพูดและการทำงานของหน่วยความจำ โครงการนี้มีจุดมุ่งหมายเพื่อสร้างแพลตฟอร์มที่ยืดหยุ่นสำหรับการทดลองกับปัญญาประดิษฐ์และการมีปฏิสัมพันธ์กับเครื่องจักรของมนุษย์ ณ ตอนนี้มันเป็นเหมือน LLM แต่ด้วยความสามารถที่ขยายออกไปทำให้สามารถมองเห็นได้ยินและมีส่วนร่วมในการสื่อสารด้วยวาจา

สถาปัตยกรรมของ Pragyantra

คุณสมบัติ

วิสัยทัศน์ : Pragyantra จำลองความสามารถในการมองเห็นทำให้สามารถประมวลผลคำบรรยายภาพสด แม้ว่าในปัจจุบันจะไม่ได้ทำการตัดสินใจตามข้อมูลภาพ แต่คุณลักษณะนี้วางรากฐานสำหรับการพัฒนาในอนาคตในพื้นที่นี้
การได้ยิน : Pragyantra สามารถรับรู้เสียงและตอบสนองในแบบเรียลไทม์
คำพูด : ความสามารถในการสร้างผลลัพธ์การพูดแบบจำลองและสื่อสารกับผู้ใช้ในภาษาธรรมชาติ
หน่วยความจำ : มันมีความสามารถในหน่วยความจำที่ จำกัด มากช่วยให้สามารถจัดเก็บและเรียกคืนข้อมูลจากการโต้ตอบล่าสุด ขณะนี้ฉันกำลังทำงานเกี่ยวกับการรวมฐานข้อมูลเวกเตอร์เพื่อปรับปรุงคุณสมบัติหน่วยความจำให้ความสามารถของหน่วยความจำเหมือนมนุษย์มากขึ้นเช่นความทรงจำระยะสั้นและระยะยาวทำให้สามารถจำลองงานเรียกคืนที่ซับซ้อนได้

รายละเอียดทางเทคนิค

ฉันจัดลำดับความสำคัญของ Pragyantra เพื่อให้มีความสามารถออฟไลน์ในขณะเดียวกันก็รวมฟังก์ชั่นออนไลน์ เพื่อให้บรรลุเป้าหมายนี้ส่วนประกอบทั้งหมดของโครงการได้รับการออกแบบให้มีความสามารถออฟไลน์พร้อมฟังก์ชันการทำงานออนไลน์เป็นคุณสมบัติเสริม ในขณะที่ใช้โหมดออฟไลน์อาจต้องใช้อุปกรณ์ที่แข็งแกร่งกว่าสำหรับการอนุมานที่เร็วขึ้นโครงการทำงานได้อย่างสมบูรณ์และทำงานได้อย่างน่าชื่นชมภายใต้เงื่อนไขเหล่านี้

กระดูกสันหลังของ Pragyantra ประกอบด้วยโมเดลโอเพนซอร์ซต่าง ๆ สำหรับงานเช่นข้อความเป็นคำพูดการพูดข้อความเป็นข้อความข้อความและข้อความเป็นข้อความและการแปลงภาพเป็นข้อความ โมเดลเหล่านี้ทำหน้าที่เป็นหน่วยการสร้างที่สถาปัตยกรรมของ Pragyantra ถูกสร้างขึ้นพร้อมกับความสามารถเพิ่มเติมและการรวมตัวกันพร้อมกันอย่างราบรื่นเพื่อเพิ่มประสิทธิภาพโดยรวมและประสบการณ์ผู้ใช้

ดังนั้น ... Pragyantra หมายถึงอะไร?

Pragyantra ที่ได้มาจากภาษาสันสกฤตเป็นคำศัพท์สองคำ: "prag" หมายถึงชาญฉลาดหรือฉลาดและ "Yantra" หมายถึงเครื่องจักรหรือหุ่นยนต์ ดังนั้นเมื่อรวมเข้าด้วยกัน Pragyantra รวบรวมแนวคิดของเครื่องอัจฉริยะสะท้อนให้เห็นถึงเป้าหมายของโครงการในการสร้างแพลตฟอร์มที่ยืดหยุ่นสำหรับการทดลองกับ AI และการมีปฏิสัมพันธ์กับเครื่องจักรของมนุษย์

การตั้งค่าและการติดตั้ง

หากต้องการตั้งค่าโครงการให้ทำตามขั้นตอนเหล่านี้:

โคลนที่เก็บ:

 git clone https://github.com/sri0606/pragyantra.git

นำทางไปยังไดเรกทอรีโครงการ:
```
 cd pragyantra
```
เรียกใช้สคริปต์การตั้งค่า:
- เรียกใช้สคริปต์การตั้งค่า Python:
```
 python setup.py
```
หรือ
- ในระบบที่มีลักษณะคล้าย UNIX (เช่น Linux หรือ MacOS):
```
 chmod +x setup.sh
./setup.sh
```
- บน Windows โดยใช้ Git Bash:
```
 bash setup.sh
```

สคริปต์การตั้งค่าจะติดตั้งการอ้างอิงดาวน์โหลดรุ่นที่ต้องการและสร้างไดเรกทอรีที่จำเป็น

เรียกใช้โปรแกรมและโต้ตอบ

สำหรับความช่วยเหลือเรียกใช้คำสั่งต่อไปนี้:

 python main.py --help

คำสั่งตัวอย่าง:

โหมดออฟไลน์

python main.py --interpreter_model llama3_8B --offline_mode --speaker_model pyttsx3

โหมดออนไลน์

python main.py --interpreter_model llama3-70B-8192 --speaker_model pyttsx3

or

python main.py --interpreter_model mixtral-8x7b-32768 --speaker_model 11labs

การอ้างอิงและการตอบรับ

 @misc {nlp_connect_2022,
   author = { {NLP Connect} },
   title = { vit-gpt2-image-captioning (Revision 0e334c7) },
   year = 2022,
   url = { https://huggingface.co/nlpconnect/vit-gpt2-image-captioning },
   doi = { 10.57967/hf/0222 },
   publisher = { Hugging Face }
   }

@article{pratap2023mms,
   title={Scaling Speech Technology to 1,000+ Languages},
   author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli},
   journal={arXiv},
   year={2023}
   }

@misc{li2021trocr,
   title={TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models},
   author={Minghao Li and Tengchao Lv and Lei Cui and Yijuan Lu and Dinei Florencio and Cha Zhang and Zhoujun Li and Furu Wei},
   year={2021},
   eprint={2109.10282},
   archivePrefix={arXiv},
   primaryClass={cs.CL}
   }

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-05-26
ขนาด 165.4KB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด