본질적으로, AIYU 쉘 파이프 라인은 다양한 AI 구성 요소를 함께 바인딩하는 Interweaving Adhesive (기술적 인 슈퍼 글루)로 사용됩니다!
AIYU는 Easlily가 랩톱을 사용하여 가장 흥미로운 AI 기술을 활용하는 파이프 라인을 구축 할 수 있습니다.
m2a; a2a fr; a2sk
마이크를 듣고 오디오 파일 (M2A)을 출력 한 다음 이전에 만든 오디오를 사용하여 프랑스어 (A2A FR)로 번역하고 마지막으로 오디오를 스피커 (A2SK)에게 재생합니다.
m2a; a2p; p2a; a2a it
마이크를 듣고 오디오 파일 (M2A)을 출력 한 다음 생성 된 오디오를 사용하여 텍스트 프롬프트 (A2P)를 사용하고 쿼리 GPT3.5 터보를 사용하여 응답 (P2A)의 오디오를 생성하고 마지막으로 생성 된 오디오를 사용하여 이탈리아어로 번역합니다 (A2A IT).
c -> code ex: sourcecode of a python program
p -> prompt ex: "how can I escape the matrix?"
t -> text ex: .txt file of a motivation letter
s -> subtitle ex: .srt file of a movie subtitles
a -> audio ex: .mp3 file of a recorded conference
I/O: {sk -> speaker, m <- microphone}
| 즉각적인 | 텍스트 | 부제 | 오디오 | 암호 | |
|---|---|---|---|---|---|
| 즉각적인 | p2p | p2t | ap2s * | p2a | p2c |
| 텍스트 | T2P | t2t | at2s * | t2a | p2c |
| 부제 | - | s2t | s2s | s2a | - |
| 오디오 | a2p | a2t | a2s | a2a | A2C |
| 암호 | - | - | - | - | c2c |
? 스피커 (Text2speaker)에 대한 GPT 및 GTTS 답변 -> T2SK
? 오디오 에 대한 GPT 및 GTTS에 대한 답변 (Text2audio) -> T2A
? GPT를 요청하고 구체적으로 코드 (Code2Text) -> C2T를 생산하십시오
? 오디오를 가져 와서 텍스트 전사 (Audio2Text) -> A2T를 생성하십시오
? 오디오를 가져 와서 자막 전사 (Audio2Subtitles) -> A2S를 생성하십시오
? 프롬프트 GPT 및 생산 텍스트 (Prompt2Text) -> P2T
? 텍스트를 가져 와서 텍스트 (text2text) -> t2tr로 번역하십시오
? 오디오를 사용하고 품질 향상 오디오 (Audio2audio) -> A2A
? 오디오 및 텍스트 전사를 가져 와서 자막을 생성합니다 (Audio+Text2Subtitles) -> AT2S
? 텍스트와 안정적인 확산 생산 이미지 (Text2image) -> T2I
git clone https://github.com/GabrieleRisso/aiyu.git
cd aiyu/
. env.list
. t2s
t2a "How are you ?"
누락 된 경우 프롬프트가 표시되고 설치 링크가 제공됩니다. 기능은 대부분 PIP 및 사전 건축 도커 이미지를 통해 설치된 Python libs를 활용합니다. 메모리 사용 통계가 곧 나옵니다.
이 저장소를 사용하면 다음과 같은 인용을 고려하십시오.
@misc{aiyu,
author = {Gabriele Risso},
title = {aiyu: core shell functions for advanced ai},
year = {2023},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {url{https://github.com/gabrielerisso/aiyu}},
}
Copyright © 2023 Gabriele Risso.