本質的に、Aiyuシェルパイプラインは、さまざまなAIコンポーネントを結合する織り間接着剤として機能します。
AIYUでは、あらゆるラップトップを使用して、最もエキサイティングなAIテクノロジーをeas的に活用するパイプラインを構築できます。
m2a; a2a fr; a2sk
マイクを聞いてオーディオファイル(M2A)を出力し、以前に作成したオーディオを使用してフランス語(A2A FR)に翻訳し、最後にスピーカー(A2SK)にオーディオを再生します。
m2a; a2p; p2a; a2a it
マイクを聞き、オーディオファイル(M2A)を出力し、作成したオーディオを使用してテキストプロンプト(A2P)に転写し、プロンプトを使用してGPT3.5ターボをクエリし、assARE(P2A)のオーディオを作成し、最後に作成したオーディオを使用してイタリア語(A2A)に翻訳します。
c -> code ex: sourcecode of a python program
p -> prompt ex: "how can I escape the matrix?"
t -> text ex: .txt file of a motivation letter
s -> subtitle ex: .srt file of a movie subtitles
a -> audio ex: .mp3 file of a recorded conference
I/O: {sk -> speaker, m <- microphone}
| プロンプト | 文章 | 字幕 | オーディオ | コード | |
|---|---|---|---|---|---|
| プロンプト | p2p | p2t | ap2s * | p2a | p2c |
| 文章 | T2P | t2t | at2s * | t2a | p2c |
| 字幕 | - | s2t | s2s | s2a | - |
| オーディオ | a2p | a2t | a2s | a2a | A2c |
| コード | - | - | - | - | c2c |
? gptとgttsにスピーカーに回答します(text2speaker) - > t2sk
? GPTとGTTSにAudio (text2audio)への回答を尋ねます - > t2a
? GPTを尋ねて、特別なコード(code2text) - > c2tを作成します
?オーディオを取り、テキストトランスクリプト(audio2text) - > a2tを作成します
?オーディオを取り、サブタイトルのトランスクリプト(Audio2Subtitles) - > a2sを作成します
?プロンプトgptおよび生成テキスト(prompt2text) - > p2t
?テキストを取り、テキスト(text2text) - > t2trに翻訳します
?オーディオを取り、品質をオーディオ(audio2audio) - > a2aに強化します
?オーディオとテキストのトランスクリプトを取り、字幕を作成します(audio+text2subtitles) - > at2s
?テキストと安定した拡散生成画像(text2image) - > t2i
git clone https://github.com/GabrieleRisso/aiyu.git
cd aiyu/
. env.list
. t2s
t2a "How are you ?"
不足している場合はプロンプトが表示され、それらをインストールするためのリンクが提供されます。関数は、主にPIPPおよびプレビルドDocker画像を介してインストールされたPython Libをレバレッジします。メモリ使用統計はまもなく公開されます。
このリポジトリを利用している場合は、次のことを引用することを検討してください。
@misc{aiyu,
author = {Gabriele Risso},
title = {aiyu: core shell functions for advanced ai},
year = {2023},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {url{https://github.com/gabrielerisso/aiyu}},
}
Copyright©2023 Gabriele Risso。