BlahST 다운로드 - BlahST 소스 코드 다운로드

BlahST

AI 소스 코드

Multilingual BlahST

다운로드

Blahst

Blah S Peech-to- T Ext는 키보드 단축키와 Whisper.cpp와 함께 Linux의 Speech에서 BLA (H) ST 입력 텍스트를 제공 할 수 있습니다. 마이크를 발사하고 고품질의 다국어 음성 인식을 오프라인으로 수행하십시오. 로컬 LLMS로 확장되면 Linux 컴퓨터와 대화하는 강력한 도구가됩니다.

Blahst는 아마도 Whisper.cpp 위에 앉아 Linux의 가장 희박한 속삭임 기반 Speech-to-Text 입력 도구 일 것입니다.

Local Whisper.cpp로 빠른 전사 또는 더 빠른 네트워크 전사를 위해 Whisper.cpp 서버로 오디오를 보냅니다.
음성 입력 언어를 선택하고 전용 wsiml 스크립트로 명령 줄에서 번역 할 수 있습니다.
Whisper.cpp를 컴파일하는 대신 다운로드 된 휴대용 Whisperfile 실행 파일을 사용할 수 있습니다. 핫키를 설정할 때 명령 줄 '-w'만 사용하십시오.
신규 : llama.cpp 또는 llamafile을 통한 로컬 LLM과의 상호 작용으로, 텍스트 답변 또는 번역을 생성하여 클립 보드에서 사용할 수 있습니다. 이 업그레이드 된 기능은 WSIAI 스크립트에 있으며 WSI가하는 모든 작업을 수행합니다. (TODO : AI 보조 기능을 설명하는 전용 문서 섹션)
실험 : Blooper 유틸리티는 XDOTOOL 또는 YDOTOOL을 사용하여 자동 붙여 넣기 루프를 사용하여 연속적인 "핸즈프리"음성 입력 또는 받아 들일 수 있습니다. 더 긴 침묵으로 스크립트가 종료되어 핫키와 재 활성화 될 수 있습니다.
뜨거운 실험 : AI 교정기 추가, 모든 창에서 선택한 편집 가능한 텍스트를 수정하는 (오타, 문법 등). "컴퓨터, 교정 ... 또는 컴퓨터는 문법과 같다". 잠시 후 선택된 텍스트는 자동으로 LLM으로 교체해야합니다.

최적화 된 최적화 된 명령 줄 도구를 사용하면 음성 텍스트 입력이 매우 빠르게 발생합니다. 다음은 로컬 LLM 기능 (AI Assistant, Translator, Scheduller, Testing Stage의 CLI 가이드)을 사용하여 데모 비디오 (오디오를 음소거 해제)입니다.

blahst-ai-demo.mp4

위의 비디오에서 오디오는 스크린 캐스팅을 분석하는 시스템으로 시작합니다 (Gnome 확장 "Voluble"은 모든 Gnome 데스크톱 알림을 전혀 다루고 여러 번의 음성 입력/인식이 뒤 따릅니다. 마지막에는 Blahst (Whisper.cpp)가 전사 한 텍스트를 사용하여 LLM 프롬프트로 형식화하고이를 중국어 변환을 텍스트로 반환하고 신경 TTS를 사용하여 말하는 지역의 다국어 LLM (llama.cpp 또는 llamafile)으로 보내는 업 커밋 "AI 함수"중 하나입니다. 린 실행 파일로 명령 라인에서 이것을 조정하는 시스템은 놀랍게도 시스템을 놀라게합니다 (비디오에서 PC가 땀이 거의 부러지지 않는다는 것을 알 수 있습니다. 온도가 낮은 상태로 유지됩니다.)

Blooper-demo.mp4

위의 비디오 (utute please)는 사용자가 일시 중지가 길어질 때까지 음성 입력을 종료 할 때까지 WSI에서 루프로 전사하기 위해 WSI에서 수정 된 Blooper의 사용을 보여줍니다 (사전 설정). XDOTOOL (또는 Wayland 사용자를위한 YDOTOOL)을 사용하면 텍스트가 일시 정지 (또는 핫키 인터럽트)에 자동으로 붙여 넣습니다. 위의 비디오의 경우, 연설은 합성 음성으로 생성되어 마이크에 의해 수집됩니다. 이를 통해 텍스트를 동시에 편집 할 수 있습니다 (멀티 태스커, 집에서 시도하지 마십시오 :). 결국, 상단 바 마이크 아이콘이 사라져서 프로그램 종료를 나타냅니다. 스크린 캐스트 유틸리티가 아이콘에 대한 주장이 있기 때문에 비디오에서는 발생하지 않습니다.

운영 원칙 ( 최고의 UI는 전혀 UI가 아닙니다. )

Blahst와의 아이디어는 몽골 공습과 동등한 UI-free 소프트웨어가되는 것입니다. CPU/GPU 동작의 짧고 강력한 버스트는 클립 보드와 상대 데스크톱 평화에 텍스트 추적만으로 완전히 사라졌습니다. 한 쌍의 핫키를 사용하여 마이크에서 녹음을 시작하고 중지하고 기록 된 연설을 Whisper.cpp [Server]에 보내는 텍스트를 클립 보드에 덤프하십시오 (그 전에 로컬 LLM으로 전달하지 않는 한). 대부분의 Linux 데스크탑 환경 및 배포판에서 작동 해야하는 보편적 인 접근 방식.

작업은 스크립트 중 하나에 의해 수행됩니다.

일반적인 음성 입력을위한 WSI ,
다국어 사용자를위한 WSIML ,
llama.cpp 또는 llamafile을 사용하여 로컬 대형 언어 모델과 대화하려는 사용자를위한 WSIAI .

음성 인식은 Linux 시스템에서 사전 컴파일되거나 LAN 또는 LocalHost에서 서버 인스턴스로 사용할 수있는 Whisper.cpp에 의해 수행됩니다. 대안 적으로, 당신은 이제 llamafile 저장소의 일부인 실제로 휴대용 실행 파일 (내장 된 속삭임 모델 포함)을 다운로드하여 사용하도록 선택할 수 있습니다.

음성 입력이 핫키와 함께 시작되면, 마이크 표시기가 상단 막대에 나타나고 (적어도 그놈에서) 기록 기간 동안 표시됩니다 (다른 핫키와 상호 작용할 수 있음). 상단 막대에서 마이크 아이콘의 사라짐은 완성을 나타내고 전사 된 텍스트는 클립 보드에서 붙여 넣을 수 있습니다. 느린 시스템에서는 마이크 아이콘이 사라지고 전사 시간이 길어 텍스트가 클립 보드에 도달하기 전에 약간의 지연이있을 수 있습니다. 내 컴퓨터에서 Whisper.cpp Server API를 통해, 평균 텍스트의 평균 단락에 대해서는 Local Whisper.cpp의 경우 300ms (300ms) 미만입니다.

예를 들어 표준 CTRL+V 와 함께 키보드 전용 작동의 경우 표준 클립 보드는 X11 및 Wayland ( wsi 또는 wsiml )에서 사용되며 wsi -p (또는 wsiml -p )는 기본 판매를 사용하고 텍스트는 중간 마우스 버튼으로 붙여 넣습니다). 왼쪽 페이스트의 경우 오른손으로 트리거 된 핫키로 음성 녹음을 강등 할 수 있습니다. ** 예를 들어 숫자 키패드에서 미사용 "+"(시작) 및 "삽입"(녹음 중지) 키를 설정했습니다.

데이터 흐름 다이어그램

WSIAI 스크립트 (W 샘플 LLM 상호 작용)

WSIAI 데이터 흐름

Blooper (루프의 음성 입력)

Blooper Dataflow

시스템 설정

전제 조건 :

최신 데스크탑 환경을 실행하는 Linux 시스템에 ZSH 또는 BASH 명령 줄 쉘 설치.
Whistper.CPP 설치 또는 LAN/LOCALHOST (네트워크 전송 섹션 참조) 또는 선택적으로 다운로드 된 WhisperFile의 SHISPER.CPP 서버.
이 저장소의 Orchestrator 도구 WSI , WSIAI 또는 WSIML은 $ home/.local/bin/폴더 또는 $ 경로의 다른 곳에 배치해야합니다 (설치 스크립트 install-wsi 대부분의 사람들).
최근 버전의 'Sox', 'Xsel'(또는 Wayland의 'WL-Copy')의 명령 줄 도구가 시스템 저장소에서.
작동하는 마이크

면책 조항 : 저자는이 문서의 내용과 상호 작용하여 발생할 수 있거나 발생할 수있는 결과에 대한 신용을 받거나 책임을지지 않습니다. 제안 된 조치 및 자동화 (예 : 설치 위치 등)는 단지 제안 일 뿐이며 저자의 선택과 의견을 기반으로합니다. 모든 사람의 취향이나 특정 상황에 맞지 않을 수 있으므로 필요에 따라 조정하십시오.

설치

선택한 폴더에서 Blahst 저장소를 복제 한 다음 아래에서 설치 방법을 선택하십시오.

 git clone https://github.com/QuantiusBenignus/BlahST.git
cd ./BlahST

설치 스크립트 사용

복제 된 저장소의 폴더에서 스크립트`install-wsi '를 실행하고 프롬프트를 따르십시오. 스크립트를 이동하고 실행 가능하게 만들고 Whisper.cpp`Main` 실행 파일을 설정하고, 환경을 설정하고, 기본값을 설정하고, 의존성을 확인하고, 종속성을 확인하고 누락 된 경우 설치를 요청합니다. 또한 스크립트는 해당 옵션을 선택할 경우 선택의 속삭임을 설정하는 데 도움이됩니다. 설치 스크립트는 네트워크 전사에 대한 설정을 처리하지만 Whisper.cpp 서버의 IP 및 포트는`wsi` 및/또는`wsiai`,`wsiml`에서 수동으로 설정되어야합니다.`wsi` 또는`wsiai` 또는`wsiai` 또는`wsiml`은 먼저 명령 줄에서 직접 실행해야합니다. 나중에 속도와 편의성을 위해 [https://github.com/quantiusbenignus/blahst/#gui-setup-o-hotkeys) 만 호출합니다.

수동 설치

(Whisper.cpp가 설치되었다고 가정하고 클로닝 된 Whisper.cpp repo에서 'make'와 함께 컴파일 된 "메인"실행 파일. 전제 조건 섹션 참조)

스크립트 WSI 및/또는 WSIAI , WSIML을 $ home/.local/bin/에 배치하십시오.

실행 가능하게하십시오

 cd $HOME/.local/bin; chmod +x wsi wsiAI wsiml

명령 줄에서 한 번 실행하여 스크립트가 필요한 종속성을 확인하도록합니다.
Local Whisper.cpp를 사용하는 경우 Whisper.cpp 디렉토리에서 컴파일 된 "메인"실행 파일에 대한 상징적 링크 ($ 경로에 '전사'를 기대)를 만듭니다. 예를 들어, $HOME/.local/bin/ ($ 경로의 일부)에서 작성하십시오.

 ln -s /full/path/to/whisper.cpp/main $HOME/.local/bin/transcribe

전사가 $ 경로에 있지 않은 경우 WSI 에서 호출을 편집하여 절대 경로를 포함 시키거나 위치를 $ 경로 변수에 추가하십시오. 그렇지 않으면 스크립트가 실패합니다. Whisper.cpp를 컴파일하지 않으려면 또는 그 외에도 적절한 WhisperFile의 실행 파일을 다운로드하여 설정하십시오.

 cd $HOME/.local/bin
wget https://huggingface.co/Mozilla/whisperfile/resolve/main/whisper-tiny.en.llamafile
chmod +x whisper-tiny.en.llamafile

구성

wsi , wsiAI , wsiml 또는 blooper 스크립트 내부에는 처음에는 "사용자 구성 블록" 이라는 명확하게 표시된 섹션이 있으며, 여기서 모든 사용자 구성 가능한 변수가 수집되었습니다. 대부분은 그대로 남을 수 있지만 중요한 것은 전사 중에 사용하려는 (또는 Whisper.CPP 서버의 IP 및 포트 번호)의 위치입니다. WhisperFile을 사용하는 경우, WhisperFile 변수를 이전에 다운로드 한 실행 파일 WhisperFile의 파일 이름으로 설정하십시오. 즉, WHISPERFILE=whisper-tiny.en.llamafile ($ 경로에 있어야 함).

핫키의 GUI 설정

수동 및 자동 설치에 대해 음성 입력을 시작하고 중지하려면

사례 1 : 그놈

연설 녹음을 시작하는 핫키

그놈 시스템 설정을 열고 "키보드"를 찾으십시오.
"키보드 바로 가기", "보기 및 사용자 지정 단축키"아래
새 창에서 아래로 스크롤하여 "사용자 정의 바로 가기"로 스크롤하여 누릅니다.
새 바로 가기를 추가하려면 "+"를 눌러 이름을 알려주십시오 : "음성 녹화 시작"
중간 마우스 버튼을 사용하려면 "명령"필드 유형 /home/yourusername/.local/bin/wsi -p 에서 클립 보드를 사용하기 위해 .../wsi 로 변경합니다.
(다국어 모델 사용자의 경우 위의 wsi wsiml 로 바꾸고 WhisperFile을 사용하는 경우 -w 플래그, 즉 /home/yourusername/.local/bin/wsi -w 추가하십시오). 마지막으로 LLM 기능을 샘플링하려면 wsi wsiAI 로 바꾸십시오.
그런 다음 "바로 가기 설정"을 누르고 (사용하지 않은) 키 조합을 선택하십시오. 예를 들어 Ctrl+Alt+A 와 같은 키 콤보 또는 KP+ (키패드+)와 같은 단일 미사용 키입니다.
추가를 클릭하면 완료됩니다.

Orchestrator 스크립트에는 Sox (REC) 호출에 침묵 감지 필터가 있으며 2 초의 침묵으로 녹음을 중지합니다 (최상의 경우). 또한, 기다리지 않기를 원하거나 침묵 감지 임계 값에 문제가있는 경우 :

수동 음성 녹음 인터럽트 (강력하게 권장)

주요 조합으로 녹음을 수동으로 수동으로 삽입 할 수있는 사람들을 위해, 큰 해킹의 정신으로 시스템 내장 기능을 사용할 것입니다.

그놈 시스템 설정을 열고 다시 "키보드"를 찾으십시오.
"키보드 바로 가기", "보기 및 사용자 지정 단축키"아래
새 창에서 아래로 스크롤하여 "사용자 정의 바로 가기"로 스크롤하여 누릅니다.
"+"를 눌러 새 바로 가기를 추가하고 "Interupt Speech Input!"
"명령"필드 유형 pkill --signal 2 rec
그런 다음 "바로 가기 설정"을 누르고 (사용하지 않은) 키 조합을 선택하십시오. 예를 들어 Ctrl+Alt+X 와 같은 키 콤보 또는 kp- (kyypad -)와 같은 단일 미사용 키.
추가를 클릭하면 완료됩니다.

그 간단합니다. 새로운 키 바인딩이 이미 다른 것을 위해 설정되지 않았는지 확인하십시오. 이제 스크립트가 음성을 녹음 할 때 새로운 키 콤보로 중지 될 수 있으며 전사가 즉시 시작됩니다.

사례 2 : XFCE4

이것은 위의 그놈 설정에 대한 simalr입니다 (참조 용은 더 자세한 지침 참조).

XFCE4 설정 관리자를 엽니 다.
키보드로 이동 → 응용 프로그램 바로 가기.
추가 버튼을 클릭하여 새 바로 가기를 만듭니다.
클립 보드 .../wsi 사용하려면 /home/yourusername/.local/bin/wsi -p 의 이름과 명령을 입력하십시오.
(다국어 모델 사용자의 경우 위의 wsi wsiml 로 바꾸고 WhisperFile을 사용하는 경우 -w 플래그, 즉 /home/yourusername/.local/bin/wsi -w 추가하십시오). 마지막으로 LLM 기능을 샘플링하려면 wsi wsiAI 로 바꾸십시오.
할당하려는 키를 단축키에 누릅니다.
정상을 클릭하여 바로 가기를 저장하십시오. 음성 녹음을 중지하기위한 핫키는 다른 키 콤보 및 명령 pkill --signal 2 rec 과 유사하게 수행해야합니다.

사례 3 : KDE (플라즈마)

이것은 위의 그놈 설정과 유사합니다 (참조 용은 더 자세한 지침 참조).

시스템 설정 응용 프로그램을 엽니 다.
바로 가기로 이동 한 다음 맞춤형 바로 가기로 이동하십시오.
편집을 클릭 한 다음 새로 보면 필요한 경우 바로 가기에 대한 새 그룹을 만듭니다.
새로 생성 된 그룹 아래에서 새로 다시 클릭하고 글로벌 바로 가기 -> 명령/URL을 선택하십시오.
새 바로 가기의 이름을 알려주십시오.
"없음"옆의 버튼을 클릭하고 바로 가기에 할당하려는 키를 눌러 원하는 바로 가기 키 조합을 선택하십시오.
트리거 탭에서 바로 가기가 트리거 될 때 실행될 명령을 지정하십시오. 예 : /home/yourusername/.local/bin/wsi 또는 .../wsi -p
(다국어 모델 사용자의 경우 위의 wsi wsiml 로 바꾸고 WhisperFile을 사용하는 경우 -w 플래그, 즉 /home/yourusername/.local/bin/wsi -w 추가하십시오). 마지막으로 LLM 기능을 샘플링하려면 wsi wsiAI 로 바꾸십시오.
사용 가능한 확인란이 점검되어 바로 가기를 활성화해야합니다.
적용 또는 확인을 클릭하여 변경 사항을 적용하십시오. 음성 녹음을 중지하기위한 핫키는 다른 키 콤보 및 명령 pkill --signal 2 rec 과 유사하게 수행해야합니다.

시스템에 설치된 버전에 따라 위의 단계에 약간의 변형이있을 수 있습니다. Mate, Cinnamon, LXQT, Deepin 등과 같은 다른 많은 환경의 경우 단계는 위의 예와 다소 유사해야합니다. 시스템 데스크톱 환경에 대한 문서를 참조하십시오.

할 일

POSIX 호환 설치 스크립트
posix 호환 오케스트레이션 스크립트

요약

Hotkey Combo의 프레스에서 wsi -p 스크립트는 연설 (핫키 또는 침묵 감지로 중지)을 녹음하고, 현지인 Whisper.cpp의 사본을 사용하고, 전사 된 텍스트를 X11 또는 Wayland의 기본 선택으로 보냅니다. 그런 다음해야 할 일은 원하는 곳에서 중간 마우스 버튼으로 붙여 넣는 것입니다. (오른손으로 마우스를 들고있는 사람들의 경우, 왼손에 대한 핫키를 기록하는 음성 녹음이 의미가 있습니다.)
플래그가없는 wsi 사용하는 경우 (접근 방식이 공존 할 수 있고, 다른 핫키 세트를 설정할 수 있음), 전사 된 텍스트는 X11 또는 Wayland의 클립 보드 (1 차 선택이 아님)로 전송됩니다. 그런 다음 CTRL+V (Gnome 터미널의 경우 CTRL+SHIFT+V ) 또는 평소와 같이 Keys SHIFT+INSert 키와 함께 붙여 넣기가 발생합니다. (대부분의 사람들에게 오른손 핫키는 잘 작동합니다.)
wsi -n (자체 핫키로 선택된)으로 네트워크를 전사하는 경우, 스크립트는 녹음 된 오디오를 실행중인 Whisper.CPP 서버 (LAN 또는 localhost )로 올바르게 설정합니다. 그런 다음 텍스트 응답을 수집하고 CTRL+V (Gnome 터미널의 경우 CTRL+SHIFT+V ) 또는 SHIFT+INSert 키 (중간 마우스 버튼으로 붙여 넣기 위해 wsi -n -p 대신 사용)로 붙여 넣을 수 있습니다.
컴파일 된 Whisper.cpp 대신 WhisperFile을 사용하는 경우 wsi -w ... 로 호출하면 스크립트는 임베디드 Whisper 모델과 함께 실제로 휴대용 실행 파일을 사용합니다.
다국어 사용자의 경우 WSI의 기능 외에도 wsiml 언어를 지정할 수있는 기능 (예 : -l fr 및 -t 로 영어로 번역 할 수있는 옵션을 제공합니다. 사용자는 원칙적으로 여러 언어에 여러 언어에 여러 핫키를 할당 할 수 있습니다. 예를 들어, 두 개의 추가 핫키를 설정할 수 있습니다. 하나는 전사 용으로, 다른 하나는 wsiml -l fr 및 wsiml -l fr -t 명령을 할당하여 프랑스어로 번역하기위한 것입니다.
실험 : 사용자는 제공된 스크립트 Blooper를 연속 자동 연설-텍스트 입력에 사용하여 CTRL+V를 누르거나 중간 마우스 버튼을 클릭 할 필요가 없습니다. 위의 두 번째 비디오에서 보여줍니다. 클립 보드는 기본적으로 사용되며 텍스트는 키보드 카렛 아래에서 자동으로 표시되지만 원칙적으로 기본 선택을 대신 설정할 수 있으며, 중간 마우스 버튼 클릭이 시뮬레이션되고 텍스트를 사용할 수있는 시간에 마우스 포인터의 현재 위치에 붙여 넣습니다. 이것은 물리적 환경에 따라 침묵 탐지에 의존합니다. 시끄러운 환경에서는 핫 키를 사용하여 녹음을 중지하십시오.

팁과 요령

SOX는 WHISPER.CPP에서 유일하게 허용되는 16K 속도로 WAV 형식으로 녹음하고 있습니다. 이것은 ** wsi ** 에서이 명령을 사용하여 수행됩니다.`rec -t wav $ ramf rate 16k silence 1 0.1 3% 1 2.0 6%`신호 레벨 임계 값이 6% 인 2s의 침묵에서 정지하려고 시도합니다. 매우 시끄러운 환경은 침묵의 감지를 방지하고 (노이즈) 기록이 계속 될 것입니다. 이것은 문제이며 모든 경우에 작동하지 않을 수있는 구제책은 'WSI'스크립트의 SOX 필터에서 지속 시간 및 침묵 임계 값을 조정하는 것입니다. 물론 선호하는 경우 수동 상호 작용 방법을 사용할 수 있습니다.

연설이 끝날 때 일관되게 목소리를 낮추면 임계 값이 높으면 임계 값이 높으면 중단 될 수 있기 때문에 임의로 임의로 인상 할 수 없습니다. 이 경우 몇 %로 낮추십시오.
음성을 진폭 (마이크에 가깝게 말하면서 명확하게 말하기)으로 음성을 구별 할 수 있도록하는 것이 가장 좋습니다 (마이크에 가깝게 말하면) 외부 소음 (마이크의 보호 위치, 노이즈 취소 하드웨어 등)을 최소화하면 음성 신호 수준이 우수한 임계 값이 더 효과적 일 수 있습니다.

연설이 캡처되면 음성 인식을 위해 transcribe (Whisper.cpp)로 전달됩니다. 이것은 실시간보다 빠르게 발생합니다 (특히 빠른 CPU 또는 Whisper.CPP 설치가 CUDA를 사용하는 경우). 전사의 명령 줄 매개 변수에 -tn 추가하여 사용되는 처리 스레드 수를 조정할 수 있습니다 (Whisper.CPP 문서를 참조하십시오). 그런 다음 스크립트는 텍스트를 구문 분석하여 음성 아티팩트를 제거하고 포맷 한 다음 X11 또는 Wayland 도구를 사용하여 기본 선택 (클립 보드)으로 보냅니다.

원칙적으로 Whisper (Whisper.cpp) 는 다국어 이며 올바른 모델 파일을 사용하면이 응용 프로그램이 올바른 언어로 전사 된 UTF-8 텍스트를 출력합니다. wsiml 스크립트는 다국어 사용 전용이며이를 통해 사용자는 음성 입력 언어를 선택할 수 있으며 (LC가 언어 코드 인 -l LC 플래그 사용) 선택한 입력 언어의 음성을 -t 플래그로 영어로 변환 할 수도 있습니다. 사용자는 자신이 전사하거나 번역하려는 다양한 언어에 여러 핫키를 할당 할 수 있습니다. 예를 들어, 두 개의 추가 핫키를 설정할 수 있습니다. 하나는 전사 용으로, 다른 하나는 wsiml -l fr 및 wsiml -l fr -t 명령을 할당하여 프랑스어로 번역하기위한 것입니다.

서버 모드를 사용할 때는 이제 두 가지 선택이 있습니다. 사전 컴파일 된 Whisper.CPP 서버 또는 다운로드 된 WhisperFile (서버 모드)을 가질 수 있습니다. 오케스트레이터 스크립트는 같은 방식으로 접근합니다.

임시 디렉토리 및 파일

Speech-to-Text 전사는 메모리 및 CPU 집약적 인 작업이며 읽기 및 쓰기 액세스를위한 빠른 스토리지는 도움이 될 수 있습니다. 그렇기 때문에 WSI는 메모리에 임시 및 리소스 파일을 저장하고 SSD/HDD "Grinding": TEMPD='/dev/shm' 줄입니다. 이 유형의 마운트 포인트 "TMPFS"는 RAM으로 생성되며 (예를 들어 최소 8GB가 충분하다고 가정 해 봅시다) 사용자 공간 응용 프로그램 용 커널에서 사용할 수 있습니다. 컴퓨터가 종료되면 자동으로 삭제되므로 중간 파일이 필요하지 않기 때문에 괜찮습니다. 실제로, 일부 유형의 응용 분야 (전자를보고 있음)의 경우 시스템 전체 /TMP 마운트 포인트를 RAM에 보관하는 것이 유리합니다 (IMHO). RAM으로 이동 /TMP를 이동하면 응용 프로그램 시작 속도가 약간 빨라질 수 있습니다. 모든 전자 앱에 대한 환영 속도. 가장 간단한 형태 로이 전환은 쉽습니다.

echo "tmpfs /tmp tmpfs rw,nosuid,nodev" | sudo tee -a /etc/fstab 다음 Linux 컴퓨터를 다시 시작하십시오. 앞서 언급 한 이유로, 특히 HDD가 주요 저장소 미디어 인 경우 Wrisper.cpp가 동일한 위치 (/dev/shm)에서 필요한 ASR 모델 파일을 이동할 수도 있습니다. 이 파일은 큰 파일이며 터미널 세션 (또는 시스템 시작)의 시작 시이 위치로 전송할 수 있습니다. 이것은 이와 같은 것을 배치하여 .profile 파일을 사용하여 수행 할 수 있습니다.

 ([ -f /dev/shm/ggml-base.en.bin ] || cp /path/to/your/local/whisper.cpp/models/ggml* /dev/shm/)

cliblurt.mp4

크레딧

AI를 열기 (속삭임)
Georgi Gerganov 및 Community (Whisper의 C/C ++ Port Whisper.cpp)
Justine Tunney, CJ Pais 및 Llamafile 커뮤니티 (Llamafile 및 Whisperfile 용)
SOX 개발자 (유서 깊은 "스위스 군대의 사운드 처리 도구 나이프")
Xsel, WL-Copy, Curl, JQ, Xdotool과 같은 CLI 유틸리티의 제작자 및 관리자 및 Linux 환경 (CLI 및 GUI)을 강력한 패러다임으로 만드는 다른 사람들 .

확장하다

추가 정보