포드 파이
이 앱을 사용하면 사용자가 제공된 파일을 기반으로 팟 캐스트 스타일로 컨텐츠를 만들 수 있습니다. 몇 가지 예는 종이, 강의, 프로젝트 설명, 개인 이력서 또는 다른 많은 것을 제공하는 것입니다.
또한이 프로젝트에 대해 이야기하기 위해 블로그 게시물을 작성했습니다. " 생성 AI를 사용하여 모든 입력에서 팟 캐스트 스타일 컨텐츠를 만드는 방법 "을 확인하십시오.
작동 방식

사용 방법
- 하나 이상의 파일을 제공합니다.
- 선택적으로 손님과 호스트의 목소리를 사용자 정의하면 여기에서 음성 샘플을 확인할 수 있습니다.
- "팟 캐스트 생성"을 클릭하고 잠시 기다리십시오.
- 오디오를 재생하고 텍스트 성적표를 따라 자유롭게 따르십시오.
예

팟 캐스트는 다른 프로젝트 "AI Beats"에서 생성됩니다.
팟 캐스트 -AI_BEAST.MP4
내 다른 프로젝트 "AI Trailer"에서 팟 캐스트 생성
팟 캐스트 -AI_TRAINER.MP4
팟 캐스트는 Andrew Huberman의 "최적의 아침 루틴"설명에서 생성됩니다
Podcast-Andrew_hubermans.mp4
팟 캐스트는 개인 이력서에 의해 생성됩니다
Podcast-Resume.mp4
지역 사용
설정
- Github 저장소를 복제하십시오
https://github.com/dimitreOliveira/PodfAI.git
cd PodfAI
- 새로운 venv를 만듭니다
python -m venv .venvs/podfai
- venv를 활성화하십시오
source .venvs/podfai/bin/activate
- 요구 사항을 설치하십시오
또는 pip 사용하여 실행할 수도 있습니다
pip install -r requirements
- Google API 종속성을 설정하십시오
앱 실행
앱을 시작하려면 아래에서 MAKE 명령을 실행하십시오
또는 일반 파이썬을 사용하여 실행할 수도 있습니다
streamlit run src / app . py
구성
기본 구성을 변경하여 앱 동작을 변경하거나 요구에 맞게 조정하십시오.
vertex:
project: {VERTEX_AI_PROJECT}
location: {VERTEX_AI_LOCATION}
transcript:
model_id: gemini-1.5-pro-002
transcript_len: 5000
max_output_tokens: 8192
temperature: 1
top_p: 0.95
top_k: 32
- 꼭지점
- 프로젝트 : Vertex AI가 사용하는 프로젝트 이름.
- 위치 : Vertex AI에서 사용하는 프로젝트 위치.
- 성적 증명서
- model_id : 팟 캐스트 전사를 만드는 데 사용되는 모델.
- Transcript_Len : 제안 된 전 사체 길이.
- max_output_tokens : 모델에서 생성 된 최대 토큰 수.
- 온도 : 온도는 토큰 선택에서 무작위성 정도를 제어합니다. 더 낮은 온도는 진실 또는 정확한 응답을 기대하는 프롬프트에 적합하지만 더 높은 온도는 더 다양하거나 예상치 못한 결과를 초래할 수 있습니다. 온도가 0 인 최고 확률 토큰이 항상 선택됩니다.
- TOP_P : TOP-P는 모델이 출력 토큰을 선택하는 방법을 변경합니다. 토큰은 확률의 합이 상위 P 값과 같을 때까지 가장 가능성이 가장 높은 것부터 최소한으로 선택됩니다. 예를 들어, 토큰 A, B 및 C가 확률이 .3, .2 및 .1이고 상단 P 값은 .5 인 경우 모델은 A 또는 B를 다음 토큰으로 선택합니다 (온도 사용).
- TOP_K : TOP-K는 모델이 출력 토큰을 선택하는 방식을 변경합니다. 최고 K는 선택된 토큰이 모델의 어휘에서 모든 토큰 중에서 가장 가능성이 높다는 것을 의미하며 (Greedy Decoding이라고도 함), 3 개의 Top-K는 다음 토큰이 3 개의 가장 가능성이 높은 토큰 중에서 선택되었음을 의미합니다 (온도 사용).
TODO
- 음성 복제를 지원합니다
- 다른 언어를 지원합니다
- 기타 입력 유형 지원 (이미지, 비디오, YouTube URL)
- Colab에서 실행할 예제 노트를 추가하십시오
- 오픈 소스 모델로 워크 플로를 재현하십시오
- 에이전트 워크 플로를 실험하여 팟 캐스트 전사를 개선하십시오
참조
- Google 클라우드-텍스트 음성 클라이언트 라이브러리
- Google Cloud TTS 로컬로 설정하십시오
- Google Cloud TTS 음성 목록
기여
이 프로젝트에 기여하는 데 관심이 있다면 감사합니다! 홍보를 만들기 전에 코드를 보풀을 보면서 아래 명령을 실행하십시오.
감사의 말
- 이 프로젝트에는 Google 클라우드 크레딧이 제공됩니다. 이 프로젝트는 Google의 ML 개발자 프로그램 팀의 지원 덕분에 가능했습니다.
- 이 프로젝트는 팟 캐스트 스타일 컨텐츠를 제외하고 다른 많은 기능이있는 Google의 노트북을 기반으로했으며 확인하십시오.