생성 -AI 뉴스 리더
Keezum AI NewsReader !
AI 뉴스 리더 저장소에 오신 것을 환영합니다! 이 프로젝트는 생성 AI 도구를 함께 사용하여 정교하고 역동적 인 뉴스 리더 아바타를 만드는 방법을 보여줍니다.
켈 면책 조항 : 농담 만하면 편안함에 따라 자유롭게 사용하십시오.
이 링크를 방문하여 데모 비디오를보고 Macy가 실제로 언급 된 두 가지 의약품에 대해 간단히 이야기합니다.
생성 AI가 개선되는 속도를 감안할 때 결과는 매우 인상적이며 시간이 지남에 따라 더 나아질 것입니다. 이 데모를 만들려면 0 달러와 25 분이 걸렸습니다.
내가 사용한 도구는 다음과 같습니다.
- 여성 약사의 이미지를 생성하는 Midjourney
- OpenAi의 chatgpt를 위한 NewSheadLines 스크립트를 생성합니다
- chatgpt 스크립트에서 오디오를 생성하기위한 elevenlabs 의 주요 비디오 AI
- 오디오와 동기화 된 현실적인 애니메이션 아바타 비디오를 생성하기위한 D-ID 의 창의적인 현실 스튜디오 (무료 평가판)
단계별 가이드
(1) MidJourney- 이미지 생성
- 아바타를 대표하려면 얼굴이 필요하며 Midjourney와 같은 이미지 생성 도구를 사용하여 바로 그 일을 할 수 있습니다.
- Midjourney는 OpenAi의 무료 AI 서비스입니다. 텍스트 설명에서 이미지를 만듭니다.
- 설정:
- MidJourney는 전적으로 Discord에서 작동하므로 Discord 계정 (무료)에 가입하십시오.
- 이 Midjourney 사이트 링크를 방문하여 자동으로 불화 초대로 이동합니다.
- Discord 초대를 MidJourney에 수락하십시오. 계속해서 불화를 선택하십시오.
- MidJourney 버튼 (선박 아이콘 포함)을 클릭하고 새로운 방을 선택합니다. 예를 들어,
newbies-24 - 채팅 라인에서 설명
/imagine 입력 한 다음 설명 프롬프트가 이어집니다. 예를 들어, 내가 사용한 프롬프트는 "뉴스 룸 배경을 가진 빨간 코트에서 여성 미디어 뉴스 리포터의 고품질 상반신 전문 사진"이었습니다. 입력 한 후 Enter를 누르고 MidJourney에 이미지를 생성 할 시간을주십시오. - 완료되면 네 이미지의 출력이 나타납니다. 이미지 세트에는 버튼 세트 U1-U4 및 V1-V4가 표시됩니다.
- 4 개의 이미지는 왼쪽 상단에서 시계 방향으로 번호가 매겨집니다. 원하는 하나에 대한 새로운 변형을 얻으려면 "v1"(또는 v2, v3 또는 v4)을 선택하고 고해상도 사본을 얻으려면 "U1"(또는 U2, U3 또는 U4)을 선택하십시오.
- U 버튼 중 하나를 선택하여 선택한 고해상도 변형을 받으면 이미지를 클릭하고 '브라우저에서 열기'를 선택하십시오. 그런 다음 로컬 컴퓨터에 고해상도 이미지를 저장할 수 있습니다.
(2) Playground Chatgpt- 텍스트 생성
- 모든 사람들이 Chatgpt를 사용하여 요즘 약간 느려졌고 돈을 지불하는 데 관심이있는 모든 사람이 아니기 때문에 Chatgptplayground를 사용하여 작업을 매우 빨리 수행 할 수 있습니다. 뉴스를 제공 할 수있는 뉴스 헤드 라인 스크립트가 필요합니다. 그렇게하려면 ChatGptplayground를 사용할 수 있습니다.
- Chatgpt는 OpenAi가 개발하고 2022 년 11 월에 시작된 챗봇입니다. OpenAI의 GPT-3 대형 언어 모델 제품군 위에 세워졌습니다.
- 설정:
- 이 링크를 방문하여 chatgpt에 액세스하십시오 (그에 따라 로그인해야합니다).
- 프롬프트 섹션에서 상담 스크립트의 관련 설명을 입력하십시오. 예를 들어, 내가 사용한 프롬프트는 다음과 같습니다. "먼저 Keezum이라는 뉴스 리더로 자신을 소개하는 스크립트를 작성한 다음 시작 부분이있는 뉴스 헤드 라인에 대해 이야기하고 최대 2 ~ 3 줄로 뉴스 정보를 제공합니다."
- ChatGpt 화면의 출력에서 생성 된 텍스트를 로컬 컴퓨터의 텍스트 파일에 복사하여 저장하십시오.
(3) elevenlabs- 텍스트 음성 연석 생성
- 다음으로 Chatgpt 스크립트 텍스트를 자연스러운 사운드 오디오 클립으로 변환하려고합니다. Prime Voice AI와 같은 무료 도구 (ElevenLabs)와 같은 무료 도구로 그렇게 할 수 있습니다.
- Prime Voice AI는 현실적이고 다재다능한 AI 스피치 소프트웨어로 스토리 텔링을위한 최고의 도구를 찾고있는 제작자와 출판사에게 가장 매력적이고 풍부하며 생생한 목소리를 제공합니다.
- 설정:
- ElevenLabs 페이지를 방문하여 무료로 계정을 만듭니다.
- 음성 합성 페이지에서 설정에서 특정 음성을 선택하고 텍스트 스크립트를 텍스트 섹션에 붙여 넣고 생성을 클릭하십시오. 내가 선택한 목소리는 그것이 가장 활기차고 자연스럽다는 것을 알았을 때
premade/Domi 였습니다. 안정성과 선명도와 같은 것에 따라 설정을 조정할 수도 있습니다. - 데모가 너무 길어지기를 원하지 않았기 때문에 Amlodipine의 섹션을 제거하여 스크립트를 약간 단축했습니다.
- 무료 계정에는 신용 한도가 있으므로 생성하려는 오디오에 현명하게 사용하십시오.
- 로컬 컴퓨터에서 .mp3 ( 'synthesized_audio.mp3') 파일을 다운로드하여 저장하십시오.
(4) D -ID- Photorealistic Talking Avatar (및 오디오 동기화) 생성
- 마지막으로, 약사 이미지를 조각하고 오디오 상담 오디오를 함께 사진을 찍을 시간입니다. 이를 위해 D-ID와 같은 도구를 사용할 수 있습니다.
- D-ID의 Creative AI 기술은 얼굴의 이미지를 가져 와서 고품질의 사진 학적 비디오로 바꿉니다. 버튼을 클릭하면 이미지를 오디오 또는 텍스트와 결합하여 표현과 음성을 제공 할 수 있습니다.
- 설정:
- D-ID 웹 사이트를 방문하여 무료 평가판 계정을 만듭니다.
- 비디오 만들기 버튼을 선택하여 새 비디오 만들기 시작
- MidJourney 약사 이미지를 발표자 이미지로 추가하십시오
- 오른쪽에있는
Upload your own voice 에 ChatGpt 스크립트 오디오를 업로드하십시오. - 오른쪽 상단에서
Generate Video 버튼을 클릭하고 걸작이 다운로드 될 때까지 기다리십시오!
의존성
이 프로젝트는 다음과 같은 종속성이 필요합니다.
Python 3.6 or higher
Midjourney
OpenAI's GPT-3 API
ElevenLabs' Prime Video AI
D-ID's Creative Reality Studio
미래의 일
우리는보다 생성적인 AI 도구를 통합하고 NewsReader Avatar의 기능을 확장 하여이 프로젝트를 계속 개선하고 개선 할 계획입니다. 또한 지역 사회의 기여 나 제안을 환영합니다. 감사의 말
우수한 생성 AI 도구에 대해 MidJourney, OpenAi, ElevenLabs 및 D-ID의 개발자와 연구원들에게 감사의 말씀을 전합니다.
특허
이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다. 자세한 내용은 라이센스 파일을 참조하십시오.