팟 캐스트 시놉시스 생성 과정은 전통적으로 제작자, 제작자 및/또는 작가가 내용을 이해하고 에피소드의 두드러진 요점과 하이라이트를 요약하여 시놉시스를 수동으로 작성해야했습니다. 이 접근법은 시간이 많이 걸리며 주요 테마에 대해 논의하는 브레인 스토밍 세션을 포함하고 팟 캐스트의 메시지와 톤을 효과적으로 전달할 때까지 텍스트를 개선 할 수 있습니다 (예 : 코미디 팟 캐스트는 유머러스 한 언어 나 하이퍼 볼을 특징으로 할 수 있습니다).
이 저장소는 Azure Cognitive Services에서 제공하는 서비스 포트폴리오를 사용 하여이 매뉴얼 및 시간 소모적 프로세스의 대부분을 자동화하는 방법을 보여줍니다. 특히 Azure Speech Service 및 Azure OpenAI는 시놉시스 , 태그 라인 , SEO 키워드 및 번역을 여러 언어로 전사하고 생성하는 데 사용됩니다. 이 과정을 자동화하기 위해 AI를 통합한다고해서 인간의 창의성의 역할이나 인간의 참여의 중요성을 제거하지는 않습니다. 대신, AI의 힘을 활용하여 시장에서 시장에서 상당한 가속을 가질 수 있습니다. 콘텐츠의 최종 검증 및 승인은 출판 전 인간 전문가의 책임으로 남아 있습니다.

이 저장소는 팟 캐스트의 오디오 (1-3 단계)를 가져 오는 고급 아키텍처를 구현하고, Azure Speech Services (4 단계)를 사용하여 텍스트로 오디오를 전사하고 Azure OpenAI GPT-3.5 (단계 5)를 사용하여 전사를 기반으로 시놉시스를 생성합니다. 사용 된 GPT 모델의 버전은 예를 들어 GPT-4 또는 미래 버전으로 쉽게 업그레이드 할 수 있습니다.
사용자가 오디오 파일 (팟 캐스트)을 업로드 할 수있는 React 웹 앱으로 구성됩니다. 이 앱은 Azure 함수 (Webapihttptrigger) 엔드 포인트를 사용하여 오디오 파일을 스토리지 계정, 즉 raw-files 컨테이너에 업로드합니다.
새 파일이 원시 raw-files 컨테이너에 추가되면 Azure 함수 (AudiofileUploadedBloBtrigger)가 트리거됩니다. 이 기능은 오디오 파일을 다운로드하여 Azure Speech Services로 보내고 오디오를 텍스트로 전사합니다. 그런 다음 전사를 동일한 저장 계정, 즉 transcription 용기에 저장합니다.
새 파일이 transcriptions 컨테이너에 추가 될 때 마지막 Azure 함수 (전사 파일로드 블로 트리거)가 트리거됩니다. 이 기능은 전사 파일을 다운로드하여 다음 기능을 수행하는 4 가지 Azure Openai 메소드로 보냅니다.
스토리지 계정 open-ai-results 컨테이너에서 결과를 별도의 텍스트 파일로 저장합니다.
이 프로젝트는 기여와 제안을 환영합니다. 대부분의 기부금은 귀하가 귀하가 귀하의 기부금을 사용할 권리를 부여 할 권리가 있다고 선언하는 기고자 라이센스 계약 (CLA)에 동의해야합니다. 자세한 내용은 https://cla.opensource.microsoft.com을 방문하십시오.
기여하려면 자체 할당 된 문제를 만들어 원하는 것에 대한 높은 수준의 개요를 제공하십시오. 논의가 끝나면 PR과 후속 조치를 취하십시오.
이 프로젝트는 Microsoft 오픈 소스 행동 강령을 채택했습니다. 자세한 내용은 추가 질문이나 의견이 있으면 행동 강령 FAQ 또는 [email protected]에 문의하십시오.