여전히 음악 소프트웨어를 정리하려고합니까? 당신은 이미 그것을 얻었습니다! 음악 제작 분야는 핵 폭발 수준의 돌파구를 안내했습니다! 확산 모델을 기반으로 한 세계 최초의 엔드 투 엔드 음악 모델이 등장하여 음악 제작의 임계 값을 직접 지상에 뿌렸습니다! 입을 움직이고 가사와 스타일을 입력하면 10 초 후에 보컬과 반주가있는 완전한 노래가 새로 출시됩니다!
이번에는 Diffrhythm이 정말 큰 움직임을 보였습니다! 전통적인 음악 제작 모델을 완전히 전복하고 프로세스 전반에 걸쳐 수동으로 개입하지 않고 완전한 노래의 자동 생성을 실현합니다! 더 이상 오래된 황소처럼 배열하고 섞을 필요가 없습니다. 예를 들어 "밤에 대한 팝송을 쓰고 싶다"또는 "재즈 스타일 우울한 사랑 노래 받기", Diffrhythm은 즉시 이해하고 독점적 인 노래를 조정할 것입니다.

더욱 충격적인 것은 Diffrhythm의 세대 속도가 엄청나게 빠르다는 것입니다! 4 분 45 초의 완전한 노래를 생성하는 데 10 초 밖에 걸리지 않습니다 (보컬 + 반주)! 이 속도는 단순히 플래시에 의해 소유됩니다! 또한, Diffrhythm으로 생성 된 음악은 훌륭한 품질입니다! 보컬과 반주는 자연스럽게 통합되어 있으며 가사와 멜로디는 매끄럽고 매끄 럽습니다. 전문 음악가들의 것처럼 들립니다. 그것이 AI의 걸작이라는 것을 듣는 것은 완전히 불가능합니다!
회절의 비밀 무기는 확산 변환기 (DIT) 아키텍처를 채택한다는 것입니다. 이 아키텍처는 전통적인 자동 회귀 모델 (예 : LLM)의 느린 추론 속도의 결함을 영리하게 피하여 회절 속도의 생성 속도가 솟아납니다! Google에서 시작한 Musiclm과 비교할 때 Diffrhythm은 50 배 빠릅니다! 이것은 단순히 플래시 킬러이며, AI 음악 생성을 밝은 속도의 시대로 가져옵니다!
회절의 사용은 또한 매우 간단하고 조잡합니다! 가사 (예 : "밤에"바람의 소리가 들립니다 ")와 스타일 팁 (예 : Pop, Electronic, Jazz) 및 Diffrhythm은 즉시 불을 열고 그 자리에서 독점적 인 노래를 만듭니다! 특정 음악 스타일에 대한 특별한 취향이 있다면 음악 클립을 프롬프트로 업로드 할 수도 있습니다. Diffrhythm은 완벽하게 복제하고 자유롭게 재생하여 원하는 음악 스타일을 생성 할 수 있습니다!
더 사려 깊은 점은 Diffrhythm이 기존 가사를 기반으로 노래를 생성 할 수있을뿐만 아니라 아무것도없는 것을 만들고 AI를 사용하여 자동으로 가사를 만듭니다! 그것은 강력한 대형 언어 모델 (LLM)이 내장되어 있으며, 생성 된 가사는 매끄럽고 문장, 올바른 문법이며 인간 서정가와 완전히 비교할 수 있습니다! 또한, Diffrhythm은 가사를 완벽하게 일치시키기 위해 가사를 지능적으로 최적화하여 가사가 음절이고 멜로디 리듬이 서로 일치하도록합니다! 더 놀라운 점은 Diffrhythm이 스타일에 적응하고 입력 한 음악 스타일 (예 : Pop, Electronics 및 Rock)에 따라 가사 테마를 자동으로 조정하여 가사와 음악 스타일이 통합되도록하는 것입니다. 너무 똑똑해서 친구가 없어요!
회절의 출시는 의심 할 여지없이 음악 제작 분야의 폭탄입니다! 그것은 음악 제작의 임계 값을 크게 낮출뿐만 아니라 모든 사람이 음악가의 꿈이되기 위해 음악가의 꿈이 될 수있게하지만 전통적인 음악 제작 모델을 완전히 파괴하고 AI 음악 제작의 새로운 시대를 열 것입니다! 미래에, 아마도 모든 사람들은 회절을 통해 마술 지팡이를 흔들어 마술사처럼 마술사와 같은 마술사와 같은 다양한 스타일의 AI 신성한 노래를 쉽게 만들 수 있습니다. 음악으로 만든 판도라의 상자는 회절로 완전히 열렸습니다! 음악 제작 에서이 산업 혁명에 대비할 준비가 되셨습니까?
시험 주소 : https://huggingface.co/spaces/aslp-lab/diffrhythm