Amazon CTO Werner Vogels baru-baru ini melakukan open-source alat baris perintah yang disebut Distill CLI, yang memanfaatkan Amazon Transcribe dan Amazon Bedrock untuk menghasilkan ringkasan dari file audio. Ini menyederhanakan proses perekaman rapat dan ekstraksi informasi serta meningkatkan efisiensi kerja. Distill CLI ditulis dalam Rust dan secara cerdik memanfaatkan layanan AWS seperti Amazon S3 dan AWS Lambda untuk mencapai transkripsi audio dan pembuatan ringkasan yang efisien. Artikel ini akan mempelajari fungsionalitas Distill CLI, keunggulan teknis, latar belakang proyek, dan potensi pengembangan di masa depan.
Amazon CTO Werner Vogels baru-baru ini meluncurkan proyek pribadi yang disebut Distill CLI. Alat sumber terbuka ini memanfaatkan Amazon Transcribe dan Amazon Bedrock untuk menghasilkan ringkasan rekaman langsung dari baris perintah. Distill CLI ditulis oleh Vogels di Rust dan bertujuan untuk menyediakan cara otomatis untuk menyalin dan menggabungkan file media. Ini menggunakan Amazon S3, AWS Lambda, Amazon Transcribe, Amazon Bedrock, dan AWS CDK untuk mengelola infrastruktur proyek.

Contoh keluaran CLI yang distllll. Sumber: Blog Semua Hal Terdistribusi
Fungsi dan fitur
Distill CLI didasarkan pada alat sumber terbuka Amazon Bedrock Audio Summarizer, yang dapat memproses rekaman dan menghasilkan ringkasan secara efisien. Pengguna dapat mengunggah file media dan memantau proses peringkasan melalui antarmuka baris perintah, menyederhanakan proses catatan rapat dan ekstraksi informasi. Vogels pertama kali menyebutkan proyek ini dalam artikel "Peretasan untuk Membuat Rapat Tim Lebih Baik", menyoroti penggunaannya dalam meningkatkan proses pencatatan.
Keuntungan teknis
Vogels membagikan beberapa pilihan teknologi dan hasil optimasi dari tahap awal proyek. Dia mengatakan bahwa dengan menulis ulang fungsi Lambda di Rust, kecepatan cold start meningkat 12 kali lipat dan penggunaan memori berkurang 73%. Pengoptimalan ini membuat seluruh proses peringkasan rekaman menjadi lebih efisien dan mengurangi jumlah penulisan ke S3. Transkrip dan ringkasan disimpan dalam memori, sehingga meningkatkan kinerja secara keseluruhan.
Distill CLI memiliki antarmuka pengguna yang bersih yang menyediakan pembaruan status dan memberi tahu pengguna jika ada kegagalan. Alat ini mendukung keluaran ringkasan ke terminal dan sebagai dokumen Word, file teks, Markdown, dan pesan Slack, serta dapat memproses file audio dalam bahasa apa pun yang didukung oleh Amazon Transcribe.

Versi pertama dari Distilasi. Sumber: Blog Semua Hal Terdistribusi
Latar belakang dan tujuan proyek
Vogels mengatakan dia selalu mencari alat dan strategi untuk meningkatkan proses pencatatannya. Meskipun ia umumnya lebih suka mencatat dengan pena dan kertas, ia juga menyadari manfaat teknologi dalam meningkatkan kemampuan mengumpulkan informasi, terutama dalam situasi seperti rapat yang memerlukan partisipasi aktif.
Vogels mencatat bahwa Distill CLI pada awalnya dikembangkan untuk memenuhi kebutuhan timnya, namun ia juga ingin menantang dirinya sendiri dengan mempelajari bahasa baru. Proyek ini membuktikan bahwa pengalaman langsung adalah cara efektif untuk belajar sekaligus menjaga rasa ingin tahu terhadap teknologi.
Dengan menggabungkan kemampuan transkripsi rekaman dan peringkasan menjadi alat yang sederhana dan efisien, Distill CLI memberikan solusi canggih kepada pengguna untuk membantu mereka mengelola dan memanfaatkan konten audio dengan lebih baik. Dengan optimalisasi proyek yang berkelanjutan dan peningkatan fungsi, alat ini diharapkan dapat memainkan peran penting dalam berbagai skenario kolaborasi tim dan perekaman rapat.
Alamat proyek: https://github.com/awslabs/distill-cli/
Secara keseluruhan, Distill CLI, sebagai alat transkripsi dan peringkasan audio yang efisien, memberi pengguna cara baru dalam manajemen konten audio dengan kesederhanaan, kemudahan penggunaan, kinerja tinggi, dan fungsi yang kuat. Fitur open source-nya juga memfasilitasi pengembang untuk meningkatkan dan memperluas, serta memiliki potensi besar untuk pengembangan di masa depan.