Bidang alat AI telah menyebabkan kegemparan lagi! Google AI Studio merilis pembaruan besar hari ini, dan fitur -fitur terbarunya dengan cepat memicu diskusi panas pada platform X. Pengguna kagum bahwa Google AI Studio sekarang dapat secara langsung memproses tautan video YouTube, dan dapat segera memahami konten video tanpa mengunduh atau mengunggah! Yang lebih mengejutkan adalah bahwa model eksperimental Gemini2.0flash (Gemini2.0flash Exp untuk singkat) dengan diam -diam membuka keterampilan magis yang dihasilkan oleh gambar alami, dan bahkan dapat mempertahankan konsistensi karakter dalam banyak gambar! Pembaruan "hasil pribadi resmi" ini dianggap sebagai "pemogokan pengurangan dimensi" oleh orang dalam industri, yang menunjukkan bahwa banyak gadget AI yang mengandalkan teknologi "yang tertutup cangkang" mungkin menghadapi "kiamat".
X Platform Pengguna InterJC Diposting hari ini: "Google AI Studio sekarang dapat secara langsung menempelkan tautan YouTube untuk memahami konten video, dan sejumlah gadget 'shell' yang akan jatuh." Dia menunjukkan dengan tajam bahwa fitur baru ini hanyalah "pukulan pengurangan dimensi". Pengguna tidak perlu lagi mengunduh video dan mengunggahnya. Mereka dapat mengajukan pertanyaan atau meringkas dengan hanya melempar tautan, dan efisiensi telah ditingkatkan dengan lebih dari satu urutan besarnya. Yang lebih menakjubkan adalah bahwa bahkan video-video bebas subtitle "tulang keras" itu dapat dengan mudah diperoleh oleh Gemini2.0flash exp dan dengan cepat mem-parsing konten hanyalah "senjata ajaib". Pengguna Jesselaunz juga secara pribadi menguji video Cina tanpa subtitle. Akibatnya, Gemini2.0flash exp "meringkas dengan sempurna" konten video, dan efeknya jauh di luar model besar lainnya. Ini bisa disebut "keterampilan eksklusif", membuat AI lain di luar jangkauan.
Jika pemahaman video hanyalah "hidangan pembuka", maka evolusi Gemini2.0flash exp dalam pembuatan gambar dapat disebut bom "tingkat bom nuklir". X Pengguna Dotey berbagi perekaman layar yang mengejutkan di platform. Dia menggunakan kata kunci "kura -kura dan kelinci untuk balapan" sebagai kata kunci dan menghasilkan 8 gambar adegan dalam sekali jalan, dan hasilnya luar biasa! Gambar yang dihasilkan tidak hanya alami dan halus, tetapi yang lebih menakjubkan adalah bahwa karakter "kura -kura" dan "kelinci" dalam gambar sebenarnya mempertahankan penampilan yang sangat konsisten dalam 8 gambar! Yang lebih mengejutkan adalah bahwa gambar pertama bahkan memiliki empat karakter besar dalam bahasa Cina: "Tortoise and Hare Race". Meskipun stroke sedikit cacat ketika diamati dengan hati -hati, kemampuan ini masih luar biasa. Dotey menghela nafas dengan penuh semangat: "Kecepatan ini terlalu cepat, itu hanya hit dari berbagai alat 'set shell'!"
Diskusi tentang platform X terus meningkat. Kekuatan kuat yang ditunjukkan oleh Gemini2.0flash exp tidak hanya tercermin dalam kemampuan pemrosesan multimodal, tetapi juga dalam kecepatan generasi yang luar biasa dan stabilitas yang luar biasa. Pengguna Python_xxt menguji tautan video tanpa subtitle selama lebih dari satu jam. Gemini2.0flash exp sebenarnya dapat "secara langsung menghasilkan konten konferensi dan analisis mendalam, dan efeknya sempurna untuk semua alat ringkasan di pasar", yang hanya "sihir". Implementasi fungsi ini tidak diragukan lagi karena pemahaman mendalam tentang konten video Gemini2.0flash Exp. Bahkan tanpa "berkat" subtitle, ia dapat secara akurat mengekstraksi informasi utama dalam video, yang menunjukkan kekuatan teknisnya.
Orang dalam industri telah dengan tajam menangkap bahwa pembaruan studio Google AI menandai transformasi besar dari strategi pengembangannya - mempercepat evolusi ke alat -alat tingkat aplikasi dari platform model dasar sederhana. X Pengguna gantrol menunjukkan secara tajam bahwa fungsi pembuatan gambar Gemini2.0flash exp dapat dengan sempurna mendukung kata -kata cepat Cina dan modifikasi dialog, yang tidak diragukan lagi sangat mengurangi ambang batas pengguna untuk digunakan. Dia juga dengan cermat melampirkan panduan operasi, "Pergi saja ke AI Studio dan pilih model", dan garis mengungkapkan kepentingan Google yang tinggi untuk keramahan pengembang.
Tentu saja, fitur -fitur baru ini menarik, tetapi beberapa pengguna telah menunjukkan sisa "kekurangan" mereka. Sebagai contoh, Dotey mengamati bahwa masih ada beberapa masalah stroke kecil dalam teks Cina yang dihasilkan oleh Gemini2.0flash Exp. Pengguna Lessnoise365 juga menyebutkan bahwa fitur serupa sebenarnya dibangun ke dalam Gemini ponsel piksel. Meskipun keunggulan gratis AI Studio luar biasa, mungkin ada ruang untuk optimasi lebih lanjut dalam hal kemudahan penggunaan. Namun, kekurangannya tidak menyembunyikan kelebihannya. Pengguna di platform X umumnya percaya bahwa pembaruan ini akan memiliki dampak mendalam pada ekosistem alat AI yang ada, terutama aplikasi "dienkapsulasi" yang mengandalkan kemasan sederhana, yang tidak diragukan lagi akan menghadapi tantangan kelangsungan hidup yang sangat besar.
Google belum secara resmi merilis rincian teknis komprehensif Gemini2.0flash Exp, tetapi kemampuan multimodal dan efisiensinya yang luar biasa telah membangkitkan harapan kuat dari seluruh industri. Dengan iterasi berkelanjutan dan peningkatan AI Studio, apakah Google akan lebih mengintegrasikan sumber daya ekologisnya yang besar dan meluncurkan fungsi AI yang lebih mengganggu dapat menjadi sorotan paling penting di bidang AI pada tahun 2025.
Alamat API:
https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube