Unduh stagehand - Unduh Kode Sumber stagehand

stagehand

Kode sumber lainnya

v1.3.0

Unduh

? Petugas untuk pentas

Kerangka Penjelajahan Web AI yang berfokus pada kesederhanaan dan ekstensibilitas.

Intro
Memulai
Referensi API
- bertindak()
- ekstrak()
- mengamati()
Dukungan Model
Cara kerjanya
StageHand vs Playwright
Tips Mendukung
Peta jalan
Berkontribusi
Ucapan Terima Kasih
Lisensi

Catatan

Stagehand saat ini tersedia sebagai rilis awal, dan kami secara aktif mencari umpan balik dari masyarakat. Silakan bergabung dengan komunitas Slack kami untuk tetap diperbarui tentang perkembangan terbaru dan memberikan umpan balik.

Intro

StageHand adalah penerus drama yang bertenaga AI, menawarkan tiga API sederhana ( act , extract , dan observe ) yang menyediakan blok bangunan untuk otomatisasi web yang digerakkan oleh bahasa alami.

Tujuan dari StageHand adalah untuk memberikan kerangka kerja yang ringan dan dapat dikonfigurasi, tanpa abstraksi yang terlalu kompleks, serta dukungan modular untuk berbagai model dan penyedia model. Ini tidak akan memesan pizza, tetapi itu akan membantu Anda mengotomatiskan web dengan andal.

Setiap fungsi tahap mengambil instruksi atom, seperti act("click the login button") atau extract("find the red shoes") , menghasilkan kode penulis naskah yang sesuai untuk mencapai instruksi itu, dan menjalankannya.

Instruksi harus atom untuk meningkatkan keandalan, dan perencanaan langkah harus ditangani oleh agen tingkat yang lebih tinggi. Anda dapat menggunakan observe() untuk mendapatkan daftar tindakan yang disarankan yang dapat diambil pada halaman saat ini, dan kemudian menggunakannya untuk mendaratkan petunjuk perencanaan langkah Anda.

StageHand adalah open source dan dikelola oleh tim Browserbase. Kami percaya bahwa dengan memungkinkan lebih banyak pengembang untuk membangun otomatisasi web yang andal, kami akan memperluas pasar pengembang yang mendapat manfaat dari infrastruktur browser tanpa kepala kami. Ini adalah kerangka kerja yang kami harapkan saat mengutak -atik aplikasi kami sendiri, dan kami senang membagikannya kepada Anda.

Memulai

1. Instal Paket StageHand

Kami juga menginstal ekstraksi Zod ke Power Typed

npm install @browserbasehq/stagehand zod

2. Konfigurasikan Penyedia Model Anda

Anda harus menyediakan kunci API Anda untuk penyedia model yang ingin Anda gunakan. Penyedia model default adalah Openai, tetapi Anda juga dapat menggunakan antropik atau orang lain. Informasi lebih lanjut tentang model yang didukung dapat ditemukan dalam referensi API.

Pastikan kunci API OpenAI atau kunci API antropik dapat diakses di lingkungan lokal Anda.

 export OPENAI_API_KEY=sk-...
export ANTHROPIC_API_KEY=sk-...

3. Buat contoh panggung

Jika Anda berencana untuk menjalankan browser secara lokal, Anda juga harus menginstal dependensi browser penulis naskah.

npm exec playwright install

Maka Anda dapat membuat instance panggung seperti itu seperti:

 import { Stagehand } from "@browserbasehq/stagehand" ;
import { z } from "zod" ;

const stagehand = new Stagehand ( {
  env : "LOCAL" ,
} ) ;

Jika Anda berencana untuk menjalankan browser dari jarak jauh, Anda harus mengatur kunci API Browserbase dan ID proyek.

 export BROWSERBASE_API_KEY=...
export BROWSERBASE_PROJECT_ID=...

 import { Stagehand } from "@browserbasehq/stagehand" ;
import { z } from "zod" ;

const stagehand = new Stagehand ( {
  env : "BROWSERBASE" ,
  enableCaching : true ,
} ) ;

4. Jalankan otomatisasi pertama Anda

 await stagehand . init ( ) ;
await stagehand . page . goto ( "https://github.com/browserbase/stagehand" ) ;
await stagehand . act ( { action : "click on the contributors" } ) ;
const contributor = await stagehand . extract ( {
  instruction : "extract the top contributor" ,
  schema : z . object ( {
    username : z . string ( ) ,
    url : z . string ( ) ,
  } ) ,
} ) ;
console . log ( `Our favorite contributor is ${ contributor . username } ` ) ;

Cuplikan sederhana ini akan membuka browser, menavigasi ke repo panggung, dan mencatat kontributor teratas.

Referensi API

`Stagehand()`

Konstruktor ini digunakan untuk membuat instance stageHand.

Argumen:
- env : 'LOCAL' atau 'BROWSERBASE' . Default ke 'BROWSERBASE' .
- modelName : (Opsional) String AvailableModel untuk menentukan model default yang akan digunakan.
- modelClientOptions : (Opsional) Opsi konfigurasi untuk klien model.
- enableCaching : boolean yang memungkinkan caching respons LLM. Ketika diatur ke true , permintaan LLM akan di -cache pada disk dan digunakan kembali untuk permintaan yang identik. Default ke false .
- headless : boolean yang menentukan apakah browser berjalan dalam mode tanpa kepala. Default ke false . Ketika Env diatur ke BROWSERBASE , ini akan diabaikan.
- domSettleTimeoutMs : integer yang menentukan batas waktu dalam milidetik untuk menunggu DOM menyelesaikan. Default ke 30000 (30 detik).
- apiKey : (Opsional) Kunci API Browserbase Anda. Default ke variabel lingkungan BROWSERBASE_API_KEY .
- projectId : (Opsional) ID Proyek Browserbase Anda. Default ke variabel lingkungan BROWSERBASE_PROJECT_ID .
- browserBaseSessionCreateParams : Opsi Konfigurasi untuk Membuat Sesi Browserbase Baru.
- browserbaseResumeSessionID : ID dari sesi browserbase yang ada untuk dilanjutkan.
- logger : Fungsi yang menangani pesan log. Berguna untuk implementasi logging khusus.
- verbose : integer yang memungkinkan beberapa level logging selama otomatisasi:
  - 0 : Terbatas untuk No Logging
  - 1 : Penebangan Tingkat SDK
  - 2 : LLM-CLient Level Logging (kebanyakan granular)
- debugDom : boolean yang menggambar kotak -kotak pembatas di sekitar elemen yang disajikan kepada LLM selama otomatisasi.
Kembali:
- Sebuah instance dari kelas Stagehand yang dikonfigurasi dengan opsi yang ditentukan.

Contoh:

 // Basic usage
const stagehand = new Stagehand ( ) ;

// Custom configuration
const stagehand = new Stagehand ( {
  env : "LOCAL" ,
  verbose : 1 ,
  headless : true ,
  enableCaching : true ,
  logger : ( logLine ) => {
    console . log ( `[ ${ logLine . category } ] ${ logLine . message } ` ) ;
  } ,
} ) ;

// Resume existing Browserbase session
const stagehand = new Stagehand ( {
  env : "BROWSERBASE" ,
  browserbaseResumeSessionID : "existing-session-id" ,
} ) ;

Metode

`init()`

init() secara tidak sinkron menginisialisasi instance stageHand. Itu harus dipanggil sebelum metode lain.

Argumen:
- modelName : (Opsional) String AvailableModel untuk menentukan model yang akan digunakan. Ini akan digunakan untuk semua metode lain kecuali ditimpa.
- modelClientOptions : (Opsional) Opsi Konfigurasi untuk Klien Model
- domSettleTimeoutMs : (Opsional) Batas waktu dalam milidetik untuk menunggu DOM menyelesaikan
Kembali:
- Promise yang diselesaikan menjadi objek yang berisi:
  - debugUrl : Sebuah string yang mewakili URL untuk debugging langsung. Ini hanya tersedia saat menggunakan browser browserbase.
  - sessionUrl : Sebuah string yang mewakili URL sesi. Ini hanya tersedia saat menggunakan browser browserbase.

Contoh:

 await stagehand . init ( { modelName : "gpt-4o" } ) ;

`act()`

act() memungkinkan panggung untuk berinteraksi dengan halaman web. Berikan action seperti "search for 'x'" , atau "select the cheapest flight presented" (tujuan atom kecil melakukan yang terbaik).

Argumen:
- action : string yang menggambarkan tindakan yang akan dilakukan
- modelName : (Opsional) String AvailableModel untuk Menentukan Model yang akan Digunakan
- modelClientOptions : (Opsional) Opsi Konfigurasi untuk Klien Model
- useVision : (Opsional) boolean atau "fallback" untuk menentukan apakah pemrosesan berbasis penglihatan harus digunakan. Default ke "fallback"
- variables : (Opsional) Record<string, string> variabel untuk digunakan dalam tindakan. Variabel dalam string aksi direferensikan menggunakan %variable_name%
- domSettleTimeoutMs : (Opsional) Batas waktu dalam milidetik untuk menunggu DOM menyelesaikan
Kembali:
- Promise yang diselesaikan menjadi objek yang berisi:
  - success : boolean yang menunjukkan jika tindakan itu selesai dengan sukses.
  - message : string yang memberikan detail tentang eksekusi tindakan.
  - action : string yang menggambarkan tindakan yang dilakukan.

Contoh:

 // Basic usage
await stagehand . act ( { action : "click on add to cart" } ) ;

// Using variables
await stagehand . act ( {
  action : "enter %username% into the username field" ,
  variables : {
    username : "[email protected]" ,
  } ,
} ) ;

// Multiple variables
await stagehand . act ( {
  action : "fill in the form with %username% and %password%" ,
  variables : {
    username : "john.doe" ,
    password : "secretpass123" ,
  } ,
} ) ;

`extract()`

extract() mengambil teks terstruktur dari halaman saat ini menggunakan ZOD. Diberikan instruksi dan schema , Anda akan menerima data terstruktur. Tidak seperti beberapa perpustakaan ekstraksi, StageHand dapat mengekstraksi informasi apa pun pada halaman, bukan hanya konten artikel utama.

Argumen:
- instruction : string yang memberikan instruksi untuk ekstraksi
- schema : z.AnyZodObject yang mendefinisikan struktur data untuk mengekstrak
- modelName : (Opsional) String AvailableModel untuk Menentukan Model yang akan Digunakan
- modelClientOptions : (Opsional) Opsi Konfigurasi untuk Klien Model
- domSettleTimeoutMs : (Opsional) Batas waktu dalam milidetik untuk menunggu DOM menyelesaikan
Kembali:
- Promise yang menyelesaikan data terstruktur sebagaimana didefinisikan oleh schema yang disediakan.

Contoh:

 const price = await stagehand . extract ( {
  instruction : "extract the price of the item" ,
  schema : z . object ( {
    price : z . number ( ) ,
  } ) ,
} ) ;

`observe()`

Catatan

observe() saat ini hanya mengevaluasi potongan pertama di halaman.

observe() digunakan untuk mendapatkan daftar tindakan yang dapat diambil pada halaman saat ini. Ini berguna untuk menambahkan konteks ke langkah perencanaan Anda, atau jika Anda tidak yakin dengan halaman apa Anda berada.

Jika Anda mencari elemen tertentu, Anda juga dapat meneruskan instruksi untuk mengamati melalui: observe({ instruction: "{your instruction}"}) .

Argumen:
- instruction : (Opsional) Suatu string yang memberikan instruksi untuk pengamatan. Default untuk "menemukan tindakan yang dapat dilakukan di halaman ini."
- modelName : (Opsional) String AvailableModel untuk Menentukan Model yang akan Digunakan
- modelClientOptions : (Opsional) Opsi Konfigurasi untuk Klien Model
- useVision : (Opsional) boolean untuk menentukan apakah pemrosesan berbasis penglihatan harus digunakan. Default ke false
- domSettleTimeoutMs : (Opsional) Batas waktu dalam milidetik untuk menunggu DOM menyelesaikan
Kembali:
- Promise yang diselesaikan menjadi berbagai objek yang berisi:
  - selector : string yang mewakili pemilih elemen
  - description : string yang menggambarkan kemungkinan tindakan

Contoh:

 const actions = await stagehand . observe ( ) ;

`page` dan `context`

page dan context adalah contoh dari Playwright's Page dan BrowserContext masing -masing. Gunakan metode ini untuk berinteraksi dengan instance penulis naskah yang digunakan StageHand. Paling umum, Anda akan menggunakan page.goto() untuk menavigasi ke URL.

Contoh:

 await stagehand . page . goto ( "https://github.com/browserbase/stagehand" ) ;

`log()`

log() digunakan untuk mencetak pesan ke konsol browser. Pesan -pesan ini akan bertahan dalam log sesi browserbase, dan dapat digunakan untuk men -debug sesi setelah selesai.

Pastikan level log di atas level verbose yang Anda atur saat menginisialisasi instance stageHand.

Contoh:
```
 stagehand . log ( "Hello, world!" ) ; 
```

Dukungan Model

StageHand memanfaatkan arsitektur klien LLM generik untuk mendukung berbagai model bahasa dari penyedia yang berbeda. Desain ini memungkinkan fleksibilitas, memungkinkan integrasi model baru dengan perubahan minimal pada sistem inti. Model yang berbeda bekerja lebih baik untuk tugas yang berbeda, sehingga Anda dapat memilih model yang paling sesuai dengan kebutuhan Anda.

Model yang didukung saat ini

StageHand saat ini mendukung model -model berikut dari Openai dan Anthropic:

Model Openai:
- gpt-4o
- gpt-4o-mini
- gpt-4o-2024-08-06
Model antropik:
- claude-3-5-sonnet-latest
- claude-3-5-sonnet-20240620
- claude-3-5-sonnet-20241022

Model -model ini dapat ditentukan saat menginisialisasi instance Stagehand atau ketika metode panggilan seperti act() dan extract() .

Cara kerjanya

SDK memiliki dua fase utama:

Memproses DOM (termasuk chunking - lihat di bawah ).
Mengambil tindakan bertenaga LLM berdasarkan keadaan DOM saat ini.

Pemrosesan dom

StageHand menggunakan kombinasi teknik untuk menyiapkan DOM.

Langkah -langkah pemrosesan DOM terlihat sebagai berikut:

Melalui Playwright, suntikkan skrip ke dalam DOM yang dapat diakses oleh SDK yang dapat menjalankan pemrosesan.
Merangkak DOM dan membuat daftar elemen kandidat.
- Elemen kandidat adalah elemen daun (elemen DOM yang mengandung zat yang menghadap pengguna aktual), atau elemen interaktif.
- Elemen interaktif ditentukan oleh kombinasi peran dan tag HTML.
Elemen kandidat yang tidak aktif, terlihat, atau di bagian atas DOM dibuang.
- LLM hanya boleh menerima elemen yang dapat ditindaklanjuti dengan setia atas nama agen/pengguna.
Untuk setiap elemen kandidat, XPATH dihasilkan. Ini menjamin bahwa jika elemen ini dipilih oleh LLM, kami akan dapat menargetkannya dengan andal.
Kembalikan kedua daftar elemen kandidat, serta peta elemen ke pemilih XPath di seberang browser kembali ke SDK, untuk dianalisis oleh LLM.

Chunking

Sementara LLMS akan terus meningkatkan panjang jendela konteks dan mengurangi latensi, memberikan sistem penalaran yang lebih sedikit untuk dipikirkan harus membuatnya lebih dapat diandalkan. Akibatnya, pemrosesan DOM dilakukan dalam potongan untuk menjaga konteks kecil per panggilan inferensi. Untuk dipotong, SDK mempertimbangkan elemen kandidat yang dimulai di bagian viewport sebagai bagian dari potongan itu. Di masa depan, padding akan ditambahkan untuk memastikan bahwa potongan individu tidak kekurangan konteks yang relevan. Lihat diagram ini untuk tampilannya:

Penglihatan

Metode act() dan observe() dapat mengambil bendera useVision . Jika ini diatur ke true , LLM akan dilengkapi dengan tangkapan layar beranotasi dari halaman saat ini untuk mengidentifikasi elemen mana yang akan ditindaklanjuti. Ini berguna untuk DOM yang kompleks bahwa LLM mengalami kesulitan, bahkan setelah diproses dan chunking. Secara default, bendera ini diatur ke "fallback" , yang berarti bahwa jika LLM gagal untuk berhasil mengidentifikasi satu elemen, StageHand akan mencoba lagi upaya menggunakan visi.

Analisis LLM

Sekarang kami memiliki daftar elemen kandidat dan cara untuk memilihnya. Kami dapat menyajikan elemen -elemen itu dengan konteks tambahan ke LLM untuk ekstraksi atau tindakan. Sementara belum teruji dalam skala besar, menyajikan "daftar elemen bernomor" memandu model untuk tidak memperlakukan konteks sebagai DOM penuh, tetapi sebagai daftar elemen terkait tetapi independen untuk dioperasikan.

Dalam kasus tindakan, kami meminta LLM untuk menulis metode penulis naskah untuk melakukan hal yang benar. Dalam pengujian kami yang terbatas, sintaksis penulis naskah jauh lebih efektif daripada mengandalkan API JavaScript bawaan, mungkin karena tokenisasi.

Terakhir, kami menggunakan LLM untuk menulis instruksi masa depan untuk dirinya sendiri untuk membantu mengelola kemajuan dan tujuannya saat beroperasi di seluruh potongan.

StageHand vs Playwright

Di bawah ini adalah contoh cara mengekstrak daftar perusahaan dari situs web hibah AI menggunakan StageHand dan Playwright.

Tips Mendukung

Memicu StageHand lebih literal dan atom daripada kerangka kerja tingkat lebih tinggi lainnya, termasuk kerangka kerja agen. Berikut adalah beberapa pedoman untuk membantu Anda membuat permintaan yang efektif:

Melakukan:

Gunakan tindakan spesifik dan ringkas

 await stagehand . act ( { action : "click the login button" } ) ;

const productInfo = await stagehand . extract ( {
  instruction : "find the red shoes" ,
  schema : z . object ( {
    productName : z . string ( ) ,
    price : z . number ( ) ,
  } ) ,
} ) ;

Memecah tugas kompleks menjadi langkah atom yang lebih kecil

Alih -alih menggabungkan tindakan:

 // Avoid this
await stagehand . act ( { action : "log in and purchase the first item" } ) ;

Pisahkan menjadi langkah -langkah individual:

 await stagehand . act ( { action : "click the login button" } ) ;
// ...additional steps to log in...
await stagehand . act ( { action : "click on the first item" } ) ;
await stagehand . act ( { action : "click the purchase button" } ) ;

Gunakan observe() untuk mendapatkan saran yang dapat ditindaklanjuti dari halaman saat ini

 const actions = await stagehand . observe ( ) ;
console . log ( "Possible actions:" , actions ) ;

Jangan:

Gunakan instruksi yang luas atau ambigu

 // Too vague
await stagehand . act ( { action : "find something interesting on the page" } ) ;

Gabungkan banyak tindakan menjadi satu instruksi

 // Avoid combining actions
await stagehand . act ( { action : "fill out the form and submit it" } ) ;

Mengharapkan tahap untuk melakukan perencanaan atau penalaran tingkat tinggi

 // Outside Stagehand's scope
await stagehand . act ( { action : "book the cheapest flight available" } ) ;

Dengan mengikuti pedoman ini, Anda akan meningkatkan keandalan dan efektivitas otomatisasi web Anda dengan StageHand. Ingat, Stagehand unggul dalam mengeksekusi tindakan yang tepat dan terdefinisi dengan baik sehingga menjaga instruksi Anda atom akan mengarah pada hasil terbaik.

Kami meninggalkan perilaku agen ke sistem agen tingkat tinggi yang dapat menggunakan stageHand sebagai alat.

Peta jalan

Pada tingkat tinggi, kami fokus pada peningkatan keandalan, kecepatan, dan biaya dalam urutan prioritas itu.

Anda dapat melihat peta jalan di sini. Ingin berkontribusi? Baca terus!

Berkontribusi

Catatan

Kami sangat menghargai kontribusi untuk StageHand! Untuk dukungan atau tinjauan kode, silakan bergabung dengan komunitas Slack kami.

Pertama, klon repo

git clone [email protected]:browserbase/stagehand.git

Kemudian instal dependensi

npm install

Pastikan Anda memiliki file .env seperti yang didokumentasikan di atas di bagian Memulai.

Kemudian, jalankan contoh skrip npm run example .

Kiat Pengembangan

Lingkaran pengembangan yang baik adalah:

Coba hal -hal dalam file contoh
Gunakan itu untuk membuat perubahan pada SDK
Tulis eval yang membantu memvalidasi perubahan Anda
Pastikan Anda tidak merusak eval yang ada!
Buka PR dan dapatkan ditinjau oleh tim.

Menjalankan eval

Anda akan membutuhkan kunci API braintrust untuk menjalankan eval

 BRAINTRUST_API_KEY = " "

Setelah itu, Anda dapat menjalankan eval menggunakan npm run evals

Menambahkan eval baru

Menjalankan semua eval bisa memakan waktu. Kami memiliki example.ts skrip kenyamanan.ts di mana Anda dapat mengembangkan eval tunggal baru Anda sebelum menambahkannya ke set semua eval.

Anda dapat menjalankan npm run example untuk mengeksekusi dan mengulangi eval yang sedang Anda kembangkan.

Menambahkan model baru

Untuk menambahkan model baru ke StageHand, ikuti langkah -langkah ini:

Tentukan model : Tambahkan nama model baru ke jenis AvailableModel di file LLMProvider.ts . Ini memastikan bahwa model diakui oleh sistem.
Peta model ke penyedia : Perbarui modelToProviderMap di kelas LLMProvider untuk mengaitkan model baru dengan penyedia yang sesuai. Pemetaan ini sangat penting untuk menentukan klien mana yang akan digunakan.
Menerapkan klien : Jika model baru membutuhkan klien baru, implementasikan kelas yang melekat pada antarmuka LLMClient . Kelas ini harus mendefinisikan semua metode yang diperlukan, seperti createChatCompletion .
Perbarui Metode getClient : Ubah Metode getClient di kelas LLMProvider untuk mengembalikan instance klien baru ketika model baru diminta.

Membangun SDK

StageHand menggunakan TSUP untuk membangun SDK dan Vanilla esbuild untuk membangun skrip yang berjalan di DOM.

Jalankan npm run build
Jalankan npm pack untuk mendapatkan tarball untuk distribusi

Ucapan Terima Kasih

Proyek ini sangat bergantung pada penulis naskah sebagai tulang punggung yang tangguh untuk mengotomatiskan web. Itu juga tidak akan mungkin terjadi tanpa teknik dan penemuan yang luar biasa yang dibuat oleh Tarsier, dan Fuji-Web.

Jeremy Press menulis MVP asli StageHand dan terus menjadi sekutu utama proyek.

Lisensi

Berlisensi di bawah lisensi MIT.

Hak Cipta 2024 Browserbase, Inc.

Memperluas

Informasi Tambahan

Versi v1.3.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-28
ukuran 1MB
Berasal dari Github

Aplikasi Terkait

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0

Informasi Terkait Semua

stagehand

? Petugas untuk pentas

Intro

Memulai

1. Instal Paket StageHand

2. Konfigurasikan Penyedia Model Anda

3. Buat contoh panggung

4. Jalankan otomatisasi pertama Anda

Referensi API

Stagehand()

Metode

init()

act()

extract()

observe()

page dan context

log()

Dukungan Model

Model yang didukung saat ini

Cara kerjanya

Pemrosesan dom

Chunking

Penglihatan

Analisis LLM

StageHand vs Playwright

Tips Mendukung

Melakukan:

Jangan:

Peta jalan

Berkontribusi

Kiat Pengembangan

Menjalankan eval

Menambahkan eval baru

Menambahkan model baru

Membangun SDK

Ucapan Terima Kasih

Lisensi

`Stagehand()`

`init()`

`act()`

`extract()`

`observe()`

`page` dan `context`

`log()`