Unduh markout - markout Source Code Unduh

markout

Kode Sumber AI

1.0.0

Unduh

Paket Python kecil yang saya buat untuk mengekstrak konten HTML dari halaman web. Ini sangat dapat disesuaikan dan saya membuatnya sesuai dengan kebutuhan saya (mengekstrak kode beberapa halaman dengan penurunan harga, tetapi hanya beberapa tag HTML yang saya butuhkan). Karena tujuannya dapat mengonversi tag HTML spesifik menjadi format markdown yang diinginkan skrip ini tidak menghasilkan output standar apa pun, melainkan menggunakan token khusus yang ditentukan dalam file konfigurasi, sehingga output dapat diformat menjadi apa pun.

Penggunaan

Mengimpor Kode Anda

Untuk menggunakan paket ini, Anda harus menginstalnya menggunakan pip :

pip install markout-html

Kemudian cukup impor ke kode Anda:

 from markout_html import *

Setelah itu Anda dapat menggunakan fungsi extract_url dan extract_html :

 result = extract_url (
  # HTML page link
  'http://example.page.com/blog/some_post.html' ,

  # Tokens to format each HTML tags contents (you can extract only the ones you want)
  {
    'p' : " n ** {} **"
  },

  # Only extract contents inside this tag
  'article'
)

result = extract_html (
  # HTML code string
  '<html>some html code</html>' ,

  # Tokens to format each HTML tags contents (you can extract only the ones you want)
  {
    'p' : " n ** {} **"
  },

  # Only extract contents inside this tag
  'article'
)

Menggunakan perintah CLI

Di bawah ini adalah beberapa contoh dengan deskripsi yang lebih baik tentang cara menggunakan perintah paket ini jika Anda tidak ingin membuat skrip python!

Jika Anda hanya ingin mengekstrak menggunakan string di terminal, Anda dapat menggunakan markout_html --extract [string] .

Anda dapat menggunakan perintah markout_html dengan bendera --help untuk info lebih lanjut.

Konfigurasi

Semua konfigurasi dapat ditemukan ke dalam satu file: .markoutrc.json (Anda dapat menentukan nama lain di terminal dengan flag --config ), jika Anda tidak memuat file konfigurasi skrip akan menggunakan nilai defaultnya. Ada contoh konfigurasi di root repositori!

Untuk menentukan penggunaan file konfigurasi yang berbeda:

markout_html --config [filename]

Nilai file konfigurasi

links - Objek tautan yang akan diekstraksi, setiap tautan memiliki nilai tujuan (file output). Contoh:

{
  "links" : {
    "http://example.page.com/blog/some_post.html" : " out/post.md " ,
    "http://example.page.com/blog/some_other_post.html" : " out/other_post.md "
  }
}

Contoh di atas akan mendapatkan html dari http://example.page.com/blog/some_post.html dan mengekstrak hasilnya menjadi out/post.md .

only_on - String yang menentukan di mana (tag html mana) untuk mengekstrak konten dari (misalnya: html, body, main). Contoh:

{
  "only_on" : " article "
}

tokens - Objek di mana masing -masing tag HTML yang ditentukan akan diekstrak ke dalam string yang diformat dan kemudian ditempatkan pada file output. Contoh:

{
  "tokens" : {
    "header" : " # {} " ,
    "h1" : " n # {} " ,
    "h2" : " n # {} " ,
    "b" : " n ## {} " ,
    "li" : " + {} " ,
    "i" : " ** {} ** " ,
    "p" : " n {} " ,
    "span" : " {} "
  }
}

Pada contoh di atas, isi tag HTML <header> akan diekstrak ke dalam string # {} , jadi misalnya, jika kami memiliki <header>Some text here!</header> Hasilnya akan menjadi # Some text here! (Ini memformat teks menjadi penurunan harga).

Kontribusi

Jangan ragu untuk meninggalkan kontribusi Anda di sini, saya akan sangat menghargainya! Juga, jika Anda memiliki keraguan atau masalah menggunakan paket ini cukup hubungi saya atau tinggalkan masalah.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-01
ukuran 9.89KB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua