Descargar markout - Descargar el código fuente de markout

markout

Código Fuente de IA

1.0.0

Descargar

Un pequeño paquete de Python que hice para extraer contenido HTML de las páginas web. Es muy personalizable y lo hice para adaptarse a mis necesidades (extraer el código de múltiples páginas a Markdown, pero solo algunas etiquetas HTML que necesitaba). Debido a su propósito, poder convertir las etiquetas HTML específicas en un formato de markdown deseado, este script no genera ninguna salida estándar, más bien, utiliza tokens personalizados especificados en un archivo de configuración, por lo que la salida puede formatearse en cualquier cosa.

Uso

Importar a su código

Para usar este paquete, deberá instalarlo con pip :

pip install markout-html

Luego, solo importárelo a su código:

 from markout_html import *

Después de eso, puede usar las funciones extract_url y extract_html :

 result = extract_url (
  # HTML page link
  'http://example.page.com/blog/some_post.html' ,

  # Tokens to format each HTML tags contents (you can extract only the ones you want)
  {
    'p' : " n ** {} **"
  },

  # Only extract contents inside this tag
  'article'
)

result = extract_html (
  # HTML code string
  '<html>some html code</html>' ,

  # Tokens to format each HTML tags contents (you can extract only the ones you want)
  {
    'p' : " n ** {} **"
  },

  # Only extract contents inside this tag
  'article'
)

Usando el comando CLI

¡A continuación hay algunos ejemplos con mejor descripción sobre cómo usar este comando de paquete si no desea crear un script de Python!

Si solo desea extraer usando una cadena en el terminal, puede usar markout_html --extract [string] .

Puede usar el comando markout_html con el indicador --help para obtener más información.

Configuración

Todas las configuraciones se pueden encontrar en un solo archivo: .markoutrc.json (puede especificar otro nombre en el terminal con el indicador --config ), si no carga un archivo de configuración, el script usará sus valores predeterminados. ¡Hay un ejemplo de configuración en la raíz del repositorio!

Para especificar un uso de archivo de configuración diferente:

markout_html --config [filename]

Los valores del archivo de configuración

links : objeto de enlaces a extraer, cada enlace tiene un valor de destino (archivo de salida). Ejemplo:

{
  "links" : {
    "http://example.page.com/blog/some_post.html" : " out/post.md " ,
    "http://example.page.com/blog/some_other_post.html" : " out/other_post.md "
  }
}

El ejemplo anterior obtendrá el HTML de http://example.page.com/blog/some_post.html y extraer los resultados en out/post.md .

only_on - cadena que especifica dónde (qué etiqueta HTML) extraer el contenido de (por ejemplo: html, cuerpo, principal). Ejemplo:

{
  "only_on" : " article "
}

tokens : objeto en el que cada etiqueta HTML especificada se extraerá en una cadena formateada y luego se coloca en el archivo de salida. Ejemplo:

{
  "tokens" : {
    "header" : " # {} " ,
    "h1" : " n # {} " ,
    "h2" : " n # {} " ,
    "b" : " n ## {} " ,
    "li" : " + {} " ,
    "i" : " ** {} ** " ,
    "p" : " n {} " ,
    "span" : " {} "
  }
}

En el ejemplo anterior, el contenido de la etiqueta HTML <header> se extraerá en la cadena # {} , por lo que, por ejemplo, si tuviéramos <header>Some text here!</header> ¡El resultado habría sido # Some text here! (Esto formatea el texto en Markdown).

Contribuciones

Siéntase libre de dejar su contribución aquí, ¡realmente lo agradecería! Además, si tiene alguna duda o problema con este paquete, simplemente contácteme o deje un problema.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-01
tamaño 9.89KB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo