Utilidad simple para convertir un documento de Microsoft Word '.doc', Microsoft Excel '.xls' y los archivos de Microsoft PowerPoint .PPT a cualquier otro formato compatible, como .txt .csv .rtf .pdf.
También se puede usar para convertir .txt, .rtf, .csv a .doc, .xls o .pdf format.
Se puede utilizar para convertir los documentos de Word más antiguos en el último formato.
Debe tener Microsoft Word, Excel o PowerPoint instalado en la máquina host.
Descargue la versión de los comunicados de GitHub - https://github.com/tobya/docto/Releases/ Más información disponible en https://tobya.github.io/docto/
Más ejemplos disponibles en
Descargar .exe de la versión https://github.com/tobya/docto/releases
También disponible para la instalación a través de Chocolatey
Choco install Docto
Para actualizar a la última versión
Actualización de Choco Docto
Los envoltorios de nodos han sido creados por @kerimg y @brrrd
https://www.npmjs.com/package/node-docto
https://github.com/brrd/msoconvert
Registre un problema para cualquier error, características o sugerencias.
Convertir el documento de Microsoft Word en texto
docto -f C:DirectoryMyFile.doc -O "C:Output DirectoryMyTextFile.txt" -T wdFormatText
Convierta el documento de Microsoft Excel en texto CSV
docto -XL -f C:DirectoryMyFile.xls -O "C:Output DirectoryMyTextFile.csv" -T xlCSV
Convierta el documento de Microsoft Word a PDF (requiere la versión de Microsoft Word que admite esto).
docto -f C:DirectoryMyFile.doc -O "C:Output DirectoryMyTextFile.pdf" -T wdFormatPDF
Convierta todos los documentos de Microsoft Word en el directorio y sus subtirectorios a PDF
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf
Elimine los archivos originales después de la conversión (-r).
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf -R true
Agregue un webhook para disparar en cada conversión (-W)
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf -W https://toflidium.com/webhooks/docto/webhook_test.php
Un webhook es una URL que se puede llamar a cada converstion para darle la capacidad de reembolsar externamente cada vez que se convierte un archivo. Actualmente, la dirección https es experimental, así que registre un problema si tiene algún problema.
Si está usando Docto en la naturaleza en algún lugar, agregue detalles a esta página de wiki
Si necesita actualizar un montón de archivos para que funcione sin conversión en OneDrive / Office365 / Word 20XX, entonces puede usar Docto. Ver esta pregunta de stackexchange
https://webapps.stackexchange.com/questions/74859/what-format-does-word-online-use
Help
Docto Version:%s
Office Version : %s
Open Source: https://github.com/tobya/DocTo/
Description: DocTo converts Word Documents and Excel Spreadsheets to other formats.
Command Line Parameters:
Each Parameter should be followed by its value eg
-f "c:DocsMyDoc.doc"
Parameters markers are case insensitive.
-H This message
--HELP -?
-WD Use Word for Converstion (Default). Help '-h -wd'
--word
-XL Use Excel for Conversion. Help '-h -xl'
--excel
-PP Use Powerpoint for Conversion. help '-h -pp'
--powerpoint
-VS Use Visio for Conversion.
--visio
-F Input File or Directory
--inputfile
-FX Input file search for if -f is directory. Can use .rtf test*.txt etc
Default ".doc*" (will find ".docx" also)
--inputextension
-O Output File or Directory to place converted Docs
--outputfile
-OX Output Extension if -F is Directory. Please include '.' eg. '.pdf' .
If not provided, pulled from standard list.
--outputextension
-T Format(Type) to convert file to, either integer or wdSaveFormat constant.
Available from
https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.word.wdsaveformat
or https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.excel.xlfileformat
or https://docs.microsoft.com/en-us/office/vba/api/powerpoint.presentation.saveas
See current List Below.
--format
-TF Force Format. -T value if an integer, is checked against current list
compiled in. It is not passed if unavailable. -TF will pass through value
without checking. Word will return an "EOleException Value out of range"
error if invalid. Use instead of -T.
--forceformat
-L Log Level Integer: 1 ERRORS 2 STANDARD 5 CHATTY 9 DEBUG 10 VERBOSE. Default: 2=STANDARD
--loglevel
-C Compatibility Mode Integer. Set to an INTEGER value from
https://msdn.microsoft.com/en-us/library/office/ff192388.aspx.
Set the compatibility mode when you want to convert documents to a later
version of word. See help '-h -c' for further info.
--compatibility
-E Encoding Integer: Sets codepage Encoding. See
https://msdn.microsoft.com/en-us/library/office/ff860880.aspx
for more details and values.
--encoding
-M Ignore all files in __MACOSX subdirectory if it exists. Default True.
--ignoremacos
-N Make list of files that take over n seconds to complete.
Use number of seconds over that conversion takes and add to list.
Outputs to filename 'docto.ignore.txt'
--listlongrunning
-NX Ignore any file listed in docto.ignore.txt, created by -N
--ignorelongrunninglist
-G Write Log to file in directory
--writelogfile
-GL Log File Name to Use. Default 'DocTo.Log';
--logfilename
-Q Quiet Mode: Nothing will be output to console. To see any errors you must
set -G or -GL. Equivalent to setting -L 0
--quiet
-R Remove Files after successful conversion: Default false; To use specify
value eg -R true
--deletefiles
-W Webhook: Url to call on events. See help '-H -HW' for more details.
--webhook
-X Halt on COM Error: Default True; If you have trouble with some files
not converting, set this to false to ignore errors and continue with
batch job.
--halterror
-V Show Versions. DocTo and Word/Excel/Powerpoint
Long Parameters:
--BookmarkSource
PDF conversions can take their bookmarks from
WordBookmarks, WordHeadings (default) or None
--DoNotOverwrite
--no-overwrite
Existing files are overridden by default, if you do not wish a file to be
over written use this option.
--no-subdirs Only convert specified directory. Do not recurse sub directories
--ExportMarkup Value for wdExportItem - default wdExportDocumentContent.
use wdExportDocumentWithMarkup to export all word comments with pdf
--no-IncludeDocProperties
--no-DocProp
Do not include Document Properties in the exported pdf file.
--PDF-OpenAfterExport
If you wish for a converted PDF to be opened after creation. No value req.
--PDF-FromPage
Save a range of pages to pdf. Integer/String. If integer --PDF-ToPage must also be set.
Other values wdExportCurrentPage, wdExportSelection
--PDF-ToPage
Save a range of pages to pdf. Integer. --PDF-FromPage must also be set.
--PDF-OptimizeFor
Set the pdf/xps to be optimized for print or screen.
Default ForPrint | ForOnScreen
--XPS-no-IRM
Do not copy IRM permissions to exported XPS document.
--PDF-No-DocStructureTags
Do not include DocStructureTags to help screen readers.
--PDF-no-BitmapMissingFonts
Do not bitmap missing fonts, fonts will be substituted.
--use-ISO190051
Create PDF to the ISO 19005-1 standard.
Experimental:
--skipdocswithtoc
EXPERIMENTAL. Will skip any docs that contain a TOC to prevent hanging.
Currently matches some false positives. Default False.
--stdout
Send file to Stdout after conversion. ( Does not work correctly for binary files)
ERROR CODES:
200 : Invalid File Format specified
201 : Insufficient Inputs. Minimum of Input File, Output File & Type
202 : Incorrect switches. Switch requires value
203 : Unknown switch in command
204 : Input File does not exist
205 : Invalid Parameter Value
220 : Word or COM Error
221 : Word not Installed
400 : Unknown Error
Se requieren 3 parámetros
Los parámetros que toman un valor tienen un espacio que los separa del valor. Algunos parámetros no requieren un valor. Todos los parámetros son insensibles al caso.
-F - -Inputfile
El archivo o carpeta que desea que abriera. Si es una carpeta, Docto cargará todos los archivos en ese directorio y sus subdirectorios. Si no desea cargar archivos de los subdirectorios, consulte el parámetro --no-subdirs .
La conversión se realizará en cada archivo a su vez.
-O --outputfile
El nombre de archivo o el nombre de plegación donde desea que se coloquen los archivos de salida. Si la entrada es un archivo pero la salida es una carpeta, el archivo de salida tendrá el mismo nombre que la entrada pero con la nueva extensión.
-T -Format
Especifique a qué formato desea convertir como wdFormatPDF o wdFormatText etc.
Ver posibles formatos de palabras y formatos de Excel. También puede usar el valor entero
-H, --help
Muestre el texto de ayuda que enumera todos los parámetros y versiones de las aplicaciones de Docto y el consultorio
-V -versión
Muestre la cadena de versión de Doco y Microsoft Office.
-WD -xl -pp -vs
Este parámetro le dice a Docto cuál de las aplicaciones que desea usar para cargar y guardar su documento por razones históricas de valor predeterminada a -WD si no se da ningún valor, sin embargo, es un buen hábito para usar siempre uno de estos valores en cualquier momento que use Doco.
-Fx -Inputextension
Por defecto, Doco cargará todos los archivos en el directorio con la extensión de la aplicación estándar
p.ej.
Si desea convertir un conjunto diferente de archivos, por ejemplo, *.rtf o *.txt puede especificarlo aquí por ext como .rtf
-Ox --outPutextension
La extensión de salida en una conversión se extrae de una lista estándar, por ejemplo. Si se convierte en wdformatpdf, el archivo se emitirá con extensión .pdf . Si desea especificar su propia extensión (como .pdfx ), puede con este parámetro.
-Tf --forceFormat
Si -t es un entero si es un valor que no estaba disponible cuando se compiló Docto, planteará un error. Si usa -tf, pasará el valor entero de -t a la solicitud de oficina sin verificar.
-L --loglevel
Establecer nivel de salida de registro. -L 10 es útil para la depuración. Use -l 0 o -q para sorprender el registro.
#### Niveles
-C -compatibilidad
Modo de compatibilidad entero. Establecer en un valor entero de la lista MSDN.
Establezca el modo de compatibilidad de la versión de Word, el documento debe ser compatible. Particualmente útil cuando desea convertir documentos más antiguos a la versión actual. Se puede utilizar para convertir los documentos de Word antiguos para que sean compatibles con OneDrive.
-E -codificación
Establece la codificación de códigos de códigos. Consulte MSDN para obtener más detalles y valores.
-N --listlAnstrunning
Algunos archivos al convertirse pueden hacer que aparezca un cuadro de diálogo. Esto solo se puede solucionar mediante intervención manual. Al establecer este parámetro, al menos puede registrar los documentos que están causando dificultad (en un archivo llamado docto.ignore.txt ) y si establece -NX estos documentos se omitirán en ejecuciones posteriores.
-Nx --ignorelongrunninglist {no-valor requirido}
Cuando establezca cualquier archivo enumerado en docto.ignore.txt en el mismo directorio que Docto.exe se saltará. Esto permite ignorar documentos problemáticos en una estructura de directorio.
-G --WriteLogFile [No se requiere valor]
Escriba el registro en un archivo y Stdout. docto.log por defecto.
-Gl --GOGFileName {FileName}
Especifique el nombre de archivo que desea que se escriba el archivo de registro.
-Q --quiet [no se requiere valor]
No hay salida a stdout. Todo, incluidos los errores, está sorprendido. Use junto con -G para asegurarse de obtener errores.
-R --deletefiles {verdadero | falso}
Si desea que se elimine el archivo de entrada después de la conversión, puede establecer esto en verdadero.
-W - -Webhook
Si lo desea, puede llamar a una URL web después de cada conversión o error. La URL de Webhook se convocará en los siguientes eventos con los siguientes parámetros
Conversión de archivo
Error
El valor de retorno se registra en Doco Log
-X --halterror {verdadero | falso}
Doco se detendrá cuando se plantee un error COM. Si desea ignorar el error y continúa establecer este valor en verdadero.
--BookmarkSource {fuente}
Las conversiones de PDF pueden tomar sus marcadores de WordbookMarks, Wordheadings (predeterminados) o ninguno
--DonotoverWrite--No-Overwrite [No se requiere valor]
Los archivos existentes se anulan de forma predeterminada, si no desea que un archivo esté por escrito, use esta opción.
-No-Subdirs
Por defecto, se convierten los subtirectorios. Use solo para convertir el directorio especificado. No recurrir sub subtirores
--ExportMarkup
Especifica
Use wdexportDocumentWithmarkup para exportar todos los comentarios de Word con PDF
-PDF-OpenaFterExport
Si desea que el PDF convertido se abra después de la creación. Sin valor req.
--PDF-FROMPAGE
-PDF-TOPAGE
Solo convierta ciertas páginas en el documento.
--use-iso190051
Cree PDF al estándar ISO 19005-1, también conozca el archivo PDF-A o PDF.
-M --ignoremacos {verdadero | falso}
Por defecto, Doco ignora cualquier archivo en un directorio __MACOSX oculto que MacOS crea. Este directorio a menudo está presente en un disco externo que se comparte entre los sistemas. Si desea verificar este Dir, establece este valor. Debe especificar valor, por ejemplo -M false .
El proyecto se compila con Delphi (uso 10.3, pero debe compilar con la mayoría de las versiones, incluidos Xe4 y 7). El proyecto no se compilará en Linux, ya que utiliza varios componentes de Windows, como COM y Word y Excel, no tienen versiones de Linux de todos modos, por lo que no habría sentido.
XLSTO ahora se incorpora a Doco. Anteriormente, XLSTO era un exe separado que se usaba para convertir archivos XLS a CSV o PDF. Esto ahora se puede hacer con el principal DocTo.exe simplemente agregando el indicador -xl.
Estoy feliz de aceptar cualquier RP que alguien le gustaría enviar. Si se involucra una gran cantidad de trabajo, abra primero un problema para garantizar que el esfuerzo no se desperdicie.
El nombre principal de la rama en el reposio es DocTo
He comenzado a escribir pruebas funcionales en PHP para verificar si la aplicación está manipulando los documentos correctamente. Si está familiarizado con PHP Laravel y Pest, me encantaría algunas pruebas adicionales.