Простая утилита для преобразования документа Microsoft Word '.doc', Microsoft Excel '.xls' и Microsoft PowerPoint .ppt.
Также можно использовать для преобразования .txt, .rtf, .csv в .doc, .xls или .pdf.
Можно использовать для преобразования старых документов Word в последний формат.
Должен быть установлен Microsoft Word, Excel или PowerPoint на хост -машине.
Скачать релиз с Github Relases - https://github.com/tobya/docto/releases/ Дополнительная информация, доступная по адресу https://tobya.github.io/docto/
Больше примеров, доступных на
Скачать .exe с выпуска https://github.com/tobya/docto/releases
Также доступен для установки через шоколадный
Choco Установите Docto
для обновления до последней версии
Choco Upgrade Docto
Обертки узлов были созданы @kerimg & @brrd
https://www.npmjs.com/package/node-docto
https://github.com/brrd/msoconvert
Пожалуйста, зарегистрируйте проблему для любых ошибок, функций или предложений.
Преобразовать документ Microsoft Word в текст
docto -f C:DirectoryMyFile.doc -O "C:Output DirectoryMyTextFile.txt" -T wdFormatText
Преобразовать документ Microsoft Excel в текст CSV
docto -XL -f C:DirectoryMyFile.xls -O "C:Output DirectoryMyTextFile.csv" -T xlCSV
Преобразовать документ Microsoft Word в PDF (требует версии Microsoft Word, которая поддерживает это).
docto -f C:DirectoryMyFile.doc -O "C:Output DirectoryMyTextFile.pdf" -T wdFormatPDF
Преобразование всех документов Microsoft Word в каталоге и его суб -каталогах в PDF
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf
Удалить исходные файлы после преобразования (-r).
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf -R true
Добавьте веб-крюк, чтобы стрелять по каждому преобразованию (-W)
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf -W https://toflidium.com/webhooks/docto/webhook_test.php
WebHook - это URL -адрес, который можно вызывать в каждом разговоре, чтобы дать вам возможность отражать внешнее время, когда файл конвертируется. В настоящее время https -адрес является экспериментальным, поэтому войдите за проблему, если у вас есть какие -либо проблемы.
Если вы где -то используете Docto в дикой природе, добавьте подробности на эту страницу вики
Если вам нужно обновить кучу файлов для работы без преобразования на OneDrive / Office365 / Word 20xx, вы можете использовать DOCTO. Смотрите этот вопрос Stackexchange
https://webapps.stackexchange.com/questions/74859/what-format-does-word-online-use
Help
Docto Version:%s
Office Version : %s
Open Source: https://github.com/tobya/DocTo/
Description: DocTo converts Word Documents and Excel Spreadsheets to other formats.
Command Line Parameters:
Each Parameter should be followed by its value eg
-f "c:DocsMyDoc.doc"
Parameters markers are case insensitive.
-H This message
--HELP -?
-WD Use Word for Converstion (Default). Help '-h -wd'
--word
-XL Use Excel for Conversion. Help '-h -xl'
--excel
-PP Use Powerpoint for Conversion. help '-h -pp'
--powerpoint
-VS Use Visio for Conversion.
--visio
-F Input File or Directory
--inputfile
-FX Input file search for if -f is directory. Can use .rtf test*.txt etc
Default ".doc*" (will find ".docx" also)
--inputextension
-O Output File or Directory to place converted Docs
--outputfile
-OX Output Extension if -F is Directory. Please include '.' eg. '.pdf' .
If not provided, pulled from standard list.
--outputextension
-T Format(Type) to convert file to, either integer or wdSaveFormat constant.
Available from
https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.word.wdsaveformat
or https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.excel.xlfileformat
or https://docs.microsoft.com/en-us/office/vba/api/powerpoint.presentation.saveas
See current List Below.
--format
-TF Force Format. -T value if an integer, is checked against current list
compiled in. It is not passed if unavailable. -TF will pass through value
without checking. Word will return an "EOleException Value out of range"
error if invalid. Use instead of -T.
--forceformat
-L Log Level Integer: 1 ERRORS 2 STANDARD 5 CHATTY 9 DEBUG 10 VERBOSE. Default: 2=STANDARD
--loglevel
-C Compatibility Mode Integer. Set to an INTEGER value from
https://msdn.microsoft.com/en-us/library/office/ff192388.aspx.
Set the compatibility mode when you want to convert documents to a later
version of word. See help '-h -c' for further info.
--compatibility
-E Encoding Integer: Sets codepage Encoding. See
https://msdn.microsoft.com/en-us/library/office/ff860880.aspx
for more details and values.
--encoding
-M Ignore all files in __MACOSX subdirectory if it exists. Default True.
--ignoremacos
-N Make list of files that take over n seconds to complete.
Use number of seconds over that conversion takes and add to list.
Outputs to filename 'docto.ignore.txt'
--listlongrunning
-NX Ignore any file listed in docto.ignore.txt, created by -N
--ignorelongrunninglist
-G Write Log to file in directory
--writelogfile
-GL Log File Name to Use. Default 'DocTo.Log';
--logfilename
-Q Quiet Mode: Nothing will be output to console. To see any errors you must
set -G or -GL. Equivalent to setting -L 0
--quiet
-R Remove Files after successful conversion: Default false; To use specify
value eg -R true
--deletefiles
-W Webhook: Url to call on events. See help '-H -HW' for more details.
--webhook
-X Halt on COM Error: Default True; If you have trouble with some files
not converting, set this to false to ignore errors and continue with
batch job.
--halterror
-V Show Versions. DocTo and Word/Excel/Powerpoint
Long Parameters:
--BookmarkSource
PDF conversions can take their bookmarks from
WordBookmarks, WordHeadings (default) or None
--DoNotOverwrite
--no-overwrite
Existing files are overridden by default, if you do not wish a file to be
over written use this option.
--no-subdirs Only convert specified directory. Do not recurse sub directories
--ExportMarkup Value for wdExportItem - default wdExportDocumentContent.
use wdExportDocumentWithMarkup to export all word comments with pdf
--no-IncludeDocProperties
--no-DocProp
Do not include Document Properties in the exported pdf file.
--PDF-OpenAfterExport
If you wish for a converted PDF to be opened after creation. No value req.
--PDF-FromPage
Save a range of pages to pdf. Integer/String. If integer --PDF-ToPage must also be set.
Other values wdExportCurrentPage, wdExportSelection
--PDF-ToPage
Save a range of pages to pdf. Integer. --PDF-FromPage must also be set.
--PDF-OptimizeFor
Set the pdf/xps to be optimized for print or screen.
Default ForPrint | ForOnScreen
--XPS-no-IRM
Do not copy IRM permissions to exported XPS document.
--PDF-No-DocStructureTags
Do not include DocStructureTags to help screen readers.
--PDF-no-BitmapMissingFonts
Do not bitmap missing fonts, fonts will be substituted.
--use-ISO190051
Create PDF to the ISO 19005-1 standard.
Experimental:
--skipdocswithtoc
EXPERIMENTAL. Will skip any docs that contain a TOC to prevent hanging.
Currently matches some false positives. Default False.
--stdout
Send file to Stdout after conversion. ( Does not work correctly for binary files)
ERROR CODES:
200 : Invalid File Format specified
201 : Insufficient Inputs. Minimum of Input File, Output File & Type
202 : Incorrect switches. Switch requires value
203 : Unknown switch in command
204 : Input File does not exist
205 : Invalid Parameter Value
220 : Word or COM Error
221 : Word not Installed
400 : Unknown Error
Требуются 3 параметра
Параметры, которые принимают значение, имеют пространство, отделяющее их от значения. Некоторые параметры не требуют значения. Все параметры нечувствительны.
-F -inputfile
Файл или папка, которую вы хотите, чтобы Docto открыл. Если это папка, Docto загрузит все файлы в этом каталоге и его подкаталогах. Если вы не хотите загружать файлы из подканальных директоров, см. Параметр --no-subdirs .
Преобразование будет выполняться в каждом файле по очереди.
-O -outputfile
Имя файла или стерна, где вы хотите размещать выходные файлы. Если ввод - это файл, но вывод - это папка, то выходной файл будет иметь то же имя, что и вход, но с новым расширением.
-T -формат
Укажите, в каком формате вы хотите преобразовать, например, wdFormatPDF или wdFormatText и т. Д.
Просмотреть возможные форматы слов и форматы Excel. Также может использовать целочисленное значение
-H, -help
Отобразить справочный текст, перечисляющий все параметры и версии приложений Docto и Office
-V --версия
Отображение строки версии как Docto, так и Microsoft Office.
-Wd -xl -pp -vs
Этот параметр сообщает Docto, какое из приложений вы хотите использовать для загрузки и сохранения вашего документа по историческим причинам Docto Default -по умолчанию, если не будет дано значение, однако это хорошая привычка, чтобы всегда использовать одно из этих значений в любое время, когда вы используете Docto.
-Fx - -Инпеткстенсия
По умолчанию Docto загрузит все файлы в каталоге со стандартным расширением приложения
например.
Если вы хотите преобразовать различный набор файлов, например *.rtf или *.txt, вы можете указать его здесь по ext, например .rtf
-Кокса -Outputextension
Выходное расширение на преобразовании извлекается из стандартного списка, например. При преобразовании в wdformatpdf файл будет выходить с расширением .pdf . Если вы хотите указать свое собственное расширение (например, .pdfx ), вы можете с этим параметром.
-Tf -forceformat
Если -t является целым числом, если это значение, которое было недоступно, когда Docto был составлен, это вызовет ошибку. Если вы используете -tf, он передаст целочисленное значение -T в офисную заявку без проверки.
-L - -loglevel
Установите уровень вывода журнала. -l 10 полезен для отладки. Используйте -l 0 или -q для удивительного журнала.
#### Уровни
-C -Совместимость
Режим совместимости целый ряд. Установите на целочисленное значение из списка MSDN.
Установите режим совместимости версии Word. Документ должен быть совместим. Частично полезно при желании преобразовать более старые документы в текущую версию. Можно использовать для преобразования старых документов Word, чтобы быть совместимыми с OneDrive.
-E -Ихкодирование
Устанавливает кодирование кодировки. Смотрите MSDN для получения более подробной информации и значений.
-N -listlongrunning
Некоторые файлы при преобразовании могут привести к появлению диалогового окна. Это может быть зафиксировано только путем ручного вмешательства. Установив этот параметр, вы можете, по крайней мере, записать документы, которые вызывают трудности (в файл с именем docto.ignore.txt ), и если вы установите -NX эти документы будут пропущены на последующих выполнениях.
-Nx-Aignorelongrunninglist {no-value-required}
При установке любых файлов, перечисленных в docto.ignore.txt в том же каталоге, что и docto.exe, будут пропущены. Это позволяет игнорировать неприятные документы в структуре каталогов.
-G --writeLogfile [не требуется значение]
Запишите журнал в файл, а также stdout. docto.log по умолчанию.
-Gl -logfilename {filename}
Укажите имя файла, которое вы хотите, чтобы файл журнала был записан.
-Q -quiet [не требуется значение]
Нет вывода в stdout. Все, включая ошибки, удивится. Используйте в сочетании с -G , чтобы убедиться, что вы получаете ошибки.
-R -deletefiles {true | false}
Если вы хотите, чтобы входной файл был удален после преобразования, вы можете установить это на True.
-W -Webhook
Если вы хотите, чтобы вы могли вызвать веб -URL после каждого преобразования или ошибки. URL -адрес webhook будет вызван на следующих событиях со следующими параметрами
Преобразование файла
Ошибка
Возвратное значение регистрируется в журнале Docto
-X -Halterror {true | false}
Docto остановится, когда ошибка COM будет поднята. Если вы хотите игнорировать ошибку и продолжить установить это значение TRUE.
-BookmarkSource {Source}
Преобразования в формате PDF могут получить свои закладки из WordBookMarks, WordHeadings (по умолчанию) или нет
-Donotoverwrite-no overwrite [не требуется значение]
Существующие файлы переопределены по умолчанию, если вы не хотите, чтобы файл был переписан, используйте эту опцию.
--нет-SUBDIRS
По умолчанию суб -каталоги преобразуются. Используйте только для преобразования указанного каталога. Не повторяйте суб -каталоги
-Exportmarkup
Указывает
Используйте wdexportdocumentwithmarkup, чтобы экспортировать все комментарии слова с pdf
-PDF-OPENAFTEREXPORT
Если вы хотите открыть конвертированный PDF после создания. Нет стоимости req.
-PDF-FROPAGE
-PDF-Topage
Конвертируйте только определенные страницы в документе.
-USE-ISO190051
Создайте PDF в соответствии с стандартом ISO 19005-1, также известен как PDF-A или PDF-архив.
-M -ignoremacos {true | false}
По умолчанию Docto игнорирует любые файлы в скрытом каталоге __MACOSX , который создает macOS. Этот каталог часто присутствует на внешнем диске, который разделяется между системами. Если вы хотите проверить это DIR Установите это значение. Вы должны указать значение, например -M false .
Проект компилизируется с Delphi (я использую 10.3, но он должен собирать большинство версий, включая XE4 и 7). Проект не будет компилировать на Linux, поскольку он использует только несколько компонентов Windows, таких как COM и Word и Excel, в любом случае не имеют версий Linux, так что не будет никакого смысла.
Xlsto теперь включен в Docto. Ранее XLSTO был отдельным EXE, который использовался для преобразования файлов XLS в CSV или PDF. Теперь это можно сделать с основным DocTo.exe , просто добавив флаг -xl.
Я рад принять любой PR, который может подать кому -либо. Если большой объем работы, пожалуйста, сначала откройте проблему, чтобы убедиться, что усилия не будут потрачены впустую.
Основное название филиала в репо - DocTo
Я начал писать функциональные тесты в PHP, чтобы проверить, правильно ли приложение манипулирует документами. Если вы знакомы с PHP Laravel и PEST, я хотел бы получить дополнительные тесты.