Utilitas sederhana untuk mengonversi dokumen Microsoft Word '.doc', Microsoft Excel '.xls' dan file .ppt Microsoft PowerpoT ke format lain yang didukung seperti .txt .csv .rtf .pdf.
Juga dapat digunakan untuk mengonversi .txt, .rtf, .csv ke .doc, .xls atau format .pdf.
Dapat digunakan untuk mengonversi dokumen kata yang lebih lama ke format terbaru.
Harus memiliki Microsoft Word, Excel atau PowerPoint yang diinstal pada mesin host.
Rilis Unduh dari Rilis Github - https://github.com/tobya/docto/releases/ Informasi lebih lanjut tersedia di https://tobya.github.io/doCto/
Lebih banyak contoh yang tersedia di
Unduh .exe dari rilis https://github.com/tobya/docto/releases
Juga tersedia untuk pemasangan melalui cokelat
Choco Instal Docto
untuk meningkatkan ke versi terbaru
Choco Upgrade Docto
Node Wrappers telah dibuat oleh @kerimg & @brrd
https://www.npmjs.com/package/node-dcto
https://github.com/brrd/msoconvert
Silakan mencatat masalah untuk setiap bug, fitur, atau saran.
Konversi dokumen Microsoft Word menjadi teks
docto -f C:DirectoryMyFile.doc -O "C:Output DirectoryMyTextFile.txt" -T wdFormatText
Konversi dokumen Microsoft Excel ke teks CSV
docto -XL -f C:DirectoryMyFile.xls -O "C:Output DirectoryMyTextFile.csv" -T xlCSV
Konversi dokumen Microsoft Word ke PDF (membutuhkan versi Microsoft Word yang mendukung ini).
docto -f C:DirectoryMyFile.doc -O "C:Output DirectoryMyTextFile.pdf" -T wdFormatPDF
Konversi semua dokumen Microsoft Word di direktori dan sub direktorinya ke PDF
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf
Hapus file asli setelah konversi (-r).
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf -R true
Tambahkan Webhook untuk Memecat pada setiap konversi (-W)
docto -f "C:Dir with SpacesFilesToConvert" -O "C:DirToOutput" -T wdFormatPDF -OX .pdf -W https://toflidium.com/webhooks/docto/webhook_test.php
Webhook adalah URL yang dapat dipanggil pada setiap konversi untuk memberi Anda kemampuan untuk repond secara eksternal setiap kali file dikonversi. Saat ini alamat https bersifat eksperimental jadi log masalah jika Anda memiliki masalah.
Jika Anda menggunakan Docto in the Wild di suatu tempat, silakan tambahkan detail ke halaman wiki ini
Jika Anda perlu memutakhirkan banyak file agar berfungsi tanpa konversi di OneDrive / Office365 / Word 20xx maka Anda dapat menggunakan Docto. Lihat pertanyaan StackExchange ini
https://webapps.stackexchange.com/questions/74859/what-format-does-word-online-use
Help
Docto Version:%s
Office Version : %s
Open Source: https://github.com/tobya/DocTo/
Description: DocTo converts Word Documents and Excel Spreadsheets to other formats.
Command Line Parameters:
Each Parameter should be followed by its value eg
-f "c:DocsMyDoc.doc"
Parameters markers are case insensitive.
-H This message
--HELP -?
-WD Use Word for Converstion (Default). Help '-h -wd'
--word
-XL Use Excel for Conversion. Help '-h -xl'
--excel
-PP Use Powerpoint for Conversion. help '-h -pp'
--powerpoint
-VS Use Visio for Conversion.
--visio
-F Input File or Directory
--inputfile
-FX Input file search for if -f is directory. Can use .rtf test*.txt etc
Default ".doc*" (will find ".docx" also)
--inputextension
-O Output File or Directory to place converted Docs
--outputfile
-OX Output Extension if -F is Directory. Please include '.' eg. '.pdf' .
If not provided, pulled from standard list.
--outputextension
-T Format(Type) to convert file to, either integer or wdSaveFormat constant.
Available from
https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.word.wdsaveformat
or https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.excel.xlfileformat
or https://docs.microsoft.com/en-us/office/vba/api/powerpoint.presentation.saveas
See current List Below.
--format
-TF Force Format. -T value if an integer, is checked against current list
compiled in. It is not passed if unavailable. -TF will pass through value
without checking. Word will return an "EOleException Value out of range"
error if invalid. Use instead of -T.
--forceformat
-L Log Level Integer: 1 ERRORS 2 STANDARD 5 CHATTY 9 DEBUG 10 VERBOSE. Default: 2=STANDARD
--loglevel
-C Compatibility Mode Integer. Set to an INTEGER value from
https://msdn.microsoft.com/en-us/library/office/ff192388.aspx.
Set the compatibility mode when you want to convert documents to a later
version of word. See help '-h -c' for further info.
--compatibility
-E Encoding Integer: Sets codepage Encoding. See
https://msdn.microsoft.com/en-us/library/office/ff860880.aspx
for more details and values.
--encoding
-M Ignore all files in __MACOSX subdirectory if it exists. Default True.
--ignoremacos
-N Make list of files that take over n seconds to complete.
Use number of seconds over that conversion takes and add to list.
Outputs to filename 'docto.ignore.txt'
--listlongrunning
-NX Ignore any file listed in docto.ignore.txt, created by -N
--ignorelongrunninglist
-G Write Log to file in directory
--writelogfile
-GL Log File Name to Use. Default 'DocTo.Log';
--logfilename
-Q Quiet Mode: Nothing will be output to console. To see any errors you must
set -G or -GL. Equivalent to setting -L 0
--quiet
-R Remove Files after successful conversion: Default false; To use specify
value eg -R true
--deletefiles
-W Webhook: Url to call on events. See help '-H -HW' for more details.
--webhook
-X Halt on COM Error: Default True; If you have trouble with some files
not converting, set this to false to ignore errors and continue with
batch job.
--halterror
-V Show Versions. DocTo and Word/Excel/Powerpoint
Long Parameters:
--BookmarkSource
PDF conversions can take their bookmarks from
WordBookmarks, WordHeadings (default) or None
--DoNotOverwrite
--no-overwrite
Existing files are overridden by default, if you do not wish a file to be
over written use this option.
--no-subdirs Only convert specified directory. Do not recurse sub directories
--ExportMarkup Value for wdExportItem - default wdExportDocumentContent.
use wdExportDocumentWithMarkup to export all word comments with pdf
--no-IncludeDocProperties
--no-DocProp
Do not include Document Properties in the exported pdf file.
--PDF-OpenAfterExport
If you wish for a converted PDF to be opened after creation. No value req.
--PDF-FromPage
Save a range of pages to pdf. Integer/String. If integer --PDF-ToPage must also be set.
Other values wdExportCurrentPage, wdExportSelection
--PDF-ToPage
Save a range of pages to pdf. Integer. --PDF-FromPage must also be set.
--PDF-OptimizeFor
Set the pdf/xps to be optimized for print or screen.
Default ForPrint | ForOnScreen
--XPS-no-IRM
Do not copy IRM permissions to exported XPS document.
--PDF-No-DocStructureTags
Do not include DocStructureTags to help screen readers.
--PDF-no-BitmapMissingFonts
Do not bitmap missing fonts, fonts will be substituted.
--use-ISO190051
Create PDF to the ISO 19005-1 standard.
Experimental:
--skipdocswithtoc
EXPERIMENTAL. Will skip any docs that contain a TOC to prevent hanging.
Currently matches some false positives. Default False.
--stdout
Send file to Stdout after conversion. ( Does not work correctly for binary files)
ERROR CODES:
200 : Invalid File Format specified
201 : Insufficient Inputs. Minimum of Input File, Output File & Type
202 : Incorrect switches. Switch requires value
203 : Unknown switch in command
204 : Input File does not exist
205 : Invalid Parameter Value
220 : Word or COM Error
221 : Word not Installed
400 : Unknown Error
3 parameter diperlukan
Parameter yang mengambil nilai memiliki ruang yang memisahkan mereka dari nilai. Beberapa parameter tidak memerlukan nilai. Semua parameter tidak sensitif.
-F --inputfile
File atau folder yang Anda ingin Docto buka. Jika itu adalah folder, Docto akan memuat semua file di direktori itu dan subdirektori. Jika Anda tidak ingin memuat file dari subdirektori, lihat parameter --no-subdirs .
Konversi akan dilakukan pada setiap file secara bergantian.
-O -outputFile
Nama file atau nama lipat di mana Anda ingin file output ditempatkan. Jika input adalah file tetapi output adalah folder maka file output akan memiliki nama yang sama dengan input tetapi dengan ekstensi baru.
-T -format
Tentukan format apa yang ingin Anda konversi ke seperti wdFormatPDF atau wdFormatText dll.
Lihat kemungkinan format kata dan format excel. Juga dapat menggunakan nilai integer
-H, --help
Tampilkan teks bantuan yang mencantumkan semua parameter dan versi aplikasi dokter dan kantor
-V --version
Tampilkan string versi Docto dan Microsoft Office.
-Wd -xl -pp -vs
Parameter ini memberi tahu Docto yang mana dari aplikasi yang ingin Anda gunakan untuk memuat dan menyimpan dokumen Anda karena alasan historis Docto default untuk -WD jika tidak ada nilai yang diberikan, namun itu adalah kebiasaan yang baik untuk selalu menggunakan salah satu dari nilai -nilai ini setiap kali Anda menggunakan Docto.
-Fx --inputextension
Secara default Docto akan memuat semua file di direktori dengan ekstensi aplikasi standar
misalnya.
Jika Anda ingin mengonversi satu set file differnt misalnya *.rtf atau *.txt Anda dapat menentukannya di sini dengan ext seperti .rtf
-Ox -outputextension
Ekstensi output pada konversi ditarik dari daftar standar, misalnya. Jika mengonversi ke wdformatpdf, file akan output dengan ekstensi .pdf . Jika Anda ingin menentukan ekstensi Anda sendiri (seperti .pdfx ), Anda dapat dengan parameter ini.
-Tf -forceFormat
Jika -t adalah bilangan bulat jika itu adalah nilai yang tidak tersedia ketika Docto dikompilasi itu akan menimbulkan kesalahan. Jika Anda menggunakan -tf itu akan melewati nilai integer -t ke aplikasi kantor tanpa memeriksa.
-L --Go -loVlevel
Atur level output log. -L 10 berguna untuk debugging. Gunakan -l 0 atau -q untuk mengejutkan logging.
Level ####
-C -kompatibilitas
Integer mode kompatibilitas. Setel ke nilai integer dari daftar MSDN.
Atur mode kompatibilitas versi Word dokumen harus kompatibel dengan. Berguna khusus ketika ingin mengonversi dokumen yang lebih lama ke versi saat ini. Dapat digunakan untuk mengonversi dokumen kata lama menjadi kompatibel dengan OneDrive.
-E --encoding
Mengatur codepage encoding. Lihat MSDN untuk detail dan nilai lebih lanjut.
-N -ListLonnonunning
Beberapa file saat dikonversi dapat menyebabkan kotak dialog muncul. Ini hanya dapat diperbaiki dengan intervensi manual. Dengan mengatur parameter ini, Anda setidaknya dapat merekam dokumen yang menyebabkan kesulitan (ke file yang disebut docto.ignore.txt ) dan jika Anda mengatur -NX dokumen -dokumen ini akan dilewati pada eksekusi berikutnya.
-Nx --ignorelongrunningList {no-value-required}
Saat mengatur file apa pun yang terdaftar di docto.ignore.txt di direktori yang sama dengan Docto.exe akan dilewati. Ini memungkinkan dokumen yang merepotkan dalam struktur direktori diabaikan.
-G --writelogfile [tidak diperlukan nilai]
Tulis log ke file serta stdout. docto.log secara default.
-Gl --gogfileName {fileName}
Tentukan nama file yang Anda harapkan dari logfile untuk ditulis.
-Q --quiet [tidak diperlukan nilai]
Tidak ada output ke stdout. Semuanya termasuk kesalahan terkejut. Gunakan bersama dengan -G untuk memastikan Anda mendapatkan kesalahan.
-R --deleteFiles {true | false}
Jika Anda ingin agar InputFile dihapus setelah konversi, Anda dapat mengatur ini menjadi True.
-W --webhook
Jika Anda ingin Anda dapat menghubungi URL web setelah setiap konversi atau kesalahan. URL webhook akan dipanggil pada acara berikut dengan parameter berikut
Konversi file
Kesalahan
Nilai pengembalian dicatat dalam log proci
-X --terterror {true | false}
Docto akan berhenti ketika kesalahan COM dinaikkan. Jika Anda ingin mengabaikan kesalahan dan terus atur nilai ini ke True.
--BookMarksource {Source}
Konversi PDF dapat mengambil bookmark mereka dari WordBookMarks, Wordheadings (default) atau tidak
--Donotoverwrite --no-overwrite [tidak diperlukan nilai]
File yang ada ditimpa secara default, jika Anda tidak ingin file tertulis menggunakan opsi ini.
--No-Subdirs
Secara default sub direktori dikonversi. Gunakan untuk hanya mengonversi direktori tertentu. Jangan mengulangi sub direktori
-ExportMarkup
Menentukan
Gunakan WDExportDocumentWithmarkup untuk mengekspor semua komentar kata dengan pdf
-PDF-OPENAFTEREXPORT
Jika Anda ingin PDF yang dikonversi dibuka setelah pembuatan. Tidak ada nilai req.
--PDF-frompage
--PDF-Topage
Hanya mengonversi halaman tertentu dalam dokumen.
--Use-iso190051
Buat PDF ke standar ISO 19005-1, juga dikenal sebagai PDF-A atau PDF Archive.
-M --Ignoremacos {true | false}
Secara default Docto mengabaikan file apa pun di direktori __MACOSX tersembunyi yang dibuat macOS. Direktori ini sering hadir pada disk eksternal yang dibagi antara sistem. Jika Anda ingin memeriksa dir ini, setel nilai ini. Anda harus menentukan nilai misalnya -M false .
Proyek ini dikompilasi dengan Delphi (saya menggunakan 10.3 tetapi harus dikompilasi dengan sebagian besar versi termasuk Xe4 & 7). Proyek ini tidak akan dikompilasi di Linux karena menggunakan beberapa komponen hanya Windows seperti COM dan Word dan Excel tidak memiliki versi Linux sehingga tidak akan ada gunanya.
XLSTO sekarang dimasukkan ke dalam Docto. Sebelumnya XLSTO adalah EXE terpisah yang digunakan untuk mengonversi file XLS ke CSV atau PDF. Ini sekarang dapat dilakukan dengan DocTo.exe utama hanya dengan menambahkan bendera -xl.
Saya senang menerima PR siapa pun yang mungkin ingin dikirim. Jika sejumlah besar pekerjaan yang terlibat, buka masalah terlebih dahulu untuk memastikan upaya tidak akan terbuang.
Nama cabang utama dalam repo adalah DocTo
Saya sudah mulai menulis tes fungsional dalam PHP untuk memeriksa apakah aplikasi memanipulasi dokumen dengan benar. Jika Anda terbiasa dengan php laravel dan hama, saya akan menyukai beberapa tes tambahan.