También hay un proyecto para crear archivos PDF: ITEXT.
Hay dos subproyectos debajo de PDFBox: Fontbox es una biblioteca de clase Java que procesa las fuentes PDF;
Un ejemplo simple:
Para introducir el paquete PDFBox-App-1.6.0.Jar.
La copia del código es la siguiente:
paquete pdf;
import java.io.file;
import java.net.malFormedUrexception;
importar org.apache.pdfbox.pdmodel.pddocument;
importar org.apache.pdfbox.util.pdftextstripper;
clase pública strippdfcontent {
public static string getText (archivo de archivo) lanza una excepción {
boolean sort = false;
ints startPage = 1;
int endpage = 10;
PDDocument Document = NULL;
intentar{
intentar{
documento = PDDocument.Load (archivo);
} capt (malformedurexception e) {
}
Pdftextstripper stripper = new PdftextStripper ();
stripper.setsortbyposition (sort);
stripper.setStartPage (startPage);
stripper.SetEndPage (EndPage);
return stripper.gettext (documento);
} Catch (Exception e) {
E.PrintStackTrace ();
devolver "";
} finalmente{
if (document! = null) {
document.close ();
}
}
}
public static void main (string [] args) {
Archivo archivo = nuevo archivo ("/home/orisun/123.pdf");
intentar{
Cadena cont = getText (archivo);
System.out.println (cont);
} Catch (Exception e) {
System.out.println ("Fallado de tira");
E.PrintStackTrace ();
}
}
}