Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Informationen über PDF-Dateien ermitteln #8

Open
j3nsch opened this issue Mar 16, 2022 · 2 comments
Open

Informationen über PDF-Dateien ermitteln #8

j3nsch opened this issue Mar 16, 2022 · 2 comments
Labels
enhancement New feature or request

Comments

@j3nsch
Copy link
Member

j3nsch commented Mar 16, 2022

Es wäre nützlich grundlegende Informationen über PDF-Dateien ermitteln zu können, um sie z.B. in der Administration mit anzuzeigen. Das könnte bei der Diagnose von Problemen helfen. Insbesondere die Format-Version und ob Dateien geschützt sind wären interessant.

@j3nsch
Copy link
Member Author

j3nsch commented Mar 16, 2022

@extracts Wenn sich bei Deiner Arbeit an den Deckblättern in dieser Hinsicht ein Möglichkeit gezeigt hat, wäre ich für Hinweise dankbar. Gerade bei Problemen mit den Deckblättern wäre es nützlich, wenn man das Original-PDF nicht erst in einem externen Tool analysieren muss. Die Umsetzung dieser Funktion hat sonst erst einmal keine hohe Priorität.

@j3nsch j3nsch added the enhancement New feature or request label Mar 16, 2022
@j3nsch j3nsch changed the title Funktion um Informationen über PDF-Dateien zu ermitteln Informationen über PDF-Dateien ermitteln Mar 16, 2022
@j3nsch j3nsch transferred this issue from OPUS4/opus4-bibtex Mar 16, 2022
@j3nsch
Copy link
Member Author

j3nsch commented Jul 8, 2022

Intern gibt es ein Ticket zur Validierung von PDF-Dateien.

https://tickets.zib.de/jira/browse/OPUSVIER-3331

Es gibt z.B. das File Information Tool Set (FITS), das Informationen über PDF Dateien liefern kann.

https://projects.iq.harvard.edu/fits

Die generierten Information werden als XML ausgegeben und können sehr umfangreich sein. Die relevanten Informationen sollten herausgefiltert werden. FITS ist in Java geschrieben und könnte mit einem Skript ausgeführt werden.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

1 participant