Zum Zwecke der Langzeitarchivierung möchte ich meine gerade fertiggestellte Arbeit (auch) im PDF/A-Format erstellen. Der einleitende Satz von Wikipedia:

PDF/A ist ein Format zur Langzeitarchivierung digitaler Dokumente, das von der International Organization for Standardization (ISO) als Subset des Portable Document Format (PDF) genormt wurde. Die Norm legt fest, wie die Elemente der zugrundeliegenden PDF-Versionen im Hinblick auf die Langzeitarchivierung verwendet werden müssen. Dabei gibt es sowohl zwingend vorgeschriebene als auch nicht zugelassene Bestandteile.

Was muss ich beachten, um mit LaTeX PDF/A-konforme Dokumente zu erstellen?

gefragt 11 Jul '13, 17:30

Andr%C3%A9's gravatar image

André
986262836
Akzeptiert-Rate: 33%

bearbeitet 08 Sep '14, 21:57

Johannes's gravatar image

Johannes
7.3k294566

Mit dem Paket »pdfx« gäbe es da eine Möglichkeit. Inwieweit das Dokument dann allerdings den Spezifikationen entspricht, kann ich nicht sagen, weil ich keine Möglichkeit zur Überprüfung habe.

(11 Jul '13, 18:15) Thorsten

Vorab sei erwähnt, dass es das PDF/A-Format nicht gibt. Vielmehr gibt es mehrere Versionen der PDF/A-Spezifikation, die unterschiedlich harte Anforderungen an die PDF-Datei stellen. Einen Teil dieser unterschiedlichen PDF/A-Formate kann man mit pdfLaTeX, XeLaTeX oder LuaLaTeX erreichen. Andere sind derzeit nahezu unerreichbar.

Praktisch unerreichbar sind derzeit die accessible PDF/A-Formate der Spezifikation PDF/A-1a, PDF/A-2a und PDF/A-3a. Das liegt daran, dass dafür tagged PDF benötigt wird. Zwar existieren aus dem Bereich barrierefreies LaTeX Ansätze, um mit pdfLaTeX erzeugte PDFs teilweise mit tags zu versehen, teilweise ist aber für die accessible Formate nicht ausreichend.

Die basic PDF/A-Formate sind hingegen durchaus erreichbar. Für PDF/A-1b muss man sich zunächst auf PDF 1.4 beschränken. Dazu genügt es nicht, \pdfminorversion (siehe »The pdfTeX User Manual«) auf 4 zu setzen. Man muss auch explizit \pdfobjcompresslevel auf 0 setzen, um auf die Komprimierung der PDF-Objekte, die es erst ab PDF 1.5 gibt, abzuschalten. Damit auch für die Streams von Images kein LZW verwendet wird, sollte man außerdem \pdfcompresslevel ebenfalls auf 0 setzen. Ab PDF/A-2b muss man sich darüber keine Gedanken mehr machen, weil dies auf PDF 1.7 basiert und pdfTeX, XeTeX und luaTeX derzeit keine PDFs einer höheren PDF-Version erzeugen.

Bei Verwendung von hyperref sollte man Option pdfa setzen. Gleichzeitig kann das leider sehr unflexible und in Teilen sogar fehlerhafte Paket pdfx beim Ausfüllen der zwingend erforderlichen XMP-Daten hilfreich sein. Mit etwas mehr Erfahrung ist es aber eventuell sinnvoller, diese Struktur mit Hilfe des Pakets hyperxmp oder xmpincl selbst zu erstellen, da man dann nicht mit den Mängeln des pdfx-Pakets konfrontiert ist. Dabei darf man keinesfalls die Einbindung eines Farbprofils vergessen.

Darüber hinaus muss man selbst Sorge dafür tragen, dass kein Paket ein PDF-Feature verwendet, das nicht PDF/A-1b konform ist. Beispielsweise darf man bei PDF/A-1b keine Transparenz verwenden.

Im Bereich der Mathematik gibt es teilweise die Hürde, dass alle Zeichen nach Unicode abbildbar sein müssen. Das ist bei LaTeX nicht generell der Fall.

Bei PDF/A-1b dürfen keine OpenType-Fonts eingebettet werden. Da aber alle Fonts eingebettet sein müssen, kann man also keine OpenType-Fonts verwenden. Das Problem gehört aber mit PDF/A-2b der Vergangenheit an.

Damit aber nicht genug: Man muss auch noch dafür sorgen, dass alle eingebundenen PDF-Dateien oder andere Grafiken mit dem Standard konform sind. Alleine das kann einigen Aufwand bedeuten.

Am Ende benötigt man dann auch noch eine Vollversion von Adobe Acrobat – der Adobe Reader genügt hier nicht – um die Einhaltung des Standards zu kontrollieren. Einige Fehler kann Acrobat auch selbst beheben, wenn man die mit pdfLaTeX, XeLaTeX oder LuaLaTeX erzeugte PDF-Datei lädt, das entsprechende Profil auswählt und damit speichert.

Ich selbst musste nur ein einziges Mal eine PDF/A-1b-Datei liefern. Die größte Hürde waren dabei die eingebundenen Grafiken. Alle anderen Hürden konnten von einem Kollegen mit Adobe Acrobat durch nachträgliche Bearbeitung genommen werden. Wie aufwändig das war und was er dazu im Detail tun musste, ist mir aber nicht bekannt.

Als Fazit für mich blieb bei der Aktion: PDF/A-1b und erst recht PDF/A-2b sind mit LaTeX möglich, wenn der Anwender weiß, was er tut und sich selbst einige Beschränkungen auferlegt. Eine automatische Einhaltung gibt es mit LaTeX jedoch ebenso wenig wie PDF/A-1a oder PDF/A-2a.

Eventuell ist besonders im Hinblick auf tagged-PDF ConTeXt eher eine Option als dies mit LaTeX erreichen zu wollen.

Permanenter link

beantwortet 15 Jul '13, 12:59

saputello's gravatar image

saputello
11.1k174365
Akzeptiert-Rate: 51%

bearbeitet 12 Aug '13, 17:17

Hervorragende Antwort. Danke.

(15 Jul '13, 19:04) Marco_D

@saputello: Ich kann mich Marco nur anschließen! (... auch wenn ich für mich aus der hervorragenden Antwort entnehme, dass eine Umwandlung in PDF/A für mich zu hoch ist ;))

(21 Jul '13, 16:12) André

Es sei der Hinweis erlaubt, daß ConTeXt durchaus tagged PDF erzeugen kann.

(12 Aug '13, 11:16) Martin Schröder

Ich würde gerne PDF/A einsetzen. Bei mir geht es insbesondere um den Schreibschutz: Wenn ich z.B. eine Word-Datei als PDF/A-Datei speichere, kann ich die PDF/A-Datei nicht mehr direkt bearbeiten, sondern muss die Veränderung dann als neue Datei abspeichern. Ist das hiermit auch möglich?

(07 Mär '15, 20:29) tt33tt

@tt33tt: Was ist »hiermit«? Schreibschutz geht normalerweise per PDF-Rechte. Allerdings sind bei PDF/A Rechteeinschränkungen gerade nicht erlaubt. Das wäre also eher ein Verstoß gegen PDF/A.

(08 Mär '15, 08:32) saputello

@saputello: Wenn ich in Word eine Datei als PDF/A speichere, dann kommt immer folgende Meldung:"Diese Datei verlangt Konformität mit dem PDF/A-Standard und wurde schreibgeschützt geöffnet, um Änderungen zu verhindern." Siehe dieser Link: http://www.myimg.de/?img=PDFA38f4f.jpg

(08 Mär '15, 18:56) tt33tt
2

@tt33tt: Das bedeutet aber nicht, dass die Datei generell nicht geändert werden kann. Das sagt nur, dass das Programm sie schreibgeschützt öffnet, um Änderungen, die zu versehentlichen Verstöße gegen PDF/A führen, zu verhindern.

(08 Mär '15, 19:06) saputello

@saputello: Achso, danke für die Erklärung!

(08 Mär '15, 19:42) tt33tt
Ergebnis 5 von 8 show 3 more comments
Deine Antwort
Vorschau umschalten

Folgen dieser Frage

Per E-Mail:

Wenn sie sich anmelden, kommen Sie für alle Updates hier in Frage

Per RSS:

Antworten

Antworten und Kommentare

Markdown-Grundlagen

  • *kursiv* oder _kursiv_
  • **Fett** oder __Fett__
  • Link:[Text](http://url.com/ "Titel")
  • Bild?![alt Text](/path/img.jpg "Titel")
  • nummerierte Liste: 1. Foo 2. Bar
  • zum Hinzufügen ein Zeilenumbruchs fügen Sie einfach zwei Leerzeichen an die Stelle an der die neue Linie sein soll.
  • grundlegende HTML-Tags werden ebenfalls unterstützt

Frage-Themen:

×44
×2

gestellte Frage: 11 Jul '13, 17:30

Frage wurde gesehen: 44,705 Mal

zuletzt geändert: 26 Jul '16, 20:09