LaTeX-Texte sehen u.a. so schön aus, weil sie echte Ligaturen zeigen. Beim Kopieren aus und Suchen in der pdf ruiniert das aber den Text, blöd in Zeiten von Digitalem Publizieren online.

Vor kurzem sah ich z.B., dass der kostenlose Font Brill des gleichnamigen Verlags statt Ligaturen aus diesem Grund lieber Kontextvarianten einsetzt, damit die pdf-Texte suchbar und kopierbar sind (vgl. Vortrag des Schriftdesigners). Freilich ist diese Schrift eine Ausnahme und hat keine völlig freie Lizenz.

Meine Frage: Gibt es denn keine Möglichkeit, dass Ligaturen wie fi, fl, Th, tt usw. beim Suchen und Kopieren korrekt angezeigt werden?

Im Moment habe ich zumindest Ligaturen in XeLaTeX ausgeschaltet mit

Open in writeLaTeX
\setmainfont[Mapping=tex-text, Ligatures={NoCommon,NoContextual}, Numbers=OldStyle]{Linux Libertine O}

Aber auch Kapitälchen und Mediävalziffern werden nicht korrekt kopiert. Vielleicht hat da schon jemand eine Lösung für sich gefunden?

Open in writeLaTeX
\documentclass[ngerman]{scrartcl}
\usepackage{xltxtra,babel}

%mit Ligaturen
\setmainfont[Mapping=tex-text, Ligatures={Common}, Numbers=OldStyle]{Linux Libertine O}
%ohne Ligaturen
\setsansfont[Mapping=tex-text, Ligatures={NoCommon,NoContextual}]{Linux Libertine O}

\begin{document}
%mit Ligaturen, Mediävalziffern und Kapitälchen
\noindent Affen finden bei Regenwetter im Theater \\
246 fliegende \textsc{Fliegen}

\bigskip

%ohne Ligaturen, Mediävalziffern und Kapitälchen
\noindent \textsf{Affen finden bei Regenwetter im Theater \\
246 fliegende Fliegen}
\end{document}

Die pdf findet z.B. nur 1x "wetter", "Theater" oder "246" oder "Fliegen" im zweiten Beispiel:

Ligaturen

gefragt 13 Mär '14, 09:50

kai's gravatar image

kai
5483914
Akzeptiert-Rate: 33%

bearbeitet 13 Mär '14, 18:04

2

Bist Du auf XeLaTeX angewiesen, oder könntest Du auf LuaLaTeX umwechseln? Wenn ich Dein MWE mit LuaLaTeX kompiliere (ersetze xltxtra mit fontspec) und in Acrobat öffne, habe ich überhaupt keine Probleme mit Ligaturen, Ziffern, oder Kapitälchen.

(13 Mär '14, 15:59) Mico
1

Mit dem libertine-Paket und pdfLaTeX klappt auch alles wunderbar

(13 Mär '14, 16:13) cgnieder

Danke für den Tipp, gerade meine erste LuaLaTeX-Kompilierung überhaupt versucht. Ich kann bei einer großen, komplexen Datei mit einigen eigenen Anpassung nicht absehen, ob ein Wechsel problemlos möglich wäre.

Allerdings: Bei mir werden nun in der LuaLaTeX-pdf "Affen", "finden", "wetter" und "Theater" gefunden, die Mediävalziffern (letzte Zeile) und Kapitälchen dagegen nicht. Machst Du etwas anders als ich, oder hast Du Dich da evtl. verschaut?

Mit dem Kompromiss ließe sich wohl vorerst leben. Also Zeit, sich mal in LuaLaTeX einzuarbeiten...

(13 Mär '14, 16:14) kai

@kai - Welche TeX distribution hast Du auf Deinem System? (Ich arbeite hauptsächlich mit MacTeX2013 und gelegentlich mit MiKTeX 2.9.)

(13 Mär '14, 16:19) Mico

@Mico Ich werde es mal mit nem Rechner mit Texlive 2013 versuchen, hier habe ich grad nur die Ubuntu 13.10-Variante von LaTeX, die immer etwas hinterherhinkt in der Aktualität. Aber ich habe gerade gesehen, Xesearch und Xeindex scheinen nur mit XeLaTeX zu funktionieren, das brauche ich. Kann man nur hoffen, das die Macher von XeLaTeX sich dieses Feature bei LuaLaTeX abgucken...

(13 Mär '14, 16:36) kai
1

@Kai - Bedenke auch dass nicht all pdf viewers genau gleich kompetent sind. Acrobat und Reader sind (vielleicht!) anders als andere viewer Programme.

(13 Mär '14, 16:38) Mico

Danke, stimmt, ich habe das aber nach Deiner Antwort auch im Acrobat Reader ausprobiert. In Evince war es nicht anders.

(13 Mär '14, 16:49) kai

@Clemens Ja das stimmt, das wusste ich, aber ist denn mit pdfLaTeX der gesamte Unicode-Bereich von Libertine abgedeckt?

(13 Mär '14, 17:11) kai

@kai Keine Ahnung erhlich gesagt. Aber wären das nicht gut 100000 Zeichen? Ich bezweifle ja sehr, dass irgendein Font (ob nun truetype oder opentype) die abdeckt. Anders gsagt: mit hat bis jetzt noch nie eins gefehlt (was aber nichts heißen muss)

(15 Mär '14, 17:51) cgnieder
Ergebnis 5 von 9 show 4 more comments

Der Tipp von @Mico ist m.E. die vorläufige Antwort auf die Frage (weitere Tipps sind natürlich willkommen):

Bist Du auf XeLaTeX angewiesen, oder könntest Du auf LuaLaTeX umwechseln? Wenn ich Dein MWE mit LuaLaTeX kompiliere (ersetze xltxtra mit fontspec) und in Acrobat öffne, habe ich überhaupt keine Probleme mit Ligaturen, Ziffern, oder Kapitälchen.

Für mich folgt daraus,

  1. dass LuaLaTeX für digitales Publizieren mit Ligaturen der XeLaTeX-Kompilation überlegen ist (und ich umsteigen werde),
  2. dass bislang auf Mediävalziffern und Kapitälchen möglichst verzichtet werden sollte, wenn es ein online suchbares Dokument ist,
  3. dass es eine Herausforderung bleibt, Drucktypographie und Onlineformate zusammenzubringen.
Permanenter link

beantwortet 13 Mär '14, 18:11

kai's gravatar image

kai
5483914
Akzeptiert-Rate: 33%

bearbeitet 13 Mär '14, 18:13

Ich habe gerade eben Dein MWE mit "EB Garamond" ausprobiert anstatt mit Linux Libertine O, und siehe da -- kein Problem mit XeLaTeX (und auch nicht mit LuaLaTeX). Somit sind die Probleme die Du entdeckt hast vielleicht mehr an Libertine Libertine (fehlerhafte Metadaten?) als an XeLaTeX anzulasten?

(13 Mär '14, 23:01) Mico

@Mico Das ist ja interessant, ich habe gerade allerdings beim Versuch gerade eben mit Minion Pro und weiteren Schriften mit otf-Features dieselben Probleme gefunden. Es scheint eher EB Garamond (wie die oben genannte Brill) die rühmliche Ausnahme zu sein.

(14 Mär '14, 09:09) kai

Das Problem existiert inzwischen nicht mehr, entnehme ich dem Ende des folgenden Posts. Möglicherweise durch ein Update von fontspec bzw. xelatex:

http://tex.stackexchange.com/questions/110354/pdfglyphtounicode-with-xetex

(05 Feb '15, 11:18) kai

Also fontspec kann da gar nichts tun. Ein Update von xetex wäre theoretisch möglich, aber ich habe nichts davon gehört und da andere Beispiele von "Kopierproblemen" immer noch existieren, zweifle ich daran. Ich gehe davon aus, dass die Schrift korrigiert wurde (und dass daher andere Schriften immer noch Probleme machen können).

(05 Feb '15, 11:46) Ulrike Fischer

Danke für den Hinweis, Ulrike. Der zitierte Post ging aber davon aus, dass sich die Schrift „Linux Libertine O“ seither nicht verändert hat.

Mein Gegenversuch eben mit der „Minion Pro“ (die damals auch Probleme machte) zeigte, dass auch dort das Problem verschwunden ist. Wäre vielleicht interessant, wenn man weitere bekannte „Kopierprobleme“ daraufhin nochmal testet, keine Ahnung...

(05 Feb '15, 14:32) kai
Deine Antwort
Vorschau umschalten

Folgen dieser Frage

Per E-Mail:

Wenn sie sich anmelden, kommen Sie für alle Updates hier in Frage

Per RSS:

Antworten

Antworten und Kommentare

Markdown-Grundlagen

  • *kursiv* oder _kursiv_
  • **Fett** oder __Fett__
  • Link:[Text](http://url.com/ "Titel")
  • Bild?![alt Text](/path/img.jpg "Titel")
  • nummerierte Liste: 1. Foo 2. Bar
  • zum Hinzufügen ein Zeilenumbruchs fügen Sie einfach zwei Leerzeichen an die Stelle an der die neue Linie sein soll.
  • grundlegende HTML-Tags werden ebenfalls unterstützt

Frage-Themen:

×48
×8
×2
×2

gestellte Frage: 13 Mär '14, 09:50

Frage wurde gesehen: 12,903 Mal

zuletzt geändert: 05 Feb '15, 14:32