LaTeX-Texte sehen u.a. so schön aus, weil sie echte Ligaturen zeigen. Beim Kopieren aus und Suchen in der pdf ruiniert das aber den Text, blöd in Zeiten von Digitalem Publizieren online. Vor kurzem sah ich z.B., dass der kostenlose Font Brill des gleichnamigen Verlags statt Ligaturen aus diesem Grund lieber Kontextvarianten einsetzt, damit die pdf-Texte suchbar und kopierbar sind (vgl. Vortrag des Schriftdesigners). Freilich ist diese Schrift eine Ausnahme und hat keine völlig freie Lizenz. Meine Frage: Gibt es denn keine Möglichkeit, dass Ligaturen wie fi, fl, Th, tt usw. beim Suchen und Kopieren korrekt angezeigt werden? Im Moment habe ich zumindest Ligaturen in XeLaTeX ausgeschaltet mit Open in writeLaTeX
\setmainfont[Mapping=tex-text, Ligatures={NoCommon,NoContextual}, Numbers=OldStyle]{Linux Libertine O} Aber auch Kapitälchen und Mediävalziffern werden nicht korrekt kopiert. Vielleicht hat da schon jemand eine Lösung für sich gefunden? Open in writeLaTeX
\documentclass[ngerman]{scrartcl} \usepackage{xltxtra,babel} %mit Ligaturen \setmainfont[Mapping=tex-text, Ligatures={Common}, Numbers=OldStyle]{Linux Libertine O} %ohne Ligaturen \setsansfont[Mapping=tex-text, Ligatures={NoCommon,NoContextual}]{Linux Libertine O} \begin{document} %mit Ligaturen, Mediävalziffern und Kapitälchen \noindent Affen finden bei Regenwetter im Theater \\ 246 fliegende \textsc{Fliegen} \bigskip %ohne Ligaturen, Mediävalziffern und Kapitälchen \noindent \textsf{Affen finden bei Regenwetter im Theater \\ 246 fliegende Fliegen} \end{document} Die pdf findet z.B. nur 1x "wetter", "Theater" oder "246" oder "Fliegen" im zweiten Beispiel: gefragt 13 Mär '14, 09:50 kai
Ergebnis 5 von 9
show 4 more comments
|
Der Tipp von @Mico ist m.E. die vorläufige Antwort auf die Frage (weitere Tipps sind natürlich willkommen):
Für mich folgt daraus,
beantwortet 13 Mär '14, 18:11 kai Ich habe gerade eben Dein MWE mit "EB Garamond" ausprobiert anstatt mit Linux Libertine O, und siehe da -- kein Problem mit XeLaTeX (und auch nicht mit LuaLaTeX). Somit sind die Probleme die Du entdeckt hast vielleicht mehr an Libertine Libertine (fehlerhafte Metadaten?) als an XeLaTeX anzulasten?
(13 Mär '14, 23:01)
Mico
@Mico Das ist ja interessant, ich habe gerade allerdings beim Versuch gerade eben mit Minion Pro und weiteren Schriften mit otf-Features dieselben Probleme gefunden. Es scheint eher EB Garamond (wie die oben genannte Brill) die rühmliche Ausnahme zu sein.
(14 Mär '14, 09:09)
kai
Das Problem existiert inzwischen nicht mehr, entnehme ich dem Ende des folgenden Posts. Möglicherweise durch ein Update von fontspec bzw. xelatex: http://tex.stackexchange.com/questions/110354/pdfglyphtounicode-with-xetex
(05 Feb '15, 11:18)
kai
Also fontspec kann da gar nichts tun. Ein Update von xetex wäre theoretisch möglich, aber ich habe nichts davon gehört und da andere Beispiele von "Kopierproblemen" immer noch existieren, zweifle ich daran. Ich gehe davon aus, dass die Schrift korrigiert wurde (und dass daher andere Schriften immer noch Probleme machen können).
(05 Feb '15, 11:46)
Ulrike Fischer
Danke für den Hinweis, Ulrike. Der zitierte Post ging aber davon aus, dass sich die Schrift „Linux Libertine O“ seither nicht verändert hat. Mein Gegenversuch eben mit der „Minion Pro“ (die damals auch Probleme machte) zeigte, dass auch dort das Problem verschwunden ist. Wäre vielleicht interessant, wenn man weitere bekannte „Kopierprobleme“ daraufhin nochmal testet, keine Ahnung...
(05 Feb '15, 14:32)
kai
|
Bist Du auf XeLaTeX angewiesen, oder könntest Du auf LuaLaTeX umwechseln? Wenn ich Dein MWE mit LuaLaTeX kompiliere (ersetze
xltxtra
mitfontspec
) und in Acrobat öffne, habe ich überhaupt keine Probleme mit Ligaturen, Ziffern, oder Kapitälchen.Mit dem
libertine
-Paket und pdfLaTeX klappt auch alles wunderbarDanke für den Tipp, gerade meine erste LuaLaTeX-Kompilierung überhaupt versucht. Ich kann bei einer großen, komplexen Datei mit einigen eigenen Anpassung nicht absehen, ob ein Wechsel problemlos möglich wäre.
Allerdings: Bei mir werden nun in der LuaLaTeX-pdf "Affen", "finden", "wetter" und "Theater" gefunden, die Mediävalziffern (letzte Zeile) und Kapitälchen dagegen nicht. Machst Du etwas anders als ich, oder hast Du Dich da evtl. verschaut?
Mit dem Kompromiss ließe sich wohl vorerst leben. Also Zeit, sich mal in LuaLaTeX einzuarbeiten...
@kai - Welche TeX distribution hast Du auf Deinem System? (Ich arbeite hauptsächlich mit MacTeX2013 und gelegentlich mit MiKTeX 2.9.)
@Mico Ich werde es mal mit nem Rechner mit Texlive 2013 versuchen, hier habe ich grad nur die Ubuntu 13.10-Variante von LaTeX, die immer etwas hinterherhinkt in der Aktualität. Aber ich habe gerade gesehen, Xesearch und Xeindex scheinen nur mit XeLaTeX zu funktionieren, das brauche ich. Kann man nur hoffen, das die Macher von XeLaTeX sich dieses Feature bei LuaLaTeX abgucken...
@Kai - Bedenke auch dass nicht all pdf viewers genau gleich kompetent sind. Acrobat und Reader sind (vielleicht!) anders als andere viewer Programme.
Danke, stimmt, ich habe das aber nach Deiner Antwort auch im Acrobat Reader ausprobiert. In Evince war es nicht anders.
@Clemens Ja das stimmt, das wusste ich, aber ist denn mit pdfLaTeX der gesamte Unicode-Bereich von Libertine abgedeckt?
@kai Keine Ahnung erhlich gesagt. Aber wären das nicht gut 100000 Zeichen? Ich bezweifle ja sehr, dass irgendein Font (ob nun truetype oder opentype) die abdeckt. Anders gsagt: mit hat bis jetzt noch nie eins gefehlt (was aber nichts heißen muss)