Wie kann man Ligaturen beibehalten, aber pdf-Text suchbar und kopierbar machen?
LaTeX-Texte sehen u.a. so schön aus, weil sie echte Ligaturen zeigen. Beim Kopieren aus und Suchen in der pdf ruiniert das aber den Text, blöd in Zeiten von Digitalem Publizieren online.
Vor kurzem sah ich z.B., dass der kostenlose Font [Brill][1] des gleichnamigen Verlags statt Ligaturen aus diesem Grund lieber Kontexvarianten einsetzt, damit die pdf-Texte suchbar und kopierbar sind (vgl. [Vortrag][2] des Schriftdesigners). Freilich ist diese Schrift eine Ausnahme und hat keine völlig freie Lizenz.
Meine Frage: Gibt es denn keine Möglichkeit, dass Ligaturen wie fi, fl, Th, tt usw. beim Suchen und Kopieren korrekt angezeigt werden?
Im Moment habe ich zumindest Ligaturen in XeLaTeX ausgeschaltet mit
\setmainfont[Mapping=tex-text, Ligatures={NoCommon,NoContextual}, Numbers=OldStyle]{Linux Libertine O}
Aber auch Kapitälchen und Mediävalziffern werden nicht korrekt kopiert. Vielleicht hat da schon jemand eine Lösung für sich gefunden?
\documentclass[ngerman]{scrartcl}
\usepackage{xltxtra,babel}
%mit Ligaturen
\setmainfont[Mapping=tex-text, Ligatures={Common}, Numbers=OldStyle]{Linux Libertine O}
%ohne Ligaturen
\setsansfont[Mapping=tex-text, Ligatures={NoCommon,NoContextual}]{Linux Libertine O}
\begin{document}
%mit Ligaturen, Mediävalziffern und Kapitälchen
\noindent Affen finden bei Regenwetter im Theater \\
246 fliegende \textsc{Fliegen}
\bigskip
%ohne Ligaturen, Mediävalziffern und Kapitälchen
\noindent \textsf{Affen finden bei Regenwetter im Theater \\
246 fliegende Fliegen}
\end{document}
Die pdf findet z.B. nur 1x "Theater" oder "246" oder "Fliegen" im zweiten Beispiel:
![Ligaturen][3]
[1]: http://www.brill.com/about/brill-fonts
[2]: https://www.youtube.com/watch?v=24-HQ236Tychttps://www.youtube.com/watch?v=24-HQ236Tyc
[3]: http://texwelt.de/wissen/upfiles/ligaturen.png