Občas se mi dostane do ruky PDF, z něhož potřebuji zkopírovat část textu (například zadání úkolu), ale po zkopírování a vložení do textového editoru jsou písmenka a háčky s čárkami zvlášť. Napsal jsem si na to tedy skript, který rozházenou diakritiku zase urovná.
Převaděč rozhašeného textu kopírovaného z pdf vytvořeného LaTeXem (diakritika před písmeny):
Pokud máte zdroják (tex), stačí zkompilovat s:
\usepackage[czech]{babel} \usepackage[utf8]{inputenc} \usepackage{lmodern} \usepackage[T1]{fontenc}- tu rozloženou diakritiku dělá právě absence "\usepackage[T1]{fontenc}" při kompilaci.
Ukázka vstupu:
Pˇr´iliˇs ˇzluˇtouˇck´y k°uň ´upˇel ˇd´abelsk´e ´ody.
Ukázka výstupu:
Příliš žluťoučký kůň úpěl ďábelské ódy
Pozn.: skript odstraní i zalomení a spojovníky (pro sloučení rozdělených slov na koncích řádků). Výsledek je třeba zkontrolovat, bohužel to není dokonalé.
Máte-li pocit, že skript nefunguje jak by měl, kontaktujte mě prosím.
Tento web jsem zakládal na střední, v roce 2008. Je zde hlavně archiv mé tvorby.
Aktuální věci publikuji kvůli úspoře času na Twitter.
Honza
"To, co druzí dělají, může být podnětem našich pocitů, nikoli však jejich příčinou."