Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

PDF-Export: Seitenwechsel in getrennten Wörtern #93

Open
phoenix-mossimo opened this issue Mar 24, 2021 · 4 comments
Open

PDF-Export: Seitenwechsel in getrennten Wörtern #93

phoenix-mossimo opened this issue Mar 24, 2021 · 4 comments

Comments

@phoenix-mossimo
Copy link
Contributor

AW: Wenn Seitenwechsel in getrennten Wörtern auftauchen (z.B. S. 9/10, folio 7r/v): ginge das mit einem Trennstrich?

@phoenix-mossimo
Copy link
Contributor Author

phoenix-mossimo commented Mar 24, 2021

Analyse:

Worttrennung bei Seitenwechsel wird in Sal-TEI mit <pb break="no" rendition="..."> markiert (rendition-Werte "#noHyphen" und "#Hyphen"). Leider haben Original-Mss. bei Worttrennungen nicht immer einen Trennstrich. HTML-Ansicht dagegen hat bei <pb> immer ein Pipe |, , egal ob es um ein Wort oder zwei Wörter handelt.

Lösung:

  • Trennzeichen wird gesetzt unabhängig davon ob Original-Ms. es hat oder nicht:
    <xsl:template match="tei:pb[@n]">
        <fo:inline font-style="normal">
            <xsl:choose>
                <xsl:when test="@rendition">-</xsl:when>
            </xsl:choose>
            <xsl:apply-templates/>
        </fo:inline>

PDF

Frage:

  • Soll sich die PDF-Ausgabe an Ms. oder HTML orientieren? I.e. bei Worttrennung immer ein "-" setzen, oder nur wenn Ms. es hat?

@awagner-mainz
Copy link
Member

Ich würde vorschlagen, wir orientieren uns an modernen Lesegewohnheiten und lassen ggf. Abweichungen der Ms. außer Acht. Mit anderen Worten: immer ein "-" setzen. Das wäre jedenfalls meine Meinung.

@phoenix-mossimo
Copy link
Contributor Author

Leider war die Ausgabe nicht ganz sauber:

an Stellen wo <pb><lp> zusammen vorkamenm wurde ein Leerzeichen eingefügt:

  • ( fol. 18r ): hom -bre
  • ( fol. 24r ): cuen -ta
  • (fol. 25r): duran -te

Gelöst nun mit indent="no" in <xsl:output>

@awagner-mainz
Copy link
Member

Die Idee war so (ich weiß nicht, ob es in allen Quellen so eingerichtet ist):

  • <lb/> erzeugen immer ein " ", es sei denn, sie haben das @break="no" gesetzt
  • <pb/> erzeugen immer ein " | ", es sei denn, sie haben das @break="no" gesetzt (dann erzeugen sie ein "|")
  • <lb/> und <pb/> mit @rendition="#hyphen" erzeugen ein "-"

In den Quellen sollte dann stehen:

Trenn<pb break="no" rendition="#hyphen"
facs="img12345" .../><lb break="no" [optional rendition="#noHyphen"]
xml:id="w0003_lb_0002/>strich

Hier sind die Quellen empfindlich hinsichtlich dessen, wo Whitespace steht und wo/wie oft das rendition-Attribut steht.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants