Wikisource:Korrekturläsning

Från Wikisource, det fria biblioteket.
Hoppa till navigering Hoppa till sök

Wikisource är en samling av källtexter, ett digitalt bibliotek. Den som har en färdig text kan lägga in den, ungefär som en artikel i Wikipedia. Men ofta är det ett problem att veta om texten verkligen är "färdig". Vanligen utgår man från en tryckt bok, och olika typer av fel kan uppstå vid avskriften. När sådana fel påpekas eller misstänks måste man på nytt leta fram boken, vilket är omständligt, långsamt, dyrt eller ibland praktiskt omöjligt. Lösningen på detta problem är att alltid fånga en digital bild av boksidan. Detta kallas ibland elektronisk faksimil. Att säkerställa att den färdiga texten stämmer överens med bilden kallas korrekturläsning.

Korrekturläsning[redigera]

Korrekturläsning görs i sidnamnrymden (sidor med prefixet "Sida"). Alla sidor i en volym finns samlade på en index-sida. För att finna sidor att korrekturläsa kan man till exempel söka i kategori:Ej korrekturläst där alla sidor som inte är korrekturlästa finns. Man kan också söka efter index på Special:IndexPages eller via kategori:Index efter status. Sidorna i sidnamnrymden infogas sedan genom transkludering i huvudnamnrymden.

Obs! För att korrekturläsningsfunktionen ska fungera krävs att javascript är aktiverat i webbläsaren.

Sidan[redigera]

Navigering
föregående sida
nästa sida
till sidans index
Vid korrekturläsning ska menyraden ha några extra knappar
Visar eller döljer sidhuvud och sidfot. I dessa fält läggs text som inte hör till källtexten och som inte ska transkluderas.
Zoomar ut bilden
Återställer zoomen till ursprungsläget
Zoomar in bilden
Växlar mellan ha faksimilbilden åt höger eller ovanför texten

Tips och råd[redigera]

Mer tips finns på Wikisource:Redigering
  • Avstavade ord skrivs ihop. Om ett ord blivit avstavat över två sidor: Kopiera den första delen av ordet och flytta över det till nästa sida.
    • Om ett en sida slutar med ett bindestreck som ska behållas som i "vår- [och höstdagjämning]" måste bindestrecket ersättas med {{-}}.
  • Behåll radbrytningarna i texten och återställ helst dessa efter det att ett avstavat ord skrivits ihop. Det underlättar för nästa person som ska korrekturläsa sidan.
  • Nytt stycke markeras med en tom rad. Denna tomrad ska även läggas in då det nya stycket börjar på nästa sida, i detta fall läggs {{Tomrad}} efter sista stycket på föregående sida för att få fram styckebrytningen.
    • {{nop}} kan inte användas för detta på svenska Wikisource.
    • <p> går inte att använda då det stör efterföljande styckebrytningar.
  • Andra sätt för att markera stycken, som indragen förstarad, ska inte läggas in.
  • Om en sida börjar med viss wikisyntax som t ex en rubrik (== ==) behövs {{Tomrad}} för att rubriken ska visas korrekt vid transkluderingen.
  • Ändra inte annat än uppenbara stavfel och aldrig faktafel i texten. Använd i sådana fall mallen {{Rättelse}}.
  • Om verket innehåller en lista av tryckfel kan dessa korrigeringar införas i texten med mallen {{Korrektion}}.
  • Text som inte direkt hör till källtexten, som sidnummer, sidrubriker och arksignaturer, tas bort eller placeras i sidhuvud respektive sidfot vilka inte tas med vid en transkludering.
  • Lägg inte in andra <noinclude>-taggar i texten. Det kan göra att den övriga texten inte visas korrekt i redigeringsläget.
  • När en tabell sträcker sig över flera sidor så behöver tabellen artificiellt inledas och/eller avslutas på många av de enskilda indexsidorna genom att lägga till {| och |} på sidornas sidhuvud resp. sidfot. Detta för att undvika syntaxfel i och med att sidan inte innehåller en fullständig tabell. En ytterligare sak att tänka på vid flersidiga tabeller är att på alla indexsidor (utom den avslutande) ska den sista tabellradens avslut |- flyttas till nästa sida, som därför inleds med {{Tomrad}} följt av |-. Som ett exempel, se tabellen som sträcker sig över sidor 144, 145, 146, 147, 148, 149 och 150 i band 1 av Fjellstedts bibel.
  • Fotnoter som sträcker sig över flera sidor kan återges genom att använda <ref name="tex">nottext</ref> på första sidan och använda <ref follow="tex">mer nottext</ref> på den eller de följande sidorna.
  • Om en fotnot består av flera stycken så ska alla stycken utom det första inledas med <p> och avslutas med </p>. Ett alternativ för fall där det inte är möjligt, t.ex. om fotnoten sträcker sig över flera sidor, är mallen {{styckebrytning}}, som lägger vad som ser ut som en vanlig styckebrytning.
  • Om en flersidig fotnot innehåller flera stycken och det finns en sidbrytning mellan två stycken så ska det senare stycket inledas på den nya sidan med en tomrad innan taggen <p>. Se denna och efterföljande sida för ett exempel.
  • För vertikal text, se exempel här.
  • För text som går i 45 graders vinkel, se här
  • För fotnot inne i en fotnot, se här
  • För en numrerad lista som går över flera uppslag, se här och här
  • För spegelvända bokstäver, se här
  • Tabell med kantlinjer och hakparenteser, se här.
  • Ovanliga tecken: ꝛc eller ⁊c (et cetera), ℔ (pund), ₻ (mark)
  • OCR: Saknas OCR-text på en sida (i djvu eller pdf-filer), kan en sådan i de flesta fall skapas genom en OCR-knapp i verktygsraden som kan aktiveras på:
    Inställningar -> finesser -> Finess som i sidnamnrymden ger en extra knapp i verktygsraden som ocr-tolkar sidan i djvu- och pdf-filer.

Status[redigera]

Korrekturläsning av en sida kan ha fem olika statusnivåer:

  1. Utan text – Sidan saknar text och behöver inte korrekturläsas. Se kategori:Utan text.
  2. Ej korrekturläst – Texten har inte korrekturlästs och består av den råa OCR-texten. Se kategori:Ej korrekturläst.
  3. Ofullständigt – Hela sidan är inte korrekturläst och/eller att det är något problem som måste diskuteras. Se kategori:Ofullständigt. I Fjellstedts bibel kan denna nivå avse sidor som renskrivits, men som ännu inte korrekturlästs.
  4. Korrekturläst – Hela sidan har korrekturläst av en användare. Se kategori:Korrekturläst.
  5. Validerad – Den här sidan har korrekturlästs av flera personer. Se kategori:Validerat.

Femte nivån dyker inte upp förrän en sida markerats som korrekturläst, alltså nivå fyra. Dessutom kan inte den som markerat en sida som korrekturläst också markera den som Validerad.

Observera att man måste vara registrerad och inloggad för att kunna ändra statusnivå.

Schematisk arbetsgång
Utan text
Tom sida Ej korrekturläst Korrekturläst Validerad
Ofullständigt


Avancerade funktioner[redigera]

Lägga upp ett nytt verk[redigera]

Ladda upp filerna[redigera]

Det första som man behöver göra är att ladda upp de inskannade bilderna. Det gör man på Wikimedia Commons. Antingen laddar man upp dem var och en för sig eller samlade i en djvu- eller pdf-fil. Filerna bör namnges på ett sådant sätt att det är tydligt vad de innehåller. Det är också lämpligt att samla sidorna i en underkategori till Commons:Category:Scanned Swedish texts. Om till exempel Hjalmar Söderbergs Gamla minnen ska laddas upp, kan lämpliga namn på filerna vara "Söderberg, Gamla minnen, sida 1.jpg", o.s.v.

För tips om hantering av djvu-filer se Help:DjVu files på engelska Wikisource.

Indexsida[redigera]

För att bläddra mellan sidor behövs en indexsida som anger sidornas ordning. På indexsidan lägger man länkar till sidorna i nummerordning. För Söderbergs Gamla minnen skulle Index:Gamla minnen innehålla följande:

[[Sida:Söderberg, Gamla minnen, sida 1.jpg]]
[[Sida:Söderberg, Gamla minnen, sida 2.jpg]]
[[Sida:Söderberg, Gamla minnen, sida 3.jpg]]
[[Sida:Söderberg, Gamla minnen, sida 4.jpg]]
[[Sida:Söderberg, Gamla minnen, sida 5.jpg]]
o.s.v.

pagelist-kommandot[redigera]

På indexsidor för djvu- och pdf-filer används <pagelist/> för att länka till sidorna. Namnet på indexsidan måste då matcha djvu-filens namn t. ex. Index:Gamla minnen.djvu.

Syntax
<pagelist from=X to=Y Z=foo AtoB=bar />

där X, Y, Z, A, B är nummer på sidor.

"from...to" parametrarna definierar ett sidintervall. (Standard är att alla sidor listas. Parametrarna behövs endast om bara en del av djvun ska användas.)

Exempel:

<pagelist from=10 to=100 />
Verso och Recto

"'AtoB'"-parametern ger en särskild stil på ett sidintervall.

Stilparametrar kan också ges till en enda sida. tillgängliga stilar är:

  • roman (romerska siffror med gemener),
  • highroman (romerska siffror med versaler),
  • empty (Sidan länkas inte).
  • folio: ark- eller folio-paginering . framsidan r "recto", baksidan v "verso". 1to4=folio ger: 1r 1v 2r 2v
  • folioroman: foliopaginering med romerska siffror i gemener: (ir iv iir iiv)
  • foliohighroman: foliopaginering med romerska siffror i versaler: (Ir Iv IIr IIv)

Annan text visas som sidlänkar.

Exempel:

<pagelist 1to10="roman" 11="Förord"/>

I detta exempel, är '1to10' ett intervall och '11' är en enskild sida.

Det är möjligt att definiera överlappande intervall eller att modifiera en enskild sida inom ett intervall. Exempel:

<pagelist 1to5="empty" 3to10="roman"  />

Räkneverk: om en numerisk parameter ges till ett sidnummer sätts sidräknaren till detta värde. Exempel:

<pagelist 1to10="roman" 11=1 />

Klart för att korrekturläsning[redigera]

Korrekturläsningen görs sedan på de sidor som länkas till på indexsidan. Den korrekturlästa texten kan sedan inkluderas på verkets sida. När ett verk är fullständigt korrekturläst kan sidorna låsas av en administratör.

Se även[redigera]

Transkludering[redigera]

Sidorna anropas sedan i en text i huvudnamnrymden genom transkludering, som en mall, i dubbla klammerparenteser. I ovannämnda exempel skulle Söderbergs Gamla minnen läggas i texten Gamla minnen och då börja:

{{Titel|Gamla minnen|Hjalmar Söderberg}}
{{Sida:Söderberg, Gamla minnen, sida 1.jpg}}
{{Sida:Söderberg, Gamla minnen, sida 2.jpg}}
{{Sida:Söderberg, Gamla minnen, sida 3.jpg}}
{{Sida:Söderberg, Gamla minnen, sida 4.jpg}}
{{Sida:Söderberg, Gamla minnen, sida 5.jpg}}
o.s.v.

Det finns även en mall {{sida}} som kan användas som även länkar tillbaka till korrekturläsningssidan. Med mallen blir utseende istället:

{{Titel|Gamla minnen|Hjalmar Söderberg}}
{{Sida|Söderberg, Gamla minnen, sida 1.jpg|num=1}}
{{Sida|Söderberg, Gamla minnen, sida 2.jpg|num=2}}
{{Sida|Söderberg, Gamla minnen, sida 3.jpg|num=3}}
{{Sida|Söderberg, Gamla minnen, sida 4.jpg|num=4}}
{{Sida|Söderberg, Gamla minnen, sida 5.jpg|num=5}}
o.s.v.

Använda pages-kommandot[redigera]

Ett tredje sätt att transkludera sidor är hjälp av <pages/> vilket också lägger in länkar till korrekturläsningssidorna, sidnumren tas från indexsidan.

Syntax

Om det är djvu-index, ska parametrarna vara heltal:

<pages index="Gamla minnen.djvu" from=100 to=200 />. 

I övriga index ska parametrarna vara sidnamn:

<pages index="Gamla minnen" from="Gamla minnen sid 1.jpg" to="Gamla minnen sid 15.jpg" />. 

Transkludering av sektioner är möjligt för första och sista sidan:

<pages index="Gamla minnen.djvu" from=100 to=200 fromsection=sektion2 tosection=sektion1 />.

Om inte alla sidor i ett intervall ska transkluderas finns några särskilda parametrar:

Step

Transkluderar var n:te sida i ett intervall. Till exempel:

<pages index="Gamla minnen.djvu" from=1 to=10 step=2 /> visar sida 1, 3, 5, 7, 9.
exclude

Transkluderar inte angivna sidor. Till exempel:

<pages index="Gamla minnen.djvu" from=1 to=10 exclude="2-5,9" /> visar sida 1, 6, 7, 8, 10.
include

Transkluderar endast angivna sidor. Till exempel:

<pages index="Gamla minnen.djvu" include="2-5,9" /> visar sida 2, 3, 4, 5, 9.

Parametrarna kan kombineras med varandra:

<pages index="Gamla minnen.djvu" from=1 to=10 include="31" exclude="2-4" step="2" /> visar sida 1, 5, 7, 9, 31.
Titelmall
  • En titelmall för sidan kan läggas in i <pages/> genom att skriva "header=1" där parametrarna hämtas från indexsidan. En parameter från indexsidan kan dock skrivas över genom att ange ett nytt värde i "pages"-taggen. t. ex.
<pages index="Gamla minnen.djvu" header=1 titel="Söderbergs minnen" />

De parametrar som går att ändra är:

  • titel=[titel]
  • upphovsman=[författare]
  • oversattare=[översättare]
  • current=[undertitel]
  • prev=[förra (sidan)]
  • next=[nästa (sida)]
  • kommentar=[kommentar (till verket)]

Delvis transkludering[redigera]

Om ett logiskt avsnitt, som ett kapitel, slutar i mitten av en sida, kan det bli nödvändigt att transkludera endast den relevanta delen av sidan. Detta kan uppnås genom att använda Labeled Section Transclusion (LST). Man märker då upp två eller flera delar av sidan (t.ex. slutet av Del I och början på Del II). När sidan ska transkluderas, anropas endast den relevanta delen av sidan, snarare än hela sidan genom att använda LST-syntax.

Infoga följande syntax i den korrekturlästa texten för att märka upp slutet på Del I och början på Del II (där båda är på samma sida):

  • <section begin=Del I />[Här är Del I]<section end=Del I />
  • <section begin=Del II />[Här är Del II.]<section end=Del II />

När slutet på Del I och början på Del II ska anropas i den hela, oavbrutna versionen av de två avsnitten används följande syntax:

Med {{sida}} blir utseendet:

  • {{Sida|[sidans namn]|section=Del I}}
  • {{Sida|[sidans namn]|section=Del II}}

Med section-parser blir istället utseendet:

  • {{#section:[sidans namn]|Del I}}
  • {{#section:[sidans namn]|Del II}}


Exempel[redigera]

Om till exempel andra kapitlet av Söderbergs Gamla minnen skulle börja mitt på sidan 7:

<section begin=Kapitel 1 />[Slutet av kapitel 1]<section end=Kapitel 1 />
<section begin=Kapitel 2 />[Början på kapitel 2]<section end=Kapitel 2 />

Första delen kan då anropas på Gamla minnen/Kapitel 1:

  • {{Sida|Söderberg, Gamla minnen, sida 7.jpg|section=Kapitel 1|num=7}}

eller med section-parser:

  • {{#section:Sida:Söderberg, Gamla minnen, sida 7.jpg|Kapitel 1}}

Andra delen på Gamla minnen/Kapitel 2:

  • {{Sida|Söderberg, Gamla minnen, sida 7.jpg|section=Kapitel 2|num=7}}

eller med section-parser:

  • {{#section:Sida:Söderberg, Gamla minnen, sida 7.jpg|Kapitel 2}}

Sektioner kan även transkluderas med hjälp <pages /> kommandot.

Bakgrund[redigera]

Wikisource grundades 2003. De första försöken med elektronisk faksimil gjordes hösten 2005. Snart efteråt infördes en utökning av MediaWiki-programvaran som kallas Proofread Page extension och det är den som används idag. Systemet tillåter kontinuerlig korrekturläsning, vilket betyder att texten aldrig blir slutgiltig. Man kan alltid återvända till texten och rätta ytterligare ett fel.

ProofreadPage-tillägget gör det möjligt att visa text jämsides med en inscannad bild av originalet. Det har följande fördelar:

  • Trovärdighet: det gör det möjligt för Wikisource att garantera att texten överensstämmer med den inscannade källan.
  • Utökade samarbetsmöjligheter: texter kan korrekturläsas och fel kan fixas av vem som helst, inte bara de som har tillgång till boken.
  • Säkerhet: texten skyddas bättre mot vandalism.
  • Ingen begränsning för visning: en bok kan visas på två olika sätt utan att data dupliceras:
  1. som en serie sidor. Varje sida är en kolumn med OCR-text och en kolumn med det scannade originalet. Underlättar korrekturläsning och redigering.
  2. nedbruten i sin logiska organisation (kapitel, dikter, etc) genom transkludering. Underlättar läsning.

Statistik[redigera]

En tabell över den historiska utvecklingen av korrekturläsningen på Wikisource finns på Wikisource:Korrekturläsning/statistik

En sida för statistik för korrekturläsning på alla språkversioner av Wikisource finns här: Korrekturläsningsstatistiksida (under uppbyggnad).

Aktuell statistik
Datum Indexsidor Ej korrekturläst Ofullständigt Korrekturläst Utan text Validerat Totalt
2024-03-19 973 15 933 186 81 474 6 030 37 412 141 035
37412 81474   15933 6030

Se även[redigera]