Hoppa till innehållet

Ämne på Wikisource:Mötesplatsen/Arkiv 2011

LA2 (diskussionbidrag)

Vi är nu inte långt ifrån att de röda (med rå OCR-text, ännu ej korrekturlästa) sidorna hamnar i minoritet (graf, tabell). De har sedan i somras, då V85 lade in många norska böcker, legat konstant omkring 11.500–12.000 men har på senaste tiden sjunkit något till 11.375, samtidigt som totala antalet faksimilsidor har vuxit till 22.600. Tillväxten sker främst genom att nya sidor korrekturläses samtidigt som de läggs in. De gula+gröna passerade nyligen 10.000 och över 400 har tillkommit senaste veckan.

Om röda sidor har någorlunda god OCR-kvalitet, så är det kanske ingen större brådska att korrekturläsa texten. En större brist är väl att texten inte transkluderas till sidor i huvudnamnrymden; den enda sökträffen ligger i namnrymden Sida. Ett sådant exempel med mycket god OCR-kvalitet på de röda sidorna är Index:Illustrerad Verldshistoria.

En annan aspekt är att de många röda sidorna markerar ett påbörjat men inte avslutat arbete, som ger hela Wikisource ett intryck av ostädat skrivbord i stället för en prydlig bokhylla. Jag är själv bättre på att påbörja än på att avsluta, så jag vill inte kasta sten i glashus. Men kanske borde vi prioritera att få några fler böcker fullständigt korrekturlästa (åtminstone gula, om än inte gröna).

Lavallen (diskussionbidrag)

För mig är Illustrerad Verldshistoria ett sidoprojekt. Något jag tar till för att inte bli alltför insnöad på mina biblar. Förhoppningsvis ska det även ge lite användbara illustrationer på Commons, samt källmaterial för Wikipedia som biprodukt. Antalet 'röda sidor med usel OCR' hoppas jag ska så sakta försvinna. För mig är det viktigare att få bort dem än att korrläsa de 'röda sidorna med god OCR'. Sidorna i Index:Svenska medeltidens bibel-arbeten (1853).djvu ser närmast oläsliga ut, men är man ovan vid 1400-talssvenska så är de sidorna nästan det även efter korrläsning.

Det kanske vore en tanke att inbjuda de som är nybörjare att börja med att Validera texter. Det är lättsammare, och kräver inte att man tar ansvar för hur texterna ska se ut stilmässigt.

Det vore lite småtrevligt att hitta ett verktyg som i ett index identiferar 'otranskluderade sidor'. Vissa sidor kommer aldrig och ska aldrig transkluderas, men det vore synd om goda sidor förblir otranskluderade för att ingen observerar dem. WhatLinkshere-verktyget som används i DotNetWikiBot är lite trubbigt mot de instrument (Index-sidor med djvu/pdf och pages-parsern) som vi har här på Wikisource, så jag kan idag inte bygga något utifrån det.

LA2 (diskussionbidrag)

Fast nu när du lade in Nils Holgersson, så steg de röda sidornas antal över 11.500 igen. Är det en naturlag att vi hamnar däromkring?

Lavallen (diskussionbidrag)
LA2 (diskussionbidrag)

Ja, man vet ju aldrig hur korrekt siffrorna är. Men trots att Nils Holgersson har lagts in med röda sidor, så utgör de röda nu mindre än hälften. Och antalet korrekturlästa (gula + gröna) har passerat 11.000 bara nio dagar efter att vi passerade 10.000.

Lavallen (diskussionbidrag)

Helt otroligt vad ett par extra flitiga användare kan göra för vår statistik!!!