OCR-en som du just nu lägger in för Nils Holgersson är förskjuten med flera sidor.
Ämne på Användardiskussion:Innocent bystander/LT
Utseende
Flera sidor? - Jag observerade just att det var en sida fel, innan jag stoppade. Ska kika på det!
Nej, jag såg fel. Jag tittade på det OCR-tolkade sidnumret (som är fel) och inte på texten (som är rätt).
Verkar ha blvit ngn konstig förskjutning när jag stoppade in djvu-filen in i Finereader. - Vissa tomma sidor har dublerats. - Jag försöker kompensera det...
Det hann bli 6 sidors förskjutning på slutet av boken.
Det blev två bilder i Finereader av vissa plancher, därav den här slagsidan, en märklig bugg.
Och samma bugg verkar finnas i band 5, det är ju hur underbart som helst! F säger att det finns 455 sidor i filen, när det bara finns 447...
Verkligen en märklig bugg, men det verkar ju ofta vara strul med bilder i Google books.
Jag fick fram en djvu som saknar jpg-bilderna (själva planscherna) i filen i mina konverteringsförsök. Säg till om du tror att har någon användning för den så kan jag tillfälligt ladda upp band 2 lokalt här på Wikisource.
Nejdå, det skulle ge i princip samma problem. OCR-en läggs i txt-filer med numrering 0001-0255 på min dator. Problemet kommer när den siffran inte stämmer med sidnamnet här ...djvu/X
Problemet uppkommer av att Finereader vrider en del av de sidor som är ställda upp. Det gör att den vridna sidan tar två sidors plats i datorn, och numreringen blir korrupt.
OK, så det är sidor där texten är roterad som är problemet. Då är det ju ingen idé.