Långsam Finereader
Långsam Finereader
Jag kör nu Finereader Professional version 10 (ett OCR-program) på min laptop, och tycker att det går förfärligt långsamt. Men vad är normal hastighet och hur mäter man det? Den stod 29 sekunder och tuggade på den här bilden (ladda hem "full resolution JPEG" och prova). Andra sidor i samma bok tar 13-16 sekunder, men även det känns onödigt långsamt. Borde det inte gå på 3-5 sekunder eller mindre?
Just den här bilden tog bara ngn sekund med min dator idag. (Kanske 2 med mönsterigenkänning.)
Finns det dåligt med minne i datorn, så kan det ta betydligt mer tid...
Datorn har 2 GB RAM, så det kan inte vara minnesbrist. Men programmet var inställt på "thorough reading". När jag ändrade detta till "fast reading" blev tolkningen snabbare (2-4 sekunder per sida) utan att kvaliteten försämrades. Thorough reading sägs i dokumentationen vara bättre på komplicerad tabell-layout, men "fast" tycks vara tillräckligt bra för de tabeller och layoutvarianter som förekommer i den här boken.
Men när jag ska "öppna" de inscannade sidorna till en ny bok, så tar detta 10-15 sekunder per sida. Även det måste väl gå att klara snabbare?
Att "Anaysera" en sida, brukar ta nästan lika lång tid som att tolka den. (Med analysera menas då att automatiskt räkna ut vilka fält som ska tolkas som text/bild/tabell etc, och avgöra om bilden är uppdelad på kolumner och om det finns sidhuvud/fot.)
Ja, men analysen av fält gör jag samtidigt med tolkningen, och det går fort nu. Men att öppna bilderna tar lång tid, oavsett om jag har "enable preprosessing" (deskew, det vill säga automatisk rotering av sneda sidor) påslaget eller inte. Det är alltså inte heller deskew som tar tid, utan något annat.
Att öppna TIFF-bilder (600 dpi bitonal, TIFF G4) går snabbt, men JPEG (300 dpi färg) går obegripligt mycket segare.