Wikisourcediskussion:Korrekturläsning/statistik

Sidans innehåll stöds inte på andra språk.
Från Wikisource, det fria biblioteket.

Det verkar som om sidor markerade utan text inte läggs till i totalen. // Wellparp 18 juni 2009 kl. 23.35 (CEST)[svara]

Allting i mallen substas in i nya rader efter förlagan mellan de två ####-raderna. Därefter det måste eventuella förändringar göras manuellt. Jag har nu uppdaterat denna så att den även räknar med Utan text-sidorna så om du nu lägger in en ny rad ska det fungera.--Thurs 18 juni 2009 kl. 23.49 (CEST)[svara]
Blev något fel fungerar inte riktigt än--Thurs 18 juni 2009 kl. 23.53 (CEST)/Nu bör alla ställen vara uppdaterade//--Thurs 19 juni 2009 kl. 00.04 (CEST)[svara]

Botgöra[redigera]

w:Användare:MickeBot gör liknande uppdateringar dagligen på wikipedia. Ska vi höra om Micke skulle kunna tänka sig att låta sin bot göra liknande arbete på denna sida vid ungefär samma tidpunkt varje vecka? -- Lavallen 23 juli 2009 kl. 18.34 (CEST)[svara]

Det låter som en bra idé. Obelix 23 juli 2009 kl. 20.44 (CEST)[svara]
Micke har tackat ja, så det som krävs nu är att vi här kommer överens! -- Lavallen 25 juli 2009 kl. 18.20 (CEST)[svara]
Men vad är problemet? Och varför inte göra daglig uppdateringar här liksom på WP?--IP7869 25 juli 2009 kl. 19.55 (CEST)[svara]
Om en bot gör jobbet automatiskt behöver ingen känna sig tvungen att komma hit och göra jobbet. Om sedan statistiken uppdateras vid nästan exakt samma intervall varje gång blir den intressantare att följa.
Rent tekniskt borde det inte vara några problem att uppdatera 1-2 ggr per dygn som viss statistik hos wikipedia, men jag vet inte om vi har sådan aktivitet här att det är motiverat. -- Lavallen 25 juli 2009 kl. 20.15 (CEST)[svara]
Än så länge borde en gång per vecka eller månad räcka. // Wellparp 27 juli 2009 kl. 11.20 (CEST)[svara]
Ja, jo, men frågan kvarstår, ska vi bjuda in Micke? -- Lavallen 27 juli 2009 kl. 12.00 (CEST)[svara]
Sidan är gjord för att kunna uppdateras automatiskt eller halvautomatiskt. Om nu Micke är villig att göra detta är det väl alldeles utmärkt. För närvarande tycker jag att det räcker med att uppdatera statistiken en eller högst två gånger i veckan. Förslagsvis strax efter midnatt mellan söndag och måndag.--Thurs 1 augusti 2009 kl. 00.21 (CEST)[svara]
Nu har jag ställt in roboten så att den uppdaterar statistiken varje måndag kl. 00.00. Om ni vill ha tätare intervaller eller vid en annan tidpunkt kan ni säga till mig på WP. Om ni vill ge roboten flagga så får ni gärna det (men det är inget krav). MiCkE 5 augusti 2009 kl. 17.02 (CEST)[svara]
Finnemang! Vi tackar! -- Lavallen 5 augusti 2009 kl. 17.31 (CEST)[svara]

Vad roboten gör[redigera]

Jag kanske skulle påpeka att roboten letar efter en siffra som följs av mallanropet: {{User:MickeBot/tommall}}. Sedan ersätts det mallanropet med innehållet i en annan mall: {{subst:User:MickeBot/mall}}. Det betyder att om man av någon anledning vill uppdatera statistiken manuellt så måste man också flytta anropet av den tomma mallen så att det hamnar sist på raden utan mellanslag emellan den och den föregående siffran. Skulle man råka ha två anrop av mallen som matchar sökkriteriet så kommer statistiken att få två likadana rader. MiCkE 6 augusti 2009 kl. 08.45 (CEST)[svara]

Norska boomen[redigera]

Tack vare "Nasjonalbiblioteket" har vi haft en väldig anströmning av material för korrekturläsning. Vi har passerat spanskspråkiga Wikisource när det gäller antalet sidor i sidnamnrymden. Andelen korrekturlästa sídor sladdar dock en hel del, men det tar den tid den tar... -- Lavallen 8 mars 2010 kl. 16.01 (CET)[svara]

Vi har nu passerat även hy: (vad det nu är för språk). Vi ligger dock som sagt lite efter i korrekturläsning och validering. Men detta är ingen tävling. -- Lavallen 25 mars 2010 kl. 16.31 (CET)[svara]
Jag läste för några dagar sedan denna artikel. Vi kanske får en svensk boom framöver. -- Simsalabim 25 mars 2010 kl. 18.49 (CET)[svara]
Inressant, intressant!!! -- Lavallen 25 mars 2010 kl. 19.15 (CET)[svara]
[hy:] tror jag är armeniska Wikisource. Nu har vi också passerat 10 000 sidor i sidnamnrymden.--Thurs 5 april 2010 kl. 00.17 (CEST)[svara]
I dagarna har vi gått om italienska Wikisource vad gäller antalet validerade sidor. Låt oss hålla dem bakom oss! Diupwijk 12 juni 2010 kl. 22.21 (CEST)[svara]
Vi är snart förbi hy också, det ser dessutom ut som det vore rimligt att vi tar oss förbi es: och it: också när det gäller hur högt vi ligger i tabellen. Tabellen verkar närmligen följa mönstret 2*validerade+1*korrekturlästa. pl: däremot har högre takt än oss, och de drar istället ifrån... -- Lavallen 13 juni 2010 kl. 19.17 (CEST)[svara]
Fast nu har vi faktiskt gått om pl (om än knappt. Vi byter kanske platser med varandra titt som tätt?). Diupwijk 14 juli 2010 kl. 12.00 (CEST)[svara]
pl:'s race verkar bygga på att man lägger över redan befintliga dokument under korrekturläsning, så deras tillväxt dämpar sig troligen snart. -- Lavallen 14 juli 2010 kl. 12.39 (CEST)[svara]
Just nu har vi 3500 enkelt korrekturlästa sidor + 1901 validerade (à 2 poäng) = 7302 poäng och har därmed gått förbi spanska Wikisource. Det är nu bara fyra språk av Wikisource som är större (franska, tyska, engelska, italienska) än svenska enligt detta sätt att mäta. Det visar att ett par regniga sommardagar och lite god vilja kan få fart på det här projektet. Men vi är allför få och behöver bli fler. Google scannar 10 eller 20 miljoner böcker på tio år och det finns ingen plan för hur en bråkdel av dessa sak bli korrekturlästa, varken hos Google, Wikisource, Project Gutenberg eller Internet Archive. De senast korrekturlästa sidorna har gått fort på grund av riktigt bra OCR. Om vi hade arbetat vidare med det som kom från NB.no hade det gått mycket långsammare. Kanske ligger lösningen i ännu bättre OCR, så att korrekturläsningen blir helt överflödig. --LA2 18 juli 2010 kl. 02.15 (CEST)[svara]
En uppföljningsartikel om skanningsrobotarna. -- Simsalabim 31 augusti 2010 kl. 12.42 (CEST)[svara]
"ett par regniga sommardagar", jag trodde du skämtade!!! Men nu ser jag rubrikerna i www.aftonbladet.se: "Översvämningar i södra Sverige", nja det har vi inte här. Det regnade duktigt inatt, men det har bara gjort värmen idag mer bastulik... -- Lavallen 18 juli 2010 kl. 12.15 (CEST)[svara]

Trenden[redigera]

Den 1/3 hade vi samlat ihop 2507 poäng (enligt statistiken för Special:IndexPages 2p för validerade sidor och 1 p för korrekturlästa)

På 77 dagar har vi mer än fördubblat den siffran och då samlat drygt 30p/dag! Det är bara en:, fr:, de: och pl: som kan matcha sådana siffror, språk som är mycket större än det svenska. -- Lavallen 17 maj 2010 kl. 22.14 (CEST)[svara]

Ej validerade sidor[redigera]

Jag försöker hitta en kategori för 'Ej validerade sidor' (gula sidor), som ju finns några kvar som är nästan ett par år gamla. Jag kan inte ens lista ut vilka verk det rör sig om, tyvärr.--IP7869 11 oktober 2010 kl. 20.05 (CEST)[svara]

Kategori:Korrekturläst du letar efter kanske? - Lavallen 11 oktober 2010 kl. 20.15 (CEST)[svara]
Finns också Kategori:Korrekturlästa index som innehåller tex Index:Maskinernas sociala betydelse som legat länge utan validering. -- Lavallen 12 oktober 2010 kl. 14.07 (CEST)[svara]
Tack! Väldigt bra med folk som tänker ut sådana där listiga ting. :) Precis sådant stöd jag behöver. (Attans små och många bokstäver urghh), men varje sådan sida ger ju 2p i konkurrensen.--IP7869 13 oktober 2010 kl. 10.54 (CEST)[svara]

Användare:Innocent timebot[redigera]

Jag har skapat ovanstående konto för att fixa den här uppdateringen.

Jag har ställt in så att ett skript går igång klockan 00:10 på måndagar. Återstår att se om det fungerar...

Uppdateringen klarar skriptet (kollat), men frågan är om det går igång inatt. Jag är dock alldeles för kvällstrött för att stanna kvar och se hur/om det fungerar.

Var inte rädda att blockera/begära blockering om det löper amok... -- Lavallen 7 november 2010 kl. 19.42 (CET)[svara]

Nej, det fungerade uppenbarligen inte. Skriptet som så fungerar, men jag lyckades inte aktivera det automatiskt inatt. -- Lavallen 8 november 2010 kl. 07.47 (CET)[svara]
Nu har jag inte testat i Windows 7, men du måste i tidigare versioner av Windows ha ett lösenord på ditt användarkonto för att kunna schemalägga program i schemaläggaren. Tweakui kan sedan göra att du automatiskt loggas in så du slipper stanna upp för att mata in lösenordet när du väl ska använda datorn. GameOn 8 november 2010 kl. 11.55 (CET)[svara]
Meddelandet jag fick när jag kom ner till datorn på morgonen var att "BotScript.exe har slutat fungera". Jag trodde att jag hade stängt av utloggningen genom skärm-/energisparfunktionerna, men tydligen inte. -- Lavallen 8 november 2010 kl. 12.00 (CET)[svara]
Ah, ja då kraschade den av någon anledning. Redigeringskonflikt har jag fått på svwp utan att någon annan redigerat i artikeln på länge så APIt är lite buggigt tycker jag. GameOn 8 november 2010 kl. 12.12 (CET)[svara]
Hur går det med skriptet? Statistiken har inte uppdaterats nu på natten/morgonen.--Thurs 29 november 2010 kl. 11.54 (CET)[svara]
Datorn har också måndag! :) -- Lavallen 29 november 2010 kl. 12.39 (CET)[svara]
OK, Jag har funnit en bugg vid första botkörningen: [1] Botten har ändrat {{User:MickeBot/tommall}} till {{byt:User:MickeBot/mall}} även i den kommenterade texten.--Thurs 29 november 2010 kl. 12.46 (CET)[svara]
Halva buggen löst (det finns två mallar innanför kommentarerna). Får fundera på den... -- Lavallen 29 november 2010 kl. 13.16 (CET)[svara]
Skulle det vara svårt att lösa är det ju inte direkt nödvändigt att det står mer än en gång.--Thurs 29 november 2010 kl. 13.50 (CET)[svara]
Det är andra förekomsten som är problemet... Vi får ta det när jag kommer tillbaka, jag måste nu med mycket kort varsel åka väldigt långt bort, pga familjeärende. -- Lavallen 29 november 2010 kl. 14.00 (CET)[svara]
Jag har förenklat instruktionen så det bör inte vara något problem i så fall. Men det är ju inget stort problem till att börja med så ta det när du har tid--Thurs 29 november 2010 kl. 15.08 (CET).[svara]
Nu har jag inte Lavallens kod för just denna, men GameOnBot vikarierar på svwp för Innocent Bot, om jag förstått insturktionerna rätt är det inte så mycket som ska göras men är det önskvärt att jag sätter boten på det så länge? GameOn 29 november 2010 kl. 19.54 (CET)[svara]
Jag tycker att du kan avvakta med det tills vidare. Sidan uppdateras bara en gång per vecka och är enkel att uppdatera manuellt om inte boten skulle vara igång.--Thurs 29 november 2010 kl. 20.41 (CET)[svara]
Ok. Säg till mig om det skulle behövas på min diskussionssida eftersom jag lite för ofta glömmer platser jag redigerat lite på. Eller glömmer är väl inte rätt ord, men jag tittar inte till dem tillräckligt snabbt alla gånger i alla fall. GameOn 30 november 2010 kl. 07.05 (CET)[svara]
Funderat lite och det borde inte vara några problem att få koden att manipulera bara den första förekomsten av mallen. Man kan då tillåta hur många förekomster som helst, innanför eller utanför kommentarer.
Det svåra har främst visat sig vara att få datorn att aktivera skriptet vid rätt klockslag, utan att "skriptet slutar fungera". -- Lavallen 1 december 2010 kl. 18.51 (CET)[svara]
Här finns nu det enkla skript som jag använder. Den byter bara den första mallen, oavsett om denna finns inom <!-- --> eller inte. -- Lavallen 5 december 2010 kl. 09.16 (CET)[svara]
OK, det är ju bra att ha om någon annan skulle behöva ta över uppdateringarna.--Thurs 5 december 2010 kl. 13.00 (CET)[svara]

LA2's järnlag[redigera]

Det verkar definitivt ligga ngt i vad LA2 sa om att det inte går att få siffran över icke-korrlästa sidor att röra sig ner under 12000. Vid 11000 finns det en betongmur! :) -- Lavallen 23 januari 2012 kl. 09.50 (CET)[svara]

Det är onekligen märkligt att den siffran varit så pass stabil under så lång tid. Men grunden är väl att de aktiva korrekturläsarna lägger in nya sidor i ungefär samma takt som de korrekturläser sidor. När man är klar med ett verk lägger man upp ett nytt och så vidare.--Thurs 23 januari 2012 kl. 12.10 (CET)[svara]

Esws[redigera]

I antal sidor har vi nu gått om spanska upplagan. Vi ligger dock långt efter när det gäller att korrläsa sidorna. Vet inte om det fortfarande är chilenska dokument som är enda drivkraften bakom spanska statistiken, men aktiveten där förekommer fortfarande ryckvis. -- Lavallen (diskussion) 8 oktober 2012 kl. 09.39 (CEST)[svara]

Om man tittar på deras så tycks de nuförtiden vara rätt lika oss. En handfull användare som jobbar med sina egna index/projekt.--Thurs (diskussion) 8 oktober 2012 kl. 21.34 (CEST)[svara]

Uppdatering[redigera]

Jag kommer upphöra att uppdatera den här sidan för nu! Om någon fortfarande är intresserad av statistiken är den välkommen att fortsätta med uppdateringarna. Instruktioner finns på statistiksidan.--Thurs (diskussion) 21 oktober 2014 kl. 20.43 (CEST)[svara]

Ökad takt[redigera]

Nu vid halvårsskiftet 2021 har antalet gula + gröna sidor nått över 80.000 (56.166 + 24.176 = 80.342), vilket är dubbelt så stort som fem år tidigare. Och de senaste fyra månaderna har den siffran ökat med mer än 1000 (mellan 1263 och 1994) varje månad, tydligen för första gången i svenska Wikisource historia. Så vitt jag kan se, beror ökningen i takten på en handfull nya medarbetare som kommit hit från Projekt Runeberg, vars korrekturläsning stängdes av i december 2020. Projekt Runeberg har i alla år haft en korrekturläsning av lite drygt 20.000 sidor, väldigt jämnt under året, vilket blir 1667 sidor per månad. Det är ett mysterium varför siffran aldrig har nått högre. --LA2 (diskussion) 3 juli 2021 kl. 23.05 (CEST)[svara]