Hoppa till innehållet

Wikisource:Mötesplatsen/Arkiv 2011

Om denna diskussion

Inte redigerbar

Miniprojekt Darwin avslutat

I de sista skälvande timmarna av 2011 känns det bra att kunna förklara Miniprojekt Darwin (som Thurs en gång kallade det) avslutat. Från början hade jag inte tänkt att ta mig an Darwins alla fria verk, men när jag kunde lägga mina vantar på "Om arternas uppkomst" så började en tanke gro. Nu är i alla fall de tre verken

i hamn. Gott nytt år på er! -- Simsalabim 31 december 2011 kl. 16.26 (CET)

Grattis! - Special:IndexPages har haft 3 Darwin-texter i topp-5 ett tag. Nu kanske det finns en chans att mina band hinner komma ifatt lite. :) -- Lavallen 31 december 2011 kl. 16.58 (CET)
Gott slut för "Miniprojekt Darwin" och ett gott nytt år till alla från mig också! --Thurs 31 december 2011 kl. 21.07 (CET)

Unbindery

"Unbindery" är ännu ett system för korrekturläsning, värt att hålla ögonen på, http://bencrowder.net/blog/category/unbindery/ --LA2 31 december 2011 kl. 00.00 (CET)

7000?

Med Simsalabims uppladdning av "Arbetare" hamnade systemets sidräkning [NUMBEROFARTICLES] ovanför 7000-strecket: 7 079.

Den siffran känns dock mindre och mindre pålitlig då den numera uppenbarligen också räknar in andra namnrymder som sidnamnrymden, (dock inte alla i den namnrymden då skulle vi ligga över 30 000 vid det här laget). Går man på korrekturläsningsstatistikens siffror hade vi 6 224 sidor i går varav 73 var förgreningssidor, vilket bör vara betydligt närmare verkligheten.

Är det så fall meningsfullt att använda sig av [NUMBEROFARTICLES] i fortsättningen, till exempel på huvudsidan, eftersom det i dagsläget inte är möjligt att förklara vad den siffran egentligen står för?--Thurs 28 december 2011 kl. 00.20 (CET)

Förutom huvudnamnrymden räknas sedan i juni 2011 (bugzilla:29172) författar-, index- samt sidnamnrymden som innehållssidor på alla Wikisource-språk. Diskussionen finns här Oldwikisource:Wikisource:Scriptorium#Include pages (and possibly indexes and authors) in official article count men det verkar inte ha fungerat riktigt som det var tänkt.--Thurs 28 december 2011 kl. 09.38 (CET)
(Sida, Författare, Index)
Märkligt! Vad krävs för att få det magiska ordet: PAGESINNAMESPACE: att fungera? -- Lavallen 28 december 2011 kl. 10.01 (CET)
Formellt skulle det väl gå igenom att begära på Bugzilla att $wgAllowSlowParserFunctions slås på men eftersom det inte verkar vara påslaget för någon wikimediawiki för att det är för kostsamt lär det väl inte vara så stor chans för oss heller. PAGESINNAMESPACE innefattar också omdirigeringarna så det ger ett för högt värde om inte dessa kan filtreras.--Thurs 28 december 2011 kl. 12.14 (CET)
Med bot skulle jag kunna använda detta API, som jag kör i princip samtidigt med att jag uppdaterar listan med sidor som saknar CR-mall. API't filtrerar bort omdirigeringar automatiskt. Med ett botflaggat konto kan man lista 5000 på ett enda anrop, så det är inget som tynger några servrar. Resultatet går att lägga in i en mall som anropas varhelstifrån man vill. Det kräver dock lite programmerande och är inget jag hinner idag. -- Lavallen 28 december 2011 kl. 14.00 (CET)
Det verkar vara en bra lösning på problemet.--Thurs 28 december 2011 kl. 21.16 (CET)
Kan 19 538[25-10-01] vara rätt antal? Detta funkar nu med {{Antalsidor}}. Mallen går att använda för att identifiera alla namnrymder som är kända för mig. Se koden för mallen... -- Lavallen 29 december 2011 kl. 14.11 (CET)
Tack, det var verkligen en snygg lösning. 6227 bör vara korrekt just nu med de 6225 från korrekturläsningsstatistiken från i morse och de två som jag lagt in efteråt. Det stämmer också om man kollar med Dynamic pagelist (6226 + 5)
--Thurs 29 december 2011 kl. 14.56 (CET)
Lagt upp källkoden till boten på malldisken. -- Lavallen 29 december 2011 kl. 15.07 (CET)
Enligt w:User:Fluff finns länkar till det magiska ordet på följande platser.
* [[:Wikisource:Huvudsida]] (fixat)
* [[:Wikisource:Mötesplatsen/Arkiv 2007]]
* [[:Användare:Erkan Yilmaz]]
* [[:Användare:Thogo]]
* [[:Användare:Bff]]
* [[:Användare:Anonymous Dissident]]
* [[:Användare:Wikitanvir]]
* [[:Användare:Dcljr]]
-- Lavallen 29 december 2011 kl. 16.14 (CET)
Förutom huvudsidan som är fixad är det m a o inget ställe vi behöver eller ens bör fixa.--Thurs 29 december 2011 kl. 17.49 (CET)

Open Call for 2012 Wikimedia Fellowship Applicants

I apologize that you are receiving this message in English. Please help translate it.

  • Do you want to help attract new contributors to Wikimedia projects?
  • Do you want to improve retention of our existing editors?
  • Do you want to strengthen our community by diversifying its base and increasing the overall number of excellent participants around the world?

The Wikimedia Foundation is seeking Community Fellows and project ideas for the Community Fellowship Program. A Fellowship is a temporary position at the Wikimedia Foundation in order to work on a specific project or set of projects. Submissions for 2012 are encouraged to focus on the theme of improving editor retention and increasing participation in Wikimedia projects. If interested, please submit a project idea or apply to be a fellow by January 15, 2012. Please visit https://meta.wikimedia.org/wiki/Wikimedia_Fellowships for more information.

Thanks!

--Siko Bouterse, Head of Community Fellowships, Wikimedia Foundation 22 december 2011 kl. 04.06 (CET)

Distributed via Global message delivery. (Wrong page? Fix here.)

Fragmenterad segmentering i ABBYY Finereader

Varför väljer OCR-programmet Finereader (version 10) att dela upp de två nedre vänstra textspalterna i massor av smårutor i stället för två stora? Är det något jag kan påverka genom inställningar i programmet? Det gör ju rätt till höger och upptill. Det handlar om den här sidan. --LA2 17 december 2011 kl. 22.59 (CET)

Något jag stöter på i Fjellstedt ibland - ja. Jag känner inte till några inställningar, andra än att man får göra sina "rutor" manuellt på dylika sidor. Det här är också förklaringen till att jag i vissa sidor har råkat växla plats mellan vänster- och högerspalten. -- Lavallen 18 december 2011 kl. 08.07 (CET)

Uppladdningsträff på Public domain day

Den 1 januari är det Public Domain Day. Det innebär att det är en massa verk där upphovsrätten som har gällt i 70 år går ut. 1 januari 2012 är det alltså alla som avled under 1941 som nu är fria för alla att använda.

För att hedra dem och låta deras verk leva vidare och göra nytta för allmänheten samlas vi till en uppladdningsträff. Dels ser vi till att verken kommer på plats på Wikimedia Commons, och dels att de kommer till rätta här på Wikisource. Vi håller till i det lilla konferensrummet på Wikimedia Sveriges kontor där vi får plats cirka 12 personer. Obligatorisk anmälan på Facebook eller info_attttt_wikimedia.se och först till kvarn gäller! --Ainali 15 december 2011 kl. 00.12 (CET)

Kollade vilka sidor som kan återställas och hittade: För trädets skull som av någon anledning inte blivit raderad. Nåja, det är kanske inte mycket lönt att radera när det återstår två veckor... Karin Boye är därmed ett namn. -- Lavallen 15 december 2011 kl. 09.13 (CET)
Tyvärr ligger det mesta av Karin Boyes produktion, förutom hennes första diktsamling "Moln", efter 1923 vilket innebär att det mesta blir en:URAA-fall. Även om vi bordlagt de verk som omfattas av URAA till HD-beslutet (juni 2012) är det knappast meningsfullt att nu lägga upp fler verk som omfattas av URAA till dess.
Hjalmar Söderbergs, som också blir fri nästa år, produktion ligger dock till en större del före 1923.--Thurs 16 december 2011 kl. 14.01 (CET)
Juni 2012, väldigt vad det drar ut på tiden.... -- Lavallen 16 december 2011 kl. 18.35 (CET)
Om någon tycker det tar för lång tid får vi väl ta upp frågan igen. Än så länge kan jag dock inte se att något förändrats.--Thurs 16 december 2011 kl. 22.24 (CET)
Artikeln på enwp om URAA saknade någon konkret sammanställning. Så kan någon kortfattat berätta vad den innebär? Är det att det ska vara 90 år efter skaparens död? I så fall borde det väl börja massraderas på commons? --Ainali 22 december 2011 kl. 22.35 (CET)
Det handlar om publicerade verk i Sverige som inte var fria 1/1 1996. De fick då ny upphovsrätt (i USA) och behåller den i 90 år från publicering, (om jag minns rätt). Commons har i väntan på domstolsutslaget struntat i lagen. WMF har varit mer restriktiv mot publicering av URAA-skyddade texter. -- Lavallen 23 december 2011 kl. 07.35 (CET)
DEn här lagen gäller förresten inte bara Sverige, men datumet kan variera med land om jag minns rätt. Observera att förhållandena i Sverige inte påverkas av detta. Sådana här texter är därför fria för Projekt Runeberg. -- Lavallen 23 december 2011 kl. 08.14 (CET)
Det är 95 år efter publiceringen som om gäller, om inte verket publicerades före 1923, då är det fritt genom en övergångsbestämmelse i den amerikanska upphovsrättslagstiftningen. Efter 1978 (tror jag) gäller andra bestämmelser men det har ingen praktisk betydelse på länge.--Thurs 23 december 2011 kl. 11.46 (CET)

Scripto

Scripto är ett tillägg till Mediawiki som gör att man kan transkribera dokument, vilket är ett annat namn för den korrekturläsning som vi gör i Wikisource. Programvaran är en rätt påhittig kombination av OpenLayers (zoom- och panoreringsfunktionen från OpenStreetMap, i stället för tillägget ProofreadPage) med wikiredigering. Den beskrivs på http://scripto.org/

För att prova den i aktion, hänvisas till brittiska War Department, vars arkiv är inscannat. Dock måste man först ansöka om att få ett konto. Det tog några dagar från min ansökan innan jag fick e-mail om att ett konto hade upprättats och jag kunde logga in med ett tillfälligt lösenord. Instruktioner finns på http://wardepartmentpapers.org/transcribe.php --LA2 14 december 2011 kl. 08.33 (CET)

Finereader online

För den som inte vill köpa ett OCR-program (Finereader Professional kostar €129), men ändå OCR:a lite snabbt och lätt, finns Finereader online, som är en webbtjänst. Man registrerar ett användarnamn och sedan betalar man (via kreditkort eller PayPal-konto) €3,50 (33 kr) för 50 sidor eller det dubbla för 200 sidor. Sedan kan man ladda upp inscannade bilder (en sida i taget som JPEG, eller en hel PDF eller Djvu) och väljer språk och filformat för resultatet. Efter en stund finns filen att avhämta. Om man väljer PDF som utformat, får man bild+text i samma fil, lämplig att ladda upp till Commons. Det går inte att göra några inställningar i övrigt. Det finns alltså inget avancerat användargränssnitt. --LA2 1 december 2011 kl. 19.07 (CET)

Det vore kanske mödan värt att testa vad man får fram om man kör ett större dokument i fraktur. Sådana har jag problem med här hemma pga datorns begränsningar. Jag anar att det inte går att träna upp ordförrådet till 1800-tals-svenska, men vore ändå intressant att se vilken kvalite det blir på det som kommer ut. -- Lavallen 2 december 2011 kl. 09.01 (CET)

ImageMap

Alex Brollo håller på att experimentera med "ImageMap" för sidor med spalter. Se det italienska exemplet it:Pagina:Vettura_a_vapore_del_signor_Dietz.djvu/1, där man i stället för OCR-text har en bild som är en klickbar ImageMap, som leder till redigering av olika delar av sidan. Detta extra steg är förstås omständigt, men i kärnan av idén finns kanske något att bygga vidare på. --LA2 30 november 2011 kl. 11.21 (CET)

Såg nu inläggen på mejl-listan. Kan inte säga att jag begriper så mycket... -- Lavallen 30 november 2011 kl. 19.00 (CET)
Har du en länk till inlägget? Spontant kan jag tänka att detta vore mest lämpligt för tidningar med en layout där olika artiklar finns i separata rutor på sidan. -- Simsalabim 30 november 2011 kl. 19.55 (CET)
Här tror jag. -- Lavallen 30 november 2011 kl. 20.55 (CET)
Tack. Det kanske finns ett frö till något i Brollos test. Annars är det en intressant fråga som LA2 ställer i tråden: Huruvida man kan visa boxen som omger ord i faksimilbilden (koordinaterna finns ju lagrade i djvu-filen). Jag tycker t.ex. att det vore värdefullt i korrläge om det ord där textmarkören för tillfället befinner sig i också lyses upp i faksimilbilden. Då skulle det bli enklare att stega sig igenom texten utan att förlora ens fokus när man hela tiden måste alternera blicken mellan bilden och texten. -- Simsalabim 30 november 2011 kl. 22.42 (CET)
Än så länge tycks det som att man måste dela upp sidan i separata bilder vilket nog kommer att bli en flaskhals för att använda denna Imagemap-funktion. Vi får väl se hur det utvecklar sig. Om man t ex kunde "Imagemappa" sidnamnrymden så att man automatiskt fick fram ett bildutsnitt och vidhörande OCR-text skulle det nog bli mer användbart.--Thurs 2 december 2011 kl. 18.29 (CET)

Länkstatistik

Jag försöker göra statistik över vilka externa sajter som Wikipedia (och även Wikisource) länkar till. Men jag vill undvika att räkna diskussionssidor och användarsidor. Borde jag enbart räkna huvudnamnrymden, eller bör jag även inkludera Sida:, Index: och Författare: ? Var har Wikisource sina viktiga externa länkar? För sv.wikisource ser antalet externa länkar ut enligt tabellen nedan. --LA2 28 november 2011 kl. 22.45 (CET)

 count(*) | page_namespace | ns_name              |
      429 |              0 |                      | Kommer att räknas
      210 |              1 | Diskussion           | Räknas inte
      454 |              2 | Användare            | Räknas inte
       85 |              3 | Användardiskussion   |
      299 |              4 | Wikisource           | Räknas inte. Projektsidorna kan innehålla långa listor av länkar, men de är avsedda för medarbetare och inte för läsare.
       27 |              5 | Wikisourcediskussion |
        1 |              7 | Fildiskussion        |
       10 |              8 | MediaWiki            |
        9 |              9 | MediaWiki-diskussion |
       23 |             10 | Mall                 | Räknas inte i mall-namnrymden, utan i sidorna där mallen används 
        4 |             11 | Malldiskussion       |
       10 |             14 | Kategori             |
       16 |             15 | Kategoridiskussion   |
      113 |             90 | Thread               |
       95 |            104 | Sida                 | Borde dessa 95 länkar räknas?
       26 |            105 | Siddiskussion        |
      160 |            106 | Författare           | Borde dessa 160 länkar räknas?
        2 |            107 | Författardiskussion  |
      303 |            108 | Index                | Borde dessa 303 länkar räknas?
       29 |            109 | Indexdiskussion      |
Länkar som direkt riktar sig mot läsarna finns det främst i författarnamnrymden, t ex till andra webbarkiv. Sidorna i sidnamnrymden ska ju i princip alltid transkluderas till huvudnamnrymden som mallarna och borde inte behöva räknas två gånger. I Index-namnrymden finns det främst "administrativa" externa länkar till Libris och filkällor t ex, jag vet inte om du räknar sådana som till för användare eller läsare.--Thurs 28 november 2011 kl. 23.31 (CET)
Jag skulle räkna index-länkarna som lite av både och. De är ofta viktiga som källinformation. -- Lavallen 29 november 2011 kl. 08.45 (CET)
Tack för input! Jag struntar således i Sida-namnrymden, men räknar in Index, Författare och (för Wikipedia) Portal, samt (för Commons) File. --LA2 29 november 2011 kl. 17.14 (CET)

Pages-kommandot

Finns det någon sida där de olika kommandona, eller vad man kallar det för, förklaras? Jag vet t.ex. att man med hjälp av "prev=" lägger till en länk till en föregående sida, men det skulle även vara intressant att kunna lägga till en kommentarslänk o.l. Diupwijk 26 november 2011 kl. 11.20 (CET)

Dokumentation är alltid trevligt! - JAg har inte ens hittat ngn på maskinöversatt tyska, vilket brukar vara det vanliga. -- Lavallen 26 november 2011 kl. 11.40 (CET)
Eftersom de här parametrarna definieras lokalt (i alla fall hittills) är det knappast meningsfullt med något central sida. Den dokumentation som finns finner man ¨på Wikisource:Korrekturläsning#Använda pages-kommandot. Vilka parametrar som kan ändras hos oss finner man i Mall:Proofreadpage header template:
  • titel=[Titel]
  • upphovsman=[författare]
  • oversattare=[översättare]
  • current=[undertitel]
  • prev=[förra (sidan)]
  • next=[nästa (sida)]
Det skulle kunna gå att lägga till en kommentar-parameter också men det kräver att man gör vissa ändringar i Mediawiki-namnrymden, det räcker inte med att lägga in den i Proofreadpage header template.--Thurs 26 november 2011 kl. 14.05 (CET)
Tack för svaret! Ok, synd med kommentarproblemet, men man kan ju alltid nyttja titelmallen istället. Diupwijk 29 november 2011 kl. 23.27 (CET)
Nu är det möjligt att lägga in en kommentar i pages-taggen med parametern "kommentar=" (exempel). Det går även att lägga in en kommentar på alla sidorna i ett verk på indexsidan.--Thurs 3 december 2011 kl. 16.32 (CET)
Tjusigt!! -- Lavallen 3 december 2011 kl. 17.41 (CET)
Snajsigt! Bra gjort. Det kommer säkerligen att bli använt. Diupwijk 4 december 2011 kl. 20.21 (CET)

Globala administratörer

En svenskspråkig användare är nu uppe för nyval som Global administratör, se: m:Steward requests/Global permissions. -- Lavallen 21 november 2011 kl. 11.20 (CET)

Du kallar väl inte på förstärkningar, eller? Haha. Nej, men det är en bra kandidat. Det är dessutom en fördel att ha en svensktalande g.a. De problem som jag har kunnat iakttaga med denna roll är att de agerar trots att de inte kan språket på den lokala wikin. Förhoppningsvis blir det problemet mindre nu. Diupwijk 26 november 2011 kl. 11.24 (CET)
Jag har inte sett dem agera alls här sedan jag kom hit. Jag har lockat till mig dem vid ett enda tillfälle när jag hittade ngt på b: eller q: som jag ville ha snabbraderat. (Riktigt snabbt allstå. - Inte vänta två dygn till en admin tittar förbi.) -- Lavallen 26 november 2011 kl. 11.48 (CET)
Och från häromdagen så är alltså Tegel ny global administratör. -- Lavallen 5 december 2011 kl. 10.03 (CET)

Temporär mötesplatssida vid LT-buggen i februari-april

Välkommen till Mötesplatsen

Mötesplatsen är det allmänna diskussionsforumet om svenska Wikisource.

Mötesplatsen är rätt plats för att ansöka om att använda en bot på projektet. Observera att kortare botkörningar, såsom interwiki, ofta kan göras utan botflagga.

För att begära byte av användarnamn/SUL, kontakta byråkraten.

To request to run a bot on Swedish Wikisource, start a thread on this page and describe your bot and what kind of job you would like to do. Note, that minor bot-jobs, such as iw-linking often can be done without botflag.

To request change of username/SUL, contact the bureaucrat.

[[Kategori:Wikisource|Mötesplatsen]]

Gamla diskussioner

Arkiverade årgångar av Wikisource:Mötesplatsen: 20072008200920102011201220132014201520162017201820192020202120222023

OBS! Liquid threads fungerar inte för närvarande!

Liquid thread-diskussionerna finns arkiverade på Wikisource:Mötesplatsen/Liquid threads

Diskussioner från Wikisourcediskussion:Mötesplatsen under LT-buggen

Index-buggen är fixad

Buggen https://bugzilla.wikimedia.org/show_bug.cgi?id=24168 är nu stängd. Problemet att index-sidorna ibland tappar sidlistan och måste noll-sparas (null edit) anses vara löst i och med MediaWiki version 1.17. Hurra! Hoppas det stämmer. Om man ser problemet på nytt, ska man rapportera det på nytt. (Jag skriver här, eftersom LiquidThreads är trasigt.) --LA2 21 februari 2011 kl. 13.21 (CET)

Gott, ett steg fram bland alla andra nytillkomna buggar! -- Lavallen 21 februari 2011 kl. 14.31 (CET)
Bra, nu fungerar också parametrarna i pagelist igen, så de flesta buggarna i 1.17 för Proofreadpage är fixade. LiquidThreads-buggen har jag inte fått mycket respons på ännu.--Thurs 22 februari 2011 kl. 08.42 (CET)
Här listas fler nyheter i 1.17 som berör Wikisource. --LA2 22 februari 2011 kl. 15.29 (CET)

Distribuerad korrekturläsning av finska dagstidningar

Finska nationalbiblioteket digitaliserar dagstidningar och anlitar företaget Microtask för att sprida ut korrekturläsningen, http://www.digitalkoot.fi/en/splash --LA2 21 februari 2011 kl. 15.04 (CET)

Och man korrekturläser genom att spela spel? -- Lavallen 21 februari 2011 kl. 16.54 (CET)

Import

Ska vi utöka antalet platser vi kan Importera ifrån? Idag har vi bara svwp, men ofta är kanske enws och oldws mer intressanta, kanske även frws, eftersom det är en av de mest tekniska projekten.

N.B. Importverktyget kan idag bara användas av administratörer. I princip kan dock även de som tillhör ngn av grupperna "Transwiki-importörer" och "Importörer" göra samma sak. Men de grupperna har inga medlemmar här idag. -- Lavallen 23 februari 2011 kl. 17.06 (CET)

Kan inte påstå att jag saknat den möjligheten särskilt mycket. Det som tar tid är snarare översättningen och anpassningen hit än själva överföringen. Men nån gång kan det möjligen vara bra. Mycket av utvecklingen av korrekturläsningen verkar dock ske genom javascript-funktioner just nu vilka inte importeras på det sättet.--Thurs 24 februari 2011 kl. 09.27 (CET)
Fördelen med att importera, istället för "klipp och klista", är att utvecklarna av den ursprungliga koden (ofta mallen i de här fallet) krediteras i historiken. Det är mer i harmoni med "Creative Commons-licensen Erkännande-Dela Lika 3.0". Nej, mindre tid tar det inte. -- Lavallen 24 februari 2011 kl. 09.48 (CET)
Jaha, så det räcker inte med en länk till historiken längre? Nackdelen med import är att man får en historik med trasiga länkar och användare som knappt satt sin fot här. Jag har inget emot att fler importmöjligheter införs men det kan vara svårt att i förväg definiera varifrån vill hämta en sida, jag har nog t ex hämtat mer från nows och dews än frws och oldws.--Thurs 24 februari 2011 kl. 13.54 (CET)
Man uppfyller mer licensens bokstav med import än man gör med en länk. Jo, man får med användarhistorik från användare som aldrig varit förbi här, på samma sätt som Innocent bot har bidrag på bla nowp. Problemet med det kommer fram främst med icke-sulade konton. Tänka efter före är alltid svårt. Om dews och nows anses vara bättre val, så har jag inget emot det... -- Lavallen 24 februari 2011 kl. 14.59 (CET)
Jag tror att den enda importmöjligheten som kan ha någon praktisk betydelse är från engelska wikisource. I övrigt spelar det inte så stor roll vilka man väljer.--Thurs 25 februari 2011 kl. 12.43 (CET)

1819 års Psalmbok

På google books finns en scannad 1819 års psalmbok tryckt 1820 är en psalmvers vi har här. Hela registret finns på wp, men en senare version. Många av texterna finns här, liksom många av 1695, och är väl lite av "herrelösa" då 1819 är överhoppad och på wp har man valt att beskriva yngsta, modernaste, lättast tillgängliga version. Helst 1986, som då alltid är förenad med upphovsskydd. Kan någon lyfta hit texten från google hit? -- IP7869 21 april 2011 kl. 08.06 (CEST)

Lavallen, jag har sett att du försökt göra något. Jag försökte själv kopiera google-texten för bara denna enda psalm, nr 130/1819, men det lyckades jag inte med. Egentligen tycker jag att hela 1819 skulle kunna flyttas/kopieras hit. 1937:an finns ju på Runeberg, scannad och korrekturläst. Liksom 1536:an. Men Göteborgspsalmboken delvis inskriven här. Psalmskatten har ju försvunnit, så därmed mycket av 1819 tyvärr. Vi har många psalmer av 1819 inskrivna, hela eller delar, som denna vers 8 av 130/1819 av FM Franzén. Den har ju i yngre psalmböcker blivit en fristående psalm. Just psalmböckerna är ju tveksamma i copyrigthhänseende. De är ju faktiskt finansierade av skattebetalarna och borde verkligen anses som public domain! Runeberg har en konkordans scannad, som kanske skulle kunna reda ut en del av alla "Okänd författare". Den 1819 som ligger på google är det definitivt. (Det är lite kul att ö är ett o med ett gement e över istället för ¨). Jag har ett eget ex tryckt 1820 också, men vill inte bryta den för scanning. --IP7869
Det jag försökt med är att flytta denna tråd till Mötesplatsen, den har hamnat lite bredvid av ngn anledning.
En psalmbok från 1819 är definitivt fri, liksom allt annat från 1819. Det ska gå att överföra den boken hit till oss. Det finns de som är bättre än jag på det, så jag avvaktar gärna om ngn annan vill försöka först. -- Lavallen 21 april 2011 kl. 09.18 (CEST)
Första sidan, med text från Google måste bort tex, och det kan inte jag. -- Lavallen 21 april 2011 kl. 09.21 (CEST)
Jag har nu laddat upp den önskade filen indexet finns på index:Psalmboken (1819).djvu. Volymen saknar OCR-text och det är tveksamt om det kan man få fram någon tillfredställande sådan. Innermarginalen på udda sidor mellan 211-227 är skadad och det är väl tveksamt om det går att hitta samma upplaga för att korrigera den. Det behöver inte vara någon index-dödare eftersom texten är så spridd att det bör vara lätt att komplettera det saknade från andra upplagor.Men om ni inte tycker det är värt att korrekturläsa den är det bara att radera indexet.--Thurs 21 april 2011 kl. 22.27 (CEST)
Nej, Jag kan nog inte få fram ngn OCR ur den texten, men eftersom varje enskild psalm är intressant i sig, så tror jag den här kan ha ett visst värde ändå. -- Lavallen 22 april 2011 kl. 08.00 (CEST)
Bra att ha fått hit den. Men det är ett problem med just denna utgåvan, tycker jag, och det är att den saknar "poetiska radbrytningar". På många psalmer har vi ju flera versioner efter varandra, och om man gör en transklussion från denna, så kommer ju versionen från 1819 att bli i löpande text, bara därför att vi har en "gottköpsversion" att utgå ifrån, och inte en mer påkostad bok. Så hur hanterar vi det? Taxelson 22 april 2011 kl. 14.10 (CEST)
Säger instruktionerna på Indexdisken att korrläsaren ska lägga in "poetiska radbrytningar", så gör man väl det? -- Lavallen 22 april 2011 kl. 14.34 (CEST)
OK, det skulle alltså kunna få se ut så här?! (eller kanske inte med versala begynnelsebokstäver på varje rad då? - det blir ju tårta på tårta, eller?) Taxelson 22 april 2011 kl. 15.19 (CEST)
Jag tycker man skulle kunna tolka texten så! (Huruvida det ska vara versaler eller inte, tar jag inte ställning till.) -- Lavallen 22 april 2011 kl. 15.21 (CEST)
Vi närmare eftertanke ska det nog vara inledande versaler på alla rader. 1695:an har det så (och den har radbrytningar) och Runeberg gör så i ett liknade fall. Taxelson 22 april 2011 kl. 20.56 (CEST)
Jag tycker också att det är bäst att frångå praxis i det här fallet och lägga in radbrytningarna. Inledande versaler tycker jag ska behållas. Det är inte helt ovanligt i äldre diktssamlingar även när de är radbrutna. --Thurs 22 april 2011 kl. 23.43 (CEST)

<<<--- Nu är ni så himla snabba! Vad är "poetiska radbrytningar"? Jag har blandat mig i på de psalmer Taxelson fixat med från 1695:an. Bara för att visa att jag tycker det är viktigt att ha rätt kronologi. I de fall vi har Göteborgspsalmboken 1650 så inbillar jag mig att faksimilerna inte är fria att använda. (Bodleian håller nog på sina faksimiler). Men texterna må ju vara fria, så bör de ligga först. I något fall finns ju 1536:na. Vad det gäller om "Psalmerna för krigsmakten" så är det ju mest av intresse att det är verser ur 1937:an, men bara ibland hela psalmerna enligt 1937. (Säg inte det till radaikalfeminstierna för då får vi ett elände i landet : ) ] Men för den utgåvan så räcker ju att tala om vilken vers/vilka verser som räckte för ynglingarna och officerarna 1961. Mellan 1819 och 1937 genomfördes ju "förkortningar" av bekvämlighetsskäl. Mellan 1694 och 1695 så var det bearbetningar av religiösa skäl, som kan vara av intresse. (Antikristopsalmerna är häftiga!). Får se vad jag kan bidra med. INte så mycket tekniskt, men åsikten att står det HErren i originalet så bör vi behålla det här i löpande text, men behöver inte ha det i artikeltiteln.--IP7869 23 april 2011 kl. 21.02 (CEST)

Om du med faksimilen menar den från 2002 så går inte den att använda om den här gjord och utgiven i Sverige (den är åtminstone det senare, vad det verkar). Det hade krävts att den är från före 1969 eller 50 år gammal. -- Lavallen 23 april 2011 kl. 21.26 (CEST)
"Poetiska radbrytningar" är helt enkelt de radbrytningar som normalt finns i lyrik efter varje versrad men som ibland saknas i vissa sångböcker för att spara plats. Se exempel på indexdiskussionen. I övrigt korrekturläses volymen efter praxis med bibehållande av versaler t. ex.--Thurs 23 april 2011 kl. 22.34 (CEST)
Beträffande kronologin: Jag skulle nog föredra en omvänd kronologi som standard. Jag tänker mig alltså att det kan göra det mer användarvänligt att man först får den mest sentida (lättlästa) versionen av texten, och sedan hittar de äldre versionerna för den som vill gräva längre i härledningarna. Titeln är ju också vanligen satt enligt den yngre versionen. En annan möjlighet är att lägga dem i tabell, synoptiskt, sida vid sida. Det bör gå bra när samma verser finns i alla versionerna, men blir otympligt om man har olika antal verser i de olika versionerna. Taxelson 24 april 2011 kl. 16.07 (CEST)
Ja, det är GBG 1650/2002 jag avser. Den kan ju inte bli aktuellt att fotografera av.
Jag föredrar "poetiska radbrytningar" med sammanhållna verser.
Smaksak, det här med kronologin. Det kommer ju upp en liten innehållsförteckning när vi lägger in årtalen som underrubriker, så det är lätt att klicka sig till den yngsta respektive den äldsta eller önskad version där emellan. Jag föredrar äldst ursprung först, för det är ganska rejält med hjälp när huvudrubriken är modern=lättläst. Får läsaren hela ursprunget så är det lättare att se vilka verser som behållits respektive bearbetats när man fortsätter läsa. Inget hindrar ju att man hoppar direkt till den yngsta versionen längst ned.
Det finns ju några tidiga försök att lägga i "tabell"-form, men det blir sällan bra om det är långa rader. Har också försökt att begränsa artiklarna med hjälp av noter när det rör sig om små skillnader i textbearbetningar. Jag föredrar alltså rättvänd kronologi och olika versioner i följd utan tabeller och liknande.--IP7869 24 april 2011 kl. 19.47 (CEST)

Det finns nu en "istället för OCR" till 1819 års psalmbok (psalmerna). Den ligger nu på Användare:Taxelson/ps1819 (se dess diskussion för detaljer), men jag tror att det vore bättre om den kunde ligga på något annat ställe än under min användare, så att alla kan känna sig fria att arbeta vidare. Men jag vet inte riktigt var, så jag är tacksam om någon finner en plats för den och flyttar den dit! Taxelson 26 april 2011 kl. 10.08 (CEST)

Jag flyttade den till Wikisource:Projekt 1819 års psalmbok. Om någon hittar ett bättre ställe, så känn dig fri att flytta igen. -- Lavallen 26 april 2011 kl. 10.42 (CEST)

1.18-buggar

Just upptäckt att det lilla magiska ordet: NOEDITSECTION inte fungerar... -- Lavallen 8 oktober 2011 kl. 17.38 (CEST)

Nej, just nu verkar det inte fungera korrekt för mig heller. När jag rensar cachen försvinner länkarna men om jag laddar om sidan som vanligt efter det kommer de tillbaka. Det verkar krångla på WP också så det är nog inte något lokalt fel.--Thurs 8 oktober 2011 kl. 23.03 (CEST)
Verkar vara fixat nu.--Thurs 22 januari 2012 kl. 18.03 (CET)
Förutom detta och liquid threads fungerar inte det nya babeltillägget längre med våra gamla babelmallar.Fixat--Thurs 8 oktober 2011 kl. 23.03 (CEST)

I sidfoten läggs det in extrarader före: <references/>. -- Lavallen 10 oktober 2011 kl. 11.47 (CEST)

Ja, en rad för varje gång man redigerar.--Thurs 14 oktober 2011 kl. 00.09 (CEST)
Det ska vara en bugfix på gång för detta.--Thurs 19 oktober 2011 kl. 20.08 (CEST)
Fixat nu?--Thurs 21 oktober 2011 kl. 23.11 (CEST)

Det här ser kryptiskt ut. -- Lavallen 20 oktober 2011 kl. 12.56 (CEST)

Det är en gammal 1.17 bugg som kom "pagequality-taggen" lades utanför det synliga sidhuvudet. Av någon anledning funkade det inte med någon automatisk konvertering på vissa sidor utan div-taggen förblev synlig. När så sidan redigeras läggs taggen in på rätt ställe vilket gör att när div-taggen med "class=pagetext" och "pagequality-taggen" dubbleras. Den enda åtgärden är att radera den de gamla taggarna om man ser den.--Thurs 20 oktober 2011 kl. 16.15 (CEST)
Ja, jag upptäckte för en stund sedan att det var lite äldre än sedan 1.18.
Frågan är om jag kan lura systemet genom att lägga in "Innocent bot" som användare i den befintliga taggen, detta för att slippa få in det i de sidor som finns kvar att ladda om?! -- Lavallen 20 oktober 2011 kl. 16.26 (CEST)
När jag tittar närmare så verkar det inte vara riktigt samma problem. I det här fallet tycks ett problem vara att de raka citationstecknen förvandlats till grafiska som väl inte fungerar i taggarna. Jag har inte lyckats återskapa detta manuellt, är det något som botten kan ha gjort?--Thurs 20 oktober 2011 kl. 16.35 (CEST)
Boten ändrar inga citat-tecken idag, men det går att göra i framtiden om det är vad som krävs. -- Lavallen 20 oktober 2011 kl. 16.48 (CEST)
Om du provar att redigera utan javascript aktiverat, vad händer då?
Boten kör ju helt utan ngn java aktiverad. I nyskapande av sidor, är det ändå ngn form av kod som lägger in headern och footern, utan att jag behöver bry mig. -- Lavallen 20 oktober 2011 kl. 16.52 (CEST)
Slår jag av javascript och ändrar citationstecknen själv kan jag reproducera buggen annars inte. Men botten borde inte ändra något alls i den taggen det borde ske automatiskt. Försöker man manuellt ändra även om man slagit av js får man ett felmeddelande. Tidigaste fallet har jag hittat var den den 16 juni i år. Före det verkar det vara OK.--Thurs 20 oktober 2011 kl. 17.29 (CEST)
Hmmm, kan det vara att boten inte hanterar den kodning som finns i citattecknen? -- Lavallen 20 oktober 2011 kl. 18.19 (CEST)
Nu vet jag inte ens vilket bot-program du använder för detta så det är svårt hjälpa till med det (inte för att jag har någon större erfarenhet av bot-körningar).--Thurs 20 oktober 2011 kl. 19.37 (CEST)
C# med hjälp av DotNetWikiBot Framework. Koden finns här. -- Lavallen 20 oktober 2011 kl. 21.11 (CEST)
Jag skulle tro att problemet ligger i hur programmet läser in citationstecknen (som väl måste konverteras på något sätt) och sedan skriver tillbaks det på sidan. Men har du inte förändrat ditt program sedan i december borde ju inte felet ligga där. Jag har tyvärr inte de kunskaperna så att jag kan vara till någon hjälp med detta men här och på WP finns det ju många med programmeringskunskaper. Jag tror i alla fall inte att det ligger i Mediawiki eller korrekturläsningstillägget.--Thurs 20 oktober 2011 kl. 23.43 (CEST)
Jag har ändrat lite i koden nu, får se hur det funkar till nästa gång. -- Lavallen 22 oktober 2011 kl. 07.52 (CEST)
Det ser ut att funka. -- Lavallen 23 oktober 2011 kl. 12.52 (CEST)

Sedan 17-18 oktober läggs det in en extrarad i slutet på texten i sidnamnrymden vilket ger en styckebrytning när sidan transkluderas. Ska vara en bugfix på gång: Oldwikisource:Wikisource:Scriptorium#Line_breaks_in_pages.--Thurs 21 oktober 2011 kl. 23.11 (CEST)

en:User:billinghurst har tagit fram ett fix med hjälp av AWB för att rensa bort dessa extra radbrytningar på en:User:SDrewthbot/trim trailing LF. Är det någon botägare som har möjlighet sätta sin bot med att göra detta då och då tills buggen är fixad?--Thurs 25 oktober 2011 kl. 18.43 (CEST)
Det ska alltså vara ngt sådant här som ska fixas, eller är det ngt mer?
Får se hur långt tillbaka jag kan köra det här. Vår Special:RecentChanges är nog inte så stor som enws', men frågan är exakt hur långt AWB kommer tillbaka utan problem. -- Lavallen 25 oktober 2011 kl. 20.23 (CEST)
Ser ut som det är exakt det som ska göras. Sätter boten på autoredigering. -- Lavallen 25 oktober 2011 kl. 20.25 (CEST)
473 sidor gicks igenom. (84 redigeringar gjordes.) De tidigaste ser ut att vara från 17 oktober. Behöver vi gå längre tillbaka? -- Lavallen 25 oktober 2011 kl. 20.47 (CEST)
Nej, det ser bra ut, botten verkar ha tagit det mesta. Sidorna från den 16 och bakåt verkar vara OK redan förut. Tack så mycket!--Thurs 25 oktober 2011 kl. 22.27 (CEST)
Jag vet inte om detta har med botkörningen att göra, men nu påbörjas ett nytt stycke vid sista textraden på sidor (i sidnamnrymnden). Se t.ex. denna sida. (Lite mer tekniskt: I den genererade html-koden hamnar den sista raden utanför sidans sista styckes p-taggar, så att det ser ut som om ett nytt stycke startas.) -- Simsalabim 26 oktober 2011 kl. 20.55 (CEST)
Jag skulle tro att det beror på att botkörningen gjorde att sista raden kom att ligga på samma rad som <references/> vilket förmodligen inte är tillåtet. Lägger man in en radbrytning efter </noinclude> försvinner problemet (i alla fall för mig). Vid transkludering verkar inte den radbrytningen föras över i alla fall så problemet ligger i sidnamnrymden.--Thurs 26 oktober 2011 kl. 22.11 (CEST)
Finemang, tack för bugbugfixarna! -- Simsalabim 27 oktober 2011 kl. 18.27 (CEST)
Gör nu en körning på daws där jag tagit hänsyn till den här saken. -- Lavallen 27 oktober 2011 kl. 21.27 (CEST)
Buggen tycks vara fixad nu för tillfället men "bugbuggen" finns kvar så att sidfoten måste börja med en radbrytning annars finns det risk för att man får en oavsiktlig styckebrytning före sista raden i sidnamnrymden.--Thurs 28 oktober 2011 kl. 22.41 (CEST)

Hitta digitaliserade verk i Libris

Ett sätt att hitta digitaliserat material är att söka på "db:digi" i Libris, så här. Man får då lite drygt 4000 träffar på saker som är digitaliserade och tillgängliga. Inte allt detta är fritt från upphovsrätt eller ens lämpligt för Wikisource (en del träffar kan exempelvis vara hänvisningar till Wikisource!), men en del kan nog vara lämpligt. --LA2 12 oktober 2011 kl. 02.46 (CEST)

Terms of Use update

I apologize that you are receiving this message in English. Please help translate it.

Hello,

The Wikimedia Foundation is discussing changes to its Terms of Use. The discussion can be found at Talk:Terms of use. Everyone is invited to join in. Because the new version of Terms of use is not in final form, we are not able to present official translations of it. Volunteers are welcome to translate it, as German volunteers have done at m:Terms of use/de, but we ask that you note at the top that the translation is unofficial and may become outdated as the English version is changed. The translation request can be found at m:Translation requests/WMF/Terms of Use 2 -- Maggie Dennis, Community Liaison 27 oktober 2011 kl. 03.18 (CEST)

Återbruk

Den 11 november ska jag hålla en workshop under FSCONS om digitalisering och återanvändning av digitaliserad litteratur. Finns det några fall där texter ur Wikisource har återanvänts i andra sammanhang, på något intressant sätt? Att hänvisa till dem som källor från Wikipedia och att räkna ordfrekvenser som underlag för Wiktionary, är två enkla användningar som jag direkt kan tänka på. Sökbarhet via Google är förstås också ett slags återanvändning, som man lätt tar för självklar. --LA2 1 november 2011 kl. 18.33 (CET)

På samma tema, så har Projekt Runeberg nu en ny nedladdningsfunktion där man får med indexfilerna som bygger upp en volym. Besök exempelvis /legender/ eller /fstal/ och klicka "download" längst ner i sidan. Det är nedladdningsalternativet med en asterisk som är nytt. --LA2 3 november 2011 kl. 00.08 (CET)
Apropos Google: Google books lenker gjerne direkte til Wikisource som en "relevant lenke" for bøker. Jeg har ikke klart å gjenfinne en slik fil akkurat nå, men du kan jo søke på et par bøker som :sv: har i google books og se om du finner en? På den måten er tekstene indeksert på en annen måte enn de blir gjennom søk på Google (à la Lavallens oppdagelse av at Wikisource også oppgis som kilse i Libris). V85 3 november 2011 kl. 21.34 (CET)

InterWikiTransclusion

Någon på gamla wikisource har tydligen skaffat sig gobala priviligier och lagt in ett javascript i vår common.js jag har återställt det i avvaktan på en diskussion här. Om jag förstår rätt är det en funktion som möjliggör att transkludera sidor från andra språkversioner vilket kan vara intressant vid parallella flerspråkiga texter. För att det ska fungera behövs det dock skapas mallar &c och det har redan rapporterats en bug. Är det någon som intresserad av att utveckla en sådan funktion just nu? Annars tycker jag det kan vänta till behovet uppstår.--Thurs 4 november 2011 kl. 22.00 (CET)

Skulle säga att det är rena grekiskan, men faktum är att jag begriper vissa grekiska ord. Det kan jag inte säga att jag gör av den länkade diskussionen. -- Lavallen 5 november 2011 kl. 12.10 (CET)
Den grupp Candalua fått behörighet i är editinterface. -- Lavallen 5 november 2011 kl. 17.26 (CET)
Jag förstår ingenting heller men säkerhetsproblem låter inte särskilt kul även om det problemet förhoppningsvis är fixat nu.--Thurs 5 november 2011 kl. 22.47 (CET)
Säkerhetsproblem brukar handla om att länkar med https inte funkar. Om det är så i det här fallet, vet jag inte. -- Lavallen 6 november 2011 kl. 08.26 (CET)
Det var någon allvarligare säkerhetsbrist också som tydligen kunde utnyttjas för att köra javascript på sidan på något sätt.--Thurs 7 november 2011 kl. 22.01 (CET)

Ålderdom

Under rubriken Ålderdom finns det ngn oklarhet i Fjellstedts register. Jag försöker kontrollera med Kalle 12's bibel, men jag hittar ingen rubrik "Ålderdom" där. Ngn som har en aning om vad det kan stå under för rubrik? -- Lavallen 16 november 2011 kl. 15.32 (CET) (Att "Å" sorteras under "A" vet jag.)

Gammal?--Thurs 16 november 2011 kl. 16.12 (CET)
Ngn skit bakom tangentbordet. Helt plötsligt fanns det en rubrik "Ålderdom". -- Lavallen 16 november 2011 kl. 17.38 (CET)

Lästips

Lite helgläsning (122 miljoner sidor — puh, det blir många kvällar med korrläsning!) -- Simsalabim 18 november 2011 kl. 22.22 (CET)


Liquid Threads


Den tidigare sidhistoriken arkiverades för att säkerhetskopiera den på Wikisource:Mötesplatsen/Arkiv 2011/LQT Archive 1 den 03 oktober 2025.

Korrekturläsning, men för långsamt

8
LA2 (diskussionbidrag)

Det är utmärkt att en del böcker blir korrekturlästa. För varje dag, månad och år ökar mängden korrekturläst text. Men det som scannas (hos Google, Internet Archive, Kungliga biblioteket, olika högskolor) är mycket mer. Går det att locka fler att hjälpa till med korrekturläsning, eller kommer vi ohjälpligt att halka efter? Om vi på svenska språket korrekturläser 2-3 hyllmeter per år i Projekt Runeberg + Wikisource tillsammans, så kommer det att ta många hundra år att avverka den första hyllkilometern. Ska vi försöka fylla på Wikisource med så mycket OCR-text som möjligt (som V85 gjorde ett tag), och inte bry oss om att korrekturläsa allt? Ska vi även transkludera sidor som inte är korrekturlästa?

Jag lade ju in Index-sidor för två månader (januari och februari 1836) av Post- och Inrikes Tidningar och korrekturläste januari. Men jag har gjort Djvu-filer för hela 1836 och 1837, och jag skulle kunna göra Djvu-filer och Index-sidor för två årtionden till. Det verkar inte hända mer inom korrekturläsning ändå.

Thurs (diskussionbidrag)

Hittills har väl inte funnits någon större entusiasm inför massuppladdningar från webbarkiv.

Jag tycker att om vi ska göra något sådant så ska det ge något mervärde att lägga det här utöver källan som den är hämtad från. Till exempel är Nasjonalbibliotekets OCR (av de svenska texterna) så dålig att den knappt är sök- och läsbar medan de senaste som Lavallen och Simsalabim gjort kanske är 95% korrekta och njutbara även utan korrekturläsning. Skillnaden är väl inte lika stor när det gäller KB:s tidningar och det förutsätter ju att någon är i så fall är villig att göra OCR-tolkningen (och att den blir bättre).

Jag tycker dock att icke korrekturlästa sidor främst ska ligga i sidnamnrymden och inte transkluderas. Där spelar det inte så stor roll om OCR-texten är dålig. Får man en relevant träff är det vanligen enkelt att gå över till faksimilen och läsa texten där istället. Tidningar är dock ett problem eftersom sidorna är så stora att man måste förstora texten för att kunna läsa den och därmed tappar man kopplingen till den sökbara texten (om en tillfällig besökare ens hittar förstoringsmöjligheten). Vårt system är väl på den punkten knappast överlägset KB:s eget.

Red:En poäng med massuppladdningar skulle kanske vara att skapa trafik till sidan. Men möts besökarna endast av en dålig OCR och en otydbar faksimil försvinner de förmodligen lika snabbt igen.

Lavallen (diskussionbidrag)

Uppläggningen av Nasjonalbibliotekets material utmärkte sig på det viset att det innehöll svenskt material från en norsk källa, en plats som det sannolikt inte är självklart att söka svenskt material i. (Till skillnad från KB.)

Thurs (diskussionbidrag)

Jovisst, att göra ett material mer lättillgängligt kan också vara en orsak till att lägga upp det här.

V85 (diskussionbidrag)

Siden jeg nevnes spesifikt, så tenker jeg at jeg bør ha mulighet til å svare i denne debatten. Dere på :sv: står selvsagt fritt til å velge de retningslinjene dere vil ha, og jeg ser at det da er to muligheter: Enten kan dere tillate at det legges inn mengder med indekssider som korrekturleses, eller ikke, eller så kan dere lage ne regel om at indekssider ikke skal lages, før det er interesse for også å korrekturlese dem. På :no: har vi ikke tatt noe bevisst valg, men foreløbig er det slik at vi godtar at det lastes opp mengder med indekssider, uavhengig av om de blir korrekturlest.

Selv tror jeg at det beste alternativet er at masseopplastninger godtas. Grunnen er enkel. Mennesker som har filer kan da laste dem opp, uten å bekymre seg over restriksjoner som statistikk, og andre brukeres meninger. Fordelen er at andre brukere, senere, som ikke har tilgang til de samme kildene, f.eks. databaser à la Nasjonalbiblioteket, eller en fysisk kopi av boken, kan korrekturlese, fordi filen er tilgjengelig på WS. Kanskje noen kommer og korrekturleser én side før de går lei og gjør noe annet. Da har WS fått én ekstra korrekturlest side vi ellers ikke ville hatt.

Selv om jeg ikke har korrekturlest mye av de filene jeg lastet opp, så synes jeg det ser ut som :sv: har tjent på at jeg lastet dem opp: De er korrigerte og flere av dem også validerte, og de har på den måten kanskje skapt mer trafikk til :sv: enn dere ville hatt uten dem?

Ellers er jeg enig i at tekster som transkluderes bør være korrekturleste først. Det har ingen verdi å vise frem ”rå” tekster som bare består av ”kode”.

Lavallen (diskussionbidrag)

Nej, förbjuda folk att lägga upp index-sidor bör vi inte göra. Det jag uppfattar frågan som, är huruvida vi aktivt ska söka upp material att ladda upp.

IP7869 (diskussionbidrag)

Jag har ju lagt in mycket texter här innan det blev vanligt med faksimiler och korrekturläsning. Jag har originaltexterna och skulle kanske scannat om jag kunnat det. Mina "uppladdningar" är således prematura. Men det är ju de ej korrekturlästa faksimilerna också!

De texter som laddats upp från norska Nasjonalbibliotek är ju en guldgruva för de som vill ha kontakt med svenska texter, som annars är svåra att komma åt. Och det ska inte föraktas, att det kanske bara korrekturläses en sida då och då. Om böckerna skulle stått orörda i bibliotekets källare så skulle ju inte en enda sida varit läst!

Var och en får bedöma sina möjligheter att tillföra något och utgångspunkten bör vara att skadar det inte så är det bra.

Thurs (diskussionbidrag)

Som det är idag får ju var och en lägga in vilka index som de vill utan några begränsningar förutom våra licens- och inklusionsregler och det finns väl inga planer på att ändra detta. Men finns det tillräckligt många användare som är intresserade för att arbeta med ett gemensamt projekt med volymuppladdning och hur skulle man i så fall göra urvalet?

Digitalisera arkivalier för släktforskningssyfte på wikisource?

13
212.85.93.161 (diskussionbidrag)

Hej, Är Wikisource rätt plats för att lägga upp och med gemensamma krafter digitalisera gamla handskrivna arkivalier från 1600-1800 talen? Jag frågar eftersom jag anser att det behövs ett fritt alternativ till de kommersiella krafter som just nu arbetar på att digitalisera stora mängder svenska arkivalier för släktforskningssyften, så att de sedan kan ta betalt för att få tillgång till dokumenten. Dessa dokument representerar den Svenska historien och är allmänna handlingar. De borde vara tillgängliga för alla. Släktforskarrörelsen i Sverige är mycket aktiv. Det handlar alltså om många potentiella frivilliga som kan hjälpas åt att digitalisera arkivalier. Det som saknas är en lämplig plattform..

Jag såg i wikisource-reglerna att statistiska dokument inte hör hemma här. De arkivalier som är intressanta för släktforskning innehåller ofta huvudsakligen tabeller med namnlistor och lite anteckningar, datum, ort, mm. om varje person.

Är Wikisource rätt plats för detta? Om inte, men någon tipsa om en bättre plats?

Lavallen (diskussionbidrag)

Ja, det behövs absolut alternativ till det kommersiella inom det här området...

Men det känns kanske som om just kyrkböcker här faller lite utanför Wikisource. Några andra synpunkter?...

Alternativ? - Tja, programvaran här är fri för vemsomhelst att sätta upp. Det som behövs är en server och ngn som sköter den.

212.85.93.147 (diskussionbidrag)

Just kyrkböckerna finns tillgängliga mot betalning från flera kommersiella aktörer nu. Det behövs absolut ett fritt alternativ här, och en plattform för frivilliga avskrifter. Men i första hand tänkte jag mig nog sådant material som de kommersiella företagen ännu inte lagt vantarna på. Jag har själv varit på krigsarkivet och fotograferat av några militära rullor från 1700talet, och har planer på att göra samma sak med några skråböcker.

Men ni anser alltså att sådant inte riktigt platsar på wikisource?

Lavallen (diskussionbidrag)

Det jag är tveksam till är rena förteckningar över födda, dödda, döpta, vigda etc. Dvs rena kyrkböcker, men andra här kanske tolkar det annorlunda.

Övrigt material kan platsa...

Thurs (diskussionbidrag)

Jo, det ligger på gränsen i alla fall. Vi inkluderar visserligen äldre i viss mån äldre handskrivna dokument av allmänintresse men det är då mer brev och andra offentliga dokument, så t ex domböcker kanske skulle gå. Rullor och kyrkobokföring är ju ett litet annorlunda källmaterial. Min uppfattning är nog att det skulle passa bättre på en egen wiki som man kan anpassa på ett annat sätt.

IP7869 (diskussionbidrag)

Det finns ju en väldigt stor mängd delredovisning som dopböcker, register över födda och döda etc som kan läggas upp församlingsvis. Svenska kyrkan har nu på olika vis börjat lägga ut olika förteckningar över kyrkogårdarna och begravda. De har inte enats inom församlingarna utan det finns 5-10 olika sajter som är mer eller mindre tillfyllest för släktforskning. Men det finns ju andra forskarbehov också, som t. ex. om båtsmän, namn, kvinnohistoria m.m. KB:s tidningsscanning är ju bra, men väldigt svår att använda jämfört med wiki. Svenska Familj-Journalen på Projekt Runeberg växer extremt sakta men växer ändå, liksom Hvar 8 Dag. Och är läsbar till skillnad från KBs tidningar.

IP7869 (diskussionbidrag)

Det är en bra idé, V85.

Det finns så mycket mer än kyrkoböckerna, som är av intresse för många inom släktforskningen. Det finns mängder av källor inom det offentliga materialet i våra arkiv. Arkiven är redan finansierade av allmänheten och ska knappast vara en källa till salu av varken bibliotek, arkiv eller olika arkivbildare.

Det kan vara ett mer allmänt intresse för enskilda att få ta del av sin hembygdshistoria, olika yrkes- och skråhistorier etc. Själv sitter jag och tittar på en pärm jag har som inleds med "Båtsmän i Åryd" (från 1700-talet), som någon har suttit och skrivit av på skrivmaskin. Det är namn på gårdar och rotar, giftermål och barn, vad folk levde och dog av. Näringar vid sidan av båtsmanskapet och sådant som visar hur livet ibland utvecklades i olyckliga riktningar. (Domböcker, företag, museisamlingar och m.m.).

Den litteratur vi har här på src och på andra närliggande projekt är vad dessa människor läste (och sjöng).

LA2 (diskussionbidrag)

För att lägga upp exempelvis kyrkböcker här, måste du nog ha faksimilbilder. Har du det? Hur skapas de bilderna?

Visst har vi en del dikter utan faksimil, men jag betvivlar att det blir hållbart för kyrkböcker. Utan faksimilbilder blir det svårt att stoppa förfalskningar och svårt att kontrollera misstänkta fel i avskriften.

Om du har några faksimilbilder som du kommit över lagligen, så tycker jag du kan ladda upp och göra ett prov. Sedan kan vi diskutera om en fortsättning är rimlig och hur den bör struktureras.

212.85.93.161 (diskussionbidrag)

Det juridiskt "säkraste" sättet att kopiera kyrkböcker och liknande är att besöka det aktuella arkivet med en digitalkamera. Tyvärr har arkiven regler som förbjuder både skanners och kamerastativ. Skanner kan man förstå, eftersom det skulle slita på böckerna, men jag har ännu inte träffat en arkivarie som kan förklara varför stativ måste vara förbjudet. De kommersiella företagen som kopierar kyrkböcker har också fått tillstånd att använda stativ, av någon märklig anledning... Men men, det fungerar hyfsat att kopiera böckerna med digitalkamera på frihand också. Så har jag gjort med några handlingar.

Ett annat sätt är att fjärrlåna mikrofilmer/mikrofiche från arkivet och kopiera dessa. Tryckfrihetsförordningen ger alla Svenskar rätt att läsa och "avbilda" alla offentliga handlingar. Men för att skoja till det lite så har riksarkivet satt en liten notis om att de äger upphovsrätten på all mikrofiche, och att all kopiering är förbjuden. Man riskerar alltså att hamna på lite otydlig juridisk mark om man gör så.


Som jag ser det så fyller wikifiering av arkivalier för släktforskning två syften.

Ett:

Det blir det en central plats dit alla som fotograferar arkivalier kan ladda upp sina bilder så att andra kan ha nytta av dom. Digitala kopior av arkivalier på internet underlättar dramatiskt vid släktforskning, eftersom man då slipper flänga land och rike runt för att besöka de olika arkiven. Det blir också ett fritt alternativ till de kommersiella krafter som tar ut ganska så stora avgifter för samma tjänst.

Två:

Med gemensamma krafter kan vi skriva av arkivalierna så att de blir digitalt sökbara. Detta gigantiska arbete gör givetvis underverk för forskningen. Men även utan avskrifter så är digitala kopior fritt tillgängliga på internet mycket värdefullt.


Vad jag vill veta just nu är väl egentligen om ni anser att detta skulle platsa här på wikisource, eller om det är bättre att jag helt enkelt drar igång en ny fristående wiki med specialinriktning på arkivalier?

81.170.236.199 (diskussionbidrag)

Nu svarar jag mig själv lite.. Idén om att starta en ny wiki för detta är ganska tilltalande. Då skulle man exempelvis kanske kunna tänka sig att kategorisera alla artiklar enligt samma system som riksarkivet använder, för att göra det lättare att hitta rätt.

IP7869 (diskussionbidrag)

Ja, kanske det är den bästa idén.

LA2 (diskussionbidrag)

Okej, jag tolkar detta som att du vill driva med oss. Lycka till med din egen wiki. Adjö.

Lavallen (diskussionbidrag)

Ja, jag tror en special-wiki kan vara den bästa lösningen i ett dylikt fall. Hör av dig om du vill ha lite hjälp och tips...

Requests for comment/Image filter on Wikisource

3
Lavallen (diskussionbidrag)

En så kallad Requests for comment/Begäran om kommentarer har satts upp på meta: meta:Requests for comment/Image filter on Wikisource.

JAg tänker efterlysa en tydlighet om vilket projekt den här RfC'n handlar om. Handlar den om 61 projekt på en enda gång, känns det riktigt illa...

Ett problem med RfC'n verkar vara att diskussionen och utformningen av sidan styrs av en användare som ställt till med en massa strul och är blockerad på enwp.

Thurs (diskussionbidrag)

En sån där diskussion på meta kommer oundvikligen att kapas av diverse fraktioner som i inte bryr sig särskilt mycket om Wikisource. Jag inte se att det kan bli något meningsfullt resultat av detta.

Jag tycker inte heller om den här tendensen att användare från engelska och flerspråkiga Wikisource på senaste tiden börjat agera i hela Wikisources namn.

Lavallen (diskussionbidrag)

Mitt envisa arbete med Fjellstedt börjar ge synbara resultat. Propheten ObadJa är nu korrekturläst. Obadja är GT's minsta bok, och det är därför inget stort, men det är ändock ett tydligt steg framåt.

Fler små böcker bland Småprofeterna och Apokryferna kommer sannolikt att bli färdigställda den närmaste månaden.

En normal dag skannar jag nu 2 nya sidor, skannar om en gammal, ger OCR från Finereader till tre sådana sidor och korrekturläser ett par stycken. Med den takten blir jag färdig med GT..... ---- tja någon gång får vi hoppas :).

Lavallen (diskussionbidrag)

Efter lite räknande skulle det ta ett halvår att ladda upp hela GT och Apokryferna i den takten. (Den låga takten är avsiktlig, då den ger noggrannare resultat.) Att dessutom ge befintliga sidor med dålig OCR ny sådan, tar ytterligare cirka åtta månader. Så jag vet vad jag har att göra...

IP7869 (diskussionbidrag)

Det tar sig allt efter hand. Jag tycker det är kul när man kan länka till andra texter. Och klart blir det ju säkert som amen i kyrkan.

Lavallen (diskussionbidrag)

Med tillkomsten av Propheten Jona, Propheten Nahum, Propheten Haggai har nu de kortaste böckerna I GT fått ny OCR. Korrläsning återstår i alla utom ObadJa som är klar.

Apokryferna har fått ett förord och snart är Tillägget till Esther uppladdat, samt snart även alla delar av Tillägget till Daniel.

Från nu kommer det dröja längre mellan att nya bibelböcker får ny OCR eller blir färdig-korrade en gång.

Lavallen (diskussionbidrag)

Propheten Malachi är nu upprättad och därmed alla böcker i GT i Fjellstedt.

Det återstår dock idag 140 sidor som fortfarande är ouppladdade i GT. Mest sidor återstår det i Hesekiel. Joel är snart färdiguppladdad och inom ngn vecka sannolikt även småtexterna i slutet på Apokryferna.

Lavallen (diskussionbidrag)

Yes, nu är även alla böcker i Apokryferna upprättade. Det saknas dock fortfarande 133 sidor som inte är uppladdade.

I band I är det nu bara en enda sida kvar i Moseböckerna till att få ny OCR.

I band II bör Joel vara uppladdad inom ngn vecka. Baruks bok ligger inte heller så långt bort till att bli uppladdad.

I band III har en sida i varje bok fram till andra Korintierna laddadts upp. Matteus blir så sakta läsligare och läsligare.

IP7869 (diskussionbidrag)

Wow! Så glad jag blir av att se alla dessa framåtskridanden.--IP7869

Lavallen (diskussionbidrag)

De första sidorna laddades upp i Augusti 2009.

Idag, när det är dags att göra delbokslut, börjar verket få sina yttre konturer synliga. Jag lovar inte att jag/vi kommer att vara färdiga när 2011 är slut, men det finns flera delmål som är inom räckhåll. Esaias bok har fått fräsch OCR innan januari är slut, Baruks och Malaki böcker är samtidigt helt uppladdade.

Inom ett halvår är sannolikt hela GT uppladdad och Matteus har ny OCR. Inom ett år är sannolikt även Apokryferna helt uppladdade.

Hur mycket som hinns med i NT är svårt att förutsäga. Men jag förutsätter att flera av småböckerna är uppladdade och korrlästa innan 2011 är slut. Det är inget tungt löfte, med tanke på att det finns flera mycket korta böcker i slutet på NT. Titus har 5 sidor, Judas brev 4, Filemon, Andra och Tredje Johannes har 2 sidor vardera.

Lavallen (diskussionbidrag)

Första delarna av nyårslöftet är uppfyllda!

Esaia har nu fräsch OCR och Malachi är uppladdad!

Lavallen (diskussionbidrag)

Det ingick inte i löftet, men nu har Höga Wisan fått hyfsad OCR rakt igenom, sedan har Haggai och Nahum blivit korrlästa en gång.

Lavallen (diskussionbidrag)

Nästa del av löftet: Baruks bok är uppladdad!

Nästa löfte får bli att: Predikaren har ny OCR. (slutet av februari) Minst en sida i varje bok i NT är uppladdad. (slutet av mars)

Michas och Amos böcker borde inte vara så långt borta, men jag vågar inte specifiera ngt datum.

Lavallen (diskussionbidrag)

Propheten ObadJa är första bok till att bli både validerad och där alla paralellhänvisningar dessutom är länkade!

Lavallen (diskussionbidrag)

Predikaren och Esthers bok har sedan ett antal dagar ny OCR och varje bok i NT har åtminstone en sida.

Michas och Amos böcker tillsammans med Tobie bok, ska inte ha så långt kvar innan de har ny OCR, men det dröjer ännu några veckor.

IP7869 (diskussionbidrag)

Vet inte vad jag ska säga. Stum av beundran eller något ditåt över din flit, kompetens och den underhållning du bjuder på.

Lavallen (diskussionbidrag)

Propheten Jona i Fjellstedt är färdig.

Det är en av bibelns mer märkliga historier.

Gud skickar sin profet Jona till staden Nineve i norr att predika om Guds dom.
Jona blir rädd, och tar båten västerut istället
I en storm kastas Jona överbord och en fisk fångar upp Jona och släpper upp honom på land efter ett par dagar.
Gud säger åter till honom att han ska gå till Nineve
Jona går till Nineve och berättar att Gud ska förstöra staden.
Befolkning blir förskräckt och ångrar sig i säck och aska.
Gud bestämmer att han ångrar sig till vidare.
Jona reagerar med att tycka att det var onödigt att han åkte till Nineve över huvud taget. Nu blev han ju till åtlöje!
Jona sätter sig utanför staden och tjurar och väntar på att Gud ska ångra sig igen och kanske ändå förstör staden.
Sedan historien om "kurbitsen", där Gud försöker tala om för Jona att han kanske borde veta bättre...

Mycket nöje!

IP7869 (diskussionbidrag)

Tack för bra sammanfattning! Jag tycker det är roligt när jag lyckas få till ankare/länkar till de olika sångtexterna och bibeltexterna. Har en på gång, där jag inte ens hört talas om den GT-aktuella personen. Men namnet nämns här på wikisource och "ankare" kommer snart.

Lavallen (diskussionbidrag)

Det är 35 sidor kvar i GT att ladda upp. Allt tyder på att hela band 2 kommer att få sina sidor uppladdade och ha fått alla sina sidor med ful-OCR ersatta innan sommaren är slut. Till dess borde även alla böcker i NT ha blivit upprättade, samt Matteus fått ny OCR rakt igenom.

Sedan finns det fortfarande väldigt många sidor i band 1, som fortfarande har ful-OCR. Men när band 2 är färdigt, kan jag lägga mer energi på det.

Innan sommaren är slut säger jag ovan, håhåjaja. Trädgårdsbelysningen har just tittat upp genom snön! - Det får duga som vårtecken!

IP7869 (diskussionbidrag)

Fantastiskt! Jag var borta över helgen och lånade en dator och förde över Hjärtesånger 1985 hir till src. På WP finns fortfarande alla noteringar i HS1895 där utgivaren hänvisar till olika bibelcitat. Så jag har inte bett någon radera innehållsförteckningen i WP-artikeln ännu.

Lavallen (diskussionbidrag)

Andra boken i Psaltaren har inte längre ngn Ful-OCR.

Lavallen (diskussionbidrag)

Pauli Bref till Filemon har nu blivit färdiguppladdad.

Det är första bibelboken i NT som blivit färdiguppladdad sedan Matteus blev färdig i november 2009! Boken har bara två sidor, och det tillkommer sannolikt snart ett par böcker till bland Johannes brev, som är ungefär lika stora.

Lavallen (diskussionbidrag)

Brefwet till Ebreerna upprättades idag.

Det är, som jag uppfattar det, sista boken i hela bibeln, som har rikligt med referenser till GT. Det finns därför nu anledning att börja komplettera de hänvisningar som tills nu varit olänkade.

Lavallen (diskussionbidrag)

Och här försvann sista sidan i band 3 som hade ful-OCR.

IP7869 (diskussionbidrag)

Allt prima som vanligt! Då var det bara det där med alla fotnoter och länkar ... Tur att sen finns : )

Lavallen (diskussionbidrag)

Hela GT är nu uppladdat! Återstår ett gäng sidor i Apokryferna i band 2, samt en förskräcklig massa sidor i band 3.

Lavallen (diskussionbidrag)

Johannes’ Uppenbarelse blev sista bok att bli upprättad. Böckerna i NT saknar dock fortfarande många sidor.

I band 2 börjar jag ser ljuset i slutet av tunneln. (Eller om det är tåget.)

I band 1 fortsätter arbetet med ny OCR, varje bok där är ganska lång, och registren är sega, med alla namn...

Jag har inte varit så fokuserad vid arbetet här sista tiden, men jag håller fortfarande schemat...

Lavallen (diskussionbidrag)

Psaltaren har fått sin sista sida med ful-OCR fixad. Återstår ett gäng sidor i Jobs Bok, sedan ska band II vara helt fri från ful-OCR.

Lavallen (diskussionbidrag)

Och här blev sista sidan i band II av med sin ful-OCR.

Lavallen (diskussionbidrag)

Ytterligare en liten knippe ljus har kommit in i tunneln. Jag har nu laddat upp de sista sidorna i band II.

Lavallen (diskussionbidrag)

Och nu har jag laddat upp sista sidan i Lukas evangelium. Det går så sakta framåt. Med nuvarande takt ska NT vara färdiguppladdat om 5-6 månader.

Hur mycket ful-OCR som fortfarande finns i band I har jag inte helt koll på, men antalet sidor i varje bok minskar så sakta. De småjobbiga registren kommer sannolikt att bli kvar till sist.

Stefan2 (diskussionbidrag)

Jag tittade på Sida:Arithmetica eller räknekonst.djvu/19 och noterade några saker som jag tycker verkar konstiga:

  • På 1700-talet när boken gavs ut var man noga med att skilja på "s" och "ſ", men alla de avskrivna sidorna saknar detta. Är det verkligen riktigt att ta bort denna uppgift från texten?
  • Många bokstavskombinationer skrevs förr i tiden ihop som ligaturer, till exempel "ct", "ck", "ſk", "fi", "ſs" och "ſz". Det verkar som att "ſz" (och även "ſs"?) ibland skrivs in som "ß". Vad ska detta vara bra för? Övriga ligaturer verkar aldrig markeras som ligaturer på något vis. Det verkar inkonsekvent. Dessutom går uppgifter om äldre stavning förlorade om både "ſs" och "ſz" byts ut mot samma sak.
LA2 (diskussionbidrag)

Både inom Wikisource och andra liknande projekt råder inkonsekvens på det här området. Det är inte självklart hur man ska transkribera. Det bästa vi kan göra är att dokumentera vilken princip som använts i varje verk, och försöka vara konsekventa inom verket. Sidan du länkar till gör också skillnad mellan fraktur (för svensk text) och antikva (för latinska termer), en åtskillnad som vi endera brukar strunta i eller använda kursiveringar för antikvan. Vi brukar också skriva ihop avstavade ord vid rad- och sidbrytningar. Ibland rättar vi tryckfel, annars inte. Det är en balansgång mellan att återge det tryckta, så noga det går, och att tolka författarens och typografens avsikter.

LA2 (diskussionbidrag)

När jag skrev Wikisource:Redigering försökte jag göra rekommendationer, men jag vet inte om alla håller sig till dem.

Lavallen (diskussionbidrag)

Boken är skriven i frakturstil, vilket vi nog varken kan eller vill efterhärma. Vi kan inte återge alla ligaturer, (tyvärr), det finns inte unicode-tecken för allt sådant.

Hur det är med "ſz" kan jag inte svara på...

Dubbel-s återger vi alltid med "ss" om det är modern svenska (dvs från 1526). Det lär vara så RA gör... För medeltida texter så försöker vi återge det mer direkt.

Det finns också undantag, såsom Index:Svenska medeltidens bibel-arbeten (1853).djvu från 1853 där man inte använder frakturstil, och vi därför kopierar rakt av med ſ, ȝ, æ och ø och vadhelst som lagts in...

Sidan du länkar till är inte färdigavskriven, det finns utrymme för omtolkningar...

Stefan2 (diskussionbidrag)

Sidan är inte färdigskriven, så jag försökte rätta till den men blev fundersam när jag upptäckte vad som hänt med "ſ" och "ß", så jag slutade rätta till saker för att först fråga hur man ska göra. Sidan Wikisource:Redigering reder ut en del.

På tal om gamla skrifter, hur pass gamla skrifter kan man lägga in här? Kan man fotografera skriva av runstenar här eller ska de placeras på någon separat non.wikisource.org för fornnordiska?

Lavallen (diskussionbidrag)

Det finns i princip ingen gräns för hur gamla texter som går att lägga upp här, så länge det finns ngn koppling till det vi idag kallar svenska. (Dvs samiska texter bör läggas på wikisource.org istället, och finska har sitt eget projekt.) Observera att tolkningar av mycket gamla texter kan vara under upphovsrätt.

Filer lägger du med fördel först upp på Commons.

LA2 (diskussionbidrag)

Tyske wikipedianen Achim Raschka (66.000 redigeringar) bloggar om en natt i Wikisource, som gav en besk eftersmak. Han är aktiv inom Wikipedia, men tänkte nu som omväxling lägga till en kort text i tyska Wikisource (ett förord av en känd författare). Han beskriver hur förvirrande det är att det finns en länk för att "skapa en artikel" (standard wiki, inte anpassat för Wikisource), men inget om hur man får sidor i namnrymderna Sida: och Index:. Sedan blir han utskälld för att han skapat en författarsida för en författare vars verk ännu omfattas av upphovsrätt, men får den raderad för att detta strider mot kutymen. Det är alltså både tekniken och bemötandet från andra användare som ger avsmak för projektet. Därefter försöker han lägga in ett handskrivet brev (av en känd författare) tillsammans med en modifierad transkription ur en annan källa, och möts av oförstående. Det är väl inga formella fel begångna, men en värdefull berättelse av hur en wiki-erfaren wikisource-nybörjare uppfattar mötet med Wikisource.

Lavallen (diskussionbidrag)

Hehe, tyska Wikisource är lite speciellt... (Inte för att jag kan ett ord tyska.)

Wikipedianer är också speciella. SFFR-diskussioner som hänvisar till att "detta kan flyttas till Wikisource/tionary/books" etc som gör att man blir mörkrädd. Majoriteten av wikipedianerna har väldig dålig koll på systerprojekten!

V85 (diskussionbidrag)

Jeg tror at tyskerne gjør ting litt anderledes enn oss andre. Jeg prøvde en gang å laste opp en bok dit, som jeg har gjort på flere prosjekter (no, sv, da, en, fr), men det varte ikke lange stunden før index-siden ble slettet, fordi "prosjektet ikke hadde blitt diskutert". I verste fall, på andre Wikisource-utgaver, så skjer det ingenting med index-sidene mine, andre får et par sider korrekturlest, men de blir ikke slettet. (Her på sv:, så blir de ganske raskt validert! Noe som er veldig gøy og motiverende for å delta mer.)

Hvert prosjekt har sin egen kultur; de har òg hver sin målsetning og hver sine retningslinjer. Wikipedia og Wikisource har forskjellige mål, derfor er de forskjellige prosjekt, og det man lærer på Wikipedia om hvordan ting skal være, vil nødvendigvis være forskjellig på Wikisource, selv om programvaren er den samme. På :en: har de tatt følgene av det, og laget siden en:Wikisource:For Wikipedians som har som mål å forklare hvordan de to prosjektene er forskjellige. De som har jobbet en del på Wikipedia vil jo vite en del om hvordan ting fungerer, det de trenger en innføring i, er hvordan prosjektene er ulike.

LA2 (diskussionbidrag)

Jag kör nu Finereader Professional version 10 (ett OCR-program) på min laptop, och tycker att det går förfärligt långsamt. Men vad är normal hastighet och hur mäter man det? Den stod 29 sekunder och tuggade på den här bilden (ladda hem "full resolution JPEG" och prova). Andra sidor i samma bok tar 13-16 sekunder, men även det känns onödigt långsamt. Borde det inte gå på 3-5 sekunder eller mindre?

Lavallen (diskussionbidrag)

Just den här bilden tog bara ngn sekund med min dator idag. (Kanske 2 med mönsterigenkänning.)

Finns det dåligt med minne i datorn, så kan det ta betydligt mer tid...

LA2 (diskussionbidrag)

Datorn har 2 GB RAM, så det kan inte vara minnesbrist. Men programmet var inställt på "thorough reading". När jag ändrade detta till "fast reading" blev tolkningen snabbare (2-4 sekunder per sida) utan att kvaliteten försämrades. Thorough reading sägs i dokumentationen vara bättre på komplicerad tabell-layout, men "fast" tycks vara tillräckligt bra för de tabeller och layoutvarianter som förekommer i den här boken.

Men när jag ska "öppna" de inscannade sidorna till en ny bok, så tar detta 10-15 sekunder per sida. Även det måste väl gå att klara snabbare?

Lavallen (diskussionbidrag)

Jag har 8 GB här på min stationära. 2 GB borde inte göra att det tar så lång tid.

Lavallen (diskussionbidrag)

Att "Anaysera" en sida, brukar ta nästan lika lång tid som att tolka den. (Med analysera menas då att automatiskt räkna ut vilka fält som ska tolkas som text/bild/tabell etc, och avgöra om bilden är uppdelad på kolumner och om det finns sidhuvud/fot.)

LA2 (diskussionbidrag)

Ja, men analysen av fält gör jag samtidigt med tolkningen, och det går fort nu. Men att öppna bilderna tar lång tid, oavsett om jag har "enable preprosessing" (deskew, det vill säga automatisk rotering av sneda sidor) påslaget eller inte. Det är alltså inte heller deskew som tar tid, utan något annat.

LA2 (diskussionbidrag)

Att öppna TIFF-bilder (600 dpi bitonal, TIFF G4) går snabbt, men JPEG (300 dpi färg) går obegripligt mycket segare.

Hur känt är Wikisource

3
Lavallen (diskussionbidrag)

Wikipedia Signpost återger resultatet av en liten enkät som skickats ut av ngt ställe:

När man frågade efter 10 projekt som drivs av WMF listades i fallande ordning: Wikipedia, Wiktionary, Commons, Wikiquote, Wikibooks, Wikinews, Wikisource, Wikiversity, Wikispecies, MediaWiki.

Hade varit spännande att se vad en svensk enkät hade gett! - Inte för att jag tror att vi skulle passerat w: wikt: eller commons:, men därefter? - Nåväl, vi syns högt i Google, får väl nöja oss med det så länge...

LA2 (diskussionbidrag)

Att försöka komma högre upp än Wikiquote kan inte vara målsättningen. (Svenska Wikiquote är enligt min åsikt ett projekt i djup kris, om inget radikalt har hänt nyligen.) För min del handlar det om att jämföra Wikisource med Projekt Runeberg, Litteraturbanken och andra liknande sajter: När flera sajter presenterar samma text, vilken av sajterna är då mest användbar? Vilken kommer högst bland sökträffarna? Vilken är det folk länkar till?

Wikisource har en stor teknisk nackdel av att Sida-namnrymden inte länkar till inklusionssidorna i huvudnamnrymden. Man vill ju leda läsarna till huvudnamnrymden. Jag misstänker dessutom att länkarna till föregående och nästa sida, som görs med Javascript, inte indexeras av sökmotorerna. Detta är länkstrukturer som fungerar i Projekt Runeberg, men inte i Wikisource. Litteraturbanken har väl bättre länkstruktur idag än för några år sedan, men hur mycket deras sajt används kan jag inte bedöma.

Lavallen (diskussionbidrag)

Ngt positivt som har hänt på sv:q: är väl att det projektet fått en engagerad användare till som administratör där. Om det räddar projektet är en annan sak...

Jag tror det kan vara mycket svårt att passera Commons i kändisskap.

Runeberg är känt av alla här. Är Wikisource känt av Runebergare?

Svenskt biografiskt lexikon

4
LA2 (diskussionbidrag)

De tio första banden av Svenskt biografiskt lexikon (från A till De la Gardie) utkom 1931 eller tidigare, medan Bonniers utgav verket. De är alltså äldre än 70 år, precis som uggleupplagan av Nordisk familjebok, även om vissa artikelförfattare inte har varit döda i 70 år. Borde vi lägga upp dessa tio band i Wikisource (och PDF:erna i Wikimedia Commons)? PDF:erna finns på en CDROM över de 31 första banden, som togs fram 2004 och numera har slutat säljas. Riksarkivet förbereder en online-databas senare i år, men rykten säger att den ska ligga under abonnemang och inte vara gratis.

Lavallen (diskussionbidrag)

URAA-problematiken finns ju även då. (Men kanske inte för de första banden.) Avvakta lite, är därför mitt råd. Den biten borde ju vara löst närsomhelst...

LA2 (diskussionbidrag)

URAA har jag inte till fullo begripit, men det kan ju vara en anledning att lägga SBL 1-10 i Projekt Runeberg i stället, om nu Riksarkivet inte gör en helt öppen lösning. Kanske tänker de lansera vid Bokmässan?

Lavallen (diskussionbidrag)

Runeberg kringgår problemet med den oklara amerikanska lagstiftningen helt och hållet! Förhoppningsvis ska vi slippa det här också ganska snart.

LA2 (diskussionbidrag)

De fem svenska universitetsbibliotek, som via Kungliga biblioteket gjorde en gemensam upphandling av digitaliseringsrobotar, har nu börjat komma igång med scanningen och har under maj 2011 startat en blogg om digitaliseringsflöden, http://digitaliseringsfloden.blogspot.com/

Lavallen (diskussionbidrag)

Intressant att även förlagen jobbar med saken...

LA2 (diskussionbidrag)

Jag tycker skillnaden i arbetsprocess är det intressantaste. Förlagen börjar med att fråga sig om det finns en marknad, och ser sedan till att få jobbet gjort genom att anlita den som gör det billigast (i Indien). Biblioteken börjar med att köpa in scanningrobotar och funderar sedan på hur de ska användas, men om det finns någon som vill läsa det digitaliserade (nyttan, outputen) verkar vara den allra sista punkten på deras dagordning.

Lavallen (diskussionbidrag)

Och kanske lite förvånande att rättigheterna måste förhandlas om när man gör det...

Skaffar man nya rättigheter för varje tryckning, och därför även när den ges ut för "print on demand"?

LA2 (diskussionbidrag)

En författare som "blir utgiven" tecknar ett förlagsavtal. Jag tror att ett vanligt förlagsavtal ger förlaget ensamrätt att ge ut boken så länge den finns i lager och därefter i fem år (i utbyte mot en viss förskottsbetalning + royalty för varje sålt exemplar). Om boken blir slutsåld, kan förlaget alltså trycka den på nytt inom fem år, men gör de inte det så återgår rättigheten till författaren, som då kan förhandla med ett annat förlag (eller göra ett nytt avtal med samma förlag). Ett förlag som vill göra en ny utgåva, elektronisk eller tryckt, kan med fördel utnyttja sin egen "backlist" eftersom de ju redan är bekanta med författaren, men för böcker som varit slutsålda så länge att förlagsavtalet har upphört, måste en ny förhandling göras. Initiativet till sådana förhandlingar kan förstås också komma från andra förlag.

LA2 (diskussionbidrag)

Nytt inlägg 5 september från Göteborgs universitetsbibliotek på bloggen. Allt är tydligen inte så strömlinjeformat, som ordet "scanningrobot" kan ge intryck av.