Wikisource:Mötesplatsen

Från Wikisource, det fria biblioteket.
Hoppa till: navigering, sök


Välkommen till Mötesplatsen[redigera]

Välkommen

Mötesplatsen är det allmänna diskussionsforumet om svenska Wikisource.

Skriv ett nytt meddelande under en ny rubrik

Mötesplatsen är rätt plats för att ansöka om att använda en bot på projektet. Observera att kortare botkörningar, såsom interwiki, ofta kan göras utan botflagga.

För användarnamnsbyten gå till Metas sida för globala användarnamnsbyten.

To request to run a bot on Swedish Wikisource, start a thread on this page and describe your bot and what kind of job you would like to do. Note, that minor bot-jobs, such as iw-linking often can be done without botflag.

To request change of username/SUL, please go to the request page for a global rename.

Gamla diskussioner[redigera]

Arkiverade årgångar av Wikisource:Mötesplatsen:

Diskussioner[redigera]

Transkriberad text utan källbilder[redigera]

Hej. Jag fick förra veckan en frågan från en anställd vid Kungliga Biblioteket som jag ville kolla av här innan jag svarar.

KB sitter på en samling av tidigt digitaliserat material (transkriberat för hand på 90-talet) där originalbilderna är väldigt skadade mikrofilmer och därför inte lämpliga att ladda upp. Samlingen i fråga rör sig om posttidnignar mellan 1600-1725 (om jag inte missminner mig). Så min frågor är:

  1. Hur fungerar det med uppladdning av texter där bilderna av sidorna saknas?
  2. Hur organiserar man enklast upp en samling som består av enskilda nummer av en "tidning" (nyhetsbrev är nog en mer passande beskrivning)
  3. Finns det någon här som skulle kunna tänka sig guida om jag sätter er i kontakt?

/André Costa (WMSE) (diskussion) 1 april 2014 kl. 13.23 (CEST)

1. Skapa en pdf eller djvu-fil med den transkriberade texten och ladda upp den på Commons som förlaga, gärna med den transkriberade texten inbäddad. Edaen (diskussion) 1 april 2014 kl. 16.26 (CEST)
Det känns ju lite bakvänt. Har sett sidor utan Commons-dokument tidigare (dock var de flesta från 2008). Eller hade svaret med gårdagens datum att göra? /André Costa (WMSE) (diskussion) 2 april 2014 kl. 10.28 (CEST)
Jämför Index:1866 K brev ang Djurgårdens förläggande till Stockholm.djvu som är en transkription av ett äldre dokument. Edaen (diskussion) 2 april 2014 kl. 10.49 (CEST)
Det är trots allt en avskrift på papper som sedan kopierats. Här rör det sig om redan digitaliserat material, att lägga det som korrekturläsning utan faksimil bara för att passa in i våra rutiner blir en aning bakvänt.
Det skulle ändå kunna vara en idé att göra det om texten innehåller formatering (kursiv, spärrning, centrering &c) om det inte går att få med den med "digitaltexten".
Finns inte detta kan man lika gärna lägga in det direkt i huvudnamnrymden.
Wikisource:Tidningar finns en del skrivet, men den sidan är inte direkt uppdaterad.
Arbetsgången utan faksimil blir i korthet.
  1. Skapa en ingångssida: [Tidningens namn]
    • På den läggs in: titelmall, en lista med tidningens nummer länkade i formen [[Tidningens namn ÅÅÅÅ-MM-DD]] och kategorier
    • Se Linköpings Wecko-Tidningar för ett aktuellt exempel
  2. Från ingångsidans länkar skapas sedan de enstaka tidningsnumren i formen:
{{Titel|Tidningens namn|undertitel=nummer och datum|förra=[[föregående nummer]]|nästa=[[nästa nummer]]|kommentar=eventuell kommentar}}

Texten

[[Kategori:Tidningens namn]]
Nackdelen med att inte använda korrekturläsningsfunktionen är att man måste lägga in titelmallen med förra- och nästa-länkarna manuellt.
Det är i princip det hela arbetsgången. Om användaren/na skapar ingångssidan och något nummer och kanske sedan avvaktar något eller några dygn för eventuella justeringar av andra användare för att sedan lägga in resten. Har de ytterligar frågor är de välkomna att ställa dem här eller någon annan diskussionssida.--Thurs (diskussion) 2 april 2014 kl. 13.36 (CEST)
Många tack för det utförliga svaret. Ska vidarebefordra så får vi hoppas att det tillkommer material. /André Costa (WMSE) (diskussion) 5 april 2014 kl. 15.50 (CEST)

Hej[redigera]

Hej på alla! Jag är en italiensk användare och studerar svenska vid universitetet. Jag ville delta på sv.wikisource, i syfte att känna och läsa er literatur och för att lära mig nya ord. Jag lagt upp den här ny bok. Finns det någon, som kan följa mina bidrag och kontrollera vad jag göra? Jag skulle vilja också finna några Hjälpsidor om vad sv.wikisource funkar. Var är de? Tack så mycket! --Nastoshka (diskussion) 22 maj 2014 kl. 11.07 (CEST)

Välkommen till svenska Wikisource. De flesta erfarna användarna här brukar hjälpa till med att svara på frågor och korrigera eventuella fel. De grundläggande hjälpsidorna finner du här: Allmänt: Wikisource:Redigering, Korrekturläsning: Wikisource:Korrekturläsning särskilt avsnittet Tips och råd.
Något som kanske skiljer svenska Wikisource från andra språkupplagor är att vi behåller radbrytningarna i texten,och återupprättar dem när ett avstavat ord skrivits ihop (med det avstavade ordet på nästa rad). I övrigt finns kanske inte så många specialfunktioner och mallar här som på de större upplagorna. --Thurs (diskussion) 22 maj 2014 kl. 13.48 (CEST)
Hej! Jag beskar filen så att Google-loggorna inte finns kvar. Säg till om det blev något fel. Edaen (diskussion) 22 maj 2014 kl. 14.29 (CEST)
Om du ska lägga in dummy-sidor bör du nog välja tomma sidor istället. Eller hur har du tänkt här?--Thurs (diskussion) 22 maj 2014 kl. 15.04 (CEST)
Jag tog bort Googles inledningsanförande. Eftersom filen används här på Wikisource måste antalet sidor vara det samma och eftersom Djvu-solo har lite svårt att hantera tomma sidor använde jag titelsidan. Edaen (diskussion) 22 maj 2014 kl. 15.07 (CEST)
OK, det blev lite förvirrande eftersom det såg ut som en smutstitel som hade markerats av misstag. Nu har jag återställt till originalversionen trots allt eftersom det verkar som om OCR-texten också försvunnit i processen.--Thurs (diskussion) 22 maj 2014 kl. 17.41 (CEST)

Uteblivna diagram[redigera]

I april 2010, 2011, 2012, 2013 gjorde jag (sparade och uppladdade kopior av) statistiska diagram för svenska och andra språk av Wikisource, som t.ex. syns i Wikisource:Korrekturläsning/statistik. Men i april 2014 glömde jag detta. Så kan det gå. Det är svårt med kontinuiteten i sådana här oavlönade projekt, där allt beror av individer. --LA2 (diskussion) 2 juni 2014 kl. 03.07 (CEST)

Jag observerade det i början av maj och laddade ned ett diagram den 5 maj, men i all vårstress hann jag inte ladda upp diagrammet. Det kanske duger? -- Simsalabim (diskussion) 2 juni 2014 kl. 09.21 (CEST)
Wikisource 20140505 pages sv.png
Det är inte jag som behöver dessa. Det är commons:Category:ProofreadPage Statistics som kommer att sakna dem om 10 år. Och för alla språk, inte bara svenska. Kanske borde det göras på månadsbasis och av någon som är avlönad. Kanske har den som producerar diagrammen dem redan sparade? --LA2 (diskussion) 2 juni 2014 kl. 18.22 (CEST)
Det duger gott för svenska Wikisources behov i alla fall. Den internationella biten det nog mer meningsfullt att diskutera hpå maillistan eller något annat internationellt forum.--Thurs (diskussion) 2 juni 2014 kl. 22.58 (CEST)

Svenska spindlar[redigera]

En PDF av boken "Svenska spindlar" (w:Svenska spindlar) finns på Wikimedia Commons. Är det någon som är intresserade av att föra den till Wikisource? --Daniel Mietchen (diskussion) 10 juni 2014 kl. 16.01 (CEST)

Wikisource och Google[redigera]

Jag kan inte spontant erinra mig att jag någon när jag googlat på ett namn eller ett begrepp har fått en träff i Wikisource. Därför har jag de senaste dagarna gjort ett litet experiment. I samband med att jag med kort mellanrum skapat både en vanlig wikipediartikel och en författarsida på Wikisource om Elsa Collin (båda skapade 24/6) så har jag roat mig med att söka på hennes namn i Google. Artikeln på Wikipedia fick jag, om jag minns rätt, träff på efter bara några timmar medan motsvarande sida på Wikisource fortfarande två dagar senare inte ger någon träff och det inte ens om jag explicit söker på "elsa collin" +wikisource. Jag har också provat att söka på hela meningar ur de dikter av Collin jag har lagt in men inte heller där hittar Google fram.

Jag vet att det finns möjlighet att explicit lägga in någon form av kod på sidor som man inte vill att Google skall indexera och att man på Wikipedia bl a gör det på diskussions- och metasidor. För Wikisources del känns det dock nästan som om det ligger någon sådan anti-indexering över hela sajten, men det kan väl knappast vara meningen? /FredrikT (diskussion) 26 juni 2014 kl. 15.54 (CEST)

Vid sökning på "Kris i befolkningsfrågan" hamnar Wikisource på andra plats, "Sweriges rikes lag" på sjätte, "Byggningabalken" på femte och "Förarbetena till Sveriges rikes lag" på andra. Av någon obegriplig anledning kommer "Missgärningsbalken" långt ner, "Fritidsutredningen" kommer på första och samma med "Om svensk jordäganderätt". Edaen (diskussion) 26 juni 2014 kl. 20.35 (CEST)
Nu har jag ingen detaljkunskap om hur Googles indexering fungerar men visst indexeras Wikisources sidor som Edaen visar. Hur lång tid det tar har jag aldrig sett någon siffra på men det känns litet orättvist att jämföra med en av de största webbplatserna.--Thurs (diskussion) 26 juni 2014 kl. 20.44 (CEST)
Enligt några stickprov verkar det dröja omkring 1-2 veckor innan texterna dyker upp vid googlesökningar.--Thurs (diskussion) 26 juni 2014 kl. 21.22 (CEST)

Kajsa Warg[redigera]

Är det någon som är intresserad av att hjälpa till att tanka upp den här digitaliseringen av Hjelpreda i Hushållningen för Unga Fruentimber?

Jag har pysslat en hel del med kokböcker och mathistoria, bl.a. för B- och kandidatuppsatser i historia. Jag korrekturläser och sånt mer än gärna, men det tekniska är jag betydligt sämre på, särskilt batch uploads och dyl.

Peter Isotalo (diskussion) 15 augusti 2014 kl. 19.32 (CEST)

Jag håller på att ladda ner bildfiler och ska skapa en djvu-fil. Den borde komma upp under helgen. -- Simsalabim (diskussion) 15 augusti 2014 kl. 22.32 (CEST)
Sweet! Det finns fler intressanta böcker på Örebros hemsida, särskilt Anna Maria Rückerschölds från 1790-tal.[1][2]
Umeå universitet har också en del i sin rara boksamling.[3] Bland de intressantaste är Egerin (1737), Elzberg (1751) och Björklund (1847).
Peter Isotalo (diskussion) 16 augusti 2014 kl. 10.23 (CEST)
En liten hushållsbok finns nu på Commons. Edaen (diskussion) 16 augusti 2014 kl. 11.54 (CEST)
Fina fisken. Hur funkar det med OCR av frakturstil? Jag la till Kategori:OCR-kö för fraktur, men vem/vad gör detta?
Peter Isotalo (diskussion) 16 augusti 2014 kl. 18.53 (CEST)
Den kategorin är meningslös, ingen har någonsin OCR-tolkat något index som legat i den.--Thurs (diskussion) 16 augusti 2014 kl. 21.39 (CEST)
Finns OCR-tolkning av frakturstil som funktion öht?
Peter Isotalo (diskussion) 17 augusti 2014 kl. 09.01 (CEST)
Jag tror det var Lavallen som stod för den. Det blir inte bra när jag gör det med VietOCR. Sweriges Rikes Lag knappades in för hand. Edaen
Lagtexten är betydligt kortare än Warg och tog ändå två månader att fixa. Och så har vi Egerin, Elzberg, Rückerschöld, etc... Sammantaget är det en jäkla massa transkribering. Jag skulle inte ducka, men finns det någon form av automatiseringsmöjligheter så kan många persontimmar besparas. Hur blev det när du försökte, Edaen?
@Lavallen, håller du fortfarande på?
Peter Isotalo (diskussion) 17 augusti 2014 kl. 13.42 (CEST)
Användaren kallar sig Innocent bystander nuförtiden. Men Lavallen stod aldrig för någon fraktur-OCR vad jag vet. Som jag förstår så gjorde han en helt vanlig OCR på Fjällstedts bibel som sedan behövde en kraftig efterbearbetning.--Thurs (diskussion) 18 augusti 2014 kl. 15.26 (CEST)
Jag hade fraktur-OCR, men texten på varje sida krävde ändå en hel del arbete innan jag publicerade den här. -- Innocent bystander (diskussion) 20 augusti 2014 kl. 14.21 (CEST)
Det blev bara ett gytter av tecken, ord och meningar framträder som enheter, men vilka bokstäver som bygger upp orden går inte att utläsa. Edaen (diskussion) 17 augusti 2014 kl. 17.25 (CEST)
Om du är villig att betala finns Abbyy Finereader Online som verkar stödja fraktur. Du kan testa tjänsten med 10 sidor utan kostnad. -- Simsalabim (diskussion) 17 augusti 2014 kl. 17.12 (CEST)

(diskussion) 17 augusti 2014 kl. 10.34 (CEST)

@Edaen, det verkar som om första sidan av inledningen inte kom med.
Peter Isotalo (diskussion) 16 augusti 2014 kl. 19.02 (CEST)
Nu skall den finnas med. Edaen (diskussion) 16 augusti 2014 kl. 19.24 (CEST)

Fler kokböcker?[redigera]

Tack så mycket för hjälpen med att fixa djvu:er. Jag lunkar på med transkribering av Warg för tillfället. Om ni ids så skulle det vara trevligt att ha andra kokböcker att variera transkriptionsarbetet med. Här är de jag tycker skulle vara väldigt bra att göra ordentligt tillgängliga:

  • Den nya och fullständiga kok-boken[4]
    • andra upplagan finns även här något bättre skannad
  • En nödig och nyttig hus-hålds- och kok-bok[5]
  • Försök til en pålitelig matrednings-bok[6]
  • Johan Winbergs Kok-bok[7]
  • En mycket nyttig och förbättrad trenchier-bok[8]

Jag är faktiskt fortfarande rätt förvånad över att Warg fortfarande inte blivit transkriberad i sin helhet och tillgängliggjord i digital form.

Peter Isotalo (diskussion) 22 augusti 2014 kl. 12.57 (CEST)

Användarnamnsbyten[redigera]

Om någon har ett önskemål om ett lokalt användarnamnsbyte bör komma fram med det snarast då det har förvarnats om att byråkraterna på de olika projekten kommer att förlora den rätten inom kort (15 september). Det mesta kan dock redan nu hanteras av den globala användarnamnsbytessidan på Meta.--Thurs (diskussion) 25 augusti 2014 kl. 22.34 (CEST)

Nya funktioner[redigera]

Nu finns det två nya funktioner i sidnamnrymden. OCR och HOCR.

OCR

Vid korrekturläsning finns det nu en knapp där man kan begära en OCR-tolkning av den sidan.

Hocr

I filer som har inbäddade OCR-text hOCR-lager (de flesta djvu- och pdf-filerna) kan man nu dubbelklicka på ett ord och komma till motsvarande ord på faksimilen. Vilket i synnerhet är praktiskt vid stora sidor som tidningar. --Thurs (diskussion) 30 augusti 2014 kl. 16.32 (CEST)

HOCR fungerar fantastiskt bra på sidor i Lagfarenhetsbiblioteket där jag lagt in text. Det fungerar däremot inte på SOU 2014:10 där det verkligen finns inbäddad text. Edaen (diskussion) 3 oktober 2014 kl. 12.35 (CEST)
Det var nog en förenkling av mig. Det som behövs är ett hOCR-lager som beskriver läget av orden på sidan med hjälp av boxar, det ska finnas i de flesta djvu-filer, någon OCR-text behövs tydligen inte. Varför det inte fungerar i det andra exemplet har jag ingen aning om.--Thurs (diskussion) 3 oktober 2014 kl. 16.51 (CEST)

Interwiki till flerspråkiga/gamla Wikisource[redigera]

Prefixet [[mul:...]] fungerar nu om man vill iw-länka till en sida på flerspråkiga/gamla Wikisource.--Thurs (diskussion) 29 september 2014 kl. 21.23 (CEST)

Färdig Liten Hushålls-Bok[redigera]

I alla fall så är den huvudsakliga transkriberingen färdig. Sida 6 (innehållet) saknas eftersom det har blivit en dubblett av sida 5. Sida 87 är också dubblerad från föregående sida. Den behöver egentligen bara redigeras bort från .djvu-filen.

Annars behövs bara korrläsning och lite erfarna ögon på typografin så att den stämmer. Sen borde den var färdig att låsas och läggas upp.

Peter Isotalo (diskussion) 10 oktober 2014 kl. 00.20 (CEST)

Nu är den korrekturläst och uppdelad i kortare avsnitt (samt den saknade sista sidan transkriberad). Validering återstår; kanske även inplacering i lämpliga kategorier. -- Slager (diskussion) 25 oktober 2014 kl. 19.06 (CEST)
Perfa. Tack för hjälpen med förbättrat index och innehållsförteckning!
Peter Isotalo (diskussion) 26 oktober 2014 kl. 02.19 (CEST)

Antikva i fraktur[redigera]

Jag har gjort ett inlägg på Wikisourcediskussion:Redigering#Antikva i fraktur borde kursiveras för den som är intresserad. Det gäller riktlinjen för hur antikva ska tolkas i verk tryckta med frakturstil.

Peter Isotalo (diskussion) 27 oktober 2014 kl. 01.38 (CET)

Koraler i 1697 års psalmbok[redigera]

Jag har i ett års tid haft tanken att reproducera noterna i 1695 års psalmbok (vilket snarare är 1697 års koralbok). Jag har sedan tidigare erfarenhet av LilyPond och såg att wikisource har stöd för mediawiki's Score Extension som använder just LilyPond. Jag såg även att Thurs hade börjat experimentera med koraler och hade en kort diskussion med honom i februari. Efter att projektet har legat i träda ett halvår så har jag nu satt ihop ett fungerande system med följande komponenter: mallarna {{Koral1697}} och {{Koralsida1697}} samt Kategori:Koral1697

Själva koralerna (melodi, bas, första versen och övrig information) har jag lagt som sidor Koral1697/1, Koral1697/2 etc. Koralsidorna kan sedan läggas till publicerade texter och sidor genom:

{{Koralsida1697|1}}

(se Desse äro de tio bud, Sida:Psalm1695-1.djvu/12 och Sida:Psalm1695-1.djvu/13, i de senare fallen så har jag en meny som använder class="varningstext" vilket bör ändras men jag visste inte om jag borde ändra i MediaWiki:Common.css.)

Funktionalitet finns för att återanvända melodin från en annan psalm och enbart byta ut versen. Då skriver man t ex på sidan Koral1697/17:

{{Koralsida1697|1|nr=17|vers=Ny vers för psalm 17 som använder melodin från psalm 1}}

Det går även att visa koralen med modern notskrift och t ex enbart melodin:

{{Koralsida1697|1|output=lilypond-modern|bas=}}

I nuläget visar jag koralen med modern notskrift och enbart melodi på Desse äro de tio bud men länkar till Koral1697/1 som har den tvåstämmiga koralen i mer autentisk notation. Se Användare:Sordin/Arbetsbänk för fler exempel. Mallarna är någorlunda dokumenterade.

Det största nackdelen jag kan se med detta system är att korrekturläsningen av noterna inte kan ske på samma sätt som med textmassan eftersom noterna ligger på en annan sida (och inte ens i sidnamnrymden). Det verkade i slutändan som att detta ändå var den mest rationella lösningen. Tanken är alltså att man inte transkluderar med noterna när man publicera en psalm från sidnamnrymden utan lägger till melodin separat med {{Koralsida1697}}.

Det är för övrigt väldigt svårt att läsa alla detaljerna från de scannade sidorna. Speciellt svårt är det att skilja fjärdedelar från åttondelar och att identifiera pauser och punkterade noter.

Kommentarer? — Sordin (diskussion) 29 oktober 2014 kl. 21.24 (CET)

Inte annat än en stilla applåd! Att korrekturläsningen av noterna sker på en annan sida verkar väl vara ett mindre problem jämfört med svårigheten att över huvud taget korrekturläsa dem... — Slager (diskussion) 31 oktober 2014 kl. 10.34 (CET)

Bot för <tt> istället för kursivt[redigera]

Per diskussionen här så skulle det vara bra med en automatisk konvertering från t.ex. ''sauce'' till <tt>sauce</tt>. Går sånt att fixa med en bot?

Peter Isotalo (diskussion) 30 oktober 2014 kl. 20.39 (CET)

Om inte kursiv används till något annat än antikva i ett index så går det att fixa med en bot.--Thurs (diskussion) 2 november 2014 kl. 23.52 (CET)
Femte upplagan av Hjelpreda i Hushållningen är nu färdigtranskriberad. Underrättelse Om Färgning finns med i samma volym, men har ingen angiven författare och verkar inte tillskrivas Warg.
Thurs, har du botkunskap nog att bussa ett byta-ut-kursivt-mot-<tt></tt>-script du kan bussa på Warg? Innan Slager påpepakde för mig att imperativformen av "låta" var "lät", så skrev jag också konsekvent "låt". Det kan vara upp till et par hundra sidor som innehåller felaktiga "låt" istället för "lät". Om möjligt, så skulle det vara bra om det också kunde botfixas. I alla fall där "låt" förekommer med mellanslag efter (och/eller före).
Peter Isotalo (diskussion) 24 november 2014 kl. 09.34 (CET)
Fixat båda nu. Märk väl att botten inte klarar av syntaxfel och att jag inte kan garantera att jag hittat alla manuellt.--Thurs (diskussion) 24 november 2014 kl. 17.33 (CET)
Sweet. Tack så mycket. Jag tror nog du fick med allt eftersom det var väldigt regelbunden syntax. Resten lär blir nog lätt att märka vid manuell korr.
Peter Isotalo (diskussion) 25 november 2014 kl. 00.01 (CET)