Wikisource:Mötesplatsen

Från Wikisource, det fria biblioteket.
Hoppa till: navigering, sök


Välkommen till Mötesplatsen[redigera]

Välkommen

Mötesplatsen är det allmänna diskussionsforumet om svenska Wikisource.

Skriv ett nytt meddelande under en ny rubrik

Mötesplatsen är rätt plats för att ansöka om att använda en bot på projektet. Observera att kortare botkörningar, såsom interwiki, ofta kan göras utan botflagga.

För användarnamnsbyten gå till Metas sida för globala användarnamnsbyten.

To request to run a bot on Swedish Wikisource, start a thread on this page and describe your bot and what kind of job you would like to do. Note, that minor bot-jobs, such as iw-linking often can be done without botflag.

To request change of username/SUL, please go to the request page for a global rename.

Gamla diskussioner[redigera]

Arkiverade årgångar av Wikisource:Mötesplatsen:

Diskussioner[redigera]

Transkriberad text utan källbilder[redigera]

Hej. Jag fick förra veckan en frågan från en anställd vid Kungliga Biblioteket som jag ville kolla av här innan jag svarar.

KB sitter på en samling av tidigt digitaliserat material (transkriberat för hand på 90-talet) där originalbilderna är väldigt skadade mikrofilmer och därför inte lämpliga att ladda upp. Samlingen i fråga rör sig om posttidnignar mellan 1600-1725 (om jag inte missminner mig). Så min frågor är:

  1. Hur fungerar det med uppladdning av texter där bilderna av sidorna saknas?
  2. Hur organiserar man enklast upp en samling som består av enskilda nummer av en "tidning" (nyhetsbrev är nog en mer passande beskrivning)
  3. Finns det någon här som skulle kunna tänka sig guida om jag sätter er i kontakt?

/André Costa (WMSE) (diskussion) 1 april 2014 kl. 13.23 (CEST)

1. Skapa en pdf eller djvu-fil med den transkriberade texten och ladda upp den på Commons som förlaga, gärna med den transkriberade texten inbäddad. Edaen (diskussion) 1 april 2014 kl. 16.26 (CEST)
Det känns ju lite bakvänt. Har sett sidor utan Commons-dokument tidigare (dock var de flesta från 2008). Eller hade svaret med gårdagens datum att göra? /André Costa (WMSE) (diskussion) 2 april 2014 kl. 10.28 (CEST)
Jämför Index:1866 K brev ang Djurgårdens förläggande till Stockholm.djvu som är en transkription av ett äldre dokument. Edaen (diskussion) 2 april 2014 kl. 10.49 (CEST)
Det är trots allt en avskrift på papper som sedan kopierats. Här rör det sig om redan digitaliserat material, att lägga det som korrekturläsning utan faksimil bara för att passa in i våra rutiner blir en aning bakvänt.
Det skulle ändå kunna vara en idé att göra det om texten innehåller formatering (kursiv, spärrning, centrering &c) om det inte går att få med den med "digitaltexten".
Finns inte detta kan man lika gärna lägga in det direkt i huvudnamnrymden.
Wikisource:Tidningar finns en del skrivet, men den sidan är inte direkt uppdaterad.
Arbetsgången utan faksimil blir i korthet.
  1. Skapa en ingångssida: [Tidningens namn]
    • På den läggs in: titelmall, en lista med tidningens nummer länkade i formen [[Tidningens namn ÅÅÅÅ-MM-DD]] och kategorier
    • Se Linköpings Wecko-Tidningar för ett aktuellt exempel
  2. Från ingångsidans länkar skapas sedan de enstaka tidningsnumren i formen:
{{Titel|Tidningens namn|undertitel=nummer och datum|förra=[[föregående nummer]]|nästa=[[nästa nummer]]|kommentar=eventuell kommentar}}

Texten

[[Kategori:Tidningens namn]]
Nackdelen med att inte använda korrekturläsningsfunktionen är att man måste lägga in titelmallen med förra- och nästa-länkarna manuellt.
Det är i princip det hela arbetsgången. Om användaren/na skapar ingångssidan och något nummer och kanske sedan avvaktar något eller några dygn för eventuella justeringar av andra användare för att sedan lägga in resten. Har de ytterligar frågor är de välkomna att ställa dem här eller någon annan diskussionssida.--Thurs (diskussion) 2 april 2014 kl. 13.36 (CEST)
Många tack för det utförliga svaret. Ska vidarebefordra så får vi hoppas att det tillkommer material. /André Costa (WMSE) (diskussion) 5 april 2014 kl. 15.50 (CEST)

Hej[redigera]

Hej på alla! Jag är en italiensk användare och studerar svenska vid universitetet. Jag ville delta på sv.wikisource, i syfte att känna och läsa er literatur och för att lära mig nya ord. Jag lagt upp den här ny bok. Finns det någon, som kan följa mina bidrag och kontrollera vad jag göra? Jag skulle vilja också finna några Hjälpsidor om vad sv.wikisource funkar. Var är de? Tack så mycket! --Nastoshka (diskussion) 22 maj 2014 kl. 11.07 (CEST)

Välkommen till svenska Wikisource. De flesta erfarna användarna här brukar hjälpa till med att svara på frågor och korrigera eventuella fel. De grundläggande hjälpsidorna finner du här: Allmänt: Wikisource:Redigering, Korrekturläsning: Wikisource:Korrekturläsning särskilt avsnittet Tips och råd.
Något som kanske skiljer svenska Wikisource från andra språkupplagor är att vi behåller radbrytningarna i texten,och återupprättar dem när ett avstavat ord skrivits ihop (med det avstavade ordet på nästa rad). I övrigt finns kanske inte så många specialfunktioner och mallar här som på de större upplagorna. --Thurs (diskussion) 22 maj 2014 kl. 13.48 (CEST)
Hej! Jag beskar filen så att Google-loggorna inte finns kvar. Säg till om det blev något fel. Edaen (diskussion) 22 maj 2014 kl. 14.29 (CEST)
Om du ska lägga in dummy-sidor bör du nog välja tomma sidor istället. Eller hur har du tänkt här?--Thurs (diskussion) 22 maj 2014 kl. 15.04 (CEST)
Jag tog bort Googles inledningsanförande. Eftersom filen används här på Wikisource måste antalet sidor vara det samma och eftersom Djvu-solo har lite svårt att hantera tomma sidor använde jag titelsidan. Edaen (diskussion) 22 maj 2014 kl. 15.07 (CEST)
OK, det blev lite förvirrande eftersom det såg ut som en smutstitel som hade markerats av misstag. Nu har jag återställt till originalversionen trots allt eftersom det verkar som om OCR-texten också försvunnit i processen.--Thurs (diskussion) 22 maj 2014 kl. 17.41 (CEST)

Uteblivna diagram[redigera]

I april 2010, 2011, 2012, 2013 gjorde jag (sparade och uppladdade kopior av) statistiska diagram för svenska och andra språk av Wikisource, som t.ex. syns i Wikisource:Korrekturläsning/statistik. Men i april 2014 glömde jag detta. Så kan det gå. Det är svårt med kontinuiteten i sådana här oavlönade projekt, där allt beror av individer. --LA2 (diskussion) 2 juni 2014 kl. 03.07 (CEST)

Jag observerade det i början av maj och laddade ned ett diagram den 5 maj, men i all vårstress hann jag inte ladda upp diagrammet. Det kanske duger? -- Simsalabim (diskussion) 2 juni 2014 kl. 09.21 (CEST)
Wikisource 20140505 pages sv.png
Det är inte jag som behöver dessa. Det är commons:Category:ProofreadPage Statistics som kommer att sakna dem om 10 år. Och för alla språk, inte bara svenska. Kanske borde det göras på månadsbasis och av någon som är avlönad. Kanske har den som producerar diagrammen dem redan sparade? --LA2 (diskussion) 2 juni 2014 kl. 18.22 (CEST)
Det duger gott för svenska Wikisources behov i alla fall. Den internationella biten det nog mer meningsfullt att diskutera hpå maillistan eller något annat internationellt forum.--Thurs (diskussion) 2 juni 2014 kl. 22.58 (CEST)

Svenska spindlar[redigera]

En PDF av boken "Svenska spindlar" (w:Svenska spindlar) finns på Wikimedia Commons. Är det någon som är intresserade av att föra den till Wikisource? --Daniel Mietchen (diskussion) 10 juni 2014 kl. 16.01 (CEST)

Wikisource och Google[redigera]

Jag kan inte spontant erinra mig att jag någon när jag googlat på ett namn eller ett begrepp har fått en träff i Wikisource. Därför har jag de senaste dagarna gjort ett litet experiment. I samband med att jag med kort mellanrum skapat både en vanlig wikipediartikel och en författarsida på Wikisource om Elsa Collin (båda skapade 24/6) så har jag roat mig med att söka på hennes namn i Google. Artikeln på Wikipedia fick jag, om jag minns rätt, träff på efter bara några timmar medan motsvarande sida på Wikisource fortfarande två dagar senare inte ger någon träff och det inte ens om jag explicit söker på "elsa collin" +wikisource. Jag har också provat att söka på hela meningar ur de dikter av Collin jag har lagt in men inte heller där hittar Google fram.

Jag vet att det finns möjlighet att explicit lägga in någon form av kod på sidor som man inte vill att Google skall indexera och att man på Wikipedia bl a gör det på diskussions- och metasidor. För Wikisources del känns det dock nästan som om det ligger någon sådan anti-indexering över hela sajten, men det kan väl knappast vara meningen? /FredrikT (diskussion) 26 juni 2014 kl. 15.54 (CEST)

Vid sökning på "Kris i befolkningsfrågan" hamnar Wikisource på andra plats, "Sweriges rikes lag" på sjätte, "Byggningabalken" på femte och "Förarbetena till Sveriges rikes lag" på andra. Av någon obegriplig anledning kommer "Missgärningsbalken" långt ner, "Fritidsutredningen" kommer på första och samma med "Om svensk jordäganderätt". Edaen (diskussion) 26 juni 2014 kl. 20.35 (CEST)
Nu har jag ingen detaljkunskap om hur Googles indexering fungerar men visst indexeras Wikisources sidor som Edaen visar. Hur lång tid det tar har jag aldrig sett någon siffra på men det känns litet orättvist att jämföra med en av de största webbplatserna.--Thurs (diskussion) 26 juni 2014 kl. 20.44 (CEST)
Enligt några stickprov verkar det dröja omkring 1-2 veckor innan texterna dyker upp vid googlesökningar.--Thurs (diskussion) 26 juni 2014 kl. 21.22 (CEST)

Kajsa Warg[redigera]

Är det någon som är intresserad av att hjälpa till att tanka upp den här digitaliseringen av Hjelpreda i Hushållningen för Unga Fruentimber?

Jag har pysslat en hel del med kokböcker och mathistoria, bl.a. för B- och kandidatuppsatser i historia. Jag korrekturläser och sånt mer än gärna, men det tekniska är jag betydligt sämre på, särskilt batch uploads och dyl.

Peter Isotalo (diskussion) 15 augusti 2014 kl. 19.32 (CEST)

Jag håller på att ladda ner bildfiler och ska skapa en djvu-fil. Den borde komma upp under helgen. -- Simsalabim (diskussion) 15 augusti 2014 kl. 22.32 (CEST)
Sweet! Det finns fler intressanta böcker på Örebros hemsida, särskilt Anna Maria Rückerschölds från 1790-tal.[1][2]
Umeå universitet har också en del i sin rara boksamling.[3] Bland de intressantaste är Egerin (1737), Elzberg (1751) och Björklund (1847).
Peter Isotalo (diskussion) 16 augusti 2014 kl. 10.23 (CEST)
En liten hushållsbok finns nu på Commons. Edaen (diskussion) 16 augusti 2014 kl. 11.54 (CEST)
Fina fisken. Hur funkar det med OCR av frakturstil? Jag la till Kategori:OCR-kö för fraktur, men vem/vad gör detta?
Peter Isotalo (diskussion) 16 augusti 2014 kl. 18.53 (CEST)
Den kategorin är meningslös, ingen har någonsin OCR-tolkat något index som legat i den.--Thurs (diskussion) 16 augusti 2014 kl. 21.39 (CEST)
Finns OCR-tolkning av frakturstil som funktion öht?
Peter Isotalo (diskussion) 17 augusti 2014 kl. 09.01 (CEST)
Jag tror det var Lavallen som stod för den. Det blir inte bra när jag gör det med VietOCR. Sweriges Rikes Lag knappades in för hand. Edaen
Lagtexten är betydligt kortare än Warg och tog ändå två månader att fixa. Och så har vi Egerin, Elzberg, Rückerschöld, etc... Sammantaget är det en jäkla massa transkribering. Jag skulle inte ducka, men finns det någon form av automatiseringsmöjligheter så kan många persontimmar besparas. Hur blev det när du försökte, Edaen?
@Lavallen, håller du fortfarande på?
Peter Isotalo (diskussion) 17 augusti 2014 kl. 13.42 (CEST)
Användaren kallar sig Innocent bystander nuförtiden. Men Lavallen stod aldrig för någon fraktur-OCR vad jag vet. Som jag förstår så gjorde han en helt vanlig OCR på Fjällstedts bibel som sedan behövde en kraftig efterbearbetning.--Thurs (diskussion) 18 augusti 2014 kl. 15.26 (CEST)
Jag hade fraktur-OCR, men texten på varje sida krävde ändå en hel del arbete innan jag publicerade den här. -- Innocent bystander (diskussion) 20 augusti 2014 kl. 14.21 (CEST)
Det blev bara ett gytter av tecken, ord och meningar framträder som enheter, men vilka bokstäver som bygger upp orden går inte att utläsa. Edaen (diskussion) 17 augusti 2014 kl. 17.25 (CEST)
Om du är villig att betala finns Abbyy Finereader Online som verkar stödja fraktur. Du kan testa tjänsten med 10 sidor utan kostnad. -- Simsalabim (diskussion) 17 augusti 2014 kl. 17.12 (CEST)

(diskussion) 17 augusti 2014 kl. 10.34 (CEST)

@Edaen, det verkar som om första sidan av inledningen inte kom med.
Peter Isotalo (diskussion) 16 augusti 2014 kl. 19.02 (CEST)
Nu skall den finnas med. Edaen (diskussion) 16 augusti 2014 kl. 19.24 (CEST)

Fler kokböcker?[redigera]

Tack så mycket för hjälpen med att fixa djvu:er. Jag lunkar på med transkribering av Warg för tillfället. Om ni ids så skulle det vara trevligt att ha andra kokböcker att variera transkriptionsarbetet med. Här är de jag tycker skulle vara väldigt bra att göra ordentligt tillgängliga:

  • Den nya och fullständiga kok-boken[4]
    • andra upplagan finns även här något bättre skannad
  • En nödig och nyttig hus-hålds- och kok-bok[5]
  • Försök til en pålitelig matrednings-bok[6]
  • Johan Winbergs Kok-bok[7]
  • En mycket nyttig och förbättrad trenchier-bok[8]

Jag är faktiskt fortfarande rätt förvånad över att Warg fortfarande inte blivit transkriberad i sin helhet och tillgängliggjord i digital form.

Peter Isotalo (diskussion) 22 augusti 2014 kl. 12.57 (CEST)

Användarnamnsbyten[redigera]

Om någon har ett önskemål om ett lokalt användarnamnsbyte bör komma fram med det snarast då det har förvarnats om att byråkraterna på de olika projekten kommer att förlora den rätten inom kort (15 september). Det mesta kan dock redan nu hanteras av den globala användarnamnsbytessidan på Meta.--Thurs (diskussion) 25 augusti 2014 kl. 22.34 (CEST)

Nya funktioner[redigera]

Nu finns det två nya funktioner i sidnamnrymden. OCR och HOCR.

OCR

Vid korrekturläsning finns det nu en knapp där man kan begära en OCR-tolkning av den sidan.

Hocr

I filer som har inbäddad OCR-text kan man nu dubbelklicka på ett ord och komma till motsvarande ord på faksimilen. Vilket i synnerhet är praktiskt vid stora sidor som tidningar. --Thurs (diskussion) 30 augusti 2014 kl. 16.32 (CEST)