Wikisource:Mötesplatsen

Från Wikisource, det fria biblioteket.
Hoppa till: navigering, sök


Välkommen till Mötesplatsen[redigera]

Välkommen

Mötesplatsen är det allmänna diskussionsforumet om svenska Wikisource.

Skriv ett nytt meddelande under en ny rubrik

Mötesplatsen är rätt plats för att ansöka om att använda en bot på projektet. Observera att kortare botkörningar, såsom interwiki, ofta kan göras utan botflagga.

För användarnamnsbyten gå till Metas sida för globala användarnamnsbyten.

To request to run a bot on Swedish Wikisource, start a thread on this page and describe your bot and what kind of job you would like to do. Note, that minor bot-jobs, such as iw-linking often can be done without botflag.

To request change of username/SUL, please go to the request page for a global rename.

Gamla diskussioner[redigera]

Arkiverade årgångar av Wikisource:Mötesplatsen:

Diskussioner[redigera]

Kajsa Warg[redigera]

Är det någon som är intresserad av att hjälpa till att tanka upp den här digitaliseringen av Hjelpreda i Hushållningen för Unga Fruentimber?

Jag har pysslat en hel del med kokböcker och mathistoria, bl.a. för B- och kandidatuppsatser i historia. Jag korrekturläser och sånt mer än gärna, men det tekniska är jag betydligt sämre på, särskilt batch uploads och dyl.

Peter Isotalo (diskussion) 15 augusti 2014 kl. 19.32 (CEST)

Jag håller på att ladda ner bildfiler och ska skapa en djvu-fil. Den borde komma upp under helgen. -- Simsalabim (diskussion) 15 augusti 2014 kl. 22.32 (CEST)
Sweet! Det finns fler intressanta böcker på Örebros hemsida, särskilt Anna Maria Rückerschölds från 1790-tal.[1][2]
Umeå universitet har också en del i sin rara boksamling.[3] Bland de intressantaste är Egerin (1737), Elzberg (1751) och Björklund (1847).
Peter Isotalo (diskussion) 16 augusti 2014 kl. 10.23 (CEST)
En liten hushållsbok finns nu på Commons. Edaen (diskussion) 16 augusti 2014 kl. 11.54 (CEST)
Fina fisken. Hur funkar det med OCR av frakturstil? Jag la till Kategori:OCR-kö för fraktur, men vem/vad gör detta?
Peter Isotalo (diskussion) 16 augusti 2014 kl. 18.53 (CEST)
Den kategorin är meningslös, ingen har någonsin OCR-tolkat något index som legat i den.--Thurs (diskussion) 16 augusti 2014 kl. 21.39 (CEST)
Finns OCR-tolkning av frakturstil som funktion öht?
Peter Isotalo (diskussion) 17 augusti 2014 kl. 09.01 (CEST)
Jag tror det var Lavallen som stod för den. Det blir inte bra när jag gör det med VietOCR. Sweriges Rikes Lag knappades in för hand. Edaen
Lagtexten är betydligt kortare än Warg och tog ändå två månader att fixa. Och så har vi Egerin, Elzberg, Rückerschöld, etc... Sammantaget är det en jäkla massa transkribering. Jag skulle inte ducka, men finns det någon form av automatiseringsmöjligheter så kan många persontimmar besparas. Hur blev det när du försökte, Edaen?
@Lavallen, håller du fortfarande på?
Peter Isotalo (diskussion) 17 augusti 2014 kl. 13.42 (CEST)
Användaren kallar sig Innocent bystander nuförtiden. Men Lavallen stod aldrig för någon fraktur-OCR vad jag vet. Som jag förstår så gjorde han en helt vanlig OCR på Fjällstedts bibel som sedan behövde en kraftig efterbearbetning.--Thurs (diskussion) 18 augusti 2014 kl. 15.26 (CEST)
Jag hade fraktur-OCR, men texten på varje sida krävde ändå en hel del arbete innan jag publicerade den här. -- Innocent bystander (diskussion) 20 augusti 2014 kl. 14.21 (CEST)
Det blev bara ett gytter av tecken, ord och meningar framträder som enheter, men vilka bokstäver som bygger upp orden går inte att utläsa. Edaen (diskussion) 17 augusti 2014 kl. 17.25 (CEST)
Om du är villig att betala finns Abbyy Finereader Online som verkar stödja fraktur. Du kan testa tjänsten med 10 sidor utan kostnad. -- Simsalabim (diskussion) 17 augusti 2014 kl. 17.12 (CEST)

(diskussion) 17 augusti 2014 kl. 10.34 (CEST)

@Edaen, det verkar som om första sidan av inledningen inte kom med.
Peter Isotalo (diskussion) 16 augusti 2014 kl. 19.02 (CEST)
Nu skall den finnas med. Edaen (diskussion) 16 augusti 2014 kl. 19.24 (CEST)

Fler kokböcker?[redigera]

Tack så mycket för hjälpen med att fixa djvu:er. Jag lunkar på med transkribering av Warg för tillfället. Om ni ids så skulle det vara trevligt att ha andra kokböcker att variera transkriptionsarbetet med. Här är de jag tycker skulle vara väldigt bra att göra ordentligt tillgängliga:

  • Den nya och fullständiga kok-boken[4]
    • andra upplagan finns även här något bättre skannad
  • En nödig och nyttig hus-hålds- och kok-bok[5]
  • Försök til en pålitelig matrednings-bok[6]
  • Johan Winbergs Kok-bok[7]
  • En mycket nyttig och förbättrad trenchier-bok[8]

Jag är faktiskt fortfarande rätt förvånad över att Warg fortfarande inte blivit transkriberad i sin helhet och tillgängliggjord i digital form.

Peter Isotalo (diskussion) 22 augusti 2014 kl. 12.57 (CEST)

Användarnamnsbyten[redigera]

Om någon har ett önskemål om ett lokalt användarnamnsbyte bör komma fram med det snarast då det har förvarnats om att byråkraterna på de olika projekten kommer att förlora den rätten inom kort (15 september). Det mesta kan dock redan nu hanteras av den globala användarnamnsbytessidan på Meta.--Thurs (diskussion) 25 augusti 2014 kl. 22.34 (CEST)

Nya funktioner[redigera]

Nu finns det två nya funktioner i sidnamnrymden. OCR och HOCR.

OCR

Vid korrekturläsning finns det nu en knapp där man kan begära en OCR-tolkning av den sidan.

Hocr

I filer som har inbäddade OCR-text hOCR-lager (de flesta djvu- och pdf-filerna) kan man nu dubbelklicka på ett ord och komma till motsvarande ord på faksimilen. Vilket i synnerhet är praktiskt vid stora sidor som tidningar. --Thurs (diskussion) 30 augusti 2014 kl. 16.32 (CEST)

HOCR fungerar fantastiskt bra på sidor i Lagfarenhetsbiblioteket där jag lagt in text. Det fungerar däremot inte på SOU 2014:10 där det verkligen finns inbäddad text. Edaen (diskussion) 3 oktober 2014 kl. 12.35 (CEST)
Det var nog en förenkling av mig. Det som behövs är ett hOCR-lager som beskriver läget av orden på sidan med hjälp av boxar, det ska finnas i de flesta djvu-filer, någon OCR-text behövs tydligen inte. Varför det inte fungerar i det andra exemplet har jag ingen aning om.--Thurs (diskussion) 3 oktober 2014 kl. 16.51 (CEST)

Interwiki till flerspråkiga/gamla Wikisource[redigera]

Prefixet [[mul:...]] fungerar nu om man vill iw-länka till en sida på flerspråkiga/gamla Wikisource.--Thurs (diskussion) 29 september 2014 kl. 21.23 (CEST)

Färdig Liten Hushålls-Bok[redigera]

I alla fall så är den huvudsakliga transkriberingen färdig. Sida 6 (innehållet) saknas eftersom det har blivit en dubblett av sida 5. Sida 87 är också dubblerad från föregående sida. Den behöver egentligen bara redigeras bort från .djvu-filen.

Annars behövs bara korrläsning och lite erfarna ögon på typografin så att den stämmer. Sen borde den var färdig att låsas och läggas upp.

Peter Isotalo (diskussion) 10 oktober 2014 kl. 00.20 (CEST)

Nu är den korrekturläst och uppdelad i kortare avsnitt (samt den saknade sista sidan transkriberad). Validering återstår; kanske även inplacering i lämpliga kategorier. -- Slager (diskussion) 25 oktober 2014 kl. 19.06 (CEST)
Perfa. Tack för hjälpen med förbättrat index och innehållsförteckning!
Peter Isotalo (diskussion) 26 oktober 2014 kl. 02.19 (CEST)

Antikva i fraktur[redigera]

Jag har gjort ett inlägg på Wikisourcediskussion:Redigering#Antikva i fraktur borde kursiveras för den som är intresserad. Det gäller riktlinjen för hur antikva ska tolkas i verk tryckta med frakturstil.

Peter Isotalo (diskussion) 27 oktober 2014 kl. 01.38 (CET)

Koraler i 1697 års psalmbok[redigera]

Jag har i ett års tid haft tanken att reproducera noterna i 1695 års psalmbok (vilket snarare är 1697 års koralbok). Jag har sedan tidigare erfarenhet av LilyPond och såg att wikisource har stöd för mediawiki's Score Extension som använder just LilyPond. Jag såg även att Thurs hade börjat experimentera med koraler och hade en kort diskussion med honom i februari. Efter att projektet har legat i träda ett halvår så har jag nu satt ihop ett fungerande system med följande komponenter: mallarna {{Koral1697}} och {{Koralsida1697}} samt Kategori:Koral1697

Själva koralerna (melodi, bas, första versen och övrig information) har jag lagt som sidor Koral1697/1, Koral1697/2 etc. Koralsidorna kan sedan läggas till publicerade texter och sidor genom:

{{Koralsida1697|1}}

(se Desse äro de tio bud, Sida:Psalm1695-1.djvu/12 och Sida:Psalm1695-1.djvu/13, i de senare fallen så har jag en meny som använder class="varningstext" vilket bör ändras men jag visste inte om jag borde ändra i MediaWiki:Common.css.)

Funktionalitet finns för att återanvända melodin från en annan psalm och enbart byta ut versen. Då skriver man t ex på sidan Koral1697/17:

{{Koralsida1697|1|nr=17|vers=Ny vers för psalm 17 som använder melodin från psalm 1}}

Det går även att visa koralen med modern notskrift och t ex enbart melodin:

{{Koralsida1697|1|output=lilypond-modern|bas=}}

I nuläget visar jag koralen med modern notskrift och enbart melodi på Desse äro de tio bud men länkar till Koral1697/1 som har den tvåstämmiga koralen i mer autentisk notation. Se Användare:Sordin/Arbetsbänk för fler exempel. Mallarna är någorlunda dokumenterade.

Det största nackdelen jag kan se med detta system är att korrekturläsningen av noterna inte kan ske på samma sätt som med textmassan eftersom noterna ligger på en annan sida (och inte ens i sidnamnrymden). Det verkade i slutändan som att detta ändå var den mest rationella lösningen. Tanken är alltså att man inte transkluderar med noterna när man publicera en psalm från sidnamnrymden utan lägger till melodin separat med {{Koralsida1697}}.

Det är för övrigt väldigt svårt att läsa alla detaljerna från de scannade sidorna. Speciellt svårt är det att skilja fjärdedelar från åttondelar och att identifiera pauser och punkterade noter.

Kommentarer? — Sordin (diskussion) 29 oktober 2014 kl. 21.24 (CET)

Inte annat än en stilla applåd! Att korrekturläsningen av noterna sker på en annan sida verkar väl vara ett mindre problem jämfört med svårigheten att över huvud taget korrekturläsa dem... — Slager (diskussion) 31 oktober 2014 kl. 10.34 (CET)

Bot för <tt> istället för kursivt[redigera]

Per diskussionen här så skulle det vara bra med en automatisk konvertering från t.ex. ''sauce'' till <tt>sauce</tt>. Går sånt att fixa med en bot?

Peter Isotalo (diskussion) 30 oktober 2014 kl. 20.39 (CET)

Om inte kursiv används till något annat än antikva i ett index så går det att fixa med en bot.--Thurs (diskussion) 2 november 2014 kl. 23.52 (CET)
Femte upplagan av Hjelpreda i Hushållningen är nu färdigtranskriberad. Underrättelse Om Färgning finns med i samma volym, men har ingen angiven författare och verkar inte tillskrivas Warg.
Thurs, har du botkunskap nog att bussa ett byta-ut-kursivt-mot-<tt></tt>-script du kan bussa på Warg? Innan Slager påpepakde för mig att imperativformen av "låta" var "lät", så skrev jag också konsekvent "låt". Det kan vara upp till et par hundra sidor som innehåller felaktiga "låt" istället för "lät". Om möjligt, så skulle det vara bra om det också kunde botfixas. I alla fall där "låt" förekommer med mellanslag efter (och/eller före).
Peter Isotalo (diskussion) 24 november 2014 kl. 09.34 (CET)
Fixat båda nu. Märk väl att botten inte klarar av syntaxfel och att jag inte kan garantera att jag hittat alla manuellt.--Thurs (diskussion) 24 november 2014 kl. 17.33 (CET)
Sweet. Tack så mycket. Jag tror nog du fick med allt eftersom det var väldigt regelbunden syntax. Resten lär blir nog lätt att märka vid manuell korr.
Peter Isotalo (diskussion) 25 november 2014 kl. 00.01 (CET)

OCR-fraktur oväntat bättre...?[redigera]

Jag tankade nyligen upp .djvu:er för Handbok wid den nu brukliga Finare Matlagningen och Handbok för Dryckers Beredning. När jag började redigera dessa så dök det plötsligt upp automatisk OCR vid redigering av sidor. För båda är den långt från perfekt, men verkar väldigt mycket bättre än de resultat jag lyckats få tidigare. Den är också otroligt mycket bättre än när jag själv trycker på OCR-funktionen.

Inget av det här dök upp automatiskt när jag transkriberade Index:Cajsa Warg.djvu. Har mjukvara uppdaterats?

Peter Isotalo (diskussion) 27 november 2014 kl. 10.11 (CET)

Den OCR som kommer upp automatiskt är inbäddad i djvu-filen så existensen av och kvaliteten på denna beror av programvaran som använts att ta fram den.--Thurs (diskussion) 27 november 2014 kl. 20.21 (CET)
Ah. Noterade inte att det fanns i pdf:en (förräns nu). Lovande dock.
Peter Isotalo (diskussion) 27 november 2014 kl. 20.51 (CET)

Kampanj på digitalisering av äldre litteratur[redigera]

KB anordnar tillsammans med europeiska EOD en kampanj på digitalisering av äldre upphovsrättsfritt material. Fram till Från 1 till 10 december så kostar det bara 100 kronor (!) för alla titlar upp till 400 sidor:

http://www.kb.se/aktuellt/nyheter/2014/E-bocker-till-kampanjpris/

Jag tänker själv beställa andra upplagan av Then Frantzöske-Kocken och Pasteybakaren för att se om det finns några restriktiva villkor för återanvändning. Annars så är det här ett gyllene tillfälle för att få tag på äldre källmaterial. Om man lägger ut pengar själv så kan man få ersättning i efterhand genom Wikimedia Sveriges (WMSE) referenslitteraturprojekt. Man behöver bara fylla i lite blanketter och ha någon form av kvitto. Det återstår fortfarande 2100 kr av budgeten och Axel Pettersson (Haxpett) på WMSE ser mer än gärna att vi gör slut på de pengarna:

https://se.wikimedia.org/wiki/Projekt:Referenslitteratur_2014

Jag återkommer när jag fått klara besked om digitaliseringstjänsten innebär några restriktioner för återanvändning.

Peter Isotalo (diskussion) 27 november 2014 kl. 12.29 (CET)

Enklare divisionsmall[redigera]

Jag har transkriberat text med en hel del divisionsbråk nyligen och tyckte att mall:division var rätt knölig. Så jag provade att skapa en mer snabbskriven och (i min mening) mer intuitiv mall. Jag döpte den Mall:1 så att koden för 12 helt enkelt blir {{1|2}}. Det skulle gå att göra för andra tal (främst 2 och 3), men just 1 del av X är nog det absolut vanligaste förekommande bråktalet. Jag tänkte länka mall:1 från den vanliga divisionsmallen, men tänkte först kolla om det kan innebära några problem.

Peter Isotalo (diskussion) 3 december 2014 kl. 00.26 (CET)

V/u och w/uu i frakturstil[redigera]

Jag håller på med Index:Een Lijten Kockebook-1650.djvu som är tryckt 1650 och alltså har rätt oregelbunden stavning och inkonsekvent användning av vissa bokstäver.

I Wikisource:Fraktur så finns rekommendationer för långt s, dubbel-s och tolkning av I/J. Det finns däremot inget om hur "v" och "w" bör transkriberas i ord där de står för vokalljud. Här är exempel:

  • enkelt u: "vp", "vt" och diverse sammansättningar eller avledningar av de orden
  • dubbelt u: "siwdh" (sjud), "tw" (tu/två), "swr" (sur), "brwn" (brun)

Jag tycker det finns goda skäl att inte skriva ut ord som "Swrkåhl" eller "vp". Det har mer att göra med valet av en viss typografi än stavning som sådan, särskilt om det inte verkar tal om variation mellan "uu" och "w" i samma texter.

Vad tycker andra?

Ping Thurs och ‎Marcus.linneberg.

Peter Isotalo (diskussion) 9 december 2014 kl. 00.48 (CET)

Det verkar tillräckligt regelmässigt för att det ska vara genomförbart men jag förstår inte riktigt poängen. Vad menar du att man vinner med detta?
Jag ser i vilket fall som helst inte detta som en generell regeländring men det går ju alltid att bestämma om särskilda regler för ett index på indexdiskussionssidan.--Thurs (diskussion) 9 december 2014 kl. 23.01 (CET)
Jag tycker det skulle vara i samma anda som att vi skriver ut "ß" som "ss". För att det inte är intressant för texten i sig och att modernisera lite grann gör den lättare att läsa. Kopplingen "w"/"uu" tror jag skulle gå många förbi. Samtidigt så skulle bibehållna "w" och "u" bara vara intressant ur ett snävt typografiskt perspektiv.
Men on vi ska göra det så tycker jag det bör vara en generell regel. Det kan mycket väl dyka up i fler texter. Annars rättar jag mig efter konsensus.
Peter Isotalo (diskussion) 10 december 2014 kl. 08.57 (CET)

Radbrytsfel i TF 1766[redigera]

2 § i Tryckfrihetsförordning 1766 vägrar att radbryta sig ordentligt. Nån som kan se vad som är fal?

Peter Isotalo (diskussion) 5 februari 2015 kl. 21.15 (CET)

Verk som mest är fotnoter[redigera]

Index:Tal om Läckerheter-1.djvu och Index:Tal om Läckerheter-2.djvu är ett huvudbry. Innehållet i boken är i praktiken 50-80% fotnoter. Det finns gott om sidor som bara är en enda rad brödtext[9] och resten fotnotstext.

Jag tänker sätta igång med att rätta texten (som glädjande nog är i antikva), men hjälp och handfasta rättningar mottages tacksamt.

Peter Isotalo (diskussion) 7 februari 2015 kl. 13.15 (CET)

Redan transkriberad[redigera]

Hett tips för den som känner för att hjälpa till: Tal om läckerheter har precis kommit ut i en ny bearbetad upplaga med en fullständig transkription. Hela klabbet ligger upp på KSLA:s sajt.

Det är alltså bara att klippa och klistra! Det behövs lite formatering, men det här är en enorm tidsbesparing. Det gäller bara att klura ut det bästa sättet att hantera de oändligt långa fotnoterna...

Peter Isotalo (diskussion) 24 februari 2015 kl. 15.11 (CET)

Långa fotnoter brukar inte vara något större problem. Du är väl bekant med <ref follow="NN">-taggen. Du kan se ett exempel på hur man kan göra här: Sida:Till Visby stads äldsta historia.djvu/6667.--Thurs (diskussion) 24 februari 2015 kl. 17.22 (CET)
Tack, Thurs. Okej, så slutnoter istället för fotnoter helt enkelt. Men, nej, <ref follow="NN"> är mig obekant. Länk till någon dokumentation?
Peter Isotalo (diskussion) 24 februari 2015 kl. 19.25 (CET)
En grundläggande hjälp finns här Wikisource:Korrekturläsning#Tips och råd. I det här fallet finns också är det något mera utförlig hjälp på på engelska Wikisource: en:Help:Page breaks#Footnotes across page breaks.--Thurs (diskussion) 24 februari 2015 kl. 20.14 (CET)

Dubbeluppslag[redigera]

Finns det något sätt att visa upp Index:Swenske och Lappeske ABC.djvu som parallella uppslag? Alltså två kolumner med svenska till vänster och samiska till höger?

Peter Isotalo (diskussion) 14 mars 2015 kl. 00.56 (CET)

Det finns ett hyfsat enkelt sätt. Den samiska texten hör egentligen inte hit och bör ligga på en samiskspråkig Wikisource. Någon sådan finns ännu inte så då läggs samiska texter på flerspråkiga Wikisource. Det finns i alla fall en nordsamisk huvudsida där Mul:Main Page/Sámegiella. När indexet och sidorna lagts in där och iw-länkats till varandra kan man visa båda texterna genom en s.k. dubbelwikilänk. (en dubbelriktad pil bredvid iw-länken som lägger båda texterna bredvid varandra). Vill man kan man framhäva den genom en länk i kommentaren till exempel.--Thurs (diskussion) 14 mars 2015 kl. 14.07 (CET)
Pragmatiskt! Men jag skulle behöva ha hjälp med att lägga in de svenska sidorna eftersom jag är osäker på hur man fixar icke-kontinuerliga index.
Peter Isotalo (diskussion) 14 mars 2015 kl. 14.28 (CET)
Det är faktiskt inte så svårt i det här fallet <pages index="Swenske och Lappeske ABC.djvu" from=8 to=36 step=2/> visar endast varannan sida.--Thurs (diskussion) 14 mars 2015 kl. 15.35 (CET)
Går det att flytta över ett index mellan språkversioner automatiskt eller måste man klippa/klistra manuellt?
Peter Isotalo (diskussion) 16 mars 2015 kl. 13.21 (CET)
Själva index-sidan är det nog inte någon mening med att försöka flytta då de är olika upplagda. En administratörer eller importör på flerspråkiga Wikisource kan förmodligen importera sidorna i sidnamnrymden om du hittar någon att fråga. Men frågan är om det är värt besväret då det rör sig om omkring 20 sidor.--Thurs (diskussion) 16 mars 2015 kl. 20.32 (CET)
Det var förstås inte meningen att du skulle flytta de svenska sidorna. Det ordnas med interwikitransklusion.--Thurs (diskussion) 25 mars 2015 kl. 22.24 (CET)