Wikisource:Mötesplatsen/Arkiv 2011
Miniprojekt Darwin avslutat
[redigera]I de sista skälvande timmarna av 2011 känns det bra att kunna förklara Miniprojekt Darwin (som Thurs en gång kallade det) avslutat. Från början hade jag inte tänkt att ta mig an Darwins alla fria verk, men när jag kunde lägga mina vantar på "Om arternas uppkomst" så började en tanke gro. Nu är i alla fall de tre verken
i hamn. Gott nytt år på er! -- Simsalabim 31 december 2011 kl. 16.26 (CET)
- Grattis! - Special:IndexPages har haft 3 Darwin-texter i topp-5 ett tag. Nu kanske det finns en chans att mina band hinner komma ifatt lite. :) -- Lavallen 31 december 2011 kl. 16.58 (CET)
- Gott slut för "Miniprojekt Darwin" och ett gott nytt år till alla från mig också! --Thurs 31 december 2011 kl. 21.07 (CET)
Unbindery
[redigera]"Unbindery" är ännu ett system för korrekturläsning, värt att hålla ögonen på, http://bencrowder.net/blog/category/unbindery/ --LA2 31 december 2011 kl. 00.00 (CET)
7000?
[redigera]Med Simsalabims uppladdning av "Arbetare" hamnade systemets sidräkning [NUMBEROFARTICLES] ovanför 7000-strecket: 7 079.
Den siffran känns dock mindre och mindre pålitlig då den numera uppenbarligen också räknar in andra namnrymder som sidnamnrymden, (dock inte alla i den namnrymden då skulle vi ligga över 30 000 vid det här laget). Går man på korrekturläsningsstatistikens siffror hade vi 6 224 sidor i går varav 73 var förgreningssidor, vilket bör vara betydligt närmare verkligheten.
Är det så fall meningsfullt att använda sig av [NUMBEROFARTICLES] i fortsättningen, till exempel på huvudsidan, eftersom det i dagsläget inte är möjligt att förklara vad den siffran egentligen står för?--Thurs 28 december 2011 kl. 00.20 (CET)
- Förutom huvudnamnrymden räknas sedan i juni 2011 (bugzilla:29172) författar-, index- samt sidnamnrymden som innehållssidor på alla Wikisource-språk. Diskussionen finns här Oldwikisource:Wikisource:Scriptorium#Include pages (and possibly indexes and authors) in official article count men det verkar inte ha fungerat riktigt som det var tänkt.--Thurs 28 december 2011 kl. 09.38 (CET)
- (Sida, Författare, Index)
- Märkligt! Vad krävs för att få det magiska ordet: PAGESINNAMESPACE: att fungera? -- Lavallen 28 december 2011 kl. 10.01 (CET)
- Formellt skulle det väl gå igenom att begära på Bugzilla att $wgAllowSlowParserFunctions slås på men eftersom det inte verkar vara påslaget för någon wikimediawiki för att det är för kostsamt lär det väl inte vara så stor chans för oss heller. PAGESINNAMESPACE innefattar också omdirigeringarna så det ger ett för högt värde om inte dessa kan filtreras.--Thurs 28 december 2011 kl. 12.14 (CET)
- Med bot skulle jag kunna använda detta API, som jag kör i princip samtidigt med att jag uppdaterar listan med sidor som saknar CR-mall. API't filtrerar bort omdirigeringar automatiskt. Med ett botflaggat konto kan man lista 5000 på ett enda anrop, så det är inget som tynger några servrar. Resultatet går att lägga in i en mall som anropas varhelstifrån man vill. Det kräver dock lite programmerande och är inget jag hinner idag. -- Lavallen 28 december 2011 kl. 14.00 (CET)
- Det verkar vara en bra lösning på problemet.--Thurs 28 december 2011 kl. 21.16 (CET)
- Kan 18 388[24-12-01] vara rätt antal? Detta funkar nu med
{{Antalsidor}}
. Mallen går att använda för att identifiera alla namnrymder som är kända för mig. Se koden för mallen... -- Lavallen 29 december 2011 kl. 14.11 (CET)- Tack, det var verkligen en snygg lösning. 6227 bör vara korrekt just nu med de 6225 från korrekturläsningsstatistiken från i morse och de två som jag lagt in efteråt. Det stämmer också om man kollar med Dynamic pagelist (6226 + 5)
- Kan 18 388[24-12-01] vara rätt antal? Detta funkar nu med
- Det verkar vara en bra lösning på problemet.--Thurs 28 december 2011 kl. 21.16 (CET)
- Med bot skulle jag kunna använda detta API, som jag kör i princip samtidigt med att jag uppdaterar listan med sidor som saknar CR-mall. API't filtrerar bort omdirigeringar automatiskt. Med ett botflaggat konto kan man lista 5000 på ett enda anrop, så det är inget som tynger några servrar. Resultatet går att lägga in i en mall som anropas varhelstifrån man vill. Det kräver dock lite programmerande och är inget jag hinner idag. -- Lavallen 28 december 2011 kl. 14.00 (CET)
- Formellt skulle det väl gå igenom att begära på Bugzilla att $wgAllowSlowParserFunctions slås på men eftersom det inte verkar vara påslaget för någon wikimediawiki för att det är för kostsamt lär det väl inte vara så stor chans för oss heller. PAGESINNAMESPACE innefattar också omdirigeringarna så det ger ett för högt värde om inte dessa kan filtreras.--Thurs 28 december 2011 kl. 12.14 (CET)
- Arbetare/19
- Karl XIV Johans tal i norska stortinget den 8 november 1814
- Historietter/Spleen
- Arbetare/20
- Arbetare/21
- Enligt w:User:Fluff finns länkar till det magiska ordet på följande platser.
* [[:Wikisource:Huvudsida]] (fixat) * [[:Wikisource:Mötesplatsen/Arkiv 2007]] * [[:Användare:Erkan Yilmaz]] * [[:Användare:Thogo]] * [[:Användare:Bff]] * [[:Användare:Anonymous Dissident]] * [[:Användare:Wikitanvir]] * [[:Användare:Dcljr]]
- -- Lavallen 29 december 2011 kl. 16.14 (CET)
- Förutom huvudsidan som är fixad är det m a o inget ställe vi behöver eller ens bör fixa.--Thurs 29 december 2011 kl. 17.49 (CET)
Open Call for 2012 Wikimedia Fellowship Applicants
[redigera]I apologize that you are receiving this message in English. Please help translate it.
- Do you want to help attract new contributors to Wikimedia projects?
- Do you want to improve retention of our existing editors?
- Do you want to strengthen our community by diversifying its base and increasing the overall number of excellent participants around the world?
The Wikimedia Foundation is seeking Community Fellows and project ideas for the Community Fellowship Program. A Fellowship is a temporary position at the Wikimedia Foundation in order to work on a specific project or set of projects. Submissions for 2012 are encouraged to focus on the theme of improving editor retention and increasing participation in Wikimedia projects. If interested, please submit a project idea or apply to be a fellow by January 15, 2012. Please visit https://meta.wikimedia.org/wiki/Wikimedia_Fellowships for more information.
Thanks!
--Siko Bouterse, Head of Community Fellowships, Wikimedia Foundation 22 december 2011 kl. 04.06 (CET)
Distributed via Global message delivery. (Wrong page? Fix here.)
Fragmenterad segmentering i ABBYY Finereader
[redigera]Varför väljer OCR-programmet Finereader (version 10) att dela upp de två nedre vänstra textspalterna i massor av smårutor i stället för två stora? Är det något jag kan påverka genom inställningar i programmet? Det gör ju rätt till höger och upptill. Det handlar om den här sidan. --LA2 17 december 2011 kl. 22.59 (CET)
- Något jag stöter på i Fjellstedt ibland - ja. Jag känner inte till några inställningar, andra än att man får göra sina "rutor" manuellt på dylika sidor. Det här är också förklaringen till att jag i vissa sidor har råkat växla plats mellan vänster- och högerspalten. -- Lavallen 18 december 2011 kl. 08.07 (CET)
Uppladdningsträff på Public domain day
[redigera]Den 1 januari är det Public Domain Day. Det innebär att det är en massa verk där upphovsrätten som har gällt i 70 år går ut. 1 januari 2012 är det alltså alla som avled under 1941 som nu är fria för alla att använda.
För att hedra dem och låta deras verk leva vidare och göra nytta för allmänheten samlas vi till en uppladdningsträff. Dels ser vi till att verken kommer på plats på Wikimedia Commons, och dels att de kommer till rätta här på Wikisource. Vi håller till i det lilla konferensrummet på Wikimedia Sveriges kontor där vi får plats cirka 12 personer. Obligatorisk anmälan på Facebook eller info_attttt_wikimedia.se och först till kvarn gäller! --Ainali 15 december 2011 kl. 00.12 (CET)
- Kollade vilka sidor som kan återställas och hittade: För trädets skull som av någon anledning inte blivit raderad. Nåja, det är kanske inte mycket lönt att radera när det återstår två veckor... Karin Boye är därmed ett namn. -- Lavallen 15 december 2011 kl. 09.13 (CET)
- Tyvärr ligger det mesta av Karin Boyes produktion, förutom hennes första diktsamling "Moln", efter 1923 vilket innebär att det mesta blir en:URAA-fall. Även om vi bordlagt de verk som omfattas av URAA till HD-beslutet (juni 2012) är det knappast meningsfullt att nu lägga upp fler verk som omfattas av URAA till dess.
- Hjalmar Söderbergs, som också blir fri nästa år, produktion ligger dock till en större del före 1923.--Thurs 16 december 2011 kl. 14.01 (CET)
- Juni 2012, väldigt vad det drar ut på tiden.... -- Lavallen 16 december 2011 kl. 18.35 (CET)
- Om någon tycker det tar för lång tid får vi väl ta upp frågan igen. Än så länge kan jag dock inte se att något förändrats.--Thurs 16 december 2011 kl. 22.24 (CET)
- Artikeln på enwp om URAA saknade någon konkret sammanställning. Så kan någon kortfattat berätta vad den innebär? Är det att det ska vara 90 år efter skaparens död? I så fall borde det väl börja massraderas på commons? --Ainali 22 december 2011 kl. 22.35 (CET)
- Det handlar om publicerade verk i Sverige som inte var fria 1/1 1996. De fick då ny upphovsrätt (i USA) och behåller den i 90 år från publicering, (om jag minns rätt). Commons har i väntan på domstolsutslaget struntat i lagen. WMF har varit mer restriktiv mot publicering av URAA-skyddade texter. -- Lavallen 23 december 2011 kl. 07.35 (CET)
- DEn här lagen gäller förresten inte bara Sverige, men datumet kan variera med land om jag minns rätt. Observera att förhållandena i Sverige inte påverkas av detta. Sådana här texter är därför fria för Projekt Runeberg. -- Lavallen 23 december 2011 kl. 08.14 (CET)
- Det är 95 år efter publiceringen som om gäller, om inte verket publicerades före 1923, då är det fritt genom en övergångsbestämmelse i den amerikanska upphovsrättslagstiftningen. Efter 1978 (tror jag) gäller andra bestämmelser men det har ingen praktisk betydelse på länge.--Thurs 23 december 2011 kl. 11.46 (CET)
- Det handlar om publicerade verk i Sverige som inte var fria 1/1 1996. De fick då ny upphovsrätt (i USA) och behåller den i 90 år från publicering, (om jag minns rätt). Commons har i väntan på domstolsutslaget struntat i lagen. WMF har varit mer restriktiv mot publicering av URAA-skyddade texter. -- Lavallen 23 december 2011 kl. 07.35 (CET)
- Artikeln på enwp om URAA saknade någon konkret sammanställning. Så kan någon kortfattat berätta vad den innebär? Är det att det ska vara 90 år efter skaparens död? I så fall borde det väl börja massraderas på commons? --Ainali 22 december 2011 kl. 22.35 (CET)
Scripto
[redigera]Scripto är ett tillägg till Mediawiki som gör att man kan transkribera dokument, vilket är ett annat namn för den korrekturläsning som vi gör i Wikisource. Programvaran är en rätt påhittig kombination av OpenLayers (zoom- och panoreringsfunktionen från OpenStreetMap, i stället för tillägget ProofreadPage) med wikiredigering. Den beskrivs på http://scripto.org/
För att prova den i aktion, hänvisas till brittiska War Department, vars arkiv är inscannat. Dock måste man först ansöka om att få ett konto. Det tog några dagar från min ansökan innan jag fick e-mail om att ett konto hade upprättats och jag kunde logga in med ett tillfälligt lösenord. Instruktioner finns på http://wardepartmentpapers.org/transcribe.php --LA2 14 december 2011 kl. 08.33 (CET)
Finereader online
[redigera]För den som inte vill köpa ett OCR-program (Finereader Professional kostar €129), men ändå OCR:a lite snabbt och lätt, finns Finereader online, som är en webbtjänst. Man registrerar ett användarnamn och sedan betalar man (via kreditkort eller PayPal-konto) €3,50 (33 kr) för 50 sidor eller det dubbla för 200 sidor. Sedan kan man ladda upp inscannade bilder (en sida i taget som JPEG, eller en hel PDF eller Djvu) och väljer språk och filformat för resultatet. Efter en stund finns filen att avhämta. Om man väljer PDF som utformat, får man bild+text i samma fil, lämplig att ladda upp till Commons. Det går inte att göra några inställningar i övrigt. Det finns alltså inget avancerat användargränssnitt. --LA2 1 december 2011 kl. 19.07 (CET)
- Det vore kanske mödan värt att testa vad man får fram om man kör ett större dokument i fraktur. Sådana har jag problem med här hemma pga datorns begränsningar. Jag anar att det inte går att träna upp ordförrådet till 1800-tals-svenska, men vore ändå intressant att se vilken kvalite det blir på det som kommer ut. -- Lavallen 2 december 2011 kl. 09.01 (CET)
ImageMap
[redigera]Alex Brollo håller på att experimentera med "ImageMap" för sidor med spalter. Se det italienska exemplet it:Pagina:Vettura_a_vapore_del_signor_Dietz.djvu/1, där man i stället för OCR-text har en bild som är en klickbar ImageMap, som leder till redigering av olika delar av sidan. Detta extra steg är förstås omständigt, men i kärnan av idén finns kanske något att bygga vidare på. --LA2 30 november 2011 kl. 11.21 (CET)
- Såg nu inläggen på mejl-listan. Kan inte säga att jag begriper så mycket... -- Lavallen 30 november 2011 kl. 19.00 (CET)
- Har du en länk till inlägget? Spontant kan jag tänka att detta vore mest lämpligt för tidningar med en layout där olika artiklar finns i separata rutor på sidan. -- Simsalabim 30 november 2011 kl. 19.55 (CET)
- Tack. Det kanske finns ett frö till något i Brollos test. Annars är det en intressant fråga som LA2 ställer i tråden: Huruvida man kan visa boxen som omger ord i faksimilbilden (koordinaterna finns ju lagrade i djvu-filen). Jag tycker t.ex. att det vore värdefullt i korrläge om det ord där textmarkören för tillfället befinner sig i också lyses upp i faksimilbilden. Då skulle det bli enklare att stega sig igenom texten utan att förlora ens fokus när man hela tiden måste alternera blicken mellan bilden och texten. -- Simsalabim 30 november 2011 kl. 22.42 (CET)
- Än så länge tycks det som att man måste dela upp sidan i separata bilder vilket nog kommer att bli en flaskhals för att använda denna Imagemap-funktion. Vi får väl se hur det utvecklar sig. Om man t ex kunde "Imagemappa" sidnamnrymden så att man automatiskt fick fram ett bildutsnitt och vidhörande OCR-text skulle det nog bli mer användbart.--Thurs 2 december 2011 kl. 18.29 (CET)
Länkstatistik
[redigera]Jag försöker göra statistik över vilka externa sajter som Wikipedia (och även Wikisource) länkar till. Men jag vill undvika att räkna diskussionssidor och användarsidor. Borde jag enbart räkna huvudnamnrymden, eller bör jag även inkludera Sida:, Index: och Författare: ? Var har Wikisource sina viktiga externa länkar? För sv.wikisource ser antalet externa länkar ut enligt tabellen nedan. --LA2 28 november 2011 kl. 22.45 (CET)
count(*) | page_namespace | ns_name | 429 | 0 | | Kommer att räknas 210 | 1 | Diskussion | Räknas inte 454 | 2 | Användare | Räknas inte 85 | 3 | Användardiskussion | 299 | 4 | Wikisource | Räknas inte. Projektsidorna kan innehålla långa listor av länkar, men de är avsedda för medarbetare och inte för läsare. 27 | 5 | Wikisourcediskussion | 1 | 7 | Fildiskussion | 10 | 8 | MediaWiki | 9 | 9 | MediaWiki-diskussion | 23 | 10 | Mall | Räknas inte i mall-namnrymden, utan i sidorna där mallen används 4 | 11 | Malldiskussion | 10 | 14 | Kategori | 16 | 15 | Kategoridiskussion | 113 | 90 | Thread | 95 | 104 | Sida | Borde dessa 95 länkar räknas? 26 | 105 | Siddiskussion | 160 | 106 | Författare | Borde dessa 160 länkar räknas? 2 | 107 | Författardiskussion | 303 | 108 | Index | Borde dessa 303 länkar räknas? 29 | 109 | Indexdiskussion |
- Länkar som direkt riktar sig mot läsarna finns det främst i författarnamnrymden, t ex till andra webbarkiv. Sidorna i sidnamnrymden ska ju i princip alltid transkluderas till huvudnamnrymden som mallarna och borde inte behöva räknas två gånger. I Index-namnrymden finns det främst "administrativa" externa länkar till Libris och filkällor t ex, jag vet inte om du räknar sådana som till för användare eller läsare.--Thurs 28 november 2011 kl. 23.31 (CET)
- Jag skulle räkna index-länkarna som lite av både och. De är ofta viktiga som källinformation. -- Lavallen 29 november 2011 kl. 08.45 (CET)
- Tack för input! Jag struntar således i Sida-namnrymden, men räknar in Index, Författare och (för Wikipedia) Portal, samt (för Commons) File. --LA2 29 november 2011 kl. 17.14 (CET)
Pages-kommandot
[redigera]Finns det någon sida där de olika kommandona, eller vad man kallar det för, förklaras? Jag vet t.ex. att man med hjälp av "prev=" lägger till en länk till en föregående sida, men det skulle även vara intressant att kunna lägga till en kommentarslänk o.l. Diupwijk 26 november 2011 kl. 11.20 (CET)
- Dokumentation är alltid trevligt! - JAg har inte ens hittat ngn på maskinöversatt tyska, vilket brukar vara det vanliga. -- Lavallen 26 november 2011 kl. 11.40 (CET)
- Eftersom de här parametrarna definieras lokalt (i alla fall hittills) är det knappast meningsfullt med något central sida. Den dokumentation som finns finner man ¨på Wikisource:Korrekturläsning#Använda pages-kommandot. Vilka parametrar som kan ändras hos oss finner man i Mall:Proofreadpage header template:
- titel=[Titel]
- upphovsman=[författare]
- oversattare=[översättare]
- current=[undertitel]
- prev=[förra (sidan)]
- next=[nästa (sida)]
- Det skulle kunna gå att lägga till en kommentar-parameter också men det kräver att man gör vissa ändringar i Mediawiki-namnrymden, det räcker inte med att lägga in den i Proofreadpage header template.--Thurs 26 november 2011 kl. 14.05 (CET)
- Tack för svaret! Ok, synd med kommentarproblemet, men man kan ju alltid nyttja titelmallen istället. Diupwijk 29 november 2011 kl. 23.27 (CET)
- Snajsigt! Bra gjort. Det kommer säkerligen att bli använt. Diupwijk 4 december 2011 kl. 20.21 (CET)
Globala administratörer
[redigera]En svenskspråkig användare är nu uppe för nyval som Global administratör, se: m:Steward requests/Global permissions. -- Lavallen 21 november 2011 kl. 11.20 (CET)
- Du kallar väl inte på förstärkningar, eller? Haha. Nej, men det är en bra kandidat. Det är dessutom en fördel att ha en svensktalande g.a. De problem som jag har kunnat iakttaga med denna roll är att de agerar trots att de inte kan språket på den lokala wikin. Förhoppningsvis blir det problemet mindre nu. Diupwijk 26 november 2011 kl. 11.24 (CET)
- Jag har inte sett dem agera alls här sedan jag kom hit. Jag har lockat till mig dem vid ett enda tillfälle när jag hittade ngt på b: eller q: som jag ville ha snabbraderat. (Riktigt snabbt allstå. - Inte vänta två dygn till en admin tittar förbi.) -- Lavallen 26 november 2011 kl. 11.48 (CET)
- Och från häromdagen så är alltså Tegel ny global administratör. -- Lavallen 5 december 2011 kl. 10.03 (CET)
Temporär mötesplatssida vid LT-buggen i februari-april
[redigera]Välkommen till Mötesplatsen
[redigera]Mötesplatsen är det allmänna diskussionsforumet om svenska Wikisource.
Mötesplatsen är rätt plats för att ansöka om att använda en bot på projektet. Observera att kortare botkörningar, såsom interwiki, ofta kan göras utan botflagga.
För att begära byte av användarnamn/SUL, kontakta byråkraten.
To request to run a bot on Swedish Wikisource, start a thread on this page and describe your bot and what kind of job you would like to do. Note, that minor bot-jobs, such as iw-linking often can be done without botflag.
To request change of username/SUL, contact the bureaucrat.
[[Kategori:Wikisource|Mötesplatsen]]
Gamla diskussioner
[redigera]Arkiverade årgångar av Wikisource:Mötesplatsen: 2007 – 2008 – 2009 – 2010 – 2011 – 2012 – 2013 – 2014 – 2015 – 2016 – 2017 – 2018 – 2019 – 2020 – 2021 – 2022 – 2023
- OBS! Liquid threads fungerar inte för närvarande!
Liquid thread-diskussionerna finns arkiverade på Wikisource:Mötesplatsen/Liquid threads
Diskussioner från Wikisourcediskussion:Mötesplatsen under LT-buggen
[redigera]Index-buggen är fixad
[redigera]Buggen https://bugzilla.wikimedia.org/show_bug.cgi?id=24168 är nu stängd. Problemet att index-sidorna ibland tappar sidlistan och måste noll-sparas (null edit) anses vara löst i och med MediaWiki version 1.17. Hurra! Hoppas det stämmer. Om man ser problemet på nytt, ska man rapportera det på nytt. (Jag skriver här, eftersom LiquidThreads är trasigt.) --LA2 21 februari 2011 kl. 13.21 (CET)
- Gott, ett steg fram bland alla andra nytillkomna buggar! -- Lavallen 21 februari 2011 kl. 14.31 (CET)
- Bra, nu fungerar också parametrarna i pagelist igen, så de flesta buggarna i 1.17 för Proofreadpage är fixade. LiquidThreads-buggen har jag inte fått mycket respons på ännu.--Thurs 22 februari 2011 kl. 08.42 (CET)
- Här listas fler nyheter i 1.17 som berör Wikisource. --LA2 22 februari 2011 kl. 15.29 (CET)
Distribuerad korrekturläsning av finska dagstidningar
[redigera]Finska nationalbiblioteket digitaliserar dagstidningar och anlitar företaget Microtask för att sprida ut korrekturläsningen, http://www.digitalkoot.fi/en/splash --LA2 21 februari 2011 kl. 15.04 (CET)
- Och man korrekturläser genom att spela spel? -- Lavallen 21 februari 2011 kl. 16.54 (CET)
Import
[redigera]Ska vi utöka antalet platser vi kan Importera ifrån? Idag har vi bara svwp, men ofta är kanske enws och oldws mer intressanta, kanske även frws, eftersom det är en av de mest tekniska projekten.
N.B. Importverktyget kan idag bara användas av administratörer. I princip kan dock även de som tillhör ngn av grupperna "Transwiki-importörer" och "Importörer" göra samma sak. Men de grupperna har inga medlemmar här idag. -- Lavallen 23 februari 2011 kl. 17.06 (CET)
- Kan inte påstå att jag saknat den möjligheten särskilt mycket. Det som tar tid är snarare översättningen och anpassningen hit än själva överföringen. Men nån gång kan det möjligen vara bra. Mycket av utvecklingen av korrekturläsningen verkar dock ske genom javascript-funktioner just nu vilka inte importeras på det sättet.--Thurs 24 februari 2011 kl. 09.27 (CET)
- Fördelen med att importera, istället för "klipp och klista", är att utvecklarna av den ursprungliga koden (ofta mallen i de här fallet) krediteras i historiken. Det är mer i harmoni med "Creative Commons-licensen Erkännande-Dela Lika 3.0". Nej, mindre tid tar det inte. -- Lavallen 24 februari 2011 kl. 09.48 (CET)
- Jaha, så det räcker inte med en länk till historiken längre? Nackdelen med import är att man får en historik med trasiga länkar och användare som knappt satt sin fot här. Jag har inget emot att fler importmöjligheter införs men det kan vara svårt att i förväg definiera varifrån vill hämta en sida, jag har nog t ex hämtat mer från nows och dews än frws och oldws.--Thurs 24 februari 2011 kl. 13.54 (CET)
- Man uppfyller mer licensens bokstav med import än man gör med en länk. Jo, man får med användarhistorik från användare som aldrig varit förbi här, på samma sätt som Innocent bot har bidrag på bla nowp. Problemet med det kommer fram främst med icke-sulade konton. Tänka efter före är alltid svårt. Om dews och nows anses vara bättre val, så har jag inget emot det... -- Lavallen 24 februari 2011 kl. 14.59 (CET)
- Jag tror att den enda importmöjligheten som kan ha någon praktisk betydelse är från engelska wikisource. I övrigt spelar det inte så stor roll vilka man väljer.--Thurs 25 februari 2011 kl. 12.43 (CET)
1819 års Psalmbok
[redigera]På google books finns en scannad 1819 års psalmbok tryckt 1820 [1] är en psalmvers vi har här. Hela registret finns på wp, men en senare version. Många av texterna finns här, liksom många av 1695, och är väl lite av "herrelösa" då 1819 är överhoppad och på wp har man valt att beskriva yngsta, modernaste, lättast tillgängliga version. Helst 1986, som då alltid är förenad med upphovsskydd. Kan någon lyfta hit texten från google hit? -- IP7869 21 april 2011 kl. 08.06 (CEST)
- Lavallen, jag har sett att du försökt göra något. Jag försökte själv kopiera google-texten för bara denna enda psalm, nr 130/1819, men det lyckades jag inte med. Egentligen tycker jag att hela 1819 skulle kunna flyttas/kopieras hit. 1937:an finns ju på Runeberg, scannad och korrekturläst. Liksom 1536:an. Men Göteborgspsalmboken delvis inskriven här. Psalmskatten har ju försvunnit, så därmed mycket av 1819 tyvärr. Vi har många psalmer av 1819 inskrivna, hela eller delar, som denna vers 8 av 130/1819 av FM Franzén. Den har ju i yngre psalmböcker blivit en fristående psalm. Just psalmböckerna är ju tveksamma i copyrigthhänseende. De är ju faktiskt finansierade av skattebetalarna och borde verkligen anses som public domain! Runeberg har en konkordans scannad, som kanske skulle kunna reda ut en del av alla "Okänd författare". Den 1819 som ligger på google är det definitivt. (Det är lite kul att ö är ett o med ett gement e över istället för ¨). Jag har ett eget ex tryckt 1820 också, men vill inte bryta den för scanning. --IP7869
- Det jag försökt med är att flytta denna tråd till Mötesplatsen, den har hamnat lite bredvid av ngn anledning.
- En psalmbok från 1819 är definitivt fri, liksom allt annat från 1819. Det ska gå att överföra den boken hit till oss. Det finns de som är bättre än jag på det, så jag avvaktar gärna om ngn annan vill försöka först. -- Lavallen 21 april 2011 kl. 09.18 (CEST)
- Första sidan, med text från Google måste bort tex, och det kan inte jag. -- Lavallen 21 april 2011 kl. 09.21 (CEST)
- Jag har nu laddat upp den önskade filen indexet finns på index:Psalmboken (1819).djvu. Volymen saknar OCR-text och det är tveksamt om det kan man få fram någon tillfredställande sådan. Innermarginalen på udda sidor mellan 211-227 är skadad och det är väl tveksamt om det går att hitta samma upplaga för att korrigera den. Det behöver inte vara någon index-dödare eftersom texten är så spridd att det bör vara lätt att komplettera det saknade från andra upplagor.Men om ni inte tycker det är värt att korrekturläsa den är det bara att radera indexet.--Thurs 21 april 2011 kl. 22.27 (CEST)
- Nej, Jag kan nog inte få fram ngn OCR ur den texten, men eftersom varje enskild psalm är intressant i sig, så tror jag den här kan ha ett visst värde ändå. -- Lavallen 22 april 2011 kl. 08.00 (CEST)
- Bra att ha fått hit den. Men det är ett problem med just denna utgåvan, tycker jag, och det är att den saknar "poetiska radbrytningar". På många psalmer har vi ju flera versioner efter varandra, och om man gör en transklussion från denna, så kommer ju versionen från 1819 att bli i löpande text, bara därför att vi har en "gottköpsversion" att utgå ifrån, och inte en mer påkostad bok. Så hur hanterar vi det? Taxelson 22 april 2011 kl. 14.10 (CEST)
- Säger instruktionerna på Indexdisken att korrläsaren ska lägga in "poetiska radbrytningar", så gör man väl det? -- Lavallen 22 april 2011 kl. 14.34 (CEST)
- OK, det skulle alltså kunna få se ut så här?! (eller kanske inte med versala begynnelsebokstäver på varje rad då? - det blir ju tårta på tårta, eller?) Taxelson 22 april 2011 kl. 15.19 (CEST)
- Jag tycker man skulle kunna tolka texten så! (Huruvida det ska vara versaler eller inte, tar jag inte ställning till.) -- Lavallen 22 april 2011 kl. 15.21 (CEST)
- Vi närmare eftertanke ska det nog vara inledande versaler på alla rader. 1695:an har det så (och den har radbrytningar) och Runeberg gör så i ett liknade fall. Taxelson 22 april 2011 kl. 20.56 (CEST)
- Jag tycker också att det är bäst att frångå praxis i det här fallet och lägga in radbrytningarna. Inledande versaler tycker jag ska behållas. Det är inte helt ovanligt i äldre diktssamlingar även när de är radbrutna. --Thurs 22 april 2011 kl. 23.43 (CEST)
- OK, det skulle alltså kunna få se ut så här?! (eller kanske inte med versala begynnelsebokstäver på varje rad då? - det blir ju tårta på tårta, eller?) Taxelson 22 april 2011 kl. 15.19 (CEST)
<<<--- Nu är ni så himla snabba! Vad är "poetiska radbrytningar"? Jag har blandat mig i på de psalmer Taxelson fixat med från 1695:an. Bara för att visa att jag tycker det är viktigt att ha rätt kronologi. I de fall vi har Göteborgspsalmboken 1650 så inbillar jag mig att faksimilerna inte är fria att använda. (Bodleian håller nog på sina faksimiler). Men texterna må ju vara fria, så bör de ligga först. I något fall finns ju 1536:na. Vad det gäller om "Psalmerna för krigsmakten" så är det ju mest av intresse att det är verser ur 1937:an, men bara ibland hela psalmerna enligt 1937. (Säg inte det till radaikalfeminstierna för då får vi ett elände i landet : ) ] Men för den utgåvan så räcker ju att tala om vilken vers/vilka verser som räckte för ynglingarna och officerarna 1961. Mellan 1819 och 1937 genomfördes ju "förkortningar" av bekvämlighetsskäl. Mellan 1694 och 1695 så var det bearbetningar av religiösa skäl, som kan vara av intresse. (Antikristopsalmerna är häftiga!). Får se vad jag kan bidra med. INte så mycket tekniskt, men åsikten att står det HErren i originalet så bör vi behålla det här i löpande text, men behöver inte ha det i artikeltiteln.--IP7869 23 april 2011 kl. 21.02 (CEST)
- Om du med faksimilen menar den från 2002 så går inte den att använda om den här gjord och utgiven i Sverige (den är åtminstone det senare, vad det verkar). Det hade krävts att den är från före 1969 eller 50 år gammal. -- Lavallen 23 april 2011 kl. 21.26 (CEST)
- "Poetiska radbrytningar" är helt enkelt de radbrytningar som normalt finns i lyrik efter varje versrad men som ibland saknas i vissa sångböcker för att spara plats. Se exempel på indexdiskussionen. I övrigt korrekturläses volymen efter praxis med bibehållande av versaler t. ex.--Thurs 23 april 2011 kl. 22.34 (CEST)
- Beträffande kronologin: Jag skulle nog föredra en omvänd kronologi som standard. Jag tänker mig alltså att det kan göra det mer användarvänligt att man först får den mest sentida (lättlästa) versionen av texten, och sedan hittar de äldre versionerna för den som vill gräva längre i härledningarna. Titeln är ju också vanligen satt enligt den yngre versionen. En annan möjlighet är att lägga dem i tabell, synoptiskt, sida vid sida. Det bör gå bra när samma verser finns i alla versionerna, men blir otympligt om man har olika antal verser i de olika versionerna. Taxelson 24 april 2011 kl. 16.07 (CEST)
- Ja, det är GBG 1650/2002 jag avser. Den kan ju inte bli aktuellt att fotografera av.
- Jag föredrar "poetiska radbrytningar" med sammanhållna verser.
- Smaksak, det här med kronologin. Det kommer ju upp en liten innehållsförteckning när vi lägger in årtalen som underrubriker, så det är lätt att klicka sig till den yngsta respektive den äldsta eller önskad version där emellan. Jag föredrar äldst ursprung först, för det är ganska rejält med hjälp när huvudrubriken är modern=lättläst. Får läsaren hela ursprunget så är det lättare att se vilka verser som behållits respektive bearbetats när man fortsätter läsa. Inget hindrar ju att man hoppar direkt till den yngsta versionen längst ned.
- Det finns ju några tidiga försök att lägga i "tabell"-form, men det blir sällan bra om det är långa rader. Har också försökt att begränsa artiklarna med hjälp av noter när det rör sig om små skillnader i textbearbetningar. Jag föredrar alltså rättvänd kronologi och olika versioner i följd utan tabeller och liknande.--IP7869 24 april 2011 kl. 19.47 (CEST)
Det finns nu en "istället för OCR" till 1819 års psalmbok (psalmerna). Den ligger nu på Användare:Taxelson/ps1819 (se dess diskussion för detaljer), men jag tror att det vore bättre om den kunde ligga på något annat ställe än under min användare, så att alla kan känna sig fria att arbeta vidare. Men jag vet inte riktigt var, så jag är tacksam om någon finner en plats för den och flyttar den dit! Taxelson 26 april 2011 kl. 10.08 (CEST)
- Jag flyttade den till Wikisource:Projekt 1819 års psalmbok. Om någon hittar ett bättre ställe, så känn dig fri att flytta igen. -- Lavallen 26 april 2011 kl. 10.42 (CEST)
1.18-buggar
[redigera]Just upptäckt att det lilla magiska ordet: NOEDITSECTION inte fungerar... -- Lavallen 8 oktober 2011 kl. 17.38 (CEST)
- Nej, just nu verkar det inte fungera korrekt för mig heller. När jag rensar cachen försvinner länkarna men om jag laddar om sidan som vanligt efter det kommer de tillbaka. Det verkar krångla på WP också så det är nog inte något lokalt fel.--Thurs 8 oktober 2011 kl. 23.03 (CEST)
- Verkar vara fixat nu.--Thurs 22 januari 2012 kl. 18.03 (CET)
- Förutom detta och liquid threads
fungerar inte det nya babeltillägget längre med våra gamla babelmallar.Fixat--Thurs 8 oktober 2011 kl. 23.03 (CEST)
I sidfoten läggs det in extrarader före: <references/>. -- Lavallen 10 oktober 2011 kl. 11.47 (CEST)
- Ja, en rad för varje gång man redigerar.--Thurs 14 oktober 2011 kl. 00.09 (CEST)
Det här ser kryptiskt ut. -- Lavallen 20 oktober 2011 kl. 12.56 (CEST)
- Det är en gammal 1.17 bugg som kom "pagequality-taggen" lades utanför det synliga sidhuvudet. Av någon anledning funkade det inte med någon automatisk konvertering på vissa sidor utan div-taggen förblev synlig. När så sidan redigeras läggs taggen in på rätt ställe vilket gör att när div-taggen med "class=pagetext" och "pagequality-taggen" dubbleras. Den enda åtgärden är att radera den de gamla taggarna om man ser den.--Thurs 20 oktober 2011 kl. 16.15 (CEST)
- Ja, jag upptäckte för en stund sedan att det var lite äldre än sedan 1.18.
- Frågan är om jag kan lura systemet genom att lägga in "Innocent bot" som användare i den befintliga taggen, detta för att slippa få in det i de sidor som finns kvar att ladda om?! -- Lavallen 20 oktober 2011 kl. 16.26 (CEST)
- När jag tittar närmare så verkar det inte vara riktigt samma problem. I det här fallet tycks ett problem vara att de raka citationstecknen förvandlats till grafiska som väl inte fungerar i taggarna. Jag har inte lyckats återskapa detta manuellt, är det något som botten kan ha gjort?--Thurs 20 oktober 2011 kl. 16.35 (CEST)
- Boten ändrar inga citat-tecken idag, men det går att göra i framtiden om det är vad som krävs. -- Lavallen 20 oktober 2011 kl. 16.48 (CEST)
- Om du provar att redigera utan javascript aktiverat, vad händer då?
- Boten kör ju helt utan ngn java aktiverad. I nyskapande av sidor, är det ändå ngn form av kod som lägger in headern och footern, utan att jag behöver bry mig. -- Lavallen 20 oktober 2011 kl. 16.52 (CEST)
- Slår jag av javascript och ändrar citationstecknen själv kan jag reproducera buggen annars inte. Men botten borde inte ändra något alls i den taggen det borde ske automatiskt. Försöker man manuellt ändra även om man slagit av js får man ett felmeddelande. Tidigaste fallet har jag hittat var den den 16 juni i år. Före det verkar det vara OK.--Thurs 20 oktober 2011 kl. 17.29 (CEST)
- Hmmm, kan det vara att boten inte hanterar den kodning som finns i citattecknen? -- Lavallen 20 oktober 2011 kl. 18.19 (CEST)
- Nu vet jag inte ens vilket bot-program du använder för detta så det är svårt hjälpa till med det (inte för att jag har någon större erfarenhet av bot-körningar).--Thurs 20 oktober 2011 kl. 19.37 (CEST)
- C# med hjälp av DotNetWikiBot Framework. Koden finns här. -- Lavallen 20 oktober 2011 kl. 21.11 (CEST)
- Jag skulle tro att problemet ligger i hur programmet läser in citationstecknen (som väl måste konverteras på något sätt) och sedan skriver tillbaks det på sidan. Men har du inte förändrat ditt program sedan i december borde ju inte felet ligga där. Jag har tyvärr inte de kunskaperna så att jag kan vara till någon hjälp med detta men här och på WP finns det ju många med programmeringskunskaper. Jag tror i alla fall inte att det ligger i Mediawiki eller korrekturläsningstillägget.--Thurs 20 oktober 2011 kl. 23.43 (CEST)
- C# med hjälp av DotNetWikiBot Framework. Koden finns här. -- Lavallen 20 oktober 2011 kl. 21.11 (CEST)
- Nu vet jag inte ens vilket bot-program du använder för detta så det är svårt hjälpa till med det (inte för att jag har någon större erfarenhet av bot-körningar).--Thurs 20 oktober 2011 kl. 19.37 (CEST)
- Hmmm, kan det vara att boten inte hanterar den kodning som finns i citattecknen? -- Lavallen 20 oktober 2011 kl. 18.19 (CEST)
- Slår jag av javascript och ändrar citationstecknen själv kan jag reproducera buggen annars inte. Men botten borde inte ändra något alls i den taggen det borde ske automatiskt. Försöker man manuellt ändra även om man slagit av js får man ett felmeddelande. Tidigaste fallet har jag hittat var den den 16 juni i år. Före det verkar det vara OK.--Thurs 20 oktober 2011 kl. 17.29 (CEST)
- När jag tittar närmare så verkar det inte vara riktigt samma problem. I det här fallet tycks ett problem vara att de raka citationstecknen förvandlats till grafiska som väl inte fungerar i taggarna. Jag har inte lyckats återskapa detta manuellt, är det något som botten kan ha gjort?--Thurs 20 oktober 2011 kl. 16.35 (CEST)
Sedan 17-18 oktober läggs det in en extrarad i slutet på texten i sidnamnrymden vilket ger en styckebrytning när sidan transkluderas. Ska vara en bugfix på gång: Oldwikisource:Wikisource:Scriptorium#Line_breaks_in_pages.--Thurs 21 oktober 2011 kl. 23.11 (CEST)
- en:User:billinghurst har tagit fram ett fix med hjälp av AWB för att rensa bort dessa extra radbrytningar på en:User:SDrewthbot/trim trailing LF. Är det någon botägare som har möjlighet sätta sin bot med att göra detta då och då tills buggen är fixad?--Thurs 25 oktober 2011 kl. 18.43 (CEST)
- Det ska alltså vara ngt sådant här som ska fixas, eller är det ngt mer?
- Får se hur långt tillbaka jag kan köra det här. Vår Special:RecentChanges är nog inte så stor som enws', men frågan är exakt hur långt AWB kommer tillbaka utan problem. -- Lavallen 25 oktober 2011 kl. 20.23 (CEST)
- Ser ut som det är exakt det som ska göras. Sätter boten på autoredigering. -- Lavallen 25 oktober 2011 kl. 20.25 (CEST)
- 473 sidor gicks igenom. (84 redigeringar gjordes.) De tidigaste ser ut att vara från 17 oktober. Behöver vi gå längre tillbaka? -- Lavallen 25 oktober 2011 kl. 20.47 (CEST)
- Nej, det ser bra ut, botten verkar ha tagit det mesta. Sidorna från den 16 och bakåt verkar vara OK redan förut. Tack så mycket!--Thurs 25 oktober 2011 kl. 22.27 (CEST)
- Jag vet inte om detta har med botkörningen att göra, men nu påbörjas ett nytt stycke vid sista textraden på sidor (i sidnamnrymnden). Se t.ex. denna sida. (Lite mer tekniskt: I den genererade html-koden hamnar den sista raden utanför sidans sista styckes p-taggar, så att det ser ut som om ett nytt stycke startas.) -- Simsalabim 26 oktober 2011 kl. 20.55 (CEST)
- Jag skulle tro att det beror på att botkörningen gjorde att sista raden kom att ligga på samma rad som <references/> vilket förmodligen inte är tillåtet. Lägger man in en radbrytning efter </noinclude> försvinner problemet (i alla fall för mig). Vid transkludering verkar inte den radbrytningen föras över i alla fall så problemet ligger i sidnamnrymden.--Thurs 26 oktober 2011 kl. 22.11 (CEST)
- Finemang, tack för bugbugfixarna! -- Simsalabim 27 oktober 2011 kl. 18.27 (CEST)
- Gör nu en körning på daws där jag tagit hänsyn till den här saken. -- Lavallen 27 oktober 2011 kl. 21.27 (CEST)
- Buggen tycks vara fixad nu för tillfället men "bugbuggen" finns kvar så att sidfoten måste börja med en radbrytning annars finns det risk för att man får en oavsiktlig styckebrytning före sista raden i sidnamnrymden.--Thurs 28 oktober 2011 kl. 22.41 (CEST)
- Gör nu en körning på daws där jag tagit hänsyn till den här saken. -- Lavallen 27 oktober 2011 kl. 21.27 (CEST)
- Finemang, tack för bugbugfixarna! -- Simsalabim 27 oktober 2011 kl. 18.27 (CEST)
- Jag skulle tro att det beror på att botkörningen gjorde att sista raden kom att ligga på samma rad som <references/> vilket förmodligen inte är tillåtet. Lägger man in en radbrytning efter </noinclude> försvinner problemet (i alla fall för mig). Vid transkludering verkar inte den radbrytningen föras över i alla fall så problemet ligger i sidnamnrymden.--Thurs 26 oktober 2011 kl. 22.11 (CEST)
- Jag vet inte om detta har med botkörningen att göra, men nu påbörjas ett nytt stycke vid sista textraden på sidor (i sidnamnrymnden). Se t.ex. denna sida. (Lite mer tekniskt: I den genererade html-koden hamnar den sista raden utanför sidans sista styckes p-taggar, så att det ser ut som om ett nytt stycke startas.) -- Simsalabim 26 oktober 2011 kl. 20.55 (CEST)
- Nej, det ser bra ut, botten verkar ha tagit det mesta. Sidorna från den 16 och bakåt verkar vara OK redan förut. Tack så mycket!--Thurs 25 oktober 2011 kl. 22.27 (CEST)
- 473 sidor gicks igenom. (84 redigeringar gjordes.) De tidigaste ser ut att vara från 17 oktober. Behöver vi gå längre tillbaka? -- Lavallen 25 oktober 2011 kl. 20.47 (CEST)
- Ser ut som det är exakt det som ska göras. Sätter boten på autoredigering. -- Lavallen 25 oktober 2011 kl. 20.25 (CEST)
Hitta digitaliserade verk i Libris
[redigera]Ett sätt att hitta digitaliserat material är att söka på "db:digi" i Libris, så här. Man får då lite drygt 4000 träffar på saker som är digitaliserade och tillgängliga. Inte allt detta är fritt från upphovsrätt eller ens lämpligt för Wikisource (en del träffar kan exempelvis vara hänvisningar till Wikisource!), men en del kan nog vara lämpligt. --LA2 12 oktober 2011 kl. 02.46 (CEST)
Terms of Use update
[redigera]I apologize that you are receiving this message in English. Please help translate it.
Hello,
The Wikimedia Foundation is discussing changes to its Terms of Use. The discussion can be found at Talk:Terms of use. Everyone is invited to join in. Because the new version of Terms of use is not in final form, we are not able to present official translations of it. Volunteers are welcome to translate it, as German volunteers have done at m:Terms of use/de, but we ask that you note at the top that the translation is unofficial and may become outdated as the English version is changed. The translation request can be found at m:Translation requests/WMF/Terms of Use 2 -- Maggie Dennis, Community Liaison 27 oktober 2011 kl. 03.18 (CEST)
Återbruk
[redigera]Den 11 november ska jag hålla en workshop under FSCONS om digitalisering och återanvändning av digitaliserad litteratur. Finns det några fall där texter ur Wikisource har återanvänts i andra sammanhang, på något intressant sätt? Att hänvisa till dem som källor från Wikipedia och att räkna ordfrekvenser som underlag för Wiktionary, är två enkla användningar som jag direkt kan tänka på. Sökbarhet via Google är förstås också ett slags återanvändning, som man lätt tar för självklar. --LA2 1 november 2011 kl. 18.33 (CET)
- På samma tema, så har Projekt Runeberg nu en ny nedladdningsfunktion där man får med indexfilerna som bygger upp en volym. Besök exempelvis /legender/ eller /fstal/ och klicka "download" längst ner i sidan. Det är nedladdningsalternativet med en asterisk som är nytt. --LA2 3 november 2011 kl. 00.08 (CET)
- Apropos Google: Google books lenker gjerne direkte til Wikisource som en "relevant lenke" for bøker. Jeg har ikke klart å gjenfinne en slik fil akkurat nå, men du kan jo søke på et par bøker som :sv: har i google books og se om du finner en? På den måten er tekstene indeksert på en annen måte enn de blir gjennom søk på Google (à la Lavallens oppdagelse av at Wikisource også oppgis som kilse i Libris). V85 3 november 2011 kl. 21.34 (CET)
InterWikiTransclusion
[redigera]Någon på gamla wikisource har tydligen skaffat sig gobala priviligier och lagt in ett javascript i vår common.js jag har återställt det i avvaktan på en diskussion här. Om jag förstår rätt är det en funktion som möjliggör att transkludera sidor från andra språkversioner vilket kan vara intressant vid parallella flerspråkiga texter. För att det ska fungera behövs det dock skapas mallar &c och det har redan rapporterats en bug. Är det någon som intresserad av att utveckla en sådan funktion just nu? Annars tycker jag det kan vänta till behovet uppstår.--Thurs 4 november 2011 kl. 22.00 (CET)
- Skulle säga att det är rena grekiskan, men faktum är att jag begriper vissa grekiska ord. Det kan jag inte säga att jag gör av den länkade diskussionen. -- Lavallen 5 november 2011 kl. 12.10 (CET)
- Den grupp Candalua fått behörighet i är editinterface. -- Lavallen 5 november 2011 kl. 17.26 (CET)
- Jag förstår ingenting heller men säkerhetsproblem låter inte särskilt kul även om det problemet förhoppningsvis är fixat nu.--Thurs 5 november 2011 kl. 22.47 (CET)
- Säkerhetsproblem brukar handla om att länkar med https inte funkar. Om det är så i det här fallet, vet jag inte. -- Lavallen 6 november 2011 kl. 08.26 (CET)
- Det var någon allvarligare säkerhetsbrist också som tydligen kunde utnyttjas för att köra javascript på sidan på något sätt.--Thurs 7 november 2011 kl. 22.01 (CET)
- Säkerhetsproblem brukar handla om att länkar med https inte funkar. Om det är så i det här fallet, vet jag inte. -- Lavallen 6 november 2011 kl. 08.26 (CET)
- Jag förstår ingenting heller men säkerhetsproblem låter inte särskilt kul även om det problemet förhoppningsvis är fixat nu.--Thurs 5 november 2011 kl. 22.47 (CET)
Ålderdom
[redigera]Under rubriken Ålderdom finns det ngn oklarhet i Fjellstedts register. Jag försöker kontrollera med Kalle 12's bibel, men jag hittar ingen rubrik "Ålderdom" där. Ngn som har en aning om vad det kan stå under för rubrik? -- Lavallen 16 november 2011 kl. 15.32 (CET) (Att "Å" sorteras under "A" vet jag.)
- Ngn skit bakom tangentbordet. Helt plötsligt fanns det en rubrik "Ålderdom". -- Lavallen 16 november 2011 kl. 17.38 (CET)
Lästips
[redigera]Lite helgläsning (122 miljoner sidor — puh, det blir många kvällar med korrläsning!) -- Simsalabim 18 november 2011 kl. 22.22 (CET)
Liquid Threads
[redigera]Innehåll
Fler specialtecken
Nederst i redigeringssidan finns klickbara specialtecken. Vi har tidigare lagt till pundtecknet (℔) där. Det skulle även vara användbart att ha med "det är" (ɔ).
De latinska/fonetiska tecknen ligger lite i oordning tycker jag. I stället för "ÄÖÆØ" borde väl alla A-varianter ligga först, sedan alla C, D, E, ... Kanske så här: Ä ä Å å Á á À à  â Ā ā Ą ą Æ æ • Ç ç Č č ĉ Ć ć • Ð ð đ • È è Ê ê Ë ë É é Ē ē Ę ę Ə ə • Ğ ğ • Í í Ī ī İ ı • Ł ł • Ñ ñ Ŋ ŋ ĝ ĥ ĵ Ń ń • Ö ö Ø ø Ó ó Ō ō Ó ó Œ œ • ŝ Š š ß ſ Ş ş Ś ś • Ŧ ŧ Þ þ • Ú ú Ü ü Ū ū ŭ • Ý ý • Ž ž Ż ż Ź ź ȝ
Jag nog förvänta mig att ha Å Ä Ö samlade sist för sig själva som i svenskan:
Á á À à  â Ā ā Ą ą • Ç ç Č č ĉ Ć ć • Ð ð đ • È è Ê ê Ë ë É é Ē ē Ę ę Ə ə • Ğ ğ • Í í Ī ī İ ı • Ł ł • Ñ ñ Ŋ ŋ ĝ ĥ ĵ Ń ń • Ó ó Ō ō Ó ó • ŝ Š š ß ſ Ş ş Ś ś • Ŧ ŧ Þ þ • Ú ú Ü ü Ū ū ŭ • Ý ý • Ž ž Ż ż Ź ź ȝ • Å å • Ä ä Æ æ • Ö ö Ø ø Œ œ
Är det "öppet o" LATIN SMALL LETTER OPEN O' (U+0254) 'ɔ' eller "omvänt c" 'LATIN SMALL LETTER REVERSED C' (U+2184) 'ↄ' du vill ha?
Har du något exempel där det används?
Jag vet inte om det är möjligt, men i de äldsta psalmböckerna är bokstäverna Ää= Aa med gement e liksom Öö= Oo. Alltså inte Æ æ respektive Œ œ, eller Øø eller med två prickar över. Och Åå var Aa med o, såsom det fortfarande är.
Jag tror inte att det finns unicode-tecken för dessa så det går förmodligen inte.
Det finns kombinationstecken
- U+0364 COMBINING LATIN SMALL LETTER E
- U+0366 COMBINING LATIN SMALL LETTER O
som man kan använda med a/A och o/O, fast på min webbläsare blir resultatet svårläst (måste förstora ett antal gånger innan något blir synligt):
- aͦ (a med o ovanför), Aͦ (A med o ovanför)
- aͤ (a med e ovanför), Aͤ (A med e ovanför)
- oͤ (o med e ovanför), Oͤ (O med e ovanför)
Jag vet inte vilket tecken som är rätt. Men ett exempel är sidan Sida:Forn-Swenskan.djvu/26, i en parentes mitt på sidan.
Efter en del letande hittade jag det på norska wikipedia. Tydligen heter det Forklaringstegnet på ren norska och har tydligen använts för förkortningen "d. e." (dette er) eller i.e. i Norge, Danmark och Island samt i mindre grad Sverige sedan medeltiden men har nu för tiden kommit i bruk. Traditionellt har man tydligen använt en uppochnedvänd c-typ men i unicode verkar "öppet o" användas [1], så jag lägger väl in detta i första hand.
Det återfinns i massor av böcker i Projekt Runeberg, och vi har det sedan länge under vårt korrekturläsningsformulär.
'i. e.' används i engelska och medicinska vetenskapliga texter och står för 'id est' (det vill säga) och ni menar alltså att det bakvända 'c' står för det?
Se avsnittet "70. Förklaringstecken" i Nils Linder, Regler och råd... (1886).
Digitalisera arkivalier för släktforskningssyfte på wikisource?
Hej, Är Wikisource rätt plats för att lägga upp och med gemensamma krafter digitalisera gamla handskrivna arkivalier från 1600-1800 talen? Jag frågar eftersom jag anser att det behövs ett fritt alternativ till de kommersiella krafter som just nu arbetar på att digitalisera stora mängder svenska arkivalier för släktforskningssyften, så att de sedan kan ta betalt för att få tillgång till dokumenten. Dessa dokument representerar den Svenska historien och är allmänna handlingar. De borde vara tillgängliga för alla. Släktforskarrörelsen i Sverige är mycket aktiv. Det handlar alltså om många potentiella frivilliga som kan hjälpas åt att digitalisera arkivalier. Det som saknas är en lämplig plattform..
Jag såg i wikisource-reglerna att statistiska dokument inte hör hemma här. De arkivalier som är intressanta för släktforskning innehåller ofta huvudsakligen tabeller med namnlistor och lite anteckningar, datum, ort, mm. om varje person.
Är Wikisource rätt plats för detta? Om inte, men någon tipsa om en bättre plats?
Ja, det behövs absolut alternativ till det kommersiella inom det här området...
Men det känns kanske som om just kyrkböcker här faller lite utanför Wikisource. Några andra synpunkter?...
Alternativ? - Tja, programvaran här är fri för vemsomhelst att sätta upp. Det som behövs är en server och ngn som sköter den.
Just kyrkböckerna finns tillgängliga mot betalning från flera kommersiella aktörer nu. Det behövs absolut ett fritt alternativ här, och en plattform för frivilliga avskrifter. Men i första hand tänkte jag mig nog sådant material som de kommersiella företagen ännu inte lagt vantarna på. Jag har själv varit på krigsarkivet och fotograferat av några militära rullor från 1700talet, och har planer på att göra samma sak med några skråböcker.
Men ni anser alltså att sådant inte riktigt platsar på wikisource?
Det jag är tveksam till är rena förteckningar över födda, dödda, döpta, vigda etc. Dvs rena kyrkböcker, men andra här kanske tolkar det annorlunda.
Övrigt material kan platsa...
Jo, det ligger på gränsen i alla fall. Vi inkluderar visserligen äldre i viss mån äldre handskrivna dokument av allmänintresse men det är då mer brev och andra offentliga dokument, så t ex domböcker kanske skulle gå. Rullor och kyrkobokföring är ju ett litet annorlunda källmaterial. Min uppfattning är nog att det skulle passa bättre på en egen wiki som man kan anpassa på ett annat sätt.
Det finns ju en väldigt stor mängd delredovisning som dopböcker, register över födda och döda etc som kan läggas upp församlingsvis. Svenska kyrkan har nu på olika vis börjat lägga ut olika förteckningar över kyrkogårdarna och begravda. De har inte enats inom församlingarna utan det finns 5-10 olika sajter som är mer eller mindre tillfyllest för släktforskning. Men det finns ju andra forskarbehov också, som t. ex. om båtsmän, namn, kvinnohistoria m.m. KB:s tidningsscanning är ju bra, men väldigt svår att använda jämfört med wiki. Svenska Familj-Journalen på Projekt Runeberg växer extremt sakta men växer ändå, liksom Hvar 8 Dag. Och är läsbar till skillnad från KBs tidningar.
Det är en bra idé, V85.
Det finns så mycket mer än kyrkoböckerna, som är av intresse för många inom släktforskningen. Det finns mängder av källor inom det offentliga materialet i våra arkiv. Arkiven är redan finansierade av allmänheten och ska knappast vara en källa till salu av varken bibliotek, arkiv eller olika arkivbildare.
Det kan vara ett mer allmänt intresse för enskilda att få ta del av sin hembygdshistoria, olika yrkes- och skråhistorier etc. Själv sitter jag och tittar på en pärm jag har som inleds med "Båtsmän i Åryd" (från 1700-talet), som någon har suttit och skrivit av på skrivmaskin. Det är namn på gårdar och rotar, giftermål och barn, vad folk levde och dog av. Näringar vid sidan av båtsmanskapet och sådant som visar hur livet ibland utvecklades i olyckliga riktningar. (Domböcker, företag, museisamlingar och m.m.).
Den litteratur vi har här på src och på andra närliggande projekt är vad dessa människor läste (och sjöng).
För att lägga upp exempelvis kyrkböcker här, måste du nog ha faksimilbilder. Har du det? Hur skapas de bilderna?
Visst har vi en del dikter utan faksimil, men jag betvivlar att det blir hållbart för kyrkböcker. Utan faksimilbilder blir det svårt att stoppa förfalskningar och svårt att kontrollera misstänkta fel i avskriften.
Om du har några faksimilbilder som du kommit över lagligen, så tycker jag du kan ladda upp och göra ett prov. Sedan kan vi diskutera om en fortsättning är rimlig och hur den bör struktureras.
Det juridiskt "säkraste" sättet att kopiera kyrkböcker och liknande är att besöka det aktuella arkivet med en digitalkamera. Tyvärr har arkiven regler som förbjuder både skanners och kamerastativ. Skanner kan man förstå, eftersom det skulle slita på böckerna, men jag har ännu inte träffat en arkivarie som kan förklara varför stativ måste vara förbjudet. De kommersiella företagen som kopierar kyrkböcker har också fått tillstånd att använda stativ, av någon märklig anledning... Men men, det fungerar hyfsat att kopiera böckerna med digitalkamera på frihand också. Så har jag gjort med några handlingar.
Ett annat sätt är att fjärrlåna mikrofilmer/mikrofiche från arkivet och kopiera dessa. Tryckfrihetsförordningen ger alla Svenskar rätt att läsa och "avbilda" alla offentliga handlingar. Men för att skoja till det lite så har riksarkivet satt en liten notis om att de äger upphovsrätten på all mikrofiche, och att all kopiering är förbjuden. Man riskerar alltså att hamna på lite otydlig juridisk mark om man gör så.
Som jag ser det så fyller wikifiering av arkivalier för släktforskning två syften.
Ett:
Det blir det en central plats dit alla som fotograferar arkivalier kan ladda upp sina bilder så att andra kan ha nytta av dom. Digitala kopior av arkivalier på internet underlättar dramatiskt vid släktforskning, eftersom man då slipper flänga land och rike runt för att besöka de olika arkiven. Det blir också ett fritt alternativ till de kommersiella krafter som tar ut ganska så stora avgifter för samma tjänst.
Två:
Med gemensamma krafter kan vi skriva av arkivalierna så att de blir digitalt sökbara. Detta gigantiska arbete gör givetvis underverk för forskningen. Men även utan avskrifter så är digitala kopior fritt tillgängliga på internet mycket värdefullt.
Vad jag vill veta just nu är väl egentligen om ni anser att detta skulle platsa här på wikisource, eller om det är bättre att jag helt enkelt drar igång en ny fristående wiki med specialinriktning på arkivalier?
Korrekturläsning, men för långsamt
Det är utmärkt att en del böcker blir korrekturlästa. För varje dag, månad och år ökar mängden korrekturläst text. Men det som scannas (hos Google, Internet Archive, Kungliga biblioteket, olika högskolor) är mycket mer. Går det att locka fler att hjälpa till med korrekturläsning, eller kommer vi ohjälpligt att halka efter? Om vi på svenska språket korrekturläser 2-3 hyllmeter per år i Projekt Runeberg + Wikisource tillsammans, så kommer det att ta många hundra år att avverka den första hyllkilometern. Ska vi försöka fylla på Wikisource med så mycket OCR-text som möjligt (som V85 gjorde ett tag), och inte bry oss om att korrekturläsa allt? Ska vi även transkludera sidor som inte är korrekturlästa?
Jag lade ju in Index-sidor för två månader (januari och februari 1836) av Post- och Inrikes Tidningar och korrekturläste januari. Men jag har gjort Djvu-filer för hela 1836 och 1837, och jag skulle kunna göra Djvu-filer och Index-sidor för två årtionden till. Det verkar inte hända mer inom korrekturläsning ändå.
Hittills har väl inte funnits någon större entusiasm inför massuppladdningar från webbarkiv.
Jag tycker att om vi ska göra något sådant så ska det ge något mervärde att lägga det här utöver källan som den är hämtad från. Till exempel är Nasjonalbibliotekets OCR (av de svenska texterna) så dålig att den knappt är sök- och läsbar medan de senaste som Lavallen och Simsalabim gjort kanske är 95% korrekta och njutbara även utan korrekturläsning. Skillnaden är väl inte lika stor när det gäller KB:s tidningar och det förutsätter ju att någon är i så fall är villig att göra OCR-tolkningen (och att den blir bättre).
Jag tycker dock att icke korrekturlästa sidor främst ska ligga i sidnamnrymden och inte transkluderas. Där spelar det inte så stor roll om OCR-texten är dålig. Får man en relevant träff är det vanligen enkelt att gå över till faksimilen och läsa texten där istället. Tidningar är dock ett problem eftersom sidorna är så stora att man måste förstora texten för att kunna läsa den och därmed tappar man kopplingen till den sökbara texten (om en tillfällig besökare ens hittar förstoringsmöjligheten). Vårt system är väl på den punkten knappast överlägset KB:s eget.
Red:En poäng med massuppladdningar skulle kanske vara att skapa trafik till sidan. Men möts besökarna endast av en dålig OCR och en otydbar faksimil försvinner de förmodligen lika snabbt igen.
Uppläggningen av Nasjonalbibliotekets material utmärkte sig på det viset att det innehöll svenskt material från en norsk källa, en plats som det sannolikt inte är självklart att söka svenskt material i. (Till skillnad från KB.)
Jovisst, att göra ett material mer lättillgängligt kan också vara en orsak till att lägga upp det här.
Siden jeg nevnes spesifikt, så tenker jeg at jeg bør ha mulighet til å svare i denne debatten. Dere på :sv: står selvsagt fritt til å velge de retningslinjene dere vil ha, og jeg ser at det da er to muligheter: Enten kan dere tillate at det legges inn mengder med indekssider som korrekturleses, eller ikke, eller så kan dere lage ne regel om at indekssider ikke skal lages, før det er interesse for også å korrekturlese dem. På :no: har vi ikke tatt noe bevisst valg, men foreløbig er det slik at vi godtar at det lastes opp mengder med indekssider, uavhengig av om de blir korrekturlest.
Selv tror jeg at det beste alternativet er at masseopplastninger godtas. Grunnen er enkel. Mennesker som har filer kan da laste dem opp, uten å bekymre seg over restriksjoner som statistikk, og andre brukeres meninger. Fordelen er at andre brukere, senere, som ikke har tilgang til de samme kildene, f.eks. databaser à la Nasjonalbiblioteket, eller en fysisk kopi av boken, kan korrekturlese, fordi filen er tilgjengelig på WS. Kanskje noen kommer og korrekturleser én side før de går lei og gjør noe annet. Da har WS fått én ekstra korrekturlest side vi ellers ikke ville hatt.
Selv om jeg ikke har korrekturlest mye av de filene jeg lastet opp, så synes jeg det ser ut som :sv: har tjent på at jeg lastet dem opp: De er korrigerte og flere av dem også validerte, og de har på den måten kanskje skapt mer trafikk til :sv: enn dere ville hatt uten dem?
Ellers er jeg enig i at tekster som transkluderes bør være korrekturleste først. Det har ingen verdi å vise frem ”rå” tekster som bare består av ”kode”.
Requests for comment/Image filter on Wikisource
En så kallad Requests for comment/Begäran om kommentarer har satts upp på meta: meta:Requests for comment/Image filter on Wikisource.
JAg tänker efterlysa en tydlighet om vilket projekt den här RfC'n handlar om. Handlar den om 61 projekt på en enda gång, känns det riktigt illa...
Ett problem med RfC'n verkar vara att diskussionen och utformningen av sidan styrs av en användare som ställt till med en massa strul och är blockerad på enwp.
En sån där diskussion på meta kommer oundvikligen att kapas av diverse fraktioner som i inte bryr sig särskilt mycket om Wikisource. Jag inte se att det kan bli något meningsfullt resultat av detta.
Jag tycker inte heller om den här tendensen att användare från engelska och flerspråkiga Wikisource på senaste tiden börjat agera i hela Wikisources namn.
ſ och ß
Jag tittade på Sida:Arithmetica eller räknekonst.djvu/19 och noterade några saker som jag tycker verkar konstiga:
- På 1700-talet när boken gavs ut var man noga med att skilja på "s" och "ſ", men alla de avskrivna sidorna saknar detta. Är det verkligen riktigt att ta bort denna uppgift från texten?
- Många bokstavskombinationer skrevs förr i tiden ihop som ligaturer, till exempel "ct", "ck", "ſk", "fi", "ſs" och "ſz". Det verkar som att "ſz" (och även "ſs"?) ibland skrivs in som "ß". Vad ska detta vara bra för? Övriga ligaturer verkar aldrig markeras som ligaturer på något vis. Det verkar inkonsekvent. Dessutom går uppgifter om äldre stavning förlorade om både "ſs" och "ſz" byts ut mot samma sak.
Både inom Wikisource och andra liknande projekt råder inkonsekvens på det här området. Det är inte självklart hur man ska transkribera. Det bästa vi kan göra är att dokumentera vilken princip som använts i varje verk, och försöka vara konsekventa inom verket. Sidan du länkar till gör också skillnad mellan fraktur (för svensk text) och antikva (för latinska termer), en åtskillnad som vi endera brukar strunta i eller använda kursiveringar för antikvan. Vi brukar också skriva ihop avstavade ord vid rad- och sidbrytningar. Ibland rättar vi tryckfel, annars inte. Det är en balansgång mellan att återge det tryckta, så noga det går, och att tolka författarens och typografens avsikter.
När jag skrev Wikisource:Redigering försökte jag göra rekommendationer, men jag vet inte om alla håller sig till dem.
Boken är skriven i frakturstil, vilket vi nog varken kan eller vill efterhärma. Vi kan inte återge alla ligaturer, (tyvärr), det finns inte unicode-tecken för allt sådant.
Hur det är med "ſz" kan jag inte svara på...
Dubbel-s återger vi alltid med "ss" om det är modern svenska (dvs från 1526). Det lär vara så RA gör... För medeltida texter så försöker vi återge det mer direkt.
Det finns också undantag, såsom Index:Svenska medeltidens bibel-arbeten (1853).djvu från 1853 där man inte använder frakturstil, och vi därför kopierar rakt av med ſ, ȝ, æ och ø och vadhelst som lagts in...
Sidan du länkar till är inte färdigavskriven, det finns utrymme för omtolkningar...
Sidan är inte färdigskriven, så jag försökte rätta till den men blev fundersam när jag upptäckte vad som hänt med "ſ" och "ß", så jag slutade rätta till saker för att först fråga hur man ska göra. Sidan Wikisource:Redigering reder ut en del.
På tal om gamla skrifter, hur pass gamla skrifter kan man lägga in här? Kan man fotografera skriva av runstenar här eller ska de placeras på någon separat non.wikisource.org för fornnordiska?
Det finns i princip ingen gräns för hur gamla texter som går att lägga upp här, så länge det finns ngn koppling till det vi idag kallar svenska. (Dvs samiska texter bör läggas på wikisource.org istället, och finska har sitt eget projekt.) Observera att tolkningar av mycket gamla texter kan vara under upphovsrätt.
Filer lägger du med fördel först upp på Commons.
Munnen full
Tyske wikipedianen Achim Raschka (66.000 redigeringar) bloggar om en natt i Wikisource, som gav en besk eftersmak. Han är aktiv inom Wikipedia, men tänkte nu som omväxling lägga till en kort text i tyska Wikisource (ett förord av en känd författare). Han beskriver hur förvirrande det är att det finns en länk för att "skapa en artikel" (standard wiki, inte anpassat för Wikisource), men inget om hur man får sidor i namnrymderna Sida: och Index:. Sedan blir han utskälld för att han skapat en författarsida för en författare vars verk ännu omfattas av upphovsrätt, men får den raderad för att detta strider mot kutymen. Det är alltså både tekniken och bemötandet från andra användare som ger avsmak för projektet. Därefter försöker han lägga in ett handskrivet brev (av en känd författare) tillsammans med en modifierad transkription ur en annan källa, och möts av oförstående. Det är väl inga formella fel begångna, men en värdefull berättelse av hur en wiki-erfaren wikisource-nybörjare uppfattar mötet med Wikisource.
Hehe, tyska Wikisource är lite speciellt... (Inte för att jag kan ett ord tyska.)
Wikipedianer är också speciella. SFFR-diskussioner som hänvisar till att "detta kan flyttas till Wikisource/tionary/books" etc som gör att man blir mörkrädd. Majoriteten av wikipedianerna har väldig dålig koll på systerprojekten!
Jeg tror at tyskerne gjør ting litt anderledes enn oss andre. Jeg prøvde en gang å laste opp en bok dit, som jeg har gjort på flere prosjekter (no, sv, da, en, fr), men det varte ikke lange stunden før index-siden ble slettet, fordi "prosjektet ikke hadde blitt diskutert". I verste fall, på andre Wikisource-utgaver, så skjer det ingenting med index-sidene mine, andre får et par sider korrekturlest, men de blir ikke slettet. (Her på sv:, så blir de ganske raskt validert! Noe som er veldig gøy og motiverende for å delta mer.)
Hvert prosjekt har sin egen kultur; de har òg hver sin målsetning og hver sine retningslinjer. Wikipedia og Wikisource har forskjellige mål, derfor er de forskjellige prosjekt, og det man lærer på Wikipedia om hvordan ting skal være, vil nødvendigvis være forskjellig på Wikisource, selv om programvaren er den samme. På :en: har de tatt følgene av det, og laget siden en:Wikisource:For Wikipedians som har som mål å forklare hvordan de to prosjektene er forskjellige. De som har jobbet en del på Wikipedia vil jo vite en del om hvordan ting fungerer, det de trenger en innføring i, er hvordan prosjektene er ulike.
Hur känt är Wikisource
Wikipedia Signpost återger resultatet av en liten enkät som skickats ut av ngt ställe:
När man frågade efter 10 projekt som drivs av WMF listades i fallande ordning: Wikipedia, Wiktionary, Commons, Wikiquote, Wikibooks, Wikinews, Wikisource, Wikiversity, Wikispecies, MediaWiki.
Hade varit spännande att se vad en svensk enkät hade gett! - Inte för att jag tror att vi skulle passerat w: wikt: eller commons:, men därefter? - Nåväl, vi syns högt i Google, får väl nöja oss med det så länge...
Att försöka komma högre upp än Wikiquote kan inte vara målsättningen. (Svenska Wikiquote är enligt min åsikt ett projekt i djup kris, om inget radikalt har hänt nyligen.) För min del handlar det om att jämföra Wikisource med Projekt Runeberg, Litteraturbanken och andra liknande sajter: När flera sajter presenterar samma text, vilken av sajterna är då mest användbar? Vilken kommer högst bland sökträffarna? Vilken är det folk länkar till?
Wikisource har en stor teknisk nackdel av att Sida-namnrymden inte länkar till inklusionssidorna i huvudnamnrymden. Man vill ju leda läsarna till huvudnamnrymden. Jag misstänker dessutom att länkarna till föregående och nästa sida, som görs med Javascript, inte indexeras av sökmotorerna. Detta är länkstrukturer som fungerar i Projekt Runeberg, men inte i Wikisource. Litteraturbanken har väl bättre länkstruktur idag än för några år sedan, men hur mycket deras sajt används kan jag inte bedöma.
Ngt positivt som har hänt på sv:q: är väl att det projektet fått en engagerad användare till som administratör där. Om det räddar projektet är en annan sak...
Jag tror det kan vara mycket svårt att passera Commons i kändisskap.
Runeberg är känt av alla här. Är Wikisource känt av Runebergare?
Svenskt biografiskt lexikon
De tio första banden av Svenskt biografiskt lexikon (från A till De la Gardie) utkom 1931 eller tidigare, medan Bonniers utgav verket. De är alltså äldre än 70 år, precis som uggleupplagan av Nordisk familjebok, även om vissa artikelförfattare inte har varit döda i 70 år. Borde vi lägga upp dessa tio band i Wikisource (och PDF:erna i Wikimedia Commons)? PDF:erna finns på en CDROM över de 31 första banden, som togs fram 2004 och numera har slutat säljas. Riksarkivet förbereder en online-databas senare i år, men rykten säger att den ska ligga under abonnemang och inte vara gratis.
URAA-problematiken finns ju även då. (Men kanske inte för de första banden.) Avvakta lite, är därför mitt råd. Den biten borde ju vara löst närsomhelst...
URAA har jag inte till fullo begripit, men det kan ju vara en anledning att lägga SBL 1-10 i Projekt Runeberg i stället, om nu Riksarkivet inte gör en helt öppen lösning. Kanske tänker de lansera vid Bokmässan?
Långsam Finereader
Jag kör nu Finereader Professional version 10 (ett OCR-program) på min laptop, och tycker att det går förfärligt långsamt. Men vad är normal hastighet och hur mäter man det? Den stod 29 sekunder och tuggade på den här bilden (ladda hem "full resolution JPEG" och prova). Andra sidor i samma bok tar 13-16 sekunder, men även det känns onödigt långsamt. Borde det inte gå på 3-5 sekunder eller mindre?
Just den här bilden tog bara ngn sekund med min dator idag. (Kanske 2 med mönsterigenkänning.)
Finns det dåligt med minne i datorn, så kan det ta betydligt mer tid...
Datorn har 2 GB RAM, så det kan inte vara minnesbrist. Men programmet var inställt på "thorough reading". När jag ändrade detta till "fast reading" blev tolkningen snabbare (2-4 sekunder per sida) utan att kvaliteten försämrades. Thorough reading sägs i dokumentationen vara bättre på komplicerad tabell-layout, men "fast" tycks vara tillräckligt bra för de tabeller och layoutvarianter som förekommer i den här boken.
Men när jag ska "öppna" de inscannade sidorna till en ny bok, så tar detta 10-15 sekunder per sida. Även det måste väl gå att klara snabbare?
Att "Anaysera" en sida, brukar ta nästan lika lång tid som att tolka den. (Med analysera menas då att automatiskt räkna ut vilka fält som ska tolkas som text/bild/tabell etc, och avgöra om bilden är uppdelad på kolumner och om det finns sidhuvud/fot.)
Ja, men analysen av fält gör jag samtidigt med tolkningen, och det går fort nu. Men att öppna bilderna tar lång tid, oavsett om jag har "enable preprosessing" (deskew, det vill säga automatisk rotering av sneda sidor) påslaget eller inte. Det är alltså inte heller deskew som tar tid, utan något annat.
Att öppna TIFF-bilder (600 dpi bitonal, TIFF G4) går snabbt, men JPEG (300 dpi färg) går obegripligt mycket segare.
djvuocr.py - nytt verktyg för OCR av Djvu-filer, integration av Tesseract 3.0 i Pywikipedia
Snubblade över tråden: commons:Commons:Village pump#OCR of djvu files : a new tool som länkar till commons:User:Tpt/djvuocr.py. Det här är värre än grekiska för mig (för där kan jag åtminstone tyda bokstäverna och läsa vissa ord). Ngn som vet?
dcjuocr.py är ett script (eller program) skrivet i python som laddar ner en djvu-fil från commons med pywikipedia. OCRar den med tesseract och lägger till OCRen direkt i djvu:n med hjälp av djvulibre. Sedan laddas djvun upp igen till commons med pywikipedia. Samtliga dessa program är fri mjukvara. Det ser ut att kunna fungera rakt av om man kör Linux. Sist jag tittade på tesseract fanns inte stöd för svenska, men det verkar som om google har skapat sådant stöd. Jag kan dock inte hitta den svenska versionen i mina ubuntu repositories. Om någon känner sig manad vore det intressant att se om tesseract kan användas här.
Missbruksfilter
Missbruksfiltret har tydligen aktiverats på alla WMF-wikis nu. Se Special:Missbruksfilter.
Exakt hur vi skulle ha nytta av detta här, vet jag inte, men jag ville rapportera min upptäckt.
Sidlayout i huvudnamnrymnden
I huvudnamnrymden finns det en del olika sidlayout på verken. Några exempel är
Detta är väl en spegling av att olika personer tycker olika om hur texten bäst presenteras för läsaren, men det kan ge ett lite splittrat intryck av wikisource för en besökare.
På norska ws (och engelska, franska, ...) har de implementerat ett sätt för läsaren att själv kunna växla mellan olika sidlayouter. På t.ex. denna sida så finns i vänsterspalten under rubriken "Visningsvalg" en länk där man ändrar utseendet. Fördelen är att då kan det subjektiva beslutet av hur texten ska presenteras överlåtas till läsaren och ws-medarbetarna slipper ha en åsikt.
Rent tekniskt verkar denna lösningen inte vara så svår att implementera (inkludera en javascriptfil och sätta upp ett par js-strukturer i common.js) så frågan är istället om detta är en önskvärd finess för oss?
Själv har det varit ett större intresse för textens innehåll än det grafiska runtom som gjort att jag inte lagt så mycket möda på den här saken. Jag har inte lärt in kodningen i den här detaljen helt enkelt. Men med det här systemet tycker jag det ser ut som vi kan få det lite som vi vill. Hur kommunicerar koden för marginalnoter med det här systemet?
Jo, innehållet är det primära. Själv valde jag samma layout för Darwinböckerna som en:Popular Science Monthly hade en gång i tiden (men inte har längre) och som såg trevlig ut, men jag har inget större känslomässigt band till den layout:en och lösningen som föreslås i denna tråd skulle passa mig bra. Det kan dock finnas andra som har starkare åsikter om detta.
(Se denna sida för hur marginalnoter ser ut i de olika layout:erna.)
För min del har jag inget emot att införa den här funktionen. Det ger en större valfrihet för läsaren och det skulle nog också vara bra med ett visst mått av standardisering av sidorna. Dessutom tycker jag mig ha märkt att de här hårdkodade layouterna som finns nu inte blir bra vid utskrift och dubbelwikivisning. (Den norska "Utseende 1" ligger också rätt nära den layouten jag brukar använda så för mig är inte det heller något problem).
Ett problem är väl är att man måste gå igenom alla gamla sidor för att ta bort den nuvarande layouten. Men det kanske kan gå att göra med hjälp av en bot?
Om jag bara lyckas räkna ut vilken kod som ska bytas ut mot vilken annan, så låter det sig nog göras.
Jag ser inte någon särskilt skillnad när jag tittar på de olika inledande exemplena. Det kanske beror på att det är olika texter som används för de olika exemplen.
Jag misstänker att variationen på sidorna är så pass stor att en botkörning blir otillförlitlig.
För att göra en uppskattning av arbetet satte jag min bot på att hitta alla sidor i huvudnamnrymnden som uppfyller dessa tre kriterier:
- wikitexten innehåller strängen '<div'
- wikitexten innehåller strängen 'width:', 'margin:', 'margin-left:' eller 'margin-right:'
- wikitexten innehåller strängen '<pages' eller '{{sida|'
(ingen skillnad på små eller stora bokstäver).
Då fick jag totalt 1378 sidor. Alla sidor behöver nog inte åtgärdas, men åtminstone tittas över.
Image filter referendum
En omröstning om möjligheten att införa ett filter mot vissa typer av bilder hålls nu.
Se m:Image filter referendum/en för detaljer (på engelska så här långt) Och själva omröstningen hittar du här: Special:SecurePoll/vote/230 (En anglais!)
Interwiki sorting order
Den här ändringen får mig att inse att vi egentligen saknar en officiell policy om hur interwiki-länkar ska sorteras. Vi har inget angivet alls för detta projekt på m:Interwiki sorting order, varför det sorteras av pywikipedia-botarna efter språk-koden. Därför hamnar finska (fi) strax före franska (fr).
Jag föreslår att vi anger att interwiki-länkarna ska sorteras efter "By order of alphabet, based on local language", så att finska sorteras som "S" och japanska under "N", vilket är mer logiskt för dem som söker sitt eget språk. Det här skulle ge samma sortering som finns på svenska och engelska wikipedia.
Ett annat alternativ som finns är: "By order of alphabet, based on local language (by first word)" vilket skulle göra att tex Indonesiska skulle hamna under bokstaven "B", eftersom det heter 'Bahasa Indonesia' eller ngt liknande. Dock så betyder 'Bahasa' helt enkelt språk, varför det är ett mindre bra sorteringsunderlag. Jag tycker därför svenska wikipedias variant är bättre.
Det finns ytterligare ett par alternativ, men det är antingen främst urformat för de som har mer än ett alfabet, eller det alternativ som är utformat för wiktionary.
Iw-sorteringen är ingen stor sak för Wikisource, men att 'fi' läggs före 'fr' stör mig ngt, varför jag gärna ser en ändring, särskilt med tanke på att 'fi' är en av våra mest iw-länkade systerwikis.
Jo, jag reagerade också på det så det skulle vara bra om vi skaffar oss en policy för sorteringsordningen.
Sorteringsordningen By order of alphabet, based on local language är nog den ordning som jag manuellt försöker följa så det är den som jag föredrar att bottarna också följer.
Stödjer förslaget.
Har jag fria händer att låta Innocent bot köra igenom alla sidor för att få rätt överallt? I huvudnamnrymden måste jag köra lågt och sakta, men i övriga (utom ns:mall) borde det bara vara att brassa på.
Please, create some Wiki link templates.
Please, create some Wiki link templates - commonscat, wikinews. Examples see on my page - Användare:Averaver.
Digitaliseringsflöden
De fem svenska universitetsbibliotek, som via Kungliga biblioteket gjorde en gemensam upphandling av digitaliseringsrobotar, har nu börjat komma igång med scanningen och har under maj 2011 startat en blogg om digitaliseringsflöden, http://digitaliseringsfloden.blogspot.com/
Intressant att även förlagen jobbar med saken...
Jag tycker skillnaden i arbetsprocess är det intressantaste. Förlagen börjar med att fråga sig om det finns en marknad, och ser sedan till att få jobbet gjort genom att anlita den som gör det billigast (i Indien). Biblioteken börjar med att köpa in scanningrobotar och funderar sedan på hur de ska användas, men om det finns någon som vill läsa det digitaliserade (nyttan, outputen) verkar vara den allra sista punkten på deras dagordning.
Och kanske lite förvånande att rättigheterna måste förhandlas om när man gör det...
Skaffar man nya rättigheter för varje tryckning, och därför även när den ges ut för "print on demand"?
En författare som "blir utgiven" tecknar ett förlagsavtal. Jag tror att ett vanligt förlagsavtal ger förlaget ensamrätt att ge ut boken så länge den finns i lager och därefter i fem år (i utbyte mot en viss förskottsbetalning + royalty för varje sålt exemplar). Om boken blir slutsåld, kan förlaget alltså trycka den på nytt inom fem år, men gör de inte det så återgår rättigheten till författaren, som då kan förhandla med ett annat förlag (eller göra ett nytt avtal med samma förlag). Ett förlag som vill göra en ny utgåva, elektronisk eller tryckt, kan med fördel utnyttja sin egen "backlist" eftersom de ju redan är bekanta med författaren, men för böcker som varit slutsålda så länge att förlagsavtalet har upphört, måste en ny förhandling göras. Initiativet till sådana förhandlingar kan förstås också komma från andra förlag.
Call for image filter referendum
The Wikimedia Foundation, at the direction of the Board of Trustees, will be holding a vote to determine whether members of the community support the creation and usage of an opt-in personal image filter, which would allow readers to voluntarily screen particular types of images strictly for their own account.
Further details and educational materials will be available shortly. The referendum is scheduled for 12-27 August, 2011, and will be conducted on servers hosted by a neutral third party. Referendum details, officials, voting requirements, and supporting materials will be posted at Meta:Image filter referendum shortly.
Sorry for delivering you a message in English. Please help translate the pages on the referendum on Meta and join the translators mailing list.
For the coordinating committee,
Philippe (WMF)
Cbrown1023
Risker
Mardetanha
PeterSymonds
Robert Harris
Om en föreslagen flytt från Wikipedia till Wikisource
Vad tycker vi om den här texten som skall finnas på Lars Gathenhielms kista? Är det någonting som vi är intresserade av? Vi brukar ju lägga in skriftliga verk, och sådana här inskrifter tycker åtminstone inte jag riktigt passar in på Wikisource, men vad tycker ni andra (iaf rent principiellt)?
Fundersam på om det faller under "publicerade" verk.
Nog finns den publicerad tidigare t ex i familjjournalen men i det skicket som det finns på WP tycker jag inte att det är något att föra över. Om inskriptionen är relevant för WP kan den ligga kvar där i så fall.
Två frågor till:
Saknas någon uppgift på w:Känner du landet, det härliga rika och w:Ack Värmeland, du sköna för att vi skall kunna flytta hit dem?
Hittade just följande formulering i Syrachs bok:
det är dem frommom godt; men dem ogudaktigom skadligt
Hur länge sedan är det man pratade så här, eller har man någonsin gjort det?
Exempel på dativ i svenskan finns i Wikipedia, men det står inte i den artikeln när dativändelsen upphörde att användas. Svenska Akademiens handlingar som (efter omstarten) började ges ut år 1800 saknar sådana former.
Om man undantar vissa dialekter var fyrkasussystemet i svenskan, som dativen tillhör, levande under äldre fornsvensk tid d v s fram till slutet av 1300-talet. Under 1400-talet börjar systemet avvecklas. I kyrkospråket och även högtidligt profant språk förekommer dock de gamla formerna ända fram till 1700-talet.
Ta bort "krafs" kring tumnagelbilder
I min korrläsning av Darwin har jag kommit till en del av boken där det förekommer många tumnagelbilder med bildtext, se t.ex. denna sida. Det jag inte är tillfreds med är att bilderna har en ful ram och bakgrundsfärg kring sig à la wikipedia, något som figurerna i boken inte har. Därför är mitt förslag att vi tar bort detta "krafs" för tumnagelbilder i huvud- och sidnamnrymden (se min Monobook.css för css-reglerna). Vad tycks?
Intressant lösning. Det kanske inte är en lika ren lösning som en tumnagelbild, men det kan vara en överlevnadsstrategi om folk trots allt vill behålla ramen och bakgrundsfärgen.
Jag brukar nog också använda andra lösningar om WP-formateringen av thumb-bildarna stör mig men det skulle vara bra att få bort det överallt.
Hmmm, finns det inte ngt magiskt ord att lägga in om man vill ha en ram? Jag vill minnas att jag sett ngt dylikt någonstans... Om det gör det, så finns det kanske ingen anledning att behålla ramarna. I författanamnrymden kan de dock vara kvar. Det är det mest Wikipediska vi har.
Det finns en parameter border som man kan lägga in i bilder för att få fram en ram.
Rd:Men jag tror inte det fungerar med Simsalabims kod. Ramen finns kvar på tumnagelbilderna men är satt till helvit så den syns inte mot bakgrunden.
Det kanske är bättre att ta bort ramen med border: none;
än att bara göra den vit så den inte syns. /EnDumEn 2 juli 2011 kl. 17.47 (CEST)
I så fall kan skulle man nog kunna ta bort bakgrundsfärgen också så rutan blir helt genomskinlig (förutom bilden). Vilket som är den bästa lösningen kan inte jag avgöra. Någon annan som har någon åsikt?
Jo, det är nog rätt och riktigt med ofärgad bakgrund. Jag tänkte inte på det. I praktiken kommer det inte ha så stor effekt eftersom vi har vit bakgrund på våra verk, men vem vet, på enskilda verk eller i framtiden kanske en annan bakgrundsfärg kommer användas. (Hmm, kanske borde bilder därmed också ha transparent bakgrund istället för vit.)
Bildtext | Bildtext |
Jo, det blir ju snyggare vid färgade bakgrunder om det är "flytande" bilder utan ram. Men det känns som lite som överkurs och inget vi kommer att kunna kräva.
OK nu har jag lagt in det i MediaWiki:Common.css. Rapportera gärna eventuella buggar eller andra problem i den här tråden.