Indexdiskussion:Uppslagsbok för alla 1910.djvu

Sidans innehåll stöds inte på andra språk.
Från Wikisource, det fria biblioteket.

Montgomery:

Då författaren avled 1913 och verket publicerades första gången före 1 januari 1929 är verket fritt enligt svensk och amerikansk upphovsrätt.

Lundström: ??

ns-0[redigera]

Jag skapade på prov Uppslagsbok för alla/A. Jag vet inte annars hur det är tänkt att presenteras i huvudnamnrymden! -- Lavallen 7 januari 2010 kl. 17.00 (CET)[svara]

Eftersom artiklarna ofta är korta så känns det som en vettig lösning att ha dem samlade efter initialbokstaven. Om du har lust kan du nu också skapa en sida för bokstaven B vars sidor jag la in ikväll. (Puh! det sliter lite att sitta och mekaniskt lägga in sidor.) -- Simsalabim 7 januari 2010 kl. 21.02 (CET)[svara]
Det är fritt fram att skapa mindre textsidor också, men jag vet ju inte exakt vilka som i sådana fall skulle efterfrågas. Skapa en textsida för varje uppslag känns som ett riktigt hundgöra. Men, som sagt, det är fritt fram för den som önskar. -- Lavallen 8 januari 2010 kl. 11.31 (CET)[svara]
Det är realistiskt om någon skriver en bot som skannar av texten efter artiklar och (semi)automatiskt skapar artikelsidorna, men det går långt över huvudet på mig. -- Simsalabim 8 januari 2010 kl. 21.34 (CET)[svara]
Förutom att skapa artikelsidorna, behöver sidnamnrymden sectioneras för varje uppslag, vilket också är ett pillgöra. Du kan se hur jag gjort här för att separera B från C.
Min bot är just semiautomatisk, det är mest ett konto för att göra trivialitetsredigeringar. Jag kan programera vissa lättare språk, men detta är över mitt huvud. Och det enda den egentligen är auktoriserad att göra här, är att lyfta fram det OCR-lager som finns i djvu-filer. -- Lavallen 9 januari 2010 kl. 10.41 (CET)[svara]
Det skulle innebära att en sida skulle delas upp i närmare 40 sektioner, även om det är tekniskt möjligt är det knappast meningsfullt. Många sidor skulle endast bestå av en enda mening, ibland endast en vidarehänvisning.--Thurs 9 januari 2010 kl. 14.32 (CET)[svara]
Visst, diskussionen gled in på ett mer hypotetiskt spår: Hur skulle man göra om... Hade det rört sig Nordisk familjebok skulle det vara intressant med en sida per artikel. -- Simsalabim 9 januari 2010 kl. 22.33 (CET)[svara]
Ja, om vi skulle lägga in ett flerbandsverk som Nordisk familjebok skulle vi nog få lägga in dem på artikelnivå. Flertalet artiklar är väl dock något längre i dessa än i detta verk även om hänvisningar finns där också.--Thurs 9 januari 2010 kl. 23.48 (CET)[svara]

Ankare[redigera]

Om man vill möjliggöra länkning direkt till en post, finns den ypperliga mallen {{Ankare}}. -- Lavallen 7 januari 2010 kl. 17.00 (CET)[svara]

Bra tips. Jag ska ändra mitt skript och lägga in sådana ankare när jag fortsätter med bokstav C. -- Simsalabim 7 januari 2010 kl. 21.02 (CET)[svara]
Nu har jag lagt in några sidor på bokstaven C med ankare. Jag hoppas allt blev rätt. -- Simsalabim 9 januari 2010 kl. 22.22 (CET)[svara]
Nja, nu ligger det ankare på ordet Cabīro, det kanske hellre skulle ligga på Cabiro? -- För jag gissar att dessa hattar på vissa vokaler är betoningsmarkeringar!? -- Lavallen 10 januari 2010 kl. 10.00 (CET)[svara]
Ok, tillbaka till ritbordet. Jag är ingen språkmänniska så jag känner mig lite osäker, men vad sägs om att jag gör ersättningarna: ā → a, ē → e, ë → e, ī → i, ï → i, ō → o, ū → u och tar bort eventuella |- och '-tecken i ankare. Man måste tänka på att dessa maskinellt genererade ankare inte kommer att bli 100% korrekta men jag tycker att om det blir 95%+ rätt så kan man nog vara rätt nöjd. Det kommer bli nödvändigt att fixa till eventuella kvarvarande felaktigheter i korrekturläsningen. -- Simsalabim 10 januari 2010 kl. 10.38 (CET)[svara]
Osäker på om ë → e och ï → i alltid blir rätt, men det får vi i så fall ta i den manuella rundan. I franska är ¨ en slags uttalsmarkering som verkar vara frivilligt att skriva ut. Tex så verkar man ju skriva både Citroën och Citroen. (Och betyder att det inte är ngt nasaljud på slutet.) -- Lavallen 10 januari 2010 kl. 10.56 (CET)[svara]

Sida 77[redigera]

Längst ner på sida 77 blev det inte rätt med apostrofen som avslutar de två kursiva bokstäverna th. Jag la in ett mellanslag för att undvika ''' (som ändrar till fet stil). Kan någon fixa? -- Simsalabim 7 januari 2010 kl. 21.02 (CET)[svara]

Jag fixade genom att lägga nowiki runt apostrofen. /EnDumEn 8 januari 2010 kl. 01.13 (CET)[svara]
Tack för fixen! Jag reparerade samma problem även på sida 85. -- Simsalabim 8 januari 2010 kl. 21.34 (CET)[svara]
Jeg pleier å gjøre forskjell på ' og ’ (hhv. ASCII og typografisk apostrof): Den første bruker jeg bare i wikikode, og den andre der det er en apostrof i teksten. V85 9 januari 2010 kl. 13.20 (CET)[svara]
Det brukar vi också göra, d v s vi använder den form av apostrofer och citationstecken som finns i faksimilen.
Men är det verkligen en apostrof. Om man t ex jämför Cel´sius och Celsius’ termometerSida:Uppslagsbok för alla 1910.djvu/162 så tycks det tecknet snarare vara ett accenttecken [´] än en apostrof [’].--Thurs 9 januari 2010 kl. 14.48 (CET)[svara]
Kanskje det er et strøk? [ʹ]. V85 9 januari 2010 kl. 16.17 (CET)[svara]
Det är en särskild typ av primtecken: Modifier letter prime? Jo det är nog det tecken som är närmast ursprungsbetydelse men i min webläsare ligger ett vanligt primtecken [′] grafiskt närmare originalet.--Thurs 9 januari 2010 kl. 20.59 (CET)Edit:Det tycks främst vara ett problem i Arial, i andra typsnitt jag provat återges tecknet korrekt--Thurs 9 januari 2010 kl. 21.54 (CET)[svara]

All text inlagd[redigera]

En liten delseger: Nu är all text från Runeberg inlagd på indexsidorna. Jippi för mig! Fast jag ser redan bristerna och det kanske vore bra med en vända till genom sidorna. Jag tänker främst på två saker som kan illustreras av följande artikel ur uppslagsboken:

satin, se satäng. -era, glätta papper medels zinkplåtar.

Som det är nu så finns ett ankare till satin men man skulle kunna peta in ett ankare till satinera också (dvs. på delordet -era). Dessutom vore de snyggt att lägga in en länk på ordet satäng. Det är två saker som är relativt görbara med ett skript. Vad tycker ni, är det något att lägga ner tid på? Och, ponera att jag gör ytterligare ett varv, finns det något annat som jag kanske skulle kunna göra? -- Simsalabim 21 januari 2010 kl. 20.42 (CET)[svara]

Jag tycker helt klart att länkning skulle förbättra texten. Om det är lätt att göra med ett skript så kan det vara värt att lägga lite tid på det. Men kanske inte om det krävs ett jättearbete. /EnDumEn 22 januari 2010 kl. 01.32 (CET)[svara]
Jo, låter det sig göras med ett skript så kör på, annars får det bli upp till den som behöver denna länk. I apokryferna har vi bara ankrat ord som internt behöver en sådan. -- Lavallen 22 januari 2010 kl. 10.25 (CET)[svara]
Då ska jag titta på saken under helgen. Min idé för att hitta lämpliga länkkandidater är att titta på spärrade ord och stoppa in en länk om föregående ord är "Se", "Jmf" e.dyl. (plus att det spärrade ordet ska ha ett ankare). Det borde fånga upp en inte helt oansenlig andel av de länkar man kan tänkas vilja ha. -- Simsalabim 22 januari 2010 kl. 19.00 (CET)[svara]
Nu har jag kommit upp till ytan igen (hann inte jobba så mycket förra helgen). Bokstaven A är inlagd med fler ankare och en del hänvisningslänkar. Träffsäkerheten i att hitta hänvisningar i texten är lite sisådär och om ordet/frasen som hänvisas till inte har ett matchande ankare (t.ex. för att ordet/frasen är förkortat) så utelämnas länken. Skrik gärna till om ni hittar något suspekt. -- Simsalabim 31 januari 2010 kl. 20.11 (CET)[svara]
När jag tänker efter så är det dumt att hårdkoda hänvisningslänkar på sidorna. Det är inte otänkbart att någon i en framtid vill stuva om sidan Uppslagsbok för alla och dess undersidor. Därför är det nog bättre om jag skapar en mall, typ {{UFA-länk}}, som tar ankaret och länkfrasen som argument och skapar länken. Hmm, varför kan man inte komma på sånt innan man lagt in 160 sidor :-( -- Simsalabim 2 februari 2010 kl. 19.38 (CET)[svara]
Vet inte hur du löser det, men det är ingen brådska, vi har som tur är, ingen dedline... -- Lavallen 2 februari 2010 kl. 21.08 (CET) (God natt!)[svara]
Nu är jag uppe i sadeln igen. Undrar hur länge tills jag blir avslängd igen :-) -- Simsalabim 3 februari 2010 kl. 21.01 (CET)[svara]
Alla {{tomrad}} är nu troligen inlagda där de ska vara! -- Lavallen 22 januari 2010 kl. 13.39 (CET)[svara]
Jag har känt flåset i nacken :-) Bra jobbat också med framsidan! -- Simsalabim 22 januari 2010 kl. 19.00 (CET)[svara]
Patrullerandet av Nya sidor har jag inte hunnit ifatt än, men det kommer väl. :) -- Lavallen 22 januari 2010 kl. 19.08 (CET)[svara]

Pagineringen[redigera]

ser tvivelsutan ganska knepig ut, räknar två nummer per sida. Varför har jag inte fått klart för mig.

Är det tekniskt möjligt utan att koda ihjäl sig att få det att se ut som det är på faksimilerna? Inte för att detta är jätteviktigt, men man blir ju nyfiken... -- Lavallen 23 januari 2010 kl. 20.21 (CET)[svara]

Den är spaltnumrerad som i de stora uppslagsverken. Nej, inte som jag känner till, om man inte vill namnge mer än 800 sidor separat. --Thurs 23 januari 2010 kl. 23.54 (CET)[svara]
Laissez faire, i så fall! -- Lavallen 24 januari 2010 kl. 08.39 (CET)[svara]

Detaljer i korrekturläsning[redigera]

Uppslagsboken är redan korrekturläst av Projekt Runeberg, men när jag arbetat med texten så har jag upptäckt några detaljer där avskriften skiljer sig från texten och där det går att uppnå större överensstämmelse mellan de två:

  1. Å̄, å̄ (Å och å med streck ovanför) avskrivs utan streck
  2. Ǟ, ǟ (Ä och ä med streck ovanför) avskrivs utan streck [Exempel: Alais (alǟ) skrivs Alais (alä)]
  3. Ȳ, ȳ (Y och y med streck ovanför) avskrivs utan streck [Exempel: cȳcas skrivs cycas]
  4. a͡u (au med inverterad brevis) avskrivs som au [Exempel: -pa͡u-' skrivs -pau-']
  5. Upphöjning och nedsänkning ignoreras [Exempel: blanc (blang) skrivs blanc (blang)]
  6. Procentstrecksbråk avskrivs snedställda [Exempel: 35 skrivs 3/5]
  7. Decimaler avskrivs nedsänkta istället för små [Exempel: 4,2 skrivs 4,2]

Frågan är vad som är värt besväret att korrigera. Jag känner mig lite skeptisk mot punkt 1 och 2 men det är mest för att de ser fula ut på min skärm och tecknen är jobbiga att få fram på min dator. -- Simsalabim 16 februari 2010 kl. 20.06 (CET)[svara]

Ojdå, jag har observerat vissa detaljer, som detta med bråk och med nedsänkta istf små siffror utan att veta hur jag skulle förfara. Punkt 1 och 2 har jag svårt att tyda, både med min dator och med mina något svaga ögon, varför jag missat dem helt. I många andra fall är jag osäker på hur man får fram alla typografiska detaljer. Har du tid och ork så kör på med de detaljer du ser. - Mina svaga ögon kommer sannolikt att missa mycket sådant. -- Lavallen 17 februari 2010 kl. 10.06 (CET)[svara]
Jag får göra mitt bästa (när jag väl börjar korrekturläsa). Om någon annan upptäcker några fler avvikelser så skriv gärna ned dem här så att man kan vara extra observant på dessa saker när man korrläser. -- Simsalabim 17 februari 2010 kl. 20.50 (CET)[svara]

Skapa unika ankare[redigera]

Det finns en rad uppslagsord som är lika och därmed fått ankare som är lika. Jag har tänkt att gå igenom alla sådana ord, men frågan är hur jag ska göra ankare unika. Ska exempelvis de tre förekomsterna av uppslagsordet Brahe få ankare "Brahe 1", "Brahe 2" och "Brahe 3" eller "Brahe, biflod"; "Brahe, adlig ätt" och "Brahe, Tyge"? Det första sättet har fördelen att man direkt kan gissa ankaret medan det andra sättet uttrycker ordets särart bättre. -- Simsalabim 16 februari 2010 kl. 20.06 (CET)[svara]

I dylika fall har jag bara ankrat den första förekomsten, åtminstone när de ligger bredvid varandra. Sedan har jag inte ankarat de efterföljande. Det andra ser ju annars snyggare ut... -- Lavallen 17 februari 2010 kl. 10.01 (CET)[svara]
Jag har testat några ord och det går ganska fort. Det blir nog den andra varianten eftersom den är, som du säger, snyggare och det är dessutom lite mer stimulerande att hitta på ankarnamn än att bara skriva dit siffror. -- Simsalabim 17 februari 2010 kl. 20.44 (CET)[svara]