User talk:Mike/notes

Definition from Wiktionary, the free dictionary
Jump to: navigation, search

Substantivmallar[edit]

Får jag förelslå följande schema för substantiven:

  1. För första deklinationen (ex. flicka pl. flickor), mallen sv-noun-or. Dessa är alltid Utrum.
  2. För andra deklinationen (ex. pojke pl. pojkar), mallen sv-noun-ar. Dessa är alltid Utrum.
  3. För tredje deklinationen (ex. bok pl. böcker), mallen sv-noun-er. Dessa är alltid Utrum.
  4. För fjärde deklinationen (ex. ko pl. kor), mallen sv-noun-r. Jag tror att dessa alltid är Utrum. (?)
  5. För femte deklinationen (ex. äpple pl. äpplen), mallen sv-noun-n. Dessa är alltid Neutrum.
  6. För sjätte deklinationen (ex. hus pl. hus), mallen sv-noun-0. Dessa är alltid Neutrum.
  7. För oregelbundna (ex. faktum pl. fakta), mallen sv-noun-irreg.


För mallarna gäller följande regler

  • Ordet i alla fyra singularformer baseras på sidans namn
  • 1= anger ordets stam i plural (sätts till sidans namn om utelämnat/blankt).
  • g= anger ordets genus. Måste vara c eller n eller blankt.
    Vet ej om parametern krävs annars än i sv-noun-irreg. Är alla deklinationer bundna till ett visst genus?
  • plmode= anger följande:
    Om plmode=unc är substantivet oräknebart och inga plural skrivs ut.
    Om plmode=tantum är substantivet ett plurale tantum, och inga singular skrivs ut.
  • PAGE= överskrider sidans namn så att mallen kan användas överallt. Bör vid vanlig användning utelämnas.


För sv-noun-irreg krävs dessutom följande:

  • defs= ordet i definit singularis. Påverkar också genitiven.
    Sätts automatiskt till {{{PAGE}}}t om g=n och defs blankt/utelämnat.
    Sätts automatiskt till {{{PAGE}}}n om g=c och defs blankt/utelämnat.
  • defpl= ordet i definit pluralis. Påverkar också genitiven.
    Sätts automatiskt till {{{1}}}na om blankt/utelämnat.


Alltså kan dessa bildas:

  • flicka/flickan/flickor/flickorna skapas med {{sv-noun-or|flick}} om sidans namn är "flicka"
  • båt/båten/båtar/båtarna skapas med {{sv-noun-ar}} om sidans namn är "båt"
  • pojke/pojken/pojkar/pojkarna skapas med {{sv-noun-ar|pojk}} om sidans namn är "pojke"
  • bok/boken/böcker/böckerna skapas med {{sv-noun-er|böck}} om sidans namn är "bok"
  • ko/kon/kor/korna skapas med {{sv-noun-r}} om sidans namn är "ko"
  • äpple/äpplet/äpplen/äpplena skapas med {{sv-noun-n}} om sidans namn är "äpple"
  • hus/huset/hus/husen skapas med {{sv-noun-0}} om sidans namn är "hus"
  • faktum/faktumet/fakta/fakta skapas med {{sv-noun-irreg|fakta|g=n|defpl=fakta}} om sidans namn är "faktum"
  • byxor/byxorna skapas med {{sv-noun-or|byx|pl=tantum}} oavsett sidans namn.

Dessutom bör sv-noun-custom finnas, där varje ruta sätts individuellt. De andra mallarna anropar denna.


Vad anser du om detta? Jag har inte lyckats tänka ut några fall som inte täcks av det här, men det finns säkert...

HymylyT@C 15:56, 9 December 2008 (UTC)

(inlägget korrigerades 16:08, 9 December 2008 (UTC))

Jag inser nu i efterhand att modellen inte täcker riktigt alla fall angående vokalerna i singular-definit-formen. Kanske detta kan åtgärdas med defs-parametern som föreslagits. HymylyT@C 20:04, 9 December 2008 (UTC)


Ah, trevligt med respons på problemet!
Ett par saker bara som jag ser här:
  1. tredje deklinationen är inte enbart utrum; där ingår t.ex. även batteri och andra neutrer som slutar på vokal.
  2. jag vet inte riktigt var du vill ha in utrer som har noll-plural (t.ex. alla som slutar på -are)? Jag vet inte om jag skulle vilja ha *alla* dem som oregelbundna...
  3. åtminstone ordet fängelse torde vara ett neutrum i den fjärde deklinationen.
  4. ord som slutar på -el, -en eller -er är notoriska när det gäller att tappa 'e':na - det blir mycket defs= där, men det kan inte hjälpas.
  5. plmode=name torde behövas för egennamn (visst, den skulle kunna slopas, men då vet jag inte riktigt hur man ska ta hand om de där specialgenitiven som uppvisas av vissa svenska orter: Falu, Pite, Växjö....)
  6. Det behövs även en genitive=-parameter för ord vars grundform slutar på -s.
  7. En defs=-parameter skull nog behövas i fler mallar än den för de oregelbundna, ja. Jag misstänker starkt att den måste in i alla, till och med i första deklinationens om den ska kunna ta hand om ord som våg.
Något av det svåraste med mallkonstruktion som jag ser det är bedömningen av vad som är effektivast respektive lättast att använda. Många mallar som var och en beskriver användingen? (Mycket att hålla reda på för alla). Få mallar, där man ofta måste specificera en stor del av formerna manuellt? (Intuitivt, men mycket att skriva för den som lägger in många ord). Få mallar, men som med kortfattade, men mer eller mindre kryptiska, parametrar kan klara av nästan vilket böjningsmönster som helst? (Svårt att använda för den som inte är van vid tänket bakom just den mallen; skräckexemplet är väl User:Mike/sv-noun). Vad jag menar här är att eftersom det finns en "oregelbundet"-mall, så kan ingenting egentligen sägas 'saknas', eftersom man skulle kunna hänvisa till den mallen hver gang. :D
Slutligen: ord som akvarium (och vissa andra ord som slutar på -um; jag misstänker även "faktum") är lite knöliga eftersom det för bestämd form singular finns två vanliga former: "akvariet" och "akvariumet". Nå, det får skribenten föra in; det gäller bara att komma ihåg att i mallarna inte länka med [[ ]] utan med {{wlink}}. \Mike 23:07, 12 December 2008 (UTC)
För att fortsätta på detta: eftersom dels en och samma deklination innehåller ord av båda genusen, och dels ett och samma deklination+genus-kombination fortfarande kan ha två olika bestämd-form-singular-ändelser, så tror jag att vi behöver dela upp mallarna på ett något annat vis. Om man föredrar ett litet antal mallar, så tror jag att man kunde ändra User:Mike/sv-noun så att den blir mer tydlig, men fortfarande använder ett minimalt antal mallar: idén har jag tagit från pappersordlistor där böjningarna oftast skrivs (då de alls nämns) som kanske -en, -ar. Min idé är då alltså att använda en mall där parametrarna 1 och 2 är dessa båda ändelser, 3 är roten för bestämd singular och 4 är roten för obestämd plural. Något i stil med (för regelbundna)
  • {{sv-noun|-an|-or|flick}} eller {{sv-noun|-n|-or||flick}} för flicka
  • {{sv-noun|-en|-or}} (för våg) (parameter 3 behövs ej, men kan ges som våg om man så vill)
  • {{sv-noun|-en|-ar|pojk}} eller {{sv-noun|-n|-ar||pojk}}
  • {{sv-noun|-en|-er||böck}} eller {{sv-noun|-en|-er|bok|böck}}
  • {{sv-noun|-et|-er}} (för batteri)
  • {{sv-noun|-n|-r}} (för ko)
  • {{sv-noun|-t|-r}} (för fängelse)
  • {{sv-noun|-t|-n}} (för äpple)
  • {{sv-noun|-et|-0}} (för hus)
  • {{sv-noun|-en|-e|användar}} eller {{sv-noun|-n|-e||användar}}*
och för oregelbundna ord, och sådana där flera alternativ finns någonstans, så ges alla formerna (men då måste man länka vart och ett av orden manuellt, i fler-alternativsfallen):
Eventuellt kunde man tänka sig en speciallösning ifall man anger den första parametern till -(e)n eller -(e)t, att mallen automatiskt ger två alternativ:
  • {{sv-noun|-(e)t|-n}} (för frö) - detta skulle då vara ekvivalent med {{sv-noun|[[fröt]], [[fröet]]|frön|fröna|gender=n}}.
Genus är inga problem; mallen kan i de allra flesta fall analysera den första parametern och använda den för att bestämma genuset. Undantaget är fallet med de oregelbundna där ett gender= behövs.
Och för oräknebara kan man helt enkelt säga att om parameter 2=-, så markeras det som oräknebart. På samma vis kan man säga att ett streck på parameter 1 markerar ordet såsom plurale tantum (i så fall torde inte genuset vara relevant):
Slutligen för namn så är ju vare sig bestämd form eller plural relevant, så (på sidan Stockholm)
<teknisk rappakalja>
Rent tekniskt skulle jag kunna göra detta på ett sätt liknande det jag nyss använt [rättare sagt, håller på att införa, det är inte helt klart än...] för adjektiven ({{sv-adj-new}}), där man har ett antal - i detta fall 4 [en för ordinarie substantiv, en för oräknebara, en för plurale tantum-substantiv, en för namn] - mallar som står för designen, och sedan en mall som anropar rätt designmall beroende på om det är ett namn eller ett oräkneligt eller... med alla nödvändiga parametrar: i grundfallet 8 stycken (grovt beskrivet, det måste till lite #if-satser och #switchar för att plocka bort --tecknen från parametrarna 1 och 2, välja rätt designmall samt varna om någon av parametrarna 1 eller 2 är felaktig):
  1. = {PAGE|{PAGENAME}} // (nom.indef.sing.)
  2. = {3|{PAGE|{PAGENAME}}}{1} // (nom.def.sing.)
  3. = {4|{3|{PAGE|{PAGENAME}}}}{2} // (nom.indef.plur.)
  4. = {4|{3|{PAGE|{PAGENAME}}}}{2}{defpl|{1}|{2}} // (nom.def.plur.), defpl är här en småkomplicerad funktion som ska bestämma om det ska vara -na eller -n
  5. = {PAGE|{PAGENAME}}{genitive|s} // (gen.indef.sing.)
  6. = {3|{PAGE|{PAGENAME}}}{1}s // (gen.def.sing.)
  7. = {4|{3|{PAGE|{PAGENAME}}}}{2}{plgen|{genitive}|{2}} // (gen.indef.plur.), plgen är här en inte så komplicerad historia som ska bestämma om genitiv-s ska användas (dvs om det är noll-plural och genitive= är satt.)
  8. = {4|{3|{PAGE|{PAGENAME}}}}{2}{defpl|{1}|{2}}s // (nom.def.plur.), defpl är här en småkomplicerad funktion som ska bestämma om det ska vara -na eller -n
</teknisk rappakalja>
Till viss del är jag rädd att detta ska upplevas som komplicerat, men dels är det ganska lite att skriva, dels så tror jag av någon anledning att det vore bra att hålla sig ifrån "oregelbundet"-alternativet i så många fall som möjligt... (mest för att jag tycker det ser snyggare ut när parametrarna är så få och så korta som möjligt??) Men det är bara min magkänsla.
En sak som kanske skulle göra att det såge bättre ut vore kanske att låta parametrarna 1 och 2 vara så enkla som möjligt och stryka --tecknen ur parametervärdena. Tyvärr skulle det då kräva, som jag ser det, att oregelbundna, oräknebara och plurale tantum-ord skulle behöva anropas med egna mallar.
Jag vet inte vad du säger om det hela? \Mike 17:13, 13 December 2008 (UTC)
* Just -are-orden var de som komplicerade saker och ting för mig när jag gjorde mitt förra försök... jag är inte helt nöjd med hur det skulle te sig i den här modellen heller.
(forts.) Jag upptäckte precis att du redan hade nämnt en {{sv-noun-custom}} - då är vi alltså inne på samma spår där. :) Jag såg förresten också i Wiktionary:Grease_pit#Possible_tweaks_to_en-noun ett förslag att tillåta parametervärdet 1=? för att markera att man inte känner till, eller är osäker på böjningen. Det skulle eventuellt kunna vara något att implementera, för oss också. \Mike 18:47, 13 December 2008 (UTC)