Om taksonomier

Om taksonomier

Dette blogindlæg er skrevet af Yukti (som slutter sig til os med Outreachy-programmet). Hun gav os tilladelse til at dele det her, det forklarer emnet ganske godt. Mange tak, Yukti! (Link til originalartiklen “Everybody Struggles”).


Vi er nu i 3. uge af Outreachy-praktikken! Mange af punkterne, jeg kommer ind på i bloggen, er blevet inspireret af nogle af skriveopfordringerne fra Outreachy-arrangørerne. I denne blog vil jeg skrive om et open-source sprogbegreb, der var nyt for mig. Under Outreachy-ansøgningsperioden.

Der var et væld af ord/begreber, som jeg blev forvirret over under Outreachy-ansøgningsperioden. Dét ord, der stikker mig mest lige nu, er Taksonomi (flertal: Taksonomier). Som ny i Open Food Facts-fællesskabet bemærkede jeg, at dette udtryk blev omtalt meget, nævnt i problematikker og pull-anmodninger. Det tog mig ikke længe at indse, at dette udtryk var vigtigt i forbindelse med projektet.

Kilde: Google

Denne definition lader til at forvirre endnu mere, ikke? (det er trods alt ikke Open Animal Facts, men Open Food Facts). På det tidspunkt kunne jeg vagt forstå, hvad dette udtryk kunne betyde i en ikke-biologisk kontekst, men kunne stadig ikke virkelig relaterer det til projektet.

Fremad

Indrømmet, jeg tøvede med blot at bede et fællesskabsmedlem  “at definere” det for mig, fordi udtrykket føltes så centralt for dette projekt, at det kun føltes rimeligt at give mig selv et par dage, udforske kodebasen, og se hvordan ting fungerer. Meget naturligt begyndte dette ord (og flere andre begreber) at give mening, da jeg blev mere fortrolig med repo-strukturen i løbet af de næste par dage.

Så, hvad er taksonomier? (Link til wiki-siden også!)

Taksonomier er kernen i datastrukturen i Open Food Facts. Disse er råtekstfiler (.txt)  fortrinsvis indeholdende oversættelser, klassifikationer, etiketter, ingredienslister og hierarkier.

Lidt forenklet, kan deres funktion groft opdeles i 2 dele,

  • Klassifikation: Taksonomier kan bruges til at etablere hierarkier for forbrugsvarer. Dette forklares bedst med et eksempel: Tag f.eks. denne “Nutella-kiks” produktside, der er linket til her.
Bemærk: Disse kategorier er opført i hierarkisk rækkefølge. Dette produkt er føst og fremmest en “Snack” , og inden for snacks en “Sød snack”. Yderligere kan man sige, at den tilhører underklassen Kiks, og i klassifikationen “Kiks” , er den en “Fyldt kiks“.
  • Oversættelse: Med disse kan der vedligeholdes en liste over oversættelser for ingredienser, visse sætninger, måleenheder, næringsstoffer og lande. Er man som jeg tosproget, ved man nok allerede, at Google Translate nogle gange bare ikke er god nok. Der kan være lokale navnevarianter, alternative stavemåder, sjældne ingredienser, synonymer og mange flere tilfælde, hvor brug af et oversættelsesværktøj ikke vil løse opgaven.

Noget fedt ved taksonomier

Man kan bidrage til dem uanset ens kendskab til kodning. Ja, det rigtigt! Finder man noget, man ønsker at rette eller tilføje til taksonomierne, behøver man blot redigere/foretage sin tilføjelse til tekstfilerne, som er linket her og foreslå sin ændring via en pull-anmodning. (linket til en beskrivende vejledning)

Afskedsord

Jeg komme snart med en blog, specifikt for bidrag til Open Food Facts-taksonomierne, til dem, som ikke er nørder udi kodning og/eller Git og GitHub.

Hold øje udkig efter den!  🙂

Farvel for nu, Yukti

No Comments

Add your comment