על טקסונומיות

על טקסונומיות

רשומת הבלוג הזאת נכתבה על ידי יוקטי (שמצטרפת אלינו עם תוכנית Outreachy). היא נתנה לנו את אישורה לשתף את זה כאן כיוון שזה מפרט את הנושא בצורה נהדרת. תודה רבה יוקטי! (קישור למאמר המקורי „לכל אחד יש מאבק”).


אנחנו עכשיו בשבוע השלישי של התמחות Outreachy! הרבה מהנקודות שאגע בהן בבלוג הן בהשראת חלק מהנחיות הכתיבה של מארגני Outreachy. בבלוג הזה, אכתוב על מונחי קוד פתוח בהם נתקלתי לראשונה. במהלך הגשת הבקשה ל־Outreachy.

היו המון מילים/מושגים שבלבלו אותי במהלך תקופת הגשת הבקשה ל־Outreachy. המילה הבולטת ביותר בעיני כרגע היא טקסונומיה (רבים: טקסונומיות). כמתנדבת חדשה בקהילת Open Food Facts, שמתי לב שהמונח הזה מאוד נפוץ, מוזכר בתיעודי תקלות ובקשות דחיפה. תוך זמן קצר הבנתי שהמונח הזה הוא ודאי חשוב בהקשר של המיזם.

מקור: Google

ההגדרה הזאת רק מבלבלת עוד יותר, לא? (ככלות הכול, לא מדובר ב־Open Animal Facts, אלא ב־Open Food Facts). בשלב הזה, הצלחתי להסיק באופן מעורפל מה המשמעות של המונח הזה מחוץ להקשר הביולוגי אך עדיין לא הצלחתי לקשר אותו למיזם.

עם הפנים קדימה

מודה, היססתי לבקש מחברי הקהילה „להסביר” לי על המונחים כיוון שהמונח הרגיש כל כך מרכזי במיזם הזה שנראה לי הוגן להשקיע עוד כמה ימים לחקירת קוד המקור ולראות איך הדברים עובדים. באופן טבעי לחלוטין, המילה הזאת (ומגוון עקרונות נוספים) החלו לקבל משמעות כשלמדתי יותר לעומק את מבנה המאגר בימים הבאים.

סבבה… אז מה זה טקסונומיות? (קישור לעמוד הוויקי בנוסף!)

טקסונומיות הן בליבת מבנה הנתונים ב־Open Food Facts. אלו קובצי טקסט גולמיים (‎.txt) שמכילים בעיקר תרגומים, סיווגים, תוויות, רשימות רכיבים והיררכיות.

לצורכי פישוט, אפשר לפרק את הצורך בהם לשני חלקים,

  • סיווג: אפשר להשתמש בטקסונומיות כדי לבסס היררכיות למוצרי צריכה. אפשר להדגים זאת באמצעות דוגמה: נסתכל על „Nutella Biscuits” (רקיקי נוטלה) הקישור לעמוד המוצר נמצא כאן.
כדאי לשים לב: הקטגוריות האלו מופיעות בסדר היררכי. המוצר הזה הוא קודם כל„Snack” (חטיף) והוא נגזרת של חטיפים מסוג „Sweet snack” (חטיף מתוק). יתרה מכך, נוכל לומר שהוא שייך לתת־המחלקה רקיקים (ביסקוויטים) תוך צלילה לסיווג „Biscuits” וסיווג תחת „Filled Biscuit” (רקיק/ביסקוויט ממולא).
  • תרגום: אם אלו ניתן לתחזק רשימה של תרגומים לרכיבים, משפטים מסוימים, יחידות מידה, חומרי הזנה ומדינות. דו־לשוניים כמוני ודאי יודעים שהתרגום של Google לא מספק תוצאה הולמת בחלק מהמקרים. יש כל מיני הטיות מקומיות לשמות, איותים חלופיים, רכיבים לא נפוצים, שמות נרדפים (חלופיים) ומגוון מצבים נוספים בהם כלי תרגום לא פותרים את הבעיה כראוי.

משהו מגניב על טקסונומיות

אפשר לתרום להן ללא קשר לידע שלך בתכנות. כן, ממש כך! אם מצאת משהו שכדאי לתקן או להוסיף לטקסונומיות, כל שיש לעשות הוא לערוך/להוסיף בקובצי הטקסט המקושרים כאן ולהציע את השינוי דרך בקשת דחיפה. (מקושר למדריך מפורט)

מילות סיכום

בקרוב אקים בלוג ייעודי לתרומה לטקסונומיות של Open Food Facts כדי להקל על ההשתלבות של כאלו שטרם התנסו בתכנות ו/או ב־Git או GitHub.

עוד עדכונים בקרוב! 🙂

להתראות ותודה על הדגים, יוקטי

No Comments

Add your comment