ה

פרק 5: מורפולוגיה כמנוע מידע

מערכת השורש-המשקל

מבנה השורש-משקל של עברית מקראית הוא אחת המערכות האלגנטיות ביותר בשפה האנושית. כדי להבין מדוע, יש לשקול כיצד שפות פועלות בדרך כלל.

באנגלית, מילים נבנות בעיקר באמצעות שרשור — חיבור חלקים ברצף. "Unbreakable" = "un-" + "break" + "-able." המשמעות נבנית באופן ליניארי.

בסינית, מילים נבנות באמצעות הרכבה — שילוב תווים בעלי משמעות. 电脑 (diànnǎo, "מחשב") = 电 ("חשמל") + 脑 ("מוח"). המשמעות היא הרכבית.

שפות שמיות פועלות באופן שונה משתיהן. מילה עברית טיפוסית נבנית משורש — בדרך כלל שלושה עיצורים — המשולב עם משקל של תנועות, קידומות וסיומות. השורש והמשקל שזורים זה בזה — נרקמים יחד ברמת האותיות הבודדות.

כוחם של שלושה עיצורים

נבחן את השורש כ-ת-ב, הנושא את המשמעות המופשטת של "כתיבה":

מילהתעתיקמשמעותמשקל מיושם
כָּתַבkatavהוא כתבCaCaC — עבר פעיל פשוט
כּוֹתֵבkotevכותב (ז')CoCeC — בינוני הווה
כְּתָבktavכתב, כתיבהCCaC — שם עצם מופשט
מִכְתָּבmikhtavמכתב, איגרתmiCCaC — כלי/תוצר
כָּתוּבkatuvכתובCaCuC — בינוני סביל
הִכְתִּיבhikhtivהוא הכתיבhiCCiC — הפעיל
נִכְתַּבnikhtavנכתבniCCaC — נפעל
כְּתֻבָּהktubahכתובהCCuCaC — מסמך רשמי
כָּתְבָןkatvanסופר, מזכירCaCCan — בעל מקצוע

משורש יחיד בן שלוש אותיות, תשע מילים — ועוד רבות יכולות להירשם. כל מילה נוצרת על ידי יישום משקל דקדוקי שונה על אותו שורש. השורש מספק את הליבה הסמנטית ("כתיבה"); המשקל מספק את כל השאר: זמן, דיאתזה, היבט, מחלקת מילים ומשמעות גזירה.

נבחן כעת את השורש ש-מ-ר, שמשמעותו "שמירה/שמירה":

מילהמשמעותמשקל
שָׁמַרהוא שמרCaCaC
שׁוֹמֵרשומר, צופהCoCeC
מִשְׁמָרמשמר, עמדת שמירהmiCCaC
מִשְׁמֶרֶתמשמרת, תפקידmiCCeCeC
שְׁמִירָהשמירה (שם עצם)CCiCaC
הִשְׁתַּמֵּרהוא נשמרhiCtaCCeC

והשורש ק-ד-ש, שמשמעותו "קדוש/מקודש":

מילהמשמעותמשקל
קָדוֹשׁקדושCaCuC
קִדֵּשׁהוא קידשCiCeC
מִקְדָּשׁמקדש, בית מקדשmiCCaC
קְדֻשָּׁהקדושהCCuCaC
הִתְקַדֵּשׁהוא התקדשhitCaCeC

אותם משקלים חוזרים על עצמם בשורשים שונים: miCCaC תמיד יוצר שם עצם של מקום או כלי; CaCuC תמיד יוצר שם תואר; hiCCiC תמיד יוצר פועל הפעיל. המשקלים הם פרודוקטיביים — ניתן ליישמם על כמעט כל שורש.

מטפורת המנוע

המילה "מנוע" נבחרה במכוון. מנוע לוקח קלט קטן ומשנה אותו, באמצעות תהליכים מובנים, לפלט גדול ומגוון. מערכת השורש-משקל עושה בדיוק זאת.

התורה מכילה בקירוב 2,000 שורשים ייחודיים היוצרים כמעט 80,000 אסימוני מילים. יחס הדחיסה — בערך 40:1 — הוא יוצא דופן. זוהי אחת ממערכות יצירת האוצר המילים היעילות ביותר בכל שפה אנושית.

החלוקה יסוד/בקרה ממופה ישירות על מנוע זה. אותיות היסוד (ג, ד, ז, ח, ט, ס, ע, פ, צ, ק, ר, ש) יוצרות את שלד השורשים — הליבה הנושאת משמעות. אותיות הבקרה (א, מ, ת, ן, י, ה, ו, ב, כ, ל) יוצרות את המכונה הדקדוקית המקיפה, משנה ומפעילה את השורשים הללו.

כריך הדקדוק

ביטוי בולט אחד של מערכת השורש-משקל הוא מה שאנו קוראים "כריך הדקדוק". כאשר מנתחים כל מילה בתורה בעלת שלושה אותיות או יותר, מתגלה תבנית מבנית דומיננטית:

45.3% מכל המילים הללו מציגות אותיות בקרה העוטפות אותיות יסוד — "הלחם" הדקדוקי העוטף את "המילוי" הסמנטי.

סטטיסטיקות נוספות מחזקות את התבנית:

  • 55% מהמילים מתחילות באות בקרה
  • 52% מהמילים מסתיימות באות בקרה
  • רק 2.8% מהמילים מורכבות כולן מאותיות יסוד

המנוע המורפולוגי אינו רק משלב שורשים ומשקלים. הוא עוטף משמעות בדקדוק. התוכן הסמנטי נסגר, נעטף ומעוצב על ידי המכונה הדקדוקית המקיפה אותו.

שיעורי הישרדות: אילו אותיות נכנסות לשורש?

אחד הניתוחים החושפים ביותר כולל מעקב אחר תדירות "הישרדותן" של אותיות מכל קבוצה כחלק מהשורש המזוהה לעומת מילוי תפקיד דקדוקי גרידא. באמצעות האלגוריתם v9, המזהה שורשים עם Z-score של 150.49 מול בקרות מעורבבות:

קבוצת אותיותשיעור הישרדותתפקיד
יסוד99.3%כמעט תמיד שורש
בכל75.7%בדרך כלל שורש, לפעמים דקדוק
אמתן46.4%מחולק בין שורש ודקדוק
יהו12.0%לעיתים רחוקות שורש, בדרך כלל דקדוק

הגרדיאנט הזה — יסוד (99.3%) > בכל (75.7%) > אמתן (46.4%) > יהו (12.0%) — אינו חלוקה בינארית אלא ספקטרום. ארבע הקבוצות יוצרות היררכיה רציפה מתוכן טהור לדקדוק טהור, כאשר הגבול בין יסוד לבקרה הוא החלוקה החדה ביותר.

שיעורי ההישרדות חושפים גם משהו על אותיות בכל. עם שיעור הישרדות של 75.7%, אותיות בכל מתנהגות יותר כמו אותיות יסוד מאשר כמו אותיות הבקרה האחרות שלהן. זה עולה בקנה אחד עם התצפית שמ (מם), המסווגת כאמתן, בעלת שיעור קידומת של 31.0% — כמעט זהה לממוצע בכל של 31.8%. קבוצת הבקרה אינה הומוגנית; היא מכילה גרדיאנט פנימי המשקף את הגרדיאנט יסוד/בקרה עצמו.

אותיות יהו לכודות

גילוי מרתק עלה מניתוח השורשים: חלק מאותיות יהו "לכודות" בתוך שורשים — הן מופיעות כעיצורי שורש ולא כסמנים דקדוקיים. האותיות הלכודות הללו מהוות כ-2.0% מכל האסימונים וכוללות 83 זוגות מילים ייחודיים.

דוגמאות:

  • איש (ish, "איש") → אש (esh, "אש") — הי לכודה
  • זהב (zahav, "זהב") → זב (zav, "זב") — הה לכודה
  • אהב (ahav, "אהבה") → אב (av, "אב") — הה לכודה

בכל מקרה, הסרת האות יהו הלכודה חושפת מילה פשוטה יותר מבוססת יסוד מתחתיה. האות הלכודה מבדילה — היא הופכת מילה בסיסית לספציפית יותר:

  • י (יוד) = אינדיבידואציה (אש → איש: אש → איש)
  • ה (הא) = כיוון/קיום (אב → אהב: אב → אהבה)
  • ו (וו) = שינוי מצב (דוגמאות שונות)

זה אינו רק משחק מילים. כאשר נבדקה הקוהרנטיות הסמנטית של פסוקים המכילים אותיות יהו לכודות, נמצא שיפור של +11.9% בקוהרנטיות נושאית, עם 90.9% מהמקרים שדורגו "טוב יותר" ו-0% שדורגו "גרוע יותר".

אותיות יהו אינן רק קישוטים דקדוקיים. גם כאשר הן לכודות בתוך שורשים, הן מבצעות תפקיד סמנטי עקבי: הן מבדילות. הן לוקחות מושג בסיסי ומפרטות אותו למושג פרטיקולרי יותר.

הימנעות פונטית

תכונה אחרונה של אותיות היסוד ראויה לציון. כאשר נותחו רצפי אותיות היסוד בשורשי התורה — הזוגות הרצופים של עיצורי יסוד — התגלתה תבנית בולטת:

רק 1.76% מביגרמות היסוד כוללות אותיות מאותה מחלקה פונטית. בטקסט אקראי עם אותן תדירויות אותיות, השיעור הצפוי הוא 14.96%.

זה אינו אפקט שולי. נבדקו 1,000 גרסאות מעורבבות של התורה: אף אחת לא התאימה לתבנית ההימנעות של הטקסט האמיתי. התוצאה: 0/1,000 ערבובים, עם זיהוי של 21 "זוגות אסורים" ספציפיים — כל הזוגות של אותיות מאותה מחלקה פונטית.

השוואה בין-טקסטואלית מגלה שזוהי תכונה ספציפית לתורה:

  • תורה: 1.76% ביגרמות מאותה מחלקה
  • קוראן: 3.20%
  • ברית חדשה יוונית: 20.61%

אותיות היסוד של התורה נמנעות מיתירות פונטית בדיוק שאין לו תחרות בכל קורפוס אחר שנבדק.

השלכות

המנוע המורפולוגי של עברית מקראית אינו מערכת שרשור פשוטה. זוהי מערכת גנרטיבית רב-שכבתית עם:

1. שכבת שורש (אותיות יסוד) הנושאת תוכן סמנטי

2. שכבה דקדוקית (אותיות בקרה) המספקת מבנה

3. היררכיה פנימית בתוך קבוצת הבקרה (גרדיאנט הישרדות אמתן > יהו > בכל)

4. אותיות הבחנה לכודות ההופכות מושגים בסיסיים לספציפיים

5. כללי הימנעות פונטית המונעים יתירות בשכבת השורש

מנוע זה פועל בעקביות יוצאת דופן לאורך כל התורה. הפרק הבא בוחן מה קורה כאשר פשוט מודדים את הפלט שלו — שיעור אותיות היסוד בטקסט — ומגלים את שכבת הבסיס הקפואה.

✦ ✦ ✦