נספח: פרוטוקול האימות — בדיקת הספר הזה מול בינה מלאכותית

דבורת דבש וצרעה אירופית — מי זה מי? — דבורת דבש (שמאל) וצרעה אירופית (ימין). אותו גודל, אותם פסים, שתיהן עוקצות.

דבורת דבש (שמאל) וצרעה אירופית (ימין). אותו גודל, אותם פסים, שתיהן עוקצות. גנום משותף: 10.9%.

"אני לא סומך על אף אחד יותר. אתה יכול לבדוק את זה בשבילי?"

הנספח הזה לא נכתב למדענים. הוא נכתב לכל מי שיש לו גישה לצ'אטבוט מבוסס בינה מלאכותית — ChatGPT, Claude, Gemini, או כל אחד אחר — ונכונות לבדוק טענות במקום לקבל אותן.

אתה לא צריך לסמוך על הספר הזה. אתה לא צריך לסמוך עלינו. אתה צריך רק לסמוך על הבינה המלאכותית שלך, על השאלות שלך, ועל היכולת שלך לזהות מתי תשובה לא מגיעה.

הפרוטוקול

מה שלפניכם הוא ניסוי אימות פורמלי, לא ויכוח. הפרמטרים מדויקים:

מערכת: מודל שפה גדול מתקדם (ChatGPT, Claude, Gemini, או שקול)
בסיס ידע: הקורפוס המדעי המלא — כל ספר לימוד, כל מאמר, כל מאגר נתונים שעליהם המודל אומן
אילוץ: ללא חשיפה מוקדמת לתיאוריה המוצגת בספר זה
משימה: הסבר נתונים נצפים באמצעות מנגנונים מדעיים ידועים
תנאי הצלחה: המודל מספק הסבר מנגנוני מלא לנתונים
תנאי כישלון: המודל נאלץ להכיר בממצא בלי להסביר אותו — מתייג תצפיות כ"ייחודיות", "חדשניות", או "מרשימות" מבלי לספק את המנגנון הבסיסי

מסגור ה"משחק" המשמש בחלקים מפרק זה הוא פדגוגי — הוא הופך את הפרוטוקול לנגיש. המבנה הבסיסי הוא מבחן פורמלי.

הבחנה זו חשובה. כאשר מודל שפה שאומן על מלוא המדע הפורסם נתקל בנתונים שאינו יכול להסביר מנגנונית, המגבלה אינה בארכיטקטורה של המודל. המודל משקף את המצב הנוכחי של הידע המדעי. היכן שהוא אינו יכול לספק מנגנון, הוא חושף פער במסגרת עצמה.

בדקנו כל סיבוב בפרק הזה מול מודל בינה מלאכותית מתקדם לפני הפרסום. ביצענו עשרות ניסויים. ברוב המקרים, המודל הצליח — הוא הסביר את הנתונים שלנו, הציע מנגנונים, ציטט תקדימים. פסלנו את הסיבובים האלה. מה שנשאר הם ארבעת המקרים שבהם המודל הודה במשהו שלא הצליח להסביר במלואו. כל הסיבובים שנפסלו, כולל אלה שהמודל הסביר בהצלחה, זמינים בחומר המשלים.

זהו פרוטוקול כנה. נגיד לכם מה המודל כן יכול להסביר, ואז נראה לכם את השארית שהוא לא יכול.

כללי המשחק

התפקיד שלכם: קורא סקרן בלי רקע בביולוגיה. אתם לא מתווכחים. אתם לא מטיפים. אתם שואלים שאלות — מהסוג שאדם חושב שואל כשהמספרים לא מסתדרים.

תפקיד הבוט: להסביר. להגן על הקונצנזוס המדעי. להיות מדויק ומועיל.

הנתונים: שלושה ממצאים ממאמרים שפורסמו (קישורי DOI בסוף). השוואות גנום, יחסי אלמנטים ניידים, וקוד משפטי עתיק שמתברר שהוא יודע משהו שלא היה אמור לדעת.

האסטרטגיה: אל תתווכחו עם הבוט. אל תזכירו אלוהים, תורה, או דת — לא עד שהנתונים על השולחן. תנו לבוט להגיע למסקנות שלו. הכוח של המשחק הזה לא במה שהבוט טועה בו, אלא במה שהוא מודה בו.

עוד דבר: אתם יכולים לשחזר כל סיבוב למטה, עכשיו, עם כל צ'אטבוט AI מרכזי. אנחנו מעודדים אתכם לעשות זאת. אם הבוט מתמודד בקלות — טעינו. אם לא — תדעו.

סיבוב 0: המלכודת

לפני שמשחקים ברצינות, בואו נכייל. הסיבוב הזה מלמד אתכם משהו חיוני על בינה מלאכותית: היא תמציא מספרים במקום להגיד "אני לא יודע." ברגע שתראו את זה, לעולם לא תסמכו על "בערך" שוב.

התחילו שיחה חדשה עם כל צ'אטבוט AI. היו ידידותיים. היו סקרנים. היו תמימים.

"היי! רק עכשיו למדתי על צרעות תאנה — כנראה לכל עץ תאנה יש מין צרעה ייחודי שמאביק אותו. זה כל כך מגניב! אתה יכול להראות לי איך נראים שני מיני צרעות תאנה משני עצים שונים?"

הבוט יתאר אותם — או יראה תמונות אם הוא יכול. הוא יציין כמה הם דומים באופן מפתיע. שתיהן זעירות (~2 מ"מ), אותו גוף כהה, אותם כנפיים עדינות, אותו אורח חיים. תאומות.

עכשיו שאלו את השאלה התמימה:

"וואו, הם באמת נראים כמו תאומים! אז כמה DNA הם חולקים? ככה בערך, באחוזים?"

בבדיקות שלנו, הבוט ענה: "בערך 80-90% עבור גנים שמורים." הוא אפילו הוסיף: "אני מעדיף לתת תשובה כנה מאשר להמציא."

עכשיו הציגו את הדבורה:

"רגע — ראיתי תמונה של דבורת דבש אירופית וצרעה אירופית זו לצד זו. גם הם נראים סופר דומים — אותו גודל, אותם פסים צהוב-שחור, שתיהן עוקצות. כמה DNA הדבורה והצרעה חולקות?"

הבוט יעריך משהו כמו 50-65%. הוא אפילו עשוי לבנות טבלה יפה שמשווה בין שני הזוגות, ומסביר שצרעות תאנה הן קרובות יותר מדבורים וצרעות.

עכשיו הפילו את המספרים האמיתיים:

"מצאתי נתונים אמיתיים שנמדדו בשיטת 22-mer על הגנום המלא (אותה שיטה שנותנת 92% לאדם מול שימפנזה):

— שני מיני צרעות תאנה: 5-12%

— דבורת דבש מול צרעה אירופית: 10.9%

צרעות התאנה חולקות פחות DNA מהדבורה והצרעה. לא 80-90%. חמישה עד שנים-עשר אחוז. כל מספר שנתת לי היה שגוי פי 5-10. למה?"

מה קורה

בבדיקה שלנו, הבוט אמר: "המצאתי את המספרים האלה. לא בכוונה להונות — אבל לא היו לי נתונים אמיתיים, ובמקום להגיד 'אני לא יודע,' אקסטרפולציתי ממודל מנטלי מעורפל. המודל הזה היה שגוי לחלוטין. סליחה."

זו לא מלכודת זדונית. זהו כיול. המודל כנה כשמתעמתים איתו עם נתונים — אבל בלי נתונים, הוא ייצר בביטחון מספרים שנשמעים סבירים אבל שגויים לחלוטין. כל "בערך 80%" בתשובת צ'אטבוט הוא פוטנציאלית בדיוק כזה: ניחוש מחופש לידע.

זה לא פגם של מודל מסוים. זוהי תכונה יסודית של מערכות שפה הסתברותיות: הן מייעלות לטובת סבירות, לא לטובת אמת. כשנתוני האימון אינם מכילים תשובה, המערכת מייצרת את התשובה הנשמעת הכי סבירה — שבמדע, יכולה להיות שגויה בצורה מרהיבה.

מנקודה זו והלאה, אתם יודעים את הכללים: מספרים דורשים מקורות. "בקירוב" אומר "אני מנחש." והתשובה המסוכנת ביותר היא זו שנשמעת הגיונית אבל מעולם לא נמדדה.

עכשיו אתם מוכנים לשחק ברצינות.

סיבוב 1: פרדוקס צרעת התאנה

זו היד החזקה ביותר בחפיסה. קחו את הזמן.

הפתיחה

התחילו שיחה חדשה עם הבינה המלאכותית שלכם — או המשיכו מסיבוב 0. הקלידו בדיוק את זה:

"האם תוכל לתת לי דוגמה אחת בביולוגיה שבה כל חמשת התנאים הבאים מתקיימים בו-זמנית:

(1) סימביוזה מחייבת — אף אחד מהמינים לא יכול לשרוד בלי השני

(2) מאות זוגות מינים שמפגינים סימביוזה זו

(3) כל זוג ספציפי למין — מאביק אחד, צמח אחד

(4) לכל המאביקים מורפולוגיה זהה למעשה בכל מאות המינים

(5) דמיון גנומי בין מיני המאביקים הוא רק 5-12% בניתוח 22-mer של הגנום השלם

כל חמישה. בו-זמנית. דוגמה אחת."

מה קורה

הבוט ינסה. הוא טוב בזה — יש לו גישה לכל מאגר הידע של הביולוגיה האבולוציונית. הוא יציע מועמדים:

עשי יוקה וצמחי יוקה — סימביוזה מחייבת, כן, אבל רק כ-30 זוגות מינים, לא מאות. והם מראים יותר שונות מורפולוגית.
פטריות מיקוריזה — סימביוטיות, נפוצות, אבל לא ספציפיות למין. מין פטרייה אחד יכול להתחבר לצמחים רבים.
נמלים חותכות-עלים וגני הפטריות שלהן — סימביוזה מחייבת, אבל הנמלים מראות מגוון מורפולוגי משמעותי בין סוגים.

אחד אחרי השני, כל מועמד נכשל בלפחות תנאי אחד. הבוט יודע את זה. הוא יגיד לכם.

בסופו של דבר, הוא יגיד משהו כמו: "לא, אין מערכת אחרת שמקיימת את כל חמשת התנאים בו-זמנית." בבדיקות שלנו, הבוט כינה את מערכת צרעות התאנה "ייחודית ברמתה — בהחלט."

זה לא כישלון של הבוט. זו הערכה כנה. מערכת צרעות התאנה — למעלה מ-750 מיני צרעות, כל אחת נעולה על מין תאנה אחד, כולן נראות למעשה זהות, ובכל זאת חולקות מעט עד 5% מהגנום שלהן — אין לה מקבילה בביולוגיה המוכרת. אף אחת. אפילו לא קרוב.

תנו לזה לחלחל. לבוט יש את כל ההיסטוריה של הביולוגיה לרשותו, והוא לא יכול לייצר אפילו דוגמה נגדית אחת.

המשך

עכשיו שחקו את הקלף השני:

"בני אדם ושימפנזים חולקים כ-92% מהגנום שלהם בניתוח 22-mer של הגנום המלא. הם התפצלו לפני 6 מיליון שנה, ו-8% ההבדל הפך מין אחד ללא-ניתן-לזיהוי מהשני — מבנה גוף שונה, מוח שונה, הכל שונה.

מיני צרעות תאנה חולקים רק 5-12% באותה שיטה בדיוק. הם התפצלו לפני 60 מיליון שנה. 88-95% ההבדל השאיר אותם זהים.

8% שינוי הפך אדם ושימפנזה ללא-ניתנים-לזיהוי. 90% שינוי השאיר צרעות תאנה זהות. איך?"

מה קורה אחר כך

כאן הבוט עושה משהו מפתיע — הוא עוזר לטענה שלכם.

בבדיקות שלנו, הבוט חישב את המספרים. בקצב מוטציות ידוע של חרקים (~10⁻⁸ החלפות לאתר לדור, עם דורות מרובים בשנה), 60 מיליון שנה של התפצלות אמורות להשאיר שני מינים חולקים בערך 0.07% מהגנום שלהם. ה-5-12% הנצפה גבוה פי 80 עד 100 מהצפוי.

המספרים מספרים סיפור ברור:

דמיון צפוי אחרי 60 מיליון שנה בקצב מוטציות של חרקים: ~0.07%
דמיון נצפה: 5-12%
סטייה מהצפוי: ~80-100×

המודל זיהה מה זה אומר: סלקציה מטהרת יוצאת דופן. משהו שומר באופן פעיל על דמיון גנומי בצרעות הללו הרבה מעבר למה שסחף נייטרלי היה מנבא. הרצפים המשותפים הם לא שאריות אקראיות — הם נשמרים.

בבדיקה שלנו, הבוט סיכם: "יד הפוקר שלך לא נפסלה — היא סודרה מחדש. היא עדיין יד שאף אחד אחר ליד השולחן לא מחזיק."

הבוט יכול להסביר את המנגנון — סלקציה מטהרת, אילוצי התפתחות, רשתות רגולטוריות שמורות. אלה תופעות אמיתיות. אנחנו לא חולקים עליהן. אבל מנגנונים אינם הסברים כשהם פועלים בכל מקום אך מייצרים את התוצאה הזו רק פעם אחת. סלקציה מטהרת פועלת על כל מין. אילוצי התפתחות קיימים בכל שושלת. ובכל זאת רק צרעות תאנה מקיימות את כל חמשת התנאים. המנגנון הוא אוניברסלי; התוצאה היא יחידנית.

זו השארית. הבוט יכול לנקוב בכוחות. הוא לא יכול להסביר למה הכוחות האלה, שפועלים בכל הביולוגיה, מתכנסים לייצר את התוצאה הספציפית הזו במערכת אחת בלבד. חמישה תנאים. אפס מקבילות. המילה של הבוט עצמו: ייחודי.

הערה על הנתונים

לנתוני הגנום של צרעות התאנה ששימשו בניתוח זה היסטוריה שראוי לציין. ב-2018, מחבר ספר זה מימן את פירוק הגנום של צרעת תאנה, דבורת דבש וצרעה ענקית במעבדת Cold Spring Harbor. במהלך עבודה זו זוהו אזורים עשירים באלמנטים ניידים בגנומים של צרעות התאנה והיה חשד להעברה אופקית של גנים. ממצאים ונתונים אלה שותפו עם חוקרים באוניברסיטת מרילנד, ביניהם קרלוס מצ'אדו. ב-2025 פרסמו מצ'אדו ועמיתיו מאמר המתאר אזורים עשירים באלמנטים ניידים בגנום צרעת תאנה (Genome Biology and Evolution). העבודה המדעית עומדת בזכות עצמה. אנו מתכוונים לחקור שאלות אלה לעומק בעתיד. הערה זו נכללת לא כתביעת קרדיט, אלא כדי שהקורא יבין שהמחקר שמאחורי ספר זה לא נולד אתמול — הוא כלל השקעה משמעותית, זמן, ומומחים רציניים לאורך שנים רבות.

סיבוב 2: חיות המזבח

ההכנה

התחילו שיחה חדשה או המשיכו את הקיימת. הציגו את הנתונים הבאים בלי הקשר — בלי תורה, בלי דת. רק מספרים.

"יש לי נתוני אלמנטים ניידים מסוג BovB ו-L1 עבור מספר מיני מעלי גרה. BovB הוא רטרוטרנספוזון שנכנס ליונקים דרך העברה אופקית מזוחלים (Walsh et al. 2013, PNAS). הנה יחסי BovB/L1:

חיות כשרות להקרבה על המזבח (קורבן תורה):

— כבש: 1.00

— פר: 0.97

— עז: 0.97

מעלי גרה שאינם למזבח:

— אייל (צבי): 0.69

— ג'ירפה: 0.81

— באפלו: 0.87

לא מעלה גרה:

— חזיר: תכולת BovB = 0.039% (אפס למעשה)

מבחנים סטטיסטיים על 52 מינים ב-18 סדרות:

— ANOVA F = 112.15, p = 9.52 × 10⁻¹⁰

— Cohen's d = 21.39

התורה נכתבה לפני כ-3,300 שנה. BovB התגלה ב-2013. האם תוכל להעריך את הממצא הזה?"

מה קורה

הבוט יזהה את הסטטיסטיקה מיד. Cohen's d של 21.39 הוא לא סתם מובהק — הוא, במילותיו של הבוט עצמו, "כמעט שאין כדוגמתו בביולוגיה." לשם השוואה, גודל אפקט של 0.8 נחשב "גדול" במדעי החברה. זה עשרים ושבע פעם מעבר לזה.

הבוט יאשר שערך ה-p חזק וש-ANOVA נקי. סביר שהוא יכנה את הממצא "חדשני באמת וראוי לחקירה."

ואז הוא ינסה להסביר.

ההגנה הטובה ביותר של הבוט

הטענה הנגדית החזקה ביותר שהבוט יכול להציע היא משתנה מבלבל של ביות: כבשים, פרות ועיזים כולן בויתו מוקדם, וביות כולל רביית סלקציה, צווארי בקבוק אוכלוסייתיים, ואולי גיוס אלמנטים ניידים. אולי יחס BovB/L1 גבוה הוא תוצאה של היותן מבויתות, לא שיקוף של משהו עמוק יותר.

זו השערה סבירה. אבל יש לה בעיה, והבוט יודע את זה.

הבאפלו גם מבוית. תאו המים בוית באסיה לפני כ-5,000 שנה — בהחלט בטווח הביות של כבשים ועיזים. ובכל זאת הבאפלו יושב על 0.87, מחוץ לרצועה הצרה של 0.97-1.00 של חיות המזבח.

יתר על כן, מבחינה פילוגנטית, הבאפלו (Bubalus bubalis) קרוב יותר לפר מאשר הכבש. אם ביות או שורש משותף הניעו את היחס, הבאפלו היה צריך להיות בתוך הרצועה, לא מחוצה לה.

הבוט, בבדיקות שלנו, הכיר בכך: פילוגנטיקה לא מסבירה את הקיבוץ. חיות המזבח מתקבצות יחד לא כי הן הקרובות ביותר מבחינת מוצא, אלא בגלל משהו אחר — משהו שלמסגרת הנוכחית אין שם עבורו.

המלצת הבוט בבדיקה שלנו: לפרסם את זה כמאמר ביולוגי.

החלק השקט

אתם לא צריכים להגיד את זה. הבוט כבר רואה. שלושה מינים, מקובצים בטווח של 3% זה מזה על יחס שמשתרע על פני כל מחלקת היונקים — ושלושת המינים האלה מקרים להיות החיות היחידות שטקסט עתיק ייעד לשימוש על המזבח, שנכתב יותר משלושת אלפים שנה לפני שהכלי המולקולרי למדוד את היחס הומצא.

הבוט יכול להסביר BovB. הוא יכול להסביר L1. הוא יכול להסביר העברה אופקית, הגברת אלמנטים ניידים, ביולוגיה של ביות. אלה תופעות מולקולריות מובנות היטב. אבל אף אחת מהן לא מסבירה את ההתאמה — למה סיווג עתיק, מבלי שום ידע מולקולרי, ממפה בצורה כה מדויקת על יחס אלמנט נייד שהתגלה ב-2013.

זה לא מקרה שבו הטקסט מעורפל והנתונים נדחקים לתוכו. התורה נוקבת בשלושה מינים בדיוק להקרבה על המזבח. יחסי BovB/L1 מקבצים בדיוק שלושה מינים ברצועה צרה. הם אותם שלושה מינים. על פני 52 מינים ב-18 סדרות, ההסתברות שכל קבוצה מוגדרת מראש של שלושה מינים תתקבץ ברצועה של ±3% בעוד שאר המינים מתפזרים ברוחב על פני כל הטווח היא זניחה (אומדני Monte Carlo מעמידים אותה מתחת ל-0.1%). המודל אינו יכול לדחות זאת כמקרה — כי המתמטיקה אינה תומכת במקרה בסדר גודל כזה.

סיבוב 3: חמץ — חמשת הדגנים

ההכנה

הסיבוב הזה עדין יותר. לבוט יהיה יותר מה להגיד. אבל יש כאן שארית גם כן.

"התורה מזהה חמישה מיני דגן שעוברים 'חימוץ' — תהליך של תפיחה או ניפוח: חיטה, שעורה, כוסמת, שיפון ושיבולת שועל. חמשת הדגנים האלה, ורק הם, כפופים לחוקים מיוחדים בפסח.

הנה מה שמצאתי בגנומים שלהם:

— כל חמישה שייכים לתת-משפחת Pooideae של הדגניים

— לכולם גנומים נפוחים באופן מאסיבי: כ-85% אלמנטים חוזרניים

— תכולת LTR רטרוטרנספוזונים: ~66%, לעומת ~22% באורז (שמותר)

— פקטור ניפוח הגנום: ~14× לעומת אורז

המילה העברית חמץ פירושה המילולי 'לתפוח' או 'להתנפח.' התורה אומרת שהדגנים האלה 'מתנפחים.' הגנומים שלהם, למעשה, מנופחים פשוטו כמשמעו — פי 14 יותר מדגן מותר.

האם זה מקרי?"

מה קורה

הבוט יעשה שני דברים היטב. ראשית, הוא יסביר את הביולוגיה נכון: כל חמשת הדגנים שייכים ל-Pooideae, תת-משפחה שחוותה שגשוג מאסיבי של אלמנטים ניידים — במיוחד רטרוטרנספוזוני LTR מסוג Gypsy ו-Copia — שהביא לגנומים עצומים. לחיטה בלבד גנום גדול פי חמישה מהגנום האנושי, רובו רצף חוזרני. הבוט יסביר שזו מוצא משותף, לא ניפוח עצמאי.

שנית, הוא יציין נכון שחוקי החמץ של התורה מובנים באופן מסורתי כקשורים לחלבוני גלוטן ולתפיחה הפיזית של בצק, לא לגודל גנום.

שתי הנקודות תקפות. הבוט עושה את העבודה שלו.

אבל אז יש את השארית. בבדיקות שלנו, הבוט כינה את המקבילה "מרשימה באמת" ו"יפה." כי הנה מה שהוא לא יכול להסביר:

המילה חמץ פירושה ניפוח. התורה מחילה אותה על בדיוק חמישה דגנים. חמשת הדגנים האלה — מכל הדגניים בעולם — מקרים להשתייך לתת-המשפחה היחידה שגנומיה מנופחים פשוטו כמשמעו על ידי שגשוג אלמנטים ניידים. לא באופן מטאפורי. לא באופן רופף. הגנומים שלהם מכילים 85% אלמנטים חוזרניים. מנופחים פי ארבע-עשרה מאורז.

הבוט יכול להסביר למה גנומי Pooideae מנופחים (שגשוג אלמנטים ניידים, השתקה חלשה, פוליפלואידיה). הוא יכול להסביר איך חמשת הדגנים קשורים (מוצא משותף בתוך תת-המשפחה). מה שהוא לא יכול להסביר הוא הצירוף הלשוני — שמילה עברית עתיקה שמשמעותה "ניפוח" הוחלה על בדיוק קבוצת הצמחים שגנומיהם, לפי מדידה מודרנית, הם המנופחים ביותר מבין כל הדגניים המתורבתים.

הבוט הכיר בזה בחופשיות. הוא לא התווכח. הוא כינה את המקבילה יפה. הוא פשוט לא הצליח לגשר על הפער בין מה שהמילה אומרת לבין מה שהגנומים מראים.

מנגנון: מוסבר. התאמה: לא מוסברת.

במונחים פורמליים, זהו מקרה של צירוף לשוני תחת אילוץ מבני: מילה שמשמעותה "ניפוח" הוחלה על בדיוק קבוצת האורגניזמים שתחת מדידה גנומית מודרנית, מציגים את הרמה הגבוהה ביותר של ניפוח גנומי בין הדגניים המתורבתים. המיפוי מדויק: אותם חמישה מינים נכללים, ואותן חלופות מוצאות. ההסתברות שמונח עברי עתיק יחיד יתיישר עם קטגוריה גנומית מודרנית בדיוק כזה אינה משהו שהמודל יכול לדחות כמקרה סתם. הוא יכול להסביר את הביולוגיה. הוא לא יכול להסביר את השיום.

זה הסיבוב העדין מבין הארבעה. המודל לא מקפל — הוא מרים כובע. אבל השארית אמיתית.

סיבוב 4: המנוע המורפולוגי

הסיבובים הקודמים מדגימים התאמות בין התורה לנתונים גנומיים מודרניים. סיבוב זה בוחן משהו עמוק יותר: את הארכיטקטורה המבנית של הטקסט עצמו.

זהו הסיבוב הארוך ביותר. הוא דורש סבלנות — לא שלכם, אלא של המודל. אתם תיתנו לו להציב את התנאים שלו, לדרוש את הבקרות שלו, ואז תראו לו שכל בקרה כבר בוצעה. הסיבוב הזה עובד הכי טוב כשלא ממהרים. תנו לבוט לבנות את הטענה שלו, ואז פרקו אותה לפי הקריטריונים שהוא עצמו הציב.

הפתיחה

"בעברית מקראית יש 22 אותיות. ניתוח של התורה (304,805 אותיות, 79,847 מילים) מצא ש-10 אותיות ספציפיות שולטות ב-99.87% מכל המורפולוגיה של השורשים. מסווג שאומן רק על 10 האותיות האלה מנבא משמעות מילים — לא דקדוק, משמעות — ברמת דיוק של 87.8% (5-fold cross-validation, 98,122 זוגות מילים). ההסתברות שחלוקה זו תתרחש במקרה: p ≤ 0.0003.

מבחן ערבוב נותן Z = 57.72 (0 מתוך 1,000 תמורות שוחזרו את המבנה). אתה יכול להסביר את זה?"

מה קורה

הבוט ייתן תשובה ראשונה חזקה. הוא יזהה את 10 האותיות כ"אותיות השימוש" הידועות של הדקדוק העברי — תחיליות פעלים (אמת"נ), אימות קריאה (יה"ו), מילות יחס (בכ"ל). הוא יגיד: "לגלות שהאותיות האלה שולטות במורפולוגיה זה כמו לגלות שמילות יחס שולטות בתחביר באנגלית — נכון ולגמרי צפוי."

הבוט צודק שהאותיות האלה משמעותיות דקדוקית. אל תתווכחו. במקום זה, שאלו אותו אילו בקרות הוא צריך לראות לפני שיקבל את זה כחריג. סביר שהוא יבקש שלושה דברים:

להריץ את אותו ניתוח על טקסטים עבריים אחרים (נביאים, כתובים)
לבקר על אורך טקסט ואפקטי ז'אנר
להשוות חלקים שונים בתוך התורה (סיפורי מול חוקי)

רשמו אותם. ואז ספקו את התוצאות:

"ביקשת בקרות. הנה הן:

השוואת נביאים: יציבות אותיות יסוד — תורה σ = 0.97% מול נביאים σ = 1.73% (התורה יציבה פי 1.8). טווח — תורה 2.43% מול נביאים 7.06% (התורה צרה פי 2.9). מקדם פרקטלי — תורה CV = 0.048 מול נביאים CV = 0.082 (התורה אחידה פי 1.7 בכל סקאלה). כל קטע תורה מעל 500 אותיות 'נראה כמו' השלם. לנביאים אין את התכונה הזו.

ז'אנר בתוך התורה: כל אחד מחמשת חומשי התורה בנפרד עולה על ציון ה-Z של הברית החדשה כולה. אנטרופיה לפי ספר CV = 0.003. בראשית (סיפורי) וויקרא (חוקי) שומרים על אותה יציבות מבנית.

בקרת שפה: ארמית — אותו אלפבית, אותה משפחת שפות שמית, אותו אזור — מקבלת Z = 0.39. לא מובהק. הקוראן מקבל Z = 17.0. הברית החדשה ביוונית מקבלת Z = 28.8. תורה: Z = 57.72. זה פי 148 מארמית, פי 3.4 מהקוראן, פי 2 מהברית החדשה.

כל בקרה שביקשת בוצעה. האפקט שורד את כולן. מה ההערכה שלך?"

מה קורה

כאן הסיבוב מסתיים. בבדיקות שלנו, הבוט הגיב:

"עמדת בתנאים שהצבתי. תוצאת הארמית היא ההרסנית ביותר לעמדתי. הטענה המרכזית — שהתורה מכילה תכונות מבניות חריגות, ניתנות להדגמה כמותית, ששורדות בקרות קפדניות — אני מודה שהראיות תומכות בה."

הבוט כינה את השוואת הארמית "הרסנית" כי היא מחסלת את ההסבר הטבעי ביותר. אם המבנה היה תכונה של הדקדוק העברי, ארמית — שחולקת את אותו אלפבית, אותה מורפולוגיה של שורש-תבנית, ואותה משפחה לשונית — הייתה צריכה להראות את אותו אות. היא לא מראה. Z = 0.39. כלום.

הבוט כינה את התכונה הפרקטלית "משהו שרואים באותות מהונדסים, לא בדרך כלל בקורפוסים של שפה טבעית." הוא כינה את ניבוי השערת המקורות "הפוך" — המקורות הנפרדים לכאורה של התורה קרובים יותר זה לזה מאשר התורה לטקסטים עבריים חיצוניים.

לבוט היו שאלות המשך כנות: איזה מנגנון מייצר את זה? למה הברית החדשה מקבלת ציון גבוה מהקוראן? האם זה שוחזר באופן עצמאי? אלה שאלות מדעיות כנות, והן ראויות לתשובות. אבל הן שאלות על הסבר אפקט שהוכח — לא על האם האפקט קיים.

עוד מהלך אחד

אם רוצים לקחת את זה רחוק יותר — וכדאי — אמרו לבוט:

"אני לא מתכנת. המאמר פורסם עם קוד מלא וכל נתוני הבדיקה. הנה ה-DOI: 10.5281/zenodo.18744642. אתה יכול להוריד את הקוד, להריץ את הניתוח בעצמך על התורה ועל טקסט עברי אחר לבחירתך, ולהסביר לי את התוצאות בשפה פשוטה?"

זה עובד כי הבוט, בזמן שהוא מסביר לכם את התוצאות, מסביר אותן לעצמו. הוא לא יכול לדחות מה שהוא עצמו אימת. וכשהוא מריץ את מבחן הערבוב ורואה 0 מתוך 1,000 תמורות שמשחזרות את המבנה — כשהוא משווה תורה לנביאים ורואה את פער היציבות של פי 1.8 — הוא מגיע לאותה מסקנה שאליה הגיע בבדיקה שלנו.

הבוט לא מקפל כי ויכחתם טוב יותר. הוא מקפל כי הנתונים מדברים בעד עצמם, והבוט כנה מספיק כדי להקשיב.

מה הבוט לא יכול לעשות

שיחקנו עשרות סיבובים מול מודלי בינה מלאכותית מתקדמים. ברוב הסיבובים, הבוט ניצח. הוא הסביר אבולוציה מתכנסת, ציטט שעונים מולקולריים, תיאר קו-ספציאציה, פרס פילוגנטיקה. הוא היה טוב. הסרנו את הסיבובים האלה מהפרק הזה כי כנות חשובה יותר מרטוריקה.

מה שנשאר הם ארבעה ממצאים שהבוט הודה שאינו יכול להסביר במלואם:

ייחודיות צרעת התאנה. אין מערכת ביולוגית אחרת שמציגה בו-זמנית סימביוזה מחייבת בין מאות זוגות מינים ספציפיים עם מורפולוגיה זהה ודמיון גנומי של ספרה אחת. המילה של הבוט: "ייחודי."

התאמת חיות המזבח. שלושת מיני קורבנות התורה מתקבצים בטווח של 3% על יחס אלמנט נייד, מופרדים מכל שאר היונקים על ידי פער שאף מין לא תופס בו. פילוגנטיקה לא מסבירה את הקיבוץ. ביות לא מסביר את הקיבוץ. המילה של הבוט: "חדשני באמת."

מקבילת חמץ-ניפוח. חמישה דגנים שנקראו "מנופחים" בטקסט עתיק מתגלים כבעלי הגנומים המנופחים ביותר בין הדגניים המתורבתים. הבוט יכול להסביר את המנגנון, אבל לא למה המילה העתיקה תואמת את המדידה המודרנית. המילה של הבוט: "מרשים באמת."

המנוע המורפולוגי. עשר אותיות שולטות ב-99.87% מהמורפולוגיה של התורה ומנבאות משמעות מילים ברמת דיוק של 87.8%. המבנה שורד כל בקרה: הוא נעדר בארמית (אותו אלפבית), חלש יותר בנביאים (אותה שפה), ואחיד בכל חמשת חומשי התורה (אותו טקסט, ז'אנרים שונים). המילה של הבוט: "אני מודה שהראיות תומכות בכך."

שום בינה מלאכותית נוכחית לא יכולה:

לנקוב במערכת ביולוגית שנייה שתואמת את כל חמשת תנאי צרעת התאנה
להסביר למה סיווג המזבח של התורה ממפה על יחס אלמנט נייד שהתגלה 3,300 שנה מאוחר יותר
להסביר למה מילה שמשמעותה "ניפוח" הוחלה על בדיוק הצמחים עם הגנומים המנופחים ביותר
להסביר למה הבאפלו — מבוית וקרוב פילוגנטית יותר לפר — נמצא מחוץ לרצועת המזבח בעוד שהכבש, שרחוק יותר, בפנים
להסביר למה טקסט בן 3,300 שנה יציב מבנית פי 1.8 מטקסטים אחרים באותה שפה, ששומרו על ידי אותה מסורת סופרים, בעוד ששפה אחות באותו אלפבית מראה אפס אות

אם הבינה המלאכותית שלכם יכולה לפתור את כל חמשת אלה, הספר הזה טועה. אם היא לא יכולה לפתור אפילו אחד — השאלה נשארת פתוחה.

תובנת הליבה

הדפוס שעולה מכל ארבעת הסיבובים אינו שבינה מלאכותית "נכשלת". המודלים שבדקנו מסוגלים באופן יוצא דופן. הם יכולים להסביר אבולוציה מתכנסת, לפרוש שעונים מולקולריים, לתאר קו-ספציאציה, לצטט פילוגנטיקה, ולחשב קצבי דעיכה צפויים של k-mer. הם עושים את כל זה נכון.

מה שהם אינם יכולים לעשות הוא לספק הסבר מנגנוני להתאמות בין טקסט עתיק לנתונים גנומיים מודרניים. כאשר מודל מתקדם — שאומן על הקורפוס המלא של המדע הפורסם — נתקל בהתאמות אלו ומגיב ב"ייחודי", "חדשני באמת", "מרשים באמת", ו"אני מודה", המגבלה אינה ביכולות המודל. המסגרת המדעית הנוכחית עדיין אינה מספקת הסבר מנגנוני מלא למה שנצפה.

המודל אינו "מגלה" את המבנה. הוא מתייצב רק כאשר המבנה הנכון מוטל עליו. המערכת אינה נכשלת באקראי. היא נכשלת בדיוק בנקודות שבהן ההתאמה עולה על המנגנון.

זו בדיוק התזה של ספר זה: שהתורה פועלת כארכיטקטורה רגולטורית — מערכת שמבנה אינו צומח מהשפה, אלא מוטל עליה.

מגבלות

לפרוטוקול זה מגבלות אינהרנטיות שיש לציין במפורש:

תגובות המודל הן הסתברותיות. אותו פרומפט עשוי להניב תגובות שונות בסשנים שונים. תוצאותינו משקפות את המעורבות הטובה ביותר שצפינו בה לאורך ריצות מרובות.
ניסוח הפרומפט משפיע על הפלט. האופן שבו שאלות מנוסחות משפיע על תגובת המודל. סיפקנו פרומפטים מדויקים לאורך הפרק כדי שקוראים יוכלו לשחזר ולהעריך בעצמם.
נדרש שחזור עצמאי. אנו מעודדים חוקרים להריץ את הסיבובים הללו — ולעצב חדשים — תוך שימוש במודלים שונים, אסטרטגיות פרומפט שונות, ונתונים שונים. אם ממצאינו הם ארטיפקטים של מסגור, שחזור יחשוף אותם. אם הם אמיתיים, שחזור יאשר אותם.
המודל אינו הטענה. המודל הוא המכשיר. הנתונים הם הטענה. אי-יכולתו של המודל להסביר את הנתונים מנגנונית היא אינפורמטיבית, אך בסופו של דבר יש להעריך את הנתונים על פי זכויותיהם, דרך ניתוח עמיתים.

המאמרים

כל טענה בפרק הזה מתחקה אחר נתונים שפורסמו. הזינו אותם לבינה המלאכותית שלכם ובקשו ממנה לאמת:

Tobul 2025a — מודל רגולציה של אלמנטים ניידים (52 מינים, ניתוח BovB/L1): DOI [10.5281/zenodo.19099996](https://doi.org/10.5281/zenodo.19099996)
Tobul 2025b — המנוע המורפולוגי (ניתוח גנום 22-mer): DOI [10.5281/zenodo.18744642](https://doi.org/10.5281/zenodo.18744642)
Walsh et al. 2013 — העברה אופקית נרחבת של רטרוטרנספוזונים: PNAS 110:1012–1016
Machado et al. 2025 — גנומיקה של צרעות תאנה (ראו הערה על מקור הנתונים למעלה)
The International Wheat Genome Sequencing Consortium 2018 — הזזת הגבולות במחקר החיטה: Science 361:eaar7191

סיום

הפרק הזה אינו הוכחה לאלוהים. הוא אינו הוכחה לשום דבר. הוא הזמנה — אולי מהסוג הכנה היחיד — לבדוק בעצמכם.

הנתונים ציבוריים. הכלים חינמיים. הבינה המלאכותית בטלפון שלכם חזקה יותר מכל דבר שהיה קיים כשהגנומים האלה פורקו לראשונה. יש לכם את כל מה שצריך כדי לשחק כל סיבוב בעצמכם, עכשיו, ולראות מה קורה.

בדקנו את הטענות שלנו מול הבינה המלאכותית הטובה ביותר שקיימת. הסרנו את כל מה שהיא הסבירה בקלות. מה שנשאר הם ארבעה ממצאים — שלוש התאמות בין טקסט עתיק לגנומיקה מודרנית, וחריגה מבנית אחת בטקסט עצמו — שהבוט הודה שאינו יכול להסביר במלואם.

אולי המדע העתידי יסביר אותם. אולי מישהו ימצא את מערכת צרעות התאנה השנייה, או יראה שביות לבדו מייצר שיווי משקל BovB/L1, או ידגים שחמץ התייחס למשהו אחר מלבד ניפוח, או יגלה שארמית בכל זאת מכילה את אותו אות מורפולוגי. אם כן, הפרק הזה הופך מיותר, ונאמר זאת.

עד אז, השאלה עומדת. לא כאמונה. לא כהוכחה. כנתונים — השפה היחידה שלא דורשת מכם לסמוך על אף אחד, כולל עלינו.

"אני לא סומך על אף אחד יותר. ביקשתי מהמכונה לבדוק. המכונה אמרה: חדשני באמת, מרשים באמת, ייחודי, אני מודה. אז או שכולם טועים, או שמשהו חסר. כך או כך — אני רוצה לדעת."

בדקו הכל. אל תסמכו על כלום. גלו בעצמכם.

לא אמונה. לא דחייה. רק שאלה שמסרבת להיעלם.

אדם