توصلت دراسة حديثة إلى أن تزويد النماذج اللغوية بذاكرة محدودة تحاكي بعض خصائص الذاكرة البشرية يمكن أن يعزز قدرتها على تعلم القواعد اللغوية، خاصة عند التدرب على كميات محدودة من النصوص.اختبار فرضية النسياناخْتُبِرَت فكرة قديمة في العلوم المعرفية مفادها أن نسيان التفاصيل الدقيقة للكلمات والجمل يساعد على التركيز على الأنماط المتكررة واستخلاص القواعد العامة. اعتمدت النماذج الحديثة على الاحتفاظ بقدر كبير من المعلومات عن الكلمات داخل السياق، لكن الباحثين اختبروا فرضية معاكسة: هل يمكن أن يصبح النموذج أفضل إذا نسي بعض التفاصيل تدريجيًا؟أضاف الفريق آلية بسيطة لتلاشي الذاكرة داخل نماذج مبنية على بنية "المحوّل".
أُطلِق على هذه النماذج اسم "محوّلات الذاكرة العابرة"، حيث لا تحتفظ بجميع الكلمات السابقة بالمستوى نفسه من الدقة، فمع مرور الكلمات تبدأ التفاصيل الأقدم في التلاشي بينما تبقى الكلمات الأقرب متاحة بصورة أوضح. يحاكي ذلك الطريقة التي لا يحتفظ فيها الإنسان بالنص الحرفي الكامل لكنه يتذكر معناه وأنماطه الأساسية.التدريب بمعيار لغوي محدوددُرِّبت النماذج باستخدام معيار "BabyLM"،
وهو مجموعة بيانات صُممت لتقريب كمية اللغة التي قد يتعرض لها الإنسان أثناء النمو. سمح ذلك بمقارنة النماذج التقليدية مع ذات الذاكرة المتلاشية في ظروف لا تعتمد على مليارات الكلمات. أظهرت الاختبارات أن النماذج المزودة بآلية النسيان حققت أداء أفضل في تعلم اللغة واختبارات فهم البنية النحوية، واستمرت النتائج عبر عمليات تدريب متعددة.لكن الفائدة لم تتحقق من خلال النسيان وحده،
إذ احتاج النموذج إلى "ذاكرة صدوية" قصيرة تحتفظ بآخر ثلاث إلى سبع كلمات بوضوح قبل أن تبدأ المعلومات في التلاشي، مما وفر توازنًا بين الحاضر والماضي. الجمع بين الذاكرة القريبة الواضحة والتلاشي التدريجي كان العامل الحاسم، حيث يساعد الاحتفاظ بآخر الكلمات على فهم العلاقات المحلية داخل الجملة بينما يجبر النسيان على التركيز على الأنماط العامة.تدعم هذه النتيجة اقتراحًا يعود إلى أبحاث إدراكية من تسعينات القرن الماضي يرى أن محدودية الذاكرة قد لا تكون مجرد عائق بل جزءًا من آلية التعلم.
وتشير الدراسة إلى أن نجاح نماذج "المحوّل" ذات السياق الواسع لا يعني أن الذاكرة غير المحدودة هي الخيار الأفضل في جميع حالات التدريب، خاصة مع البيانات القليلة.نتيجة غير متوقعةكشفت التجربة عن نتيجة غير متوقعة، حيث حسّنت الذاكرة العابرة تعلم اللغة وفهم القواعد لكنها خفضت قدرة النماذج على توقع الزمن الذي يحتاجه البشر لقراءة الكلمات والجمل. في دراسات سابقة،
ارتبط تحسن الأداء اللغوي بقدرة أفضل على توقع سلوك القارئ، لكن الدراسة الجديدة لم تجد هذا الارتباط، مما يشير إلى أن آليات التعلم الفعال قد تختلف عن تلك التي تمكّن من محاكاة معالجة الإنسان للغة أثناء القراءة.دلالات لتطوير نماذج أصغرلا تعني النتائج أن النسيان سيجعل جميع أنظمة الذكاء الاصطناعي أفضل، فهي تمثل اختبارًا أوليًا على نماذج صغيرة في ظروف تدريب محددة.
لكنها تطرح اتجاهًا مختلفًا عن السعي المستمر لتوسيع الذاكرة والسياق، وقد تساعد قيود الذاكرة المصممة بعناية على بناء نماذج تتعلم بكفاءة عند نقص البيانات أو تطوير أنظمة أصغر تستطيع استخلاص القواعد بدلاً من حفظ النصوص. تفتح الدراسة سؤالاً جديدًا: هل تحتاج النماذج دائمًا إلى ذاكرة أكبر، أم أن نسيان المعلومات غير الضرورية قد يكون جزءًا من التعلم الأفضل؟
لفت البحث إلى أن النسيان التدريجي يدفع النموذج إلى التركيز على الأنماط العامة (شاترستوك) توصل الباحثون إلى أن تحسّن التعلّم اللغوي لم يؤدِ إلى محاكاة أدق لسرعة القراءة البشرية (شاترستوك)