Google تُقدّم Gemini 1.5 Pro: مليون رمز في سياق واحد
قدّمت Google نموذج Gemini 1.5 Pro بنافذة سياق تصل إلى مليون رمز — ما يعادل ساعة كاملة من الفيديو أو أكثر من ثلاثين ألف سطر من الكود في طلب واحد.
في فبراير 2024، أعلنت Google عن إطلاق Gemini 1.5 Pro في إطار وصول محدود للمطورين. ما يُميّز هذا النموذج ليس مجرد حجم نافذة السياق الاستثنائية، بل البنية التقنية المختلفة التي تجعل معالجة هذا الحجم الضخم ممكنة بكفاءة.
مليون رمز — ماذا يعني ذلك عملياً؟
نافذة السياق في نماذج اللغة هي الحجم الأقصى من المعلومات الذي يستطيع النموذج معالجته دفعةً واحدة. في حين تعمل معظم النماذج بنوافذ تتراوح بين 8 آلاف و128 ألف رمز، يصل Gemini 1.5 Pro إلى مليون رمز — أي ما يعادل ساعة كاملة من مقاطع الفيديو، أو 11 ساعة من الصوت، أو 30 ألف سطر من الكود البرمجي، وكل ذلك في طلب واحد.
هذا يعني أن النموذج يستطيع "قراءة" رواية كاملة أو تحليل قاعدة كود ضخمة أو مراجعة أرشيف مستندات شركة — ومن ثَمَّ الإجابة عن أسئلة تفصيلية بدقة عالية.
بنية Mixture-of-Experts
يعتمد Gemini 1.5 Pro على بنية Mixture-of-Experts (MoE) التي تُقسّم النموذج إلى "خبراء" متخصصين يُفعَّل منهم في كل مرة مجموعة صغيرة حسب طبيعة المهمة. النتيجة: أداء مماثل لنماذج أكبر حجماً مع استهلاك حوسبي أقل، وهو ما يُفسّر قدرته على التعامل مع السياق الضخم بكفاءة.
التأثير العملي على المطورين
المطورون الذين يبنون تطبيقات على هذا النموذج يستطيعون الآن تحليل قواعد كود ضخمة دفعةً واحدة بدلاً من تجزئتها. وفي التطبيقات القانونية والطبية، يمكن رفع ملف حالة كامل بكل وثائقه ومناقشته بعمق. هذا يُقلّص "مشكلة التجزئة" التي كانت تُعقّد بناء تطبيقات معالجة المستندات.
الخلاصة
يُمثّل Gemini 1.5 Pro نقلة نوعية في مفهوم "ما يستطيع النموذج احتواؤه". المنافسة في عالم نوافذ السياق الكبيرة ستتصاعد، ومن يُحسن توظيف هذه الإمكانية في تطبيقاته الفعلية سيكون لديه ميزة حقيقية.
سارة المنصوري
محررة تقنية
مهندسة برمجيات وباحثة في تقنيات الذكاء الاصطناعي، متخصصة في نماذج اللغة الكبيرة وتطبيقاتها العملية.