OpenAI تطلق GPT-4o: ذكاء اصطناعي متكامل مجاني للجميع
أطلقت OpenAI نموذج GPT-4o 'أوموني' — نموذج متعدد الوسائط يفهم النص والصوت والصورة في آنٍ واحد، ومتاح مجاناً لجميع مستخدمي ChatGPT.
في مايو 2024، أطلقت OpenAI نموذج GPT-4o — وهو ما تسمّيه الشركة نموذجاً "أوموني" (Omni بمعنى شامل). الأهم من التقنية نفسها: أصبح هذا النموذج متاحاً مجاناً لجميع مستخدمي ChatGPT، وليس حكراً على المشتركين في الخطط المدفوعة.
ما الذي يميّز GPT-4o؟
قبل GPT-4o، كانت قدرات ChatGPT الصوتية والمرئية مبنية على نماذج منفصلة تعمل بالتسلسل. أما GPT-4o فيجمع معالجة النص والصوت والصورة في نموذج واحد متكامل، مما يُتيح الاستجابة للمحادثة الصوتية في أقل من ثلث ثانية — أي بسرعة تقترب من ردود الفعل البشرية الطبيعية.
من الناحية التقنية، يعمل GPT-4o بسرعة ضعف سرعة GPT-4 Turbo وبنصف تكلفته. هذا الانخفاض في التكلفة يُؤثر مباشرة على المطورين الذين يبنون تطبيقات على واجهة OpenAI البرمجية، إذ تنخفض فاتورتهم التشغيلية بصورة ملموسة.
المحادثة الصوتية في الوقت الحقيقي
أحد أبرز ما جاء به GPT-4o هو وضع Voice الجديد الذي يُتيح محادثة صوتية طبيعية تستجيب للنبرة ومقاطعات الحديث. النموذج قادر على اكتشاف المشاعر من الصوت، والاستجابة بأسلوب يتناسب مع السياق العاطفي للمحادثة — وهو ما جعل التجارب الأولى مدهشة بشكل حقيقي.
ماذا يعني هذا للمستخدم العربي؟
إتاحة GPT-4o مجاناً تعني أن ملايين المستخدمين العرب يستطيعون الوصول إلى نموذج يفهم الصور ويتحدث بصوت طبيعي دون أي اشتراك. جودة العربية في هذا النموذج تحسّنت ملحوظاً مقارنة بالإصدارات السابقة، مع فهم أفضل للمصطلحات العامية والإقليمية في المحادثة الصوتية.
الخلاصة
GPT-4o ليس مجرد ترقية تقنية، بل تحوّل في نموذج التوزيع: من أداة مدفوعة للمحترفين إلى منصة مجانية للجميع. هذا الانفتاح يُسرّع من انتشار الذكاء الاصطناعي في المجتمعات التي كانت تُعاني من حاجز التكلفة.
أحمد الرشيدي
محرر رئيسي
كاتب متخصص في الذكاء الاصطناعي والتقنية الحديثة، يتابع مستجدات الصناعة منذ أكثر من ست سنوات.