الاقتصادي - أعلنت شركة (OpenAI) أمس عن الجيل الرابع من نموذجها اللغوي العملاق (GPT) الذي يحمل اسم (GPT-4)، والذي من المتوقع أن يُحدث طفرة كبرى في قدرات الذكاء الاصطناعي التوليدي؛ لأنه نموذج لغوي متعدد الوسائط (Multi-Modal LLM) أي يمكنه قبول مدخلات الصور والنصوص وإنشاء مخرجات نصية.
يمثل الإصدار الأخير من (GPT-4) علامة بارزة في مجال الذكاء الاصطناعي، لا سيما في معالجة اللغة الطبيعية. لذلك سنستعرض اليوم في هذه المقالة الإمكانيات الجديدة التي يقدمها نموذج GPT-4 وكيف يختلف عن الإصدارات السابقة؟
أولًا؛ ما هو (GPT-4)؟
يُعد (GPT-4) هو الإصدار الأحدث والأكثر تقدمًا من النموذج اللغوي (GPT) لتوليد النصوص الذي أطلقته شركة (OpenAI) عام 2018، ثم أطلقت الجيل الثالث منه (GPT-3) في عام 2020، ثم طورته حتى إصدار (GPT-3.5) الذي استخدمته لإنشاء روبوت الدردشة التفاعلي ChatGPT الذي أطلقته في شهر نوفمبر الماضي.
إذا كنت قد استخدمت (ChatGPT) فأنت على دراية بالإصدار السابق (GPT-3.5)، الذي يقتصر على إدخال نصي، ويولد نصوصًا بلغة طبيعية أو أكوادًا برمجية بسيطة. لكن (GPT-4) هو أحدث إصدار ويتميز بأنه متعدد الوسائط لأنه يقبل مدخلات الصور والنصوص، ويولد مخرجات نصية، فهو قادر على فهم محتوى الصور وتحليلها بشكل جيد، حتى مع الصور المعقدة، مثل: صور الرسوم البيانية أو أوراق العمل، والمستندات الطويلة، وهو تحسن كبير عن النموذج السابق.