ما هو نموذج Gimini للذكاء الاصطناعي القادم من

2024-04-25 05:56:16 (اخر تعديل 2024-04-25 05:56:16 )

بواسطة الشك

في سياق أحد التحديثات، تمت ترقية (Bard) مع (Gemini Pro)، وهذا يمنح الدردشة الآلية مزيداً من القدرات المتقدمة في التفكير والفهم، وحسبما أعلنت (Google) من المتوقع دمج (Bard) مع (Gemini Ultra) في العام القادم، كما ستتم إضافة (Gemini) إلى تطبيقات (Google) الأخرى خلال الأشهر القادمة، مثل البحث وإعلانات (Google) ومتصفح (Chrome).

سنستكشف في هذا المقال الابتكار الأحدث من عالم الذكاء الاصطناعي، وهو نموذج (Gimini) الذي أطلقته "غوغل"، وسنلقي نظرة عميقة على كيفية تفوقه في فهم اللغة الطبيعية وتنفيذ المهام بشكل ذكي، وهذا يجسد قفزة نوعية في مجال التعلم الآلي.

ما هو "جيميني" من (Google)؟

ما هو

"جيميني" هو نموذج ذكاء اصطناعي جديد وقوي من (Google) يمكنه فهم ليس فقط النصوص، لكن أيضاً الصور ومقاطع الفيديو والصوت، وبوصفه نموذجاً متعدد الوسائط، يوصف "جيميني" بأنَّه قادر على إكمال مهام معقدة في الرياضيات والفيزياء ومجالات أخرى، إضافة إلى فهم وتوليد ترميز عالي الجودة بلغات البرمجة المختلفة، وحالياً يتوفر "جيميني" من خلال التكامل مع (Google Bard) و(Google Pixel 8)، وسيتم دمجه تدريجياً في خدمات (Google) الأخرى.

يقول "دينيس حسابيس" الرئيس التنفيذي والمؤسس المشارك لـ (Google DeepMind): "جيميني هو نتيجة جهود تعاونية كبيرة من قِبل فِرق في جوجل، مثل زملاؤنا في بحث (Google)، وتم بناؤه من الألف إلى الياء ليكون متعدد الوسائط، وهذا يعني أنَّه يستطيع التعميم والفهم المتسلسل، والتشغيل عبر، ودمج مختلف أنواع المعلومات مثل النصوص، والشيفرة، والصوت، والصورة، والفيديو".

يعتمد "جيميني" على وحدات معالجة الأنساق الخاصة بـ "جوجل":

تعتمد اللغة طويلة النطاق على وحدات معالجة الأنساق التي أنتجتها "جوجل"، والتي تُعَدُّ أجهزة متخصصة مصمَّمة لتدريب نماذج الذكاء الاصطناعي، لكن في المستقبل، سيتم تدريب "جيميني" على كل من وحدات معالجة الأنساق ووحدات معالجة الرسومات، وذلك وفقاً لما صرح به (Amin Vahdat) نائب رئيس الذكاء الاصطناعي في (Google Cloud) في إحاطة صحفية، كما أنَّ شركة (Nvidia) تنتج وحدة معالجة الرسومات (H100)؛ وهي رقاقة شهيرة لتشغيل منتجات الذكاء الاصطناعي الإبداعية.

من صنع "جيميني"؟

تم إنشاء "جيميني" بواسطة (Google) و(Alphabet) الشركة الأم لـ "جوجل"، وتم إصداره بوصفه أحدث نموذج ذكاء اصطناعي للشركة حتى الآن، وقد قدَّمت (Google DeepMind) أيضاً مساهمات كبيرة في تطوير "جيميني".

هل سيضطر الأشخاص للدفع مقابل هذا؟

صرَّحت "هسياو" بأنَّ (Google) تستكشف كيفية جني الأرباح من "جيميني"، ولكنَّها لم تقدِّم أي تفاصيل محددة حتى الآن.

هل "جيميني" يهلوس؟

"ما تزال اللغات طويلة النطاق قادرة على التسبب في الهلوسة"، وذلك وفقاً لما صرح به "إيلي كولينز" نائب رئيس المنتج في (DeepMind) التابعة لـ "جوجل" خلال المؤتمر الصحفي.

"جيميني" مستوحى من (AlphaGo):

يدين "جيميني" كثيراً لـ (AlphaGo) الذي تم تطويره بواسطة (DeepMind) التابعة لـ "جوجل" وأصبح أول برنامج كمبيوتر يهزم لاعب (Go) بشرياً محترفاً، فقد شهد تاريخ الذكاء الاصطناعي حدثاً تاريخياً في عام 2016 عندما فاز (AlphaGo) على "لي سيدول"، وهو واحد من أعظم لاعبي الجو في العالم في لعبته الخاصة.

سيجمع التقنيات المستخدَمة في (AlphaGo) مع التكنولوجيا التي تشغل (ChatGPT)؛ إذ قالت "دينيس حسابيس" رئيسة (DeepMind) لـ (Wired) في شهر حزيران/ يونيو: "قد تفكر في جيميني على أنَّه يجمع على مستوى عالٍ بعض قوى الأنظمة من نوع (AlphaGo) مع قدرات اللغة المذهلة للنماذج الكبيرة".

الإصدارات الأولية لـ "جيميني":

الإصدارات الأولية لـ جيميني

بدأت (Google) بتوزيع إصدار أولي من النموذج لمجموعة صغيرة من الشركات في شهر أيلول/ سبتمبر، وذلك وفقاً لتقرير (The Information).

ذكر أحد الأشخاص الذي اختبر التكنولوجيا سابقاً للموقع أنَّه قد يتفوق على (GPT-4)؛ وذلك لأنَّه يستفيد من بيانات (Google) من منتجات المستهلك، إضافة إلى المعلومات المجموعة من الإنترنت، ويفترض أن يعني ذلك أنَّ النموذج يمكنه فهم نوايا المستخدم بشكل أدق، وذلك وفقاً للتقرير.

كما قال الشخص أيضاً إنَّ النموذج يبدو أنَّه يولِّد إجابات غير صحيحة بشكل أقل، وهي مشكلة شائعة في مجال الذكاء الاصطناعي تُعرَف باسم الهلوسة، وكانت تتميز روبوتات الدردشة المدعومة بالذكاء الاصطناعي في تقديمها معلومات غير صحيحة بوصفها حقائق.

في شهر شباط/ فبراير، أظهر إعلان (Google) عن منافس (ChatGPT) المعروف باسم (Bard) تقديم (ChatGPT) إجابة غير صحيحة، وتوقع باحثون وراء مدونة (SemiAnalysis) أيضاً أن يكون أداء (Gemini) أفضل من (GPT-4)؛ وذلك بسبب استحواذ (Google) على رقاقات عالية الجودة.

هل توجد إصدارات مختلفة من "جيميني"؟

"جيميني" هو ذكاء اصطناعي متعدد الوسائط من (Google)، وهذا يعني أنَّه قادر على معالجة أكثر من نوع واحد من البيانات، ويستطيع النموذج معالجة الصور والنصوص والصوت والفيديو ولغات البرمجة، كما تتيح القدرات الجديدة ميزات مثل تحليل الكتابة للرسوم البيانية البصرية.

تعزز الشركة التكنولوجية أيضاً قدرات توليد الشفرة للتنافس مع (GitHub Copilot) من (Microsoft) الذي يعتمد على تقنية (OpenAI)، وذلك وفقاً لتقرير سابق من (The Information)، فالإصدار الأول للنموذج (Gemini 1.0) مُحسَّن لثلاثة أحجام، وهي (Gemini Ultra) و(Pro) و(Nano).

تصف (Google) "جيميني" بأنَّه نموذج مرن وقادر على التشغيل على كل شيء، من مراكز بيانات (Google) إلى الأجهزة المحمولة، ولتحقيق هذه التوسعة، سيتم إطلاق "جيميني" في ثلاثة أحجام، وهي (Gemini Nano) و(Gemini Pro)، و(Gemini Ultra).

1. جيميني نانو (Gemini Nano):

تم تصميم نموذج (Gemini Nano) لتشغيله على الهواتف الذكية، وخاصةً هاتف (Google Pixel8)، وقد تم بناؤه لأداء مهام على الجهاز نفسه التي تتطلب معالجة ذكاء اصطناعي فعالة دون الحاجة إلى الاتصال بخوادم خارجية، مثل اقتراح الردود ضمن تطبيقات الدردشة أو تلخيص النصوص.

2. جيميني برو (Gemini Pro):

يعمل على مراكز بيانات (Google)، وقد تم تصميم (Gemini Pro) لتشغيل أحدث إصدار من دردشة "جوجل" الاصطناعية (Bard)، وهو قادر على تقديم استجابة سريعة وفهم الاستفسارات المعقدة.

3. جيميني ألترا (Gemini Ultra):

على الرغم من عدم توفُّره بشكل واسع حتى الآن، وصفت "غوغل" (Gemini Ultra) بأنَّه نموذجها الأكثر قدرة؛ إذ يتجاوز "النتائج الحالية على 30 من أصل 32 مقياساً أكاديمياً متنوع الاستخدام في أبحاث وتطوير النماذج اللغوية الكبيرة (LLM)"، وهو مصمم للمهام المعقدة للغاية، وسيتم إطلاقه بعد الانتهاء من مرحلة الاختبار الحالية.

كيف يمكن الوصول إلى "جيميني"؟

يتوفر "جيميني" حالياً على منتجات (Google) بأحجام (Nano) و(Pro)، مثل هاتف (Pixel 8) ودردشة "جوجل" (Bard)، كما تخطط (Google) لدمج "جيميني" مع مرور الوقت في خدماتها مثل البحث، والإعلانات، ومتصفح (Chrome)، وخدمات أخرى.

سيتمكن المطورون وعملاء الشركات من الوصل إلى "جيميني برو" عبر واجهة برمجة التطبيقات (Gemini) في (AI Studio) و(Google Cloud Vertex AI) بدءاً من 13 من شهر كانون الأول/ ديسمبر لعام 2023، وسيتمكن مطورو (Android) من الوصول إلى "جيميني نانو" عبر (AICore) الذي سيكون متاحاً في مرحلة مبكرة للاستعراض.

كيف يختلف "جيميني" عن نماذج الذكاء الاصطناعي الأخرى مثل (GPT-4)؟

يبدو أنَّ النموذج الجديد - "جيميني" من (Google) - يُعَدُّ واحداً من أضخم وأحدث نماذج الذكاء الاصطناعي حتى الآن، على الرغم من أنَّ إصدار النموذج (Ultra) سيكون الحاسم لتحديد ذلك بالتأكيد.

بالمقارنة مع نماذج أخرى شهيرة تشغِّل روبوتات الدردشة الاصطناعية، يتميز "جيميني" بخاصية تعدُّد الوسائط الأصلية، في حين تعتمد نماذج أخرى مثل (GPT-4) على وحدات إضافية وتكامل لتحقيق تعدُّد الوسائط.

بالمقارنة مع (GPT-4) الذي يعتمد أساساً على النصوص، يقوم "جيميني" بأداء مهام متعددة الوسائط بشكل طبيعي وبسهولة، في حين يبرع (GPT-4) في مهام ذات صلة باللغة مثل إنشاء المحتوى وتحليل النصوص المعقدة بشكل طبيعي، إلا أنَّه يعتمد على وحدات إضافية من (OpenAI) لتحليل الصور والوصول إلى الويب، ويعتمد على (DALL-E 3) و(Whisper) لإنشاء الصور ومعالجة الصوت.

يبدو أيضاً أنَّ "جيميني" من (Google) يركز أكثر على المنتجات من نماذج أخرى متاحة حالياً، فإما أن يمتد داخل نظام الشركة أو مخططاً لذلك؛ إذ يُعَدُّ محرِّكاً لكل من (Bard) وأجهزة (Pixel 8)، في حين أنَّ نماذج أخرى مثل (GPT-4) و(Llama) من (Meta) هي أكثر توجهاً للخدمات ومتاحة لمطوري التطبيقات والأدوات والخدمات المتنوعة.

في الختام:

يظهر نموذج (Gemini) للذكاء الاصطناعي القادم من "غوغل" بوصفه ابتكاراً مثيراً يعتمد على تقنيات متقدمة في مجال التعلم الآلي، ويتميز بقدرته على استخدام تقنية تعدُّد الوسائط بشكل فعال.

يبرز هذا النموذج في تحقيق تقدُّم ملحوظ في فهم اللغة الطبيعية وتنفيذ المهام الذكية، وهذا يفتح أفقاً جديداً لتطبيقات الذكاء الاصطناعي في مجموعة متنوعة من المجالات، فإنَّ توقعات المستقبل تتجه نحو استخدام (Gemini) لتحسين تفاعل الأنظمة مع المستخدمين وتطوير حلول ذكية تلبي احتياجات المجتمع بشكل مبتكَر وفعال.