جوجل جيمناي (Google Gemini)، نموذج الذكاء الاصطناعي التوليدي (AI) وبرنامج الدردشة الآلي الذي أنشأته شركة محرك البحث جوجل (Google)، والذي يستخدم نماذج لغوية كبيرة (LLMs) “للتحدث” مع المستخدمين وإنشاء المحتوى.
تم الإعلان عن بارد (Bard) وهو (الاسم الأصلي لـ Google Gemini) من قبل الرئيس التنفيذي لشركة (Google Sundar Pichai) في فبراير 2023 باعتبارها “خدمة الذكاء الاصطناعي للمحادثة التجريبية، المدعومة من LaMDA”. LaMDA (نموذج اللغة لتطبيقات الحوار) هو برنامج المحادثة من Google. تم إطلاق بارد بعد شهر. في يونيو 2022، ادعى مهندس جوجل بليك ليموين Blake Lemoine أن LaMDA كان واعيًا، وهو ما نفته الشركة. (تم وضع ليموين في إجازة إدارية بعد الإعلان عن ادعاءاته ثم تم طرده في شهر يوليو من ذلك العام).
تلقى Bard انتقادات بمجرد الإعلان عنه، حيث أظهر العرض الترويجي لشركة Google خطأً غير مقصود، حيث قدم حقائق غير صحيحة ردًا على السؤال التالي: “ما هي الاكتشافات الجديدة من تلسكوب جيمس ويب الفضائي التي يمكنني أن أخبر طفلي البالغ من العمر 9 سنوات عنها؟” وبعد هذا الخطأ، انخفضت القيمة السوقية لشركة Alphabet، الشركة الأم لشركة Google، بمقدار 100 مليار دولار. بعد وقت قصير من إطلاق بارد، أصدرت بلومبرج نيوز تقريرًا يضم لقطات شاشة للرسائل الداخلية من موظفي جوجل. قال أحد الموظفين في رسالة داخلية: “إن Bard أسوأ من كونه عديم الفائدة: من فضلك لا تطلقه”. وأفاد موظف آخر أن بارد كان “كاذبًا مرضيًا”. وتشير الشهادات إلى أن جوجل استعجلت في إطلاق بارد، متجاوزة الاختبارات القائمة على الأخلاقيات، من أجل مواكبة المنافسين مثل مايكروسوفت وأوبن إيه آي. في أبريل 2023، قامت جوجل بدمج اثنتين من مجموعاتها البحثية في مجال الذكاء الاصطناعي، وهما Brain وDeepMind، في Google DeepMind، وهي خطوة ادعى بيتشاي أنها “ستسرع بشكل كبير” تقدم Google في مجال الذكاء الاصطناعي.
في ديسمبر 2023، أصدرت Google إصدارًا محدثًا من Bard يستخدم LLM جديدًا، يسمى Gemini، مدعيًا أن التكنولوجيا تفوقت على GPT-4 الخاص بـ OpenAI. عاد المؤسس المشارك لشركة Google، سيرجي برين، إلى Google للمساعدة في إنشاء النظام الجديد.
قامت Google في البداية بتقسيم تقنية Gemini إلى ثلاث فئات. يعمل Nano على تشغيل الميزات الموجودة في بعض أجهزة Android من Google ويمكن أن يساعد في تسهيل الوصول إلى الأجهزة. على سبيل المثال، يشتمل هاتف Google Pixel 8 Pro على ميزة TalkBack، التي تساعد ضعاف البصر على التفاعل مع أجهزتهم باستخدام اللمس والكلام. تمت إضافة Pro إلى Bard بعد وقت قصير من الإعلان عن Gemini وتم تسويقه على أنه يتمتع بأداء قوي عبر مجموعة متنوعة من المهام، مثل تلخيص التقارير وإنشاء أكواد الكمبيوتر. ويُقال إن Ultra، الذي تم إطلاقه في فبراير 2024، هو النموذج الأسرع والأكثر جودة. بالإضافة إلى النص، يتم تدريب برج الجوزاء أيضًا على الصور والأصوات، مما يجعله متعدد الوسائط، أو قادرًا على الجمع بين أنواع متعددة من المعلومات، مثل النص والصور. على سبيل المثال، بالنظر إلى صورة ما، يستطيع الجوزاء وصف الصورة وتغييرها. بعد بضعة أشهر من إطلاق النماذج الثلاثة الأولية، أصدرت Google إصدار Gemini 1.5 Pro، والذي زعمت أنه كان أسرع أداءً. لمعالجة مخاوف المستخدمين فيما يتعلق بالجزء الأكبر من البرنامج، أصدرت Google بعد ذلك برنامج Gemini 1.5 Flash، والذي ادعت أنه أخف وزنًا من سابقه.
في أوائل عام 2024، أعادت Google تسمية Bard إلى Gemini. عندما تم إطلاق المنصة لأول مرة، كانت متاحة باللغة الإنجليزية فقط ولكنها توسعت لتشمل اليابانية والكورية في الأسبوع التالي. اعتبارًا من أبريل 2024، يتوفر تطبيق الويب Gemini بأكثر من 40 لغة. أطلقت Google أيضًا برنامج Gemini Advanced، مدعيةً أن “Gemini Advanced أكثر قدرة بكثير على القيام بمهام معقدة للغاية مثل البرمجة والتفكير المنطقي واتباع التعليمات الدقيقة والتعاون الإبداعي”.
في شهر إطلاقه، اكتسب جيميناي اهتمامًا سلبيًا عندما ظهرت منشورات على وسائل التواصل الاجتماعي تظهر أن المنصة أنشأت صورًا غير دقيقة (وأحيانًا مسيئة) تحدد أجناسًا وأعراقًا غير صحيحة لمجموعات معينة من الأشخاص. انتقد المعلقون، مثل الرئيس التنفيذي لشركة تسلا، إيلون ماسك، الخوارزمية، التي قام المهندسون بتحسينها بشكل مضلل لمحاولة تجنب التحيز لصالح الذكور البيض ولكنها انحرفت كثيرًا في الاتجاه المعاكس. على سبيل المثال، أنتج النموذج صورة لجندي ألماني من الحقبة النازية على هيئة امرأة آسيوية. وفي أعقاب التقارير، أوقفت Google مؤقتًا قدرة النظام الأساسي على إنشاء صور للبشر. اعترف برين بأن الشركة “أفسدت بالتأكيد عملية توليد الصور”، موضحًا اعتقاده أن “السبب في الغالب كان بسبب عدم إجراء اختبارات شاملة و…بالتأكيد، لسبب وجيه، أزعج الكثير من الناس”.