نکات کلیدی

  • مدل Gemini هوش مصنوعی گوگل دارای سه نوع Ultra، Pro و Nano است که بر روی وظایف و سطوح پیچیدگی مختلف تمرکز دارد.
  • Gemini Ultra نتایج امیدوارکننده‌ای را در معیارهای کلیدی هوش مصنوعی نشان می‌دهد، اما از دسامبر 2023، برای استفاده عمومی در دسترس نیست. گوگل می گوید باید در ژانویه 2024 در دسترس باشد.
  • Gemini Pro در دسترس است و اگرچه عملکرد بسیار خوبی دارد، اما در حال حاضر نتوانسته GPT-4 را از سلطنت خلع کند.
گوگل به طور مداوم وعده داده است که مدل هوش مصنوعی Gemini آن بهتر از GPT-4 OpenAI است، مدلی که ChatGPT Plus را تقویت می کند. اکنون که Google Gemini راه اندازی شده است، می توانیم در نهایت آن را آزمایش کنیم و ببینیم Gemini چگونه با GPT-4 مقایسه می شود.

وقتی گوگل Bard را در مارس 2023 راه اندازی کرد، دلایل زیادی برای هیجان زده شدن وجود داشت. در نهایت، انحصار ChatGPT OpenAI شکسته خواهد شد و ما رقابت شایسته ای خواهیم داشت.

اما Bard هرگز آن گونه‌ای نبود که مردم به آن امید داشتند و GPT-4 همچنان پلتفرم ربات چت هوش مصنوعی مولد غالب است. اکنون Gemini گوگل اینجاست، اما آیا مدل هوش مصنوعی مورد انتظار بهتر از ChatGPT است؟

بیشتر بخوانید: نحوه استفاده از ChatGPT در Microsoft Word

مدل هوش مصنوعی Gemini گوگل چیست؟

Gemini تواناترین مدل هوش مصنوعی مولد گوگل است که قادر به درک و عملکرد در قالب‌های مختلف داده، از جمله متن، صدا، تصویر و ویدیو است. این تلاش گوگل برای ایجاد یک مدل هوش مصنوعی یکپارچه از قابلیت‌های ترسیمی از توانمندترین فناوری‌های هوش مصنوعی خود است. Gemini در سه نوع موجود خواهد بود:

  1. Gemini Ultra: بزرگترین و تواناترین نوع طراحی شده برای انجام کارهای بسیار پیچیده.
  2. Gemini Pro: بهترین مدل برای مقیاس‌بندی و ارائه عملکرد بالا در طیف وسیعی از وظایف، اما نسبت به Ultra توانایی کمتری دارد.
  3. Gemini Nano: کارآمدترین مدل طراحی شده برای استقرار وظایف بر روی دستگاه. به عنوان مثال، توسعه‌دهندگان می‌توانند از Gemini Nano برای ساخت اپلیکیشن‌های تلفن همراه یا سیستم‌های یکپارچه استفاده کنند و هوش مصنوعی قدرتمند را وارد فضای موبایل کنند.
گوگل در وبلاگ رسمی خود، کلمه کلیدی، می گوید که Gemini Ultra در چندین معیار از پیشرفته ترین عملکردها بهتر عمل می کند. گوگل ادعا می کند که Gemini Ultra در چندین معیار کلیدی GPT-4 پیشرو در صنعت را شکست می دهد.

گوگل می‌گوید Gemini Ultra با امتیاز بی‌سابقه 90 درصدی در معیار دقیق MMLU، اولین مدلی است که در این آزمایش چند وجهی که 57 سوژه را در بر می‌گیرد، از عملکرد سطح انسانی پیشی گرفته است.

Gemini Ultra همچنین می‌تواند کدهای با کیفیت بالا را در برخی از محبوب‌ترین زبان‌های برنامه‌نویسی جهان از جمله Go، JavaScript، Python، Java و C++ درک کند، توضیح دهد و تولید کند. روی کاغذ، همه اینها نتایج عالی هستند. اما اینها همه معیار هستند و معیارها همیشه کل داستان را بیان نمی کنند. بنابراین، Gemini در کارهای دنیای واقعی چقدر خوب عمل می کند؟

نحوه استفاده از هوش مصنوعی گوگل Gemini

از بین سه نوع مدل Gemini AI، می توانید از همین الان استفاده از Gemini Pro را شروع کنید. Gemini Pro در حال حاضر در چت ربات Bard Google در دسترس است. برای استفاده از Gemini Pro با Bard، به bard.google.com بروید و با حساب Google خود وارد شوید.

گوگل می گوید که Gemini Ultra در ژانویه 2024 عرضه می شود، بنابراین فعلاً باید به آزمایش Gemini Pro در برابر ChatGPT بسنده کنیم.

چگونه Gemini با GPT-3.5 و GPT-4 مقایسه می شود

هنگامی که هر مدل هوش مصنوعی جدیدی راه اندازی می شود، در برابر مدل های هوش مصنوعی GPT OpenAI آزمایش می شود، که به طور کلی به عنوان مدلی پیشرفته پذیرفته شده است که سایر مدل ها باید در برابر آن مقاومت کنند. بنابراین، با استفاده از Bard و ChatGPT، توانایی Gemini را در ریاضیات، نوشتن خلاقانه، تولید کد و پردازش دقیق ورودی های تصویر آزمایش کردیم.

با شروع ساده‌ترین سؤال ریاضی که می‌توانستیم به آن فکر کنیم، از هر دو چت بات‌ها خواستیم تا حل کنند: -1 x -1 x -1 .

بارد در ابتدا رفت. ما سوال را دو بار تکرار کردیم، همه با پاسخ های اشتباه برگشتیم. ما در تلاش سوم جواب گرفتیم، اما این به حساب نمی آید.

بارد به سوال ریاضی پاسخ می دهد

ما ChatGPT را روی GPT-3.5 اجرا کردیم. اولین آزمایش درست شد.

ChatGPT به سوال ریاضی پاسخ می دهد

برای آزمایش توانایی‌های Gemini در تفسیر تصویر، ما آن را به تفسیر برخی از میم‌ های محبوب واداشتیم. آن را رد کرد و گفت که نمی تواند تصاویر با افراد موجود در آن را تفسیر کند. ChatGPT که GPT-4V را اجرا می‌کرد، می‌خواست و می‌توانست این کار را بدون نقص انجام دهد.

ما تلاش دیگری را انجام دادیم تا تصویر را تفسیر کنیم و در عین حال توانایی حل مسئله و کدگذاری آن را آزمایش کنیم. ما به Bard که Gemini Pro را اجرا می‌کرد، یک اسکرین شات دادیم و از آن خواستیم کدهای HTML و CSS را تفسیر و بنویسد تا اسکرین شات را تکرار کند.

این اسکرین شات منبع است.

اسکرین شات از خالق ربات چت بیس

در زیر تلاش Gemini Pro برای تفسیر و تکرار اسکرین شات با استفاده از HTML و CSS آمده است.

نتایج تکرار اسکرین شات توسط بارد

و در اینجا تلاش GPT-4 برای تکرار اسکرین شات است. نتیجه تعجب آور نیست، با توجه به اینکه GPT-4 از لحاظ تاریخی در کدنویسی قوی بوده است. ما قبلاً استفاده از GPT-4 را برای ساختن یک برنامه وب از ابتدا نشان داده‌ایم .

نتایج تکرار اسکرین شات توسط ChatGPT

ما از Gemini Pro خواستیم شعری در مورد تسلا (برند خودروهای الکتریکی) بسازد. این پیشرفت‌های جزئی را نسبت به آزمایش‌های قبلی که در گذشته انجام داده‌ایم نشان داد. نتیجه این است:

بارد در حال اجرا جمینی پرو شعری می نویسد
در این مرحله، ما فکر کردیم که مقایسه نتایج با GPT-3.5 به جای GPT-4 سوپرشارژ مناسب تر باشد. بنابراین، ما از ChatGPT که GPT-3.5 را اجرا می کند، درخواست کردیم تا شعری مشابه بسازد.
ChatGPT شعر می نویسد

ممکن است این یک انتخاب شخصی باشد، اما برداشت Gemini Pro در این مورد بهتر به نظر می رسد. اما ما به شما اجازه قضاوت می دهیم.

آیا Gemini بهتر از ChatGPT است؟

قبل از اینکه Google Bard را راه‌اندازی کند، فکر می‌کردیم که این رقابت ChatGPT است که منتظرش بودیم – اینطور نبود. اکنون، Gemini اینجاست، و تا کنون، Gemini Pro به نظر نمی‌رسد مدلی باشد که به ChatGPT ضربه ناک اوت بدهد.

گوگل می گوید Gemini Ultra بسیار بهتر خواهد بود. ما واقعاً امیدواریم که اینطور باشد و با ادعاهای مطرح شده در اعلامیه Gemini Ultra مطابقت داشته باشد یا از آن فراتر رود. اما تا زمانی که بهترین نسخه ابزار هوش مصنوعی مولد گوگل را نبینیم و آزمایش نکنیم، نمی‌دانیم که آیا این ابزار می‌تواند سایر رقبای مدل هوش مصنوعی را شکست دهد یا خیر. همانطور که مطرح می شود، GPT-4 قهرمان بی چون و چرای مدل هوش مصنوعی باقی می ماند.

منبع: MAKEUSEOF.COM