معرفی هوش مصنوعی گوگل Gemini (گوگل بارد سابق) – دانستنی‌ها، کاربردها و نحوه استفاده

2074
هوش مصنوعی گوگل Gemini

این روزها علاوه بر اینکه تمایل به آموزش یادگیری ماشین و هوش مصنوعی سر به فلک کشیده، شاهد از راه رسیدن انبوهی ابزار متکی بر این تکنولوژی‌ها نیز هستیم که می‌توانند زندگی را برای عموم مردم آسان‌تر کنند. یکی از این ابزارها، Google Gemini است که در واقع پاسخ گوگل به ChatGPT به حساب می‌آید، اما تفاوت‌هایی کوچک و بزرگ نیز با آن دارد. با گوگل جمینی می‌توانید به تقریباً هر نیازی رسیدگی کنید، از برنامه‌ریزی برای جشن‌های تولد و تهیه پیش‌نویس ایمیل‌ها گرفته تا دریافت پاسخ راجع به موضوعات پیچیده. در ادامه این مطلب با کوئرا بلاگ همراه باشید تا نگاهی جامع به هوش مصنوعی گوگل جمینی بیندازیم و هرآنچه لازم است راجع به آن بدانید را تشریح کنیم.

هوش مصنوعی گوگل Gemini چیست؟

Google Gemini (که قبلا تحت عنوان Google Bard شناخته می شد)، یک ابزار چت‌بات (Chatbot) متکی بر هوش مصنوعی است که به کمک پردازش زبان طبیعی (Natural Language Processing) و یادگیری ماشین (Machine Learning)، مکالمات انسانی را شبیه‌سازی می‌کند. این هوش مصنوعی نه‌تنها نقش مکمل را برای جستجوگر گوگل ایفا می‌کند، بلکه می‌توان به یکپارچه‌سازی آن با وب‌سایت‌ها، پلتفرم‌های پیام‌رسان و اپلیکیشن‌های گوناگون پرداخت تا پاسخ‌هایی طبیعی به سوالات کاربران ارائه کند.

هوش مصنوعی گوگل Gemini

نکته مهم اینکه Gemini تنها یک ابزار یا هوش مصنوعی نیست، بلکه از این نام برای توصیف مجموعه‌ای از مدل‌های هوش مصنوعی مختلف استفاده می‌شود که قابلیت درک زبان انسانی، اصوات، کدها و ویدیوها را با خود به ارمغان می‌آورند.

نخستین ورژن از جمینی در ماه دسامبر ۲۰۲۳ از راه رسید و توسعه آن نیز برعهده تیم Google DeepMind بود که واحدی متمرکز بر تحقیق و توسعه هوش‌های مصنوعی پیشرفته به حساب می‌آید. جمینی از همان لحظه عرضه، پیشرفته‌ترین «مدل زبانی بزرگ» (Large Language Model | LLM) گوگل بوده است که قابلیت‌هایی متنوع از خود به نمایش می‌گذارد. به عنوان مثال می‌توان به درک و تشخیص تصاویر (و رسیدگی به وظایف پیچیده مانند درک نمودارها)، پشتیبانی از ۴۰ زبان مختلف (برای وظایف مربوط به ترجمه) و همینطور پاسخ دادن به جستارهای کاربران اشاره کرد.

برخلاف مدل‌های هوش مصنوعی پیشین گوگل، جمینی ابزاری «چندوجهی» (Multimodal) به حساب می‌آید که یعنی می‌تواند با انواع داده (صدا، تصویر و متن) تعامل کند. برای مثال Gemini می‌تواند دست‌خط کاربران را تشکیل دهد و از اطلاعات موجود در نمودارها و دیاگرام‌ها برای حل مسائل پیچیده کمک بگیرد.

هوش مصنوعی گوگل Gemini چطور کار می‌کند؟

درست مثل سایر چت‌بات‌های امروزی، Gemini از اساس به‌گونه‌ای طراحی شده که «گفتگوگر» (Conversational) باشد. این یعنی کاربران می‌توانند جستارها (یا به اصطلاح کوئری‌ها) و درخواست‌های خود را درون کادری متنی تایپ کنند و سپس Google Gemini با استفاده از ادبیاتی مشابه ادبیات انسانی، پاسخی جامع به آن‌ها ارائه می‌دهد.

Google Gemini AI

برای مثال می‌توانید از گوگل Gemini بپرسید که: «تلسکوپ جیمز وب چه دستاوردهای جدیدی داشته که بتوانم آن‌ها را به کودک ۹ ساله‌ام توضیح دهم؟» و بعد از جمع‌آوری اطلاعات از سوی هوش مصنوعی، پاسخی در اختیارتان قرار می‌گیرد که برای کودکان قابل فهم خواهد بود. البته که هیچ‌یک از چت‌بات‌های امروزی دقتی ۱۰۰ درصدی ندارند و گاهی از اوقات، اطلاعات اشتباه یا دروغین را از سطح وب جمع‌آوری می‌کنند و در اختیار شما می‌گذارند. بنابراین تا جای ممکن باید به بررسی چندباره اطلاعات پرداخت و از صحت آن‌ها اطمینان حاصل کرد.

ناگفته نماند که هنگام کار با Gemini نه‌تنها می‌توان از تصاویر به عنوان فرمان یا پرامپت (Prompt) استفاده کرد، بلکه می‌توان از آن خواست که در پاسخ پرامپت‌ها تصویرسازی کند و یا انواع تصاویر و ویدیوهای موجود در سطح وب را بیابد.

آیا هوش مصنوعی گوگل Gemini رایگان است؟

گوگل هم یک نسخه رایگان از جمینی را در دسترس کاربران قرار داده و هم یک نسخه پولی. برای دسترسی به نسخه رایگان این هوش مصنوعی کافی‌ست به سراغ وب‌اپلیکیشن جمینی یا اپلیکیشن آن روی iOS و اندروید بروید. در این نسخه می‌توانید منتظر دسترسی به تمام قابلیت‌های بنیادین باشید:

  • دسترسی به فرمان‌ها یا پرامپت‌های متنی و تولید محتوای متنی
  • دسترسی به قابلیت آپلود و تولید تصویر
  • دسترسی به قابلیت جستجو در میان اپلیکیشن‌ها و سرویس‌های گوگل

نسخه پولی نیز Gemini Advanced را با قابلیت‌های پیشرفته در اختیارتان می‌گذارد:

  • دسترسی به نسخه پیشرفته‌تر هوش مصنوعی گوگل که برای وظایف پیچیده‌تر طراحی شده
  • امکان برقراری مکالمات طولانی‌تر
  • امکان استفاده از جمینی در اپلیکیشن‌های گوناگون گوگل مانند Gmail و Google Docs
  • دسترسی به ۲ ترابایت فضای ذخیره‌سازی ابری

کاربردهای هوش مصنوعی گوگل جمینی چیست؟

توانایی‌های Google Gemini در گذر زمان افزایش می‌یابد، اما سازندگان آن می‌گویند که در غایی‌ترین حالت، این چت‌بات برای «تولید متن»، «ترجمه به زبان‌های گوناگون»، «نوشتن محتوای خلاقانه» و «پاسخ دادن به سوالات» طراحی شده، آن هم «به شکلی آموزنده». از سوی دیگر، می‌توانید از این هوش مصنوعی برای نوشتن کد به زبان‌های برنامه‌نویسی مختلف و یا ایرادیابی کدها نیز استفاده کنید.

هر زمان که از پاسخ دریافتی برای جستارها راضی نبودید، می‌توانید به سراغ دکمه‌ای به نام «Google It» بروید تا به جستجوگر گوگل هدایت شوید و اطلاعاتی هرچه بیشتر به دست آورید. گوگل می‌گوید این قابلیت برای اوقاتی طراحی شده که می‌خواهید اطلاعات دریافتی را صحت‌سنجی کنید. در واقع این شرکت بارها و بارها به کاربران اخطار داده که کاملاً بر پاسخ‌های Gemini متکی نباشند و حقایق را با جستجوی دستی بیابند. با درنظرگیری این مسائل، لازم است به Gemini به چشم ابزار مکملی نگاه کنید که بعد از جمع‌آوری اطلاعات ضروری، به شما در امور خلاقانه یاری می‌رساند.

هوش مصنوعی گوگل Gemini

اگر به دنبال پاسخی سرراست‌تر برای کاربردهای هوش مصنوعی گوگل جمینی می‌گردید، باید گفت که قابلیت‌ها و توانایی‌های چنین ابزارهایی به مراتب گسترده‌تر از آن است که بتوان تمامی آن‌ها را فهرست کرد. اما مواردی که در پایین آورده‌ایم احتمالا به شما در درک ظرفیت‌های Gemini کمک کنند:

  • پاسخ دادن به سوالات، اما به شکلی‌تر سرراست‌تر و هدفمندتر نسبت به جستجوگر گوگل
  • کمک به فرایند کدنویسی و تولید کد برای قسمت‌های ساده‌تر پروژه‌های برنامه‌نویسی
  • ایفای نقش معلم هنگام نیاز به یادگیری موضوعات تازه
  • تولید ایمیل و پیام‌های رسمی
  • کمک به مشکلات منطقی
  • ترجمه جملات و پاراگراف‌ها از یک زبان به زبانی دیگر
  • بهینه‌سازی متون به اشکال گوناگون
  • گردآوری اطلاعات از منابع مختلف
  • خلاصه‌نویسی مقالات و متون موجود در صفحات وب
  • کمک به طوفان فکری و ایده‌پردازی برای محتوا
  • نوشتن توضیحات کوتاه و الهام‌بخش راجع به هر سوژه‌ای
  • مقایسه داده‌ها و پژوهش‌ها در قالب نمودار
  • ارائه پیشنهاد برای مقاصد گردشگری یا فعالیت‌های ورزشی (همراه با تصویر)

به عنوان نکته نهایی باید گفت فارغ از اینکه با Google Gemini چه می‌کنید و چه اهدافی را در پیش می‌گیرید، لازم است در ارائه اطلاعات شخصی محتاط باشید. در گزارش‌ها آمده که گوگل مکالمات خصوصی شما با Gemini را ذخیره می‌کند و بنابراین بهتر است به هیچ وجه اطلاعات حساس خود را در اختیار این هوش مصنوعی نگذارید.

چطور از هوش مصنوعی گوگل Gemini استفاده کنیم؟

اگرچه تا همین چند وقت پیش برای استفاده از Google Gemini باید در صف انتظار باقی می‌ماندید، اما اکنون هرکسی می‌تواند در این سرویس ثبت نام و شروع به استفاده از آن کند. ضمنا Gemini در ۱۸۰ کشور جهان در دسترس قرار گرفته و از بیش از ۴۰ زبان (از جمله فارسی) پشتیبانی می‌کند. اگر با مطالعه بخش‌های قبلی مقاله به استفاده از هوش مصنوعی جمینی علاقه‌مند شده‌اید، در ادامه روش ثبت نام و استفاده از آن را آموزش داده‌ایم.

ثبت نام و آغاز به کار

  • پیش از هرچیز به وب‌سایت Gemini.Google.com بروید. هر زمان که مایل به دسترسی به این ابزار باشید، باید از این آدرس اقدام کنید. البته به دلخواه خود می‌توانید به سراغ اپلیکیشن Gemini در اندروید یا اپلیکیشن Google در iOS نیز بروید.
  • روی دکمه Sign In کلیک کنید. در نظر داشته باشید که برای کار با گوگل جمینی به یک حساب گوگل نیاز دارید که پیش‌تر با آن، قانونی بودن سن خود را تایید کرده باشید.
هوش مصنوعی گوگل Gemini
  • حالا نیاز به تایید قواعد استفاده از خدمات (Terms of Service) جمینی خواهید داشت. روی دکمه More کلیک کنید و در صفحه بعد، دکمه I Agree را فشار دهید.
پذیرش قوانین
  • اکنون همه‌چیز برای کار با Gemini آماده است. صرفا دکمه Continue را فشار دهید تا به صفحه مکالمه با هوش مصنوعی گوگل هدایت شوید. از این لحظه به بعد، با ورود به آدرس Gemini.Google.com، مستقیما به همین صفحه مکالمه هدایت خواهید شد.
هوش مصنوعی گوگل Gemini

کار با گوگل جمینی

  • زمانی که به گوگل جمینی دسترسی یافتید، می‌توانید شروع به آزمون و خطا با توانایی‌های آن کنید.
مراجعه به سرویس Gemini
  • با ورود به آدرس Gemini.Google.com مستقیما به ابزار هوش مصنوعی دسترسی پیدا می‌کنید.
هوش مصنوعی گوگل Gemini
  • سوال یا جستار دلخواه خود را درون کادر متنی بنویسید و دکمه Enter را فشار دهید.
دریافت پاسخ از Gemini AI
  • حالا باید اندکی برای دریافت پاسخ هوش مصنوعی صبر کنید. بعد از دریافت پاسخ، می‌توانید یا مکالمه را ادامه دهید و یا با کلیک روی نماد G، به جستجوگر گوگل هدایت شوید و جستجویی سنتی‌تر داشته باشید.

به همین سادگی کار به پایان می‌رسد و از این لحظه به بعد می‌توانید بهره‌وری خود را چه در محیط کار و چه در زندگی روزمره افزایش دهید.

محدودیت‌های هوش مصنوعی گوگل جمینی چیست؟

جمینی مثل خیلی دیگر از ابزارهای هوش مصنوعی، معایب خاص خود را نیز دارد. این معایب می‌توانند شما را به خطا بیندازند، از بهره‌وری بکاهند و باعث شوند جمینی تنها برای برخی از وظایف شما مناسب باشند.

  • بی‌دقتی گاه و بی‌گاه: جمینی ممکن است گاهی پاسخ‌هایی اشتباه در اختیارتان بگذارد. در جهان هوش مصنوعی، به این موضوع «خیال‌پردازی» می‌گویند. با توجه به اینکه ابزارهای هوش مصنوعی دست به پیش‌بینی‌های گوناگون می‌زنند، کاملا محتمل است برخی از پیش‌بینی‌ها اشتباه از آب درآیند. تمام این‌ها بدان معناست که ابزارهایی مانند Gemini ممکن است حتی هنگام خلاصه‌‌سازی متنی که مستقیما از اینترنت به دست آمده هم اشتباه کنند. از سوی دیگر، منبع دریافت اطلاعات هم ممکن است غیرموثق باشد، بنابراین پیشنهاد می‌شود همیشه اطلاعات ضروری را خودتان نیز به صورت دستی جستجو و بررسی کنید. جمینی حتی ممکن است راجع به توانایی‌های خود اشتباه کند. برای مثال ممکن است بگوید قادر به جستجو در سطح وب نیست، اما اگر جمله‌بندی فرمان خود را تغییر دهید، دقیقا همین کار را انجام خواهد داد.
  • سوگیری: پاسخ‌های جمینی گاهی از اوقات پاسخ‌هایی جهت‌گیرانه ارائه می‌کند. اکثر اوقات، این مشکل به خاطر کمبود اطلاعات آموزشی برای هوش مصنوعی رقم می‌خورد، مثلا زمانی که راجع به فرهنگ‌ها و کشورهای گوناگون سوال می‌پرسید. گاهی دیگر از اوقات هم سوگیری‌ها ناشی از ایده‌ها، نظرات و کلیشه‌های موجود در داده‌های آموزشی است. مثلا ممکن است جمینی راجع به دو نظر متقابل در سیاست جهانی، طرف یکی از آن‌ها را بگیرد. 
  • خلاقیت محدود: اگرچه جمینی قادر به تولید محتوای خلاقانه است، اما توانایی‌های بیشتری در رسیدگی به وظایف پژوهشی دارد. با توجه به اینکه گوگل بخش اعظمی از شهرت خود را مدیون جستجوگری است که تمام اطلاعات جهان را در اختیارتان می‌گذارد، منطقی است که هوش مصنوعی خود را به‌گونه‌ای بسازد که روی ارائه پاسخ‌های مستقیم و آگاهی‌بخش متمرکز باشد. اگر به دنبال وظایف خلاقانه باشید، باید فرمان‌هایی توصیفی و دقیق بنویسید و پاسخ‌های بعدی جمینی را بازتعریف کنید. اگر دائما به دنبال خروجی‌های خلاقانه می‌گردید، احتمالا بهتر باشد به سراغ سایر ابزارهای هوش مصنوعی بروید.

گوگل Gemini یا ChatGPT؛ کدام یک بهتر است؟

از زمانی که هوش مصنوعی ChatGPT شرکت OpenAI در دسترس قرار گرفت، جایگاه خود را به عنوان برترین چت‌بات برای رسیدگی به هرکاری تثبیت کرد، از ایده‌پردازی و ایمیل‌نویسی گرفته تا فرمول‌نویسی برای اکسل و ایرادیابی کدها. اما ChatGPT هم محدودیت‌های خاص خود را دارد، برای مثال تنها مشترکان پولی می‌توانند به مدل‌های قدرتمندتر GPT-4 دسترسی پیدا کنند که قادر به مرور وب و تولید تصویر است.

جمینی از طرف دیگر بسیاری از همین وظایف را با سرعت بیشتری نسبت به ChatGPT انجام می‌دهد و قابلیت‌های رایگان گسترده‌تری دارد. با این حال، در هر دو ابزار شاهد توانایی‌ها و ویژگی‌های گوناگونی هستیم که آن‌ها را از یکدیگر متمایز می‌کنند. در ادامه، برخی از ویژگی‌های هر دو ابزار را به صورت خلاصه بررسی می‌کنیم.

مقایسه Google Gemini و ChatGPT

گوگل Gemini و ChatGPT در یک نگاه

در ساده‌ترین حالت، هر دو هوش مصنوعی در دسته‌بندی «چت‌بات‌» قرار می‌گیرند و به کمک پردازش زبان طبیعی، به سوالات و درخواست‌های شما پاسخ می‌دهند و مکالمات انسانی برقرار می‌کنند. اما شاهد وجود تمایزی کوچک و بزرگ نیز هستیم که عمدتا به خاطر تمرین دادن مدل‌ها براساس داده‌های متفاوت به وجود آمده‌اند.

ChatGPTGemini
شرکت سازندهOpenAIGoogle
مدل زبانGPT-3.5 Turbo و GPT-4Gemini Pro
منابع دادهChatGPT با مجموعه‌ای گسترده از متون – از جمله متون موجود ویکیپدیا، کتاب‌ها، مقالات، اسناد و محتوای موجود در سطح اینترنت تعلیم داده شده است. منابع موجود در مدل رایگان GPT-3.5 Turbo متعلق به پیش از سپتامبر ۲۰۲۱ هستند، اما کاربران ChatGPT Plus می‌توانند از GPT-4 برای یافتن محتوای به‌روز در سطح وب کمک بگیرند. گوگل منابع و داده‌های آموزشی جمینی را اعلام نکرده است، اما به احتمال فراوان این هوش مصنوعی هم با آرشیو سایت‌های اینترنتی، دیتابیس‌های تبدیل تصویر به متن و همینطور داده‌های خصوصی گوگل تعلیم داده شده است. جمینی هم می‌تواند به شما در یافتن محتوای کاملا به‌روز کمک کند.
زبان‌های پشتیبانی‌شدهبیش از ۹۵ زبان (از جمله فارسی)بیش از ۴۰ زبان (از جمله فارسی)
Pricingرایگان و پولی (۲۰ دلار در ماه)رایگان و پولی (۲۰ دلار در ماه)

کدام هوش مصنوعی بهتر است؟

در نهایت مروری کوتاه بر مزایا و معایب هر هوش مصنوعی می‌اندازیم تا بهتر قادر به مقایسه هوش مصنوعی گوگل و OpenAI باشید.

مزایا و معایب Google Gemini

مزایامعایب
جمینی ابزاری موثرتر برای پژوهش است و نه‌تناه فهرستی از منابع مرتبط در اختیارتان می‌گذارد، بلکه قابلیت صحت‌سنجی پاسخ‌ها را هم در اختیارتان می‌گذارد. جمینی می‌تواند پاسخ‌های خود را با صدای بلند بخواند، اما نمی‌تواند مکالمات رفت و برگشتی برقرار کند.
جمینی اجازه می‌دهد از پاسخ‌ها (برای استفاده در گوگل داکس و جیمیل) خروجی یا اکسپورت بگیرید و مکالمات متنی یا تصویری خود را با دیگران به اشتراک بگذارید. اگرچه جمینی به درخواست شما منابع و لینک‌های منتهی به منابع را ارائه می‌کند، اما این منابع گاهی اوقات چندان موثق نیستند.
جمینی با سرعت بیشتری در سطح وب جستجو می‌کند، تصاویر گوناگون را می‌یابد و تصویر می‌سازد. تمام این قابلیت‌ها به رایگان در اختیار تمام کاربران قرار گرفته‌اند. یکپارچه‌سازی جمینی با اپلیکیشن‌های روزمره و مورد استفاده، فرایندی دشوار برای کاربران عادی به حساب می‌آید.

مزایا و معایب ChatGPT

مزایامعایب
ChatGPT در تولید متون – مانند مقالات طولانی‌ و ایمیل‌ها – مهارت بیشتری دارد و تصویرسازی هم می‌کند. دسترسی به جستجوی وب و تولید تصویر تنها در اختیار کاربران اشتراک پولی ChatGPT Plus و اشتراک Enterprise قرار می‌گیرد.
ChatPGT می‌تواند به تحلیل داده و دیگر وظایف مربوط به داده مشغول شود. جستجو در سطح وب می‌تواند عملکردی ضعیف داشته باشد و با سرعت کمتری نسبت به جمینی انجام می‌شود.
ChatGPT اجازه می‌دهد نسخه‌هایی سفارشی از این هوش مصنوعی بسازید و آن‌ها را برای مرور در وب، تولید تصویر با DALLE-3 و اجرای کد پیکربندی کنید. ChatGPT اجازه نمی‌دهد مکالمات و تصاویر را با دیگران به اشتراک بگذارید و قابلیت ادامه دادن مکالمات از دفعه قبلی را در اختیار مردم نمی‌گذارد.

ناگفته نماند که ChatGPT و Google Gemini یک ایراد مشترک نیز دارند: ارائه محتوا و پاسخ‌هایی که به نظر موثق جلوه می‌کنند، اما حاوی اطلاعات دروغین یا اشتباه هستند. در مجموع باید گفت که هر دو ابزار مجموعه‌ای از قابلیت‌های بی‌نظیر را در اختیار شما قرار می‌دهند و اینکه کدام هوش مصنوعی را برتر به حساب می‌آورید، بستگی به این دارد که می‌خواهید چه نیازهایی را برطرف کنید.

هوش مصنوعی گوگل Gemini

جمع‌بندی و پاسخ به سوالات متداول پیرامون هوش مصنوعی گوگل Gemini

اکنون که به پایان مطلب رسیده‌ایم، به خوبی از کاربردها و توانایی‌های هوش مصنوعی گوگل جمینی باخبر هستید و می‌دانید که چطور باید به استفاده از این ابزار مشغول شد. بنابراین همین حالا دست به کار شوید و هر سوالی که دارید را از جمینی بپرسید. اما هیچوقت از یاد نبرید که گوگل جمینی و تمام ابزارهای مشابه، ۱۰۰ درصد دقیق نیستند و باید موثق بودن اطلاعات حساس را به صورت جداگانه بررسی کنید.

آیا گوگل جمینی از زبان فارسی پشتیبانی می‌کند؟

بله، گوگل جمینی از بیش از ۴۰ زبان مختلف پشتیبانی می‌کند که از جمله آن‌ها می‌توان به فارسی، انگلیسی، ژاپنی، کره‌ای، عربی، چینی، آلمانی، فرانسوی، ترکی و روسی اشاره کرد.

آیا گوگل جمینی رایگان است؟

در حال حاضر که این مقاله نوشته می‌شود، Google Gemini یک نسخه رایگان و یک نسخه پولی دارد و در دسترس تمام کاربران در ۱۸۰ کشور جهان قرار گرفته است. گوگل ممولا سرویس‌های خود را به صورت رایگان عرضه می‌کند، اما برای دسترسی به تمام قابلیت‌های پیشرفته جمینی باید ماهانه ۲۰ دلار بپردازید.

منبع: Tom’s Guide و TechTarget و Google Gemini و Zapier

آموزش برنامه نویسی با کوئرا کالج
شایان ضیایی

اشتراک در
اطلاع از
guest

0 دیدگاه‌
قدیمی‌ترین
تازه‌ترین بیشترین واکنش
بازخورد (Feedback) های اینلاین
View all comments