خانه توسعهدهنده تکنولوژی معرفی هوش مصنوعی گوگل Gemini (گوگل بارد سابق) – دانستنیها، کاربردها و نحوه استفاده
معرفی هوش مصنوعی گوگل Gemini (گوگل بارد سابق) – دانستنیها، کاربردها و نحوه استفاده
این روزها علاوه بر اینکه تمایل به آموزش یادگیری ماشین و هوش مصنوعی سر به فلک کشیده، شاهد از راه رسیدن انبوهی ابزار متکی بر این تکنولوژیها نیز هستیم که میتوانند زندگی را برای عموم مردم آسانتر کنند. یکی از این ابزارها، Google Gemini است که در واقع پاسخ گوگل به ChatGPT به حساب میآید، اما تفاوتهایی کوچک و بزرگ نیز با آن دارد. با گوگل جمینی میتوانید به تقریباً هر نیازی رسیدگی کنید، از برنامهریزی برای جشنهای تولد و تهیه پیشنویس ایمیلها گرفته تا دریافت پاسخ راجع به موضوعات پیچیده. در ادامه این مطلب با کوئرا بلاگ همراه باشید تا نگاهی جامع به هوش مصنوعی گوگل جمینی بیندازیم و هرآنچه لازم است راجع به آن بدانید را تشریح کنیم.
فهرست مطالب
Toggleهوش مصنوعی گوگل Gemini چیست؟
Google Gemini (که قبلا تحت عنوان Google Bard شناخته می شد)، یک ابزار چتبات (Chatbot) متکی بر هوش مصنوعی است که به کمک پردازش زبان طبیعی (Natural Language Processing) و یادگیری ماشین (Machine Learning)، مکالمات انسانی را شبیهسازی میکند. این هوش مصنوعی نهتنها نقش مکمل را برای جستجوگر گوگل ایفا میکند، بلکه میتوان به یکپارچهسازی آن با وبسایتها، پلتفرمهای پیامرسان و اپلیکیشنهای گوناگون پرداخت تا پاسخهایی طبیعی به سوالات کاربران ارائه کند.
نکته مهم اینکه Gemini تنها یک ابزار یا هوش مصنوعی نیست، بلکه از این نام برای توصیف مجموعهای از مدلهای هوش مصنوعی مختلف استفاده میشود که قابلیت درک زبان انسانی، اصوات، کدها و ویدیوها را با خود به ارمغان میآورند.
نخستین ورژن از جمینی در ماه دسامبر ۲۰۲۳ از راه رسید و توسعه آن نیز برعهده تیم Google DeepMind بود که واحدی متمرکز بر تحقیق و توسعه هوشهای مصنوعی پیشرفته به حساب میآید. جمینی از همان لحظه عرضه، پیشرفتهترین «مدل زبانی بزرگ» (Large Language Model | LLM) گوگل بوده است که قابلیتهایی متنوع از خود به نمایش میگذارد. به عنوان مثال میتوان به درک و تشخیص تصاویر (و رسیدگی به وظایف پیچیده مانند درک نمودارها)، پشتیبانی از ۴۰ زبان مختلف (برای وظایف مربوط به ترجمه) و همینطور پاسخ دادن به جستارهای کاربران اشاره کرد.
برخلاف مدلهای هوش مصنوعی پیشین گوگل، جمینی ابزاری «چندوجهی» (Multimodal) به حساب میآید که یعنی میتواند با انواع داده (صدا، تصویر و متن) تعامل کند. برای مثال Gemini میتواند دستخط کاربران را تشکیل دهد و از اطلاعات موجود در نمودارها و دیاگرامها برای حل مسائل پیچیده کمک بگیرد.
هوش مصنوعی گوگل Gemini چطور کار میکند؟
درست مثل سایر چتباتهای امروزی، Gemini از اساس بهگونهای طراحی شده که «گفتگوگر» (Conversational) باشد. این یعنی کاربران میتوانند جستارها (یا به اصطلاح کوئریها) و درخواستهای خود را درون کادری متنی تایپ کنند و سپس Google Gemini با استفاده از ادبیاتی مشابه ادبیات انسانی، پاسخی جامع به آنها ارائه میدهد.
برای مثال میتوانید از گوگل Gemini بپرسید که: «تلسکوپ جیمز وب چه دستاوردهای جدیدی داشته که بتوانم آنها را به کودک ۹ سالهام توضیح دهم؟» و بعد از جمعآوری اطلاعات از سوی هوش مصنوعی، پاسخی در اختیارتان قرار میگیرد که برای کودکان قابل فهم خواهد بود. البته که هیچیک از چتباتهای امروزی دقتی ۱۰۰ درصدی ندارند و گاهی از اوقات، اطلاعات اشتباه یا دروغین را از سطح وب جمعآوری میکنند و در اختیار شما میگذارند. بنابراین تا جای ممکن باید به بررسی چندباره اطلاعات پرداخت و از صحت آنها اطمینان حاصل کرد.
ناگفته نماند که هنگام کار با Gemini نهتنها میتوان از تصاویر به عنوان فرمان یا پرامپت (Prompt) استفاده کرد، بلکه میتوان از آن خواست که در پاسخ پرامپتها تصویرسازی کند و یا انواع تصاویر و ویدیوهای موجود در سطح وب را بیابد.
آیا هوش مصنوعی گوگل Gemini رایگان است؟
گوگل هم یک نسخه رایگان از جمینی را در دسترس کاربران قرار داده و هم یک نسخه پولی. برای دسترسی به نسخه رایگان این هوش مصنوعی کافیست به سراغ وباپلیکیشن جمینی یا اپلیکیشن آن روی iOS و اندروید بروید. در این نسخه میتوانید منتظر دسترسی به تمام قابلیتهای بنیادین باشید:
- دسترسی به فرمانها یا پرامپتهای متنی و تولید محتوای متنی
- دسترسی به قابلیت آپلود و تولید تصویر
- دسترسی به قابلیت جستجو در میان اپلیکیشنها و سرویسهای گوگل
نسخه پولی نیز Gemini Advanced را با قابلیتهای پیشرفته در اختیارتان میگذارد:
- دسترسی به نسخه پیشرفتهتر هوش مصنوعی گوگل که برای وظایف پیچیدهتر طراحی شده
- امکان برقراری مکالمات طولانیتر
- امکان استفاده از جمینی در اپلیکیشنهای گوناگون گوگل مانند Gmail و Google Docs
- دسترسی به ۲ ترابایت فضای ذخیرهسازی ابری
کاربردهای هوش مصنوعی گوگل جمینی چیست؟
تواناییهای Google Gemini در گذر زمان افزایش مییابد، اما سازندگان آن میگویند که در غاییترین حالت، این چتبات برای «تولید متن»، «ترجمه به زبانهای گوناگون»، «نوشتن محتوای خلاقانه» و «پاسخ دادن به سوالات» طراحی شده، آن هم «به شکلی آموزنده». از سوی دیگر، میتوانید از این هوش مصنوعی برای نوشتن کد به زبانهای برنامهنویسی مختلف و یا ایرادیابی کدها نیز استفاده کنید.
هر زمان که از پاسخ دریافتی برای جستارها راضی نبودید، میتوانید به سراغ دکمهای به نام «Google It» بروید تا به جستجوگر گوگل هدایت شوید و اطلاعاتی هرچه بیشتر به دست آورید. گوگل میگوید این قابلیت برای اوقاتی طراحی شده که میخواهید اطلاعات دریافتی را صحتسنجی کنید. در واقع این شرکت بارها و بارها به کاربران اخطار داده که کاملاً بر پاسخهای Gemini متکی نباشند و حقایق را با جستجوی دستی بیابند. با درنظرگیری این مسائل، لازم است به Gemini به چشم ابزار مکملی نگاه کنید که بعد از جمعآوری اطلاعات ضروری، به شما در امور خلاقانه یاری میرساند.
اگر به دنبال پاسخی سرراستتر برای کاربردهای هوش مصنوعی گوگل جمینی میگردید، باید گفت که قابلیتها و تواناییهای چنین ابزارهایی به مراتب گستردهتر از آن است که بتوان تمامی آنها را فهرست کرد. اما مواردی که در پایین آوردهایم احتمالا به شما در درک ظرفیتهای Gemini کمک کنند:
- پاسخ دادن به سوالات، اما به شکلیتر سرراستتر و هدفمندتر نسبت به جستجوگر گوگل
- کمک به فرایند کدنویسی و تولید کد برای قسمتهای سادهتر پروژههای برنامهنویسی
- ایفای نقش معلم هنگام نیاز به یادگیری موضوعات تازه
- تولید ایمیل و پیامهای رسمی
- کمک به مشکلات منطقی
- ترجمه جملات و پاراگرافها از یک زبان به زبانی دیگر
- بهینهسازی متون به اشکال گوناگون
- گردآوری اطلاعات از منابع مختلف
- خلاصهنویسی مقالات و متون موجود در صفحات وب
- کمک به طوفان فکری و ایدهپردازی برای محتوا
- نوشتن توضیحات کوتاه و الهامبخش راجع به هر سوژهای
- مقایسه دادهها و پژوهشها در قالب نمودار
- ارائه پیشنهاد برای مقاصد گردشگری یا فعالیتهای ورزشی (همراه با تصویر)
به عنوان نکته نهایی باید گفت فارغ از اینکه با Google Gemini چه میکنید و چه اهدافی را در پیش میگیرید، لازم است در ارائه اطلاعات شخصی محتاط باشید. در گزارشها آمده که گوگل مکالمات خصوصی شما با Gemini را ذخیره میکند و بنابراین بهتر است به هیچ وجه اطلاعات حساس خود را در اختیار این هوش مصنوعی نگذارید.
- بیشتر بخوانید: 15 ابزار هوش مصنوعی که کیفیت عکس را بالا میبرند
چطور از هوش مصنوعی گوگل Gemini استفاده کنیم؟
اگرچه تا همین چند وقت پیش برای استفاده از Google Gemini باید در صف انتظار باقی میماندید، اما اکنون هرکسی میتواند در این سرویس ثبت نام و شروع به استفاده از آن کند. ضمنا Gemini در ۱۸۰ کشور جهان در دسترس قرار گرفته و از بیش از ۴۰ زبان (از جمله فارسی) پشتیبانی میکند. اگر با مطالعه بخشهای قبلی مقاله به استفاده از هوش مصنوعی جمینی علاقهمند شدهاید، در ادامه روش ثبت نام و استفاده از آن را آموزش دادهایم.
ثبت نام و آغاز به کار
- پیش از هرچیز به وبسایت Gemini.Google.com بروید. هر زمان که مایل به دسترسی به این ابزار باشید، باید از این آدرس اقدام کنید. البته به دلخواه خود میتوانید به سراغ اپلیکیشن Gemini در اندروید یا اپلیکیشن Google در iOS نیز بروید.
- روی دکمه Sign In کلیک کنید. در نظر داشته باشید که برای کار با گوگل جمینی به یک حساب گوگل نیاز دارید که پیشتر با آن، قانونی بودن سن خود را تایید کرده باشید.
- حالا نیاز به تایید قواعد استفاده از خدمات (Terms of Service) جمینی خواهید داشت. روی دکمه More کلیک کنید و در صفحه بعد، دکمه I Agree را فشار دهید.
- اکنون همهچیز برای کار با Gemini آماده است. صرفا دکمه Continue را فشار دهید تا به صفحه مکالمه با هوش مصنوعی گوگل هدایت شوید. از این لحظه به بعد، با ورود به آدرس Gemini.Google.com، مستقیما به همین صفحه مکالمه هدایت خواهید شد.
کار با گوگل جمینی
- زمانی که به گوگل جمینی دسترسی یافتید، میتوانید شروع به آزمون و خطا با تواناییهای آن کنید.
- با ورود به آدرس Gemini.Google.com مستقیما به ابزار هوش مصنوعی دسترسی پیدا میکنید.
- سوال یا جستار دلخواه خود را درون کادر متنی بنویسید و دکمه Enter را فشار دهید.
- حالا باید اندکی برای دریافت پاسخ هوش مصنوعی صبر کنید. بعد از دریافت پاسخ، میتوانید یا مکالمه را ادامه دهید و یا با کلیک روی نماد G، به جستجوگر گوگل هدایت شوید و جستجویی سنتیتر داشته باشید.
به همین سادگی کار به پایان میرسد و از این لحظه به بعد میتوانید بهرهوری خود را چه در محیط کار و چه در زندگی روزمره افزایش دهید.
محدودیتهای هوش مصنوعی گوگل جمینی چیست؟
جمینی مثل خیلی دیگر از ابزارهای هوش مصنوعی، معایب خاص خود را نیز دارد. این معایب میتوانند شما را به خطا بیندازند، از بهرهوری بکاهند و باعث شوند جمینی تنها برای برخی از وظایف شما مناسب باشند.
- بیدقتی گاه و بیگاه: جمینی ممکن است گاهی پاسخهایی اشتباه در اختیارتان بگذارد. در جهان هوش مصنوعی، به این موضوع «خیالپردازی» میگویند. با توجه به اینکه ابزارهای هوش مصنوعی دست به پیشبینیهای گوناگون میزنند، کاملا محتمل است برخی از پیشبینیها اشتباه از آب درآیند. تمام اینها بدان معناست که ابزارهایی مانند Gemini ممکن است حتی هنگام خلاصهسازی متنی که مستقیما از اینترنت به دست آمده هم اشتباه کنند. از سوی دیگر، منبع دریافت اطلاعات هم ممکن است غیرموثق باشد، بنابراین پیشنهاد میشود همیشه اطلاعات ضروری را خودتان نیز به صورت دستی جستجو و بررسی کنید. جمینی حتی ممکن است راجع به تواناییهای خود اشتباه کند. برای مثال ممکن است بگوید قادر به جستجو در سطح وب نیست، اما اگر جملهبندی فرمان خود را تغییر دهید، دقیقا همین کار را انجام خواهد داد.
- سوگیری: پاسخهای جمینی گاهی از اوقات پاسخهایی جهتگیرانه ارائه میکند. اکثر اوقات، این مشکل به خاطر کمبود اطلاعات آموزشی برای هوش مصنوعی رقم میخورد، مثلا زمانی که راجع به فرهنگها و کشورهای گوناگون سوال میپرسید. گاهی دیگر از اوقات هم سوگیریها ناشی از ایدهها، نظرات و کلیشههای موجود در دادههای آموزشی است. مثلا ممکن است جمینی راجع به دو نظر متقابل در سیاست جهانی، طرف یکی از آنها را بگیرد.
- خلاقیت محدود: اگرچه جمینی قادر به تولید محتوای خلاقانه است، اما تواناییهای بیشتری در رسیدگی به وظایف پژوهشی دارد. با توجه به اینکه گوگل بخش اعظمی از شهرت خود را مدیون جستجوگری است که تمام اطلاعات جهان را در اختیارتان میگذارد، منطقی است که هوش مصنوعی خود را بهگونهای بسازد که روی ارائه پاسخهای مستقیم و آگاهیبخش متمرکز باشد. اگر به دنبال وظایف خلاقانه باشید، باید فرمانهایی توصیفی و دقیق بنویسید و پاسخهای بعدی جمینی را بازتعریف کنید. اگر دائما به دنبال خروجیهای خلاقانه میگردید، احتمالا بهتر باشد به سراغ سایر ابزارهای هوش مصنوعی بروید.
گوگل Gemini یا ChatGPT؛ کدام یک بهتر است؟
از زمانی که هوش مصنوعی ChatGPT شرکت OpenAI در دسترس قرار گرفت، جایگاه خود را به عنوان برترین چتبات برای رسیدگی به هرکاری تثبیت کرد، از ایدهپردازی و ایمیلنویسی گرفته تا فرمولنویسی برای اکسل و ایرادیابی کدها. اما ChatGPT هم محدودیتهای خاص خود را دارد، برای مثال تنها مشترکان پولی میتوانند به مدلهای قدرتمندتر GPT-4 دسترسی پیدا کنند که قادر به مرور وب و تولید تصویر است.
جمینی از طرف دیگر بسیاری از همین وظایف را با سرعت بیشتری نسبت به ChatGPT انجام میدهد و قابلیتهای رایگان گستردهتری دارد. با این حال، در هر دو ابزار شاهد تواناییها و ویژگیهای گوناگونی هستیم که آنها را از یکدیگر متمایز میکنند. در ادامه، برخی از ویژگیهای هر دو ابزار را به صورت خلاصه بررسی میکنیم.
گوگل Gemini و ChatGPT در یک نگاه
در سادهترین حالت، هر دو هوش مصنوعی در دستهبندی «چتبات» قرار میگیرند و به کمک پردازش زبان طبیعی، به سوالات و درخواستهای شما پاسخ میدهند و مکالمات انسانی برقرار میکنند. اما شاهد وجود تمایزی کوچک و بزرگ نیز هستیم که عمدتا به خاطر تمرین دادن مدلها براساس دادههای متفاوت به وجود آمدهاند.
ChatGPT | Gemini | |
شرکت سازنده | OpenAI | |
مدل زبان | GPT-3.5 Turbo و GPT-4 | Gemini Pro |
منابع داده | ChatGPT با مجموعهای گسترده از متون – از جمله متون موجود ویکیپدیا، کتابها، مقالات، اسناد و محتوای موجود در سطح اینترنت تعلیم داده شده است. منابع موجود در مدل رایگان GPT-3.5 Turbo متعلق به پیش از سپتامبر ۲۰۲۱ هستند، اما کاربران ChatGPT Plus میتوانند از GPT-4 برای یافتن محتوای بهروز در سطح وب کمک بگیرند. | گوگل منابع و دادههای آموزشی جمینی را اعلام نکرده است، اما به احتمال فراوان این هوش مصنوعی هم با آرشیو سایتهای اینترنتی، دیتابیسهای تبدیل تصویر به متن و همینطور دادههای خصوصی گوگل تعلیم داده شده است. جمینی هم میتواند به شما در یافتن محتوای کاملا بهروز کمک کند. |
زبانهای پشتیبانیشده | بیش از ۹۵ زبان (از جمله فارسی) | بیش از ۴۰ زبان (از جمله فارسی) |
Pricing | رایگان و پولی (۲۰ دلار در ماه) | رایگان و پولی (۲۰ دلار در ماه) |
کدام هوش مصنوعی بهتر است؟
- بیشتر بخوانید: نقشه راه یادگیری هوش مصنوعی – در سال ۲۰۲۳ و برای مبتدیان
در نهایت مروری کوتاه بر مزایا و معایب هر هوش مصنوعی میاندازیم تا بهتر قادر به مقایسه هوش مصنوعی گوگل و OpenAI باشید.
مزایا و معایب Google Gemini
مزایا | معایب |
جمینی ابزاری موثرتر برای پژوهش است و نهتناه فهرستی از منابع مرتبط در اختیارتان میگذارد، بلکه قابلیت صحتسنجی پاسخها را هم در اختیارتان میگذارد. | جمینی میتواند پاسخهای خود را با صدای بلند بخواند، اما نمیتواند مکالمات رفت و برگشتی برقرار کند. |
جمینی اجازه میدهد از پاسخها (برای استفاده در گوگل داکس و جیمیل) خروجی یا اکسپورت بگیرید و مکالمات متنی یا تصویری خود را با دیگران به اشتراک بگذارید. | اگرچه جمینی به درخواست شما منابع و لینکهای منتهی به منابع را ارائه میکند، اما این منابع گاهی اوقات چندان موثق نیستند. |
جمینی با سرعت بیشتری در سطح وب جستجو میکند، تصاویر گوناگون را مییابد و تصویر میسازد. تمام این قابلیتها به رایگان در اختیار تمام کاربران قرار گرفتهاند. | یکپارچهسازی جمینی با اپلیکیشنهای روزمره و مورد استفاده، فرایندی دشوار برای کاربران عادی به حساب میآید. |
مزایا و معایب ChatGPT
مزایا | معایب |
ChatGPT در تولید متون – مانند مقالات طولانی و ایمیلها – مهارت بیشتری دارد و تصویرسازی هم میکند. | دسترسی به جستجوی وب و تولید تصویر تنها در اختیار کاربران اشتراک پولی ChatGPT Plus و اشتراک Enterprise قرار میگیرد. |
ChatPGT میتواند به تحلیل داده و دیگر وظایف مربوط به داده مشغول شود. | جستجو در سطح وب میتواند عملکردی ضعیف داشته باشد و با سرعت کمتری نسبت به جمینی انجام میشود. |
ChatGPT اجازه میدهد نسخههایی سفارشی از این هوش مصنوعی بسازید و آنها را برای مرور در وب، تولید تصویر با DALLE-3 و اجرای کد پیکربندی کنید. | ChatGPT اجازه نمیدهد مکالمات و تصاویر را با دیگران به اشتراک بگذارید و قابلیت ادامه دادن مکالمات از دفعه قبلی را در اختیار مردم نمیگذارد. |
ناگفته نماند که ChatGPT و Google Gemini یک ایراد مشترک نیز دارند: ارائه محتوا و پاسخهایی که به نظر موثق جلوه میکنند، اما حاوی اطلاعات دروغین یا اشتباه هستند. در مجموع باید گفت که هر دو ابزار مجموعهای از قابلیتهای بینظیر را در اختیار شما قرار میدهند و اینکه کدام هوش مصنوعی را برتر به حساب میآورید، بستگی به این دارد که میخواهید چه نیازهایی را برطرف کنید.
- بیشتر بخوانید: معرفی ۸ هوش مصنوعی چهره که شما را شگفت زده خواهند کرد
جمعبندی و پاسخ به سوالات متداول پیرامون هوش مصنوعی گوگل Gemini
اکنون که به پایان مطلب رسیدهایم، به خوبی از کاربردها و تواناییهای هوش مصنوعی گوگل جمینی باخبر هستید و میدانید که چطور باید به استفاده از این ابزار مشغول شد. بنابراین همین حالا دست به کار شوید و هر سوالی که دارید را از جمینی بپرسید. اما هیچوقت از یاد نبرید که گوگل جمینی و تمام ابزارهای مشابه، ۱۰۰ درصد دقیق نیستند و باید موثق بودن اطلاعات حساس را به صورت جداگانه بررسی کنید.
بله، گوگل جمینی از بیش از ۴۰ زبان مختلف پشتیبانی میکند که از جمله آنها میتوان به فارسی، انگلیسی، ژاپنی، کرهای، عربی، چینی، آلمانی، فرانسوی، ترکی و روسی اشاره کرد.
در حال حاضر که این مقاله نوشته میشود، Google Gemini یک نسخه رایگان و یک نسخه پولی دارد و در دسترس تمام کاربران در ۱۸۰ کشور جهان قرار گرفته است. گوگل ممولا سرویسهای خود را به صورت رایگان عرضه میکند، اما برای دسترسی به تمام قابلیتهای پیشرفته جمینی باید ماهانه ۲۰ دلار بپردازید.
منبع: Tom’s Guide و TechTarget و Google Gemini و Zapier