نسل جدیدی از هوش مصنوعی با جمنای ۳

معرفی جمنای3

مدل هوش مصنوعی جمنای ۳ (Gemini 3) که کاربران فارسی‌زبان آن را بیشتر با نام‌های «جمینی» می‌شناسند، یکی از مهم‌ترین گام‌های جمنای گوگل در مسیر توسعه مدل‌های هوش مصنوعی است. این نسخه تازه با تمرکز بر استدلال دقیق‌تر، درک پیشرفته‌تر محتوای چندرسانه‌ای و توانایی عمل به‌عنوان یک Agent، تجربه‌ای متفاوت‌تر از نسل‌های قبلی ارائه می‌دهد.

هوش مصنوعی جمنای گوگل حاصل تقریباً دو سال توسعه مداوم روی نسخه‌های پیشین این خانواده است. هر نسخه قبلی قابلیت‌هایی تازه به مجموعه اضافه می‌کرد و اکنون این مدل جدید، آن توانایی‌ها را کنار هم قرار داده تا یک تصویر قدرتمند، یکپارچه و پخته‌تر از هوش مصنوعی ارائه دهد.

در این نسخه، مدل تنها «بهتر نمی‌فهمد»؛ بلکه عمیق‌تر تحلیل می‌کند، الگوهای پیچیده‌تری را تشخیص می‌دهد و می‌تواند محتوای طولانی و چندوجهی را با دقتی نزدیک‌تر به استانداردهای AGI پردازش کند. فعال‌شدن جمنای گوگل در سرویس‌های اصلی گوگل نیز نشان می‌دهد که این مدل قرار است نقشی مهم در تجربه روزمره کاربران و ابزارهای توسعه‌دهندگان داشته باشد.

معرفی جمنای ۳: هوشمندترین عضو خانواده Gemini

جمنای ۳ با هدف باز تعریف استانداردهای مدل‌های بزرگ زبانی طراحی شده است. نسخه Pro اکنون در بسیاری از سرویس‌های گوگل فعال می‌باشد و نسخه تخصصی‌تر آن یعنی Gemini 3 Deep Think نیز برای تحلیل‌های عمیق‌تر معرفی شده است. حضور این دو مدل در ابزارهایی مثل AI Studio، Vertex AI و پلتفرم توسعه‌عاملانه جدید گوگل یعنی Google Antigravity نشان می‌دهد که گوگل تلاش دارد تجربه کاربران را از «پرسش و پاسخ ساده» به «همکاری و ساخت» ارتقا دهد.

تمرکز این نسل روی چند محور اصلی بوده است:

  • افزایش عمق استدلال
  • درک قوی‌تر محتوای چندرسانه‌ای
  • برنامه‌ریزی دقیق‌تر
  • و ارائه پاسخ‌های هدفمندتر، کوتاه‌تر و قابل‌استفاده‌تر.

این تغییرات باعث شده هوش مصنوعی جمنای گوگل در نقش یک «کمک‌فکر» واقعی ظاهر شود؛ ابزاری که می‌تواند در یادگیری، تولید محتوا، تحلیل‌های تخصصی و حتی توسعه نرم‌افزار همراه کاربر باشد.

استدلال پیشرفته با عمق و ظرافت بیشتر

نسخه هوش مصنوعی جمنای ۳ پرو در بخش استدلال پیشرفت چشمگیری داشته و نتایج آن در آزمون‌های رسمی نیز این موضوع را تأیید می‌کند. گوگل در این نسل تلاش کرده تا توان تحلیل چندمرحله‌ای، تشخیص الگوهای پیچیده و درک جزئیات پنهان را تقویت کند؛ مواردی که پیش‌تر برای مدل‌های زبانی به‌سادگی قابل انجام نبود یا با خطای بالا همراه بود.

نتایج نشان می‌دهد که هوش مصنوعی جمنای گوگل موفق شده در یکی از مهم‌ترین معیارهای جهانی یعنی LMArena Leaderboard امتیاز ۱۵۰۱ Elo را به‌دست آورد؛ رقمی که آن را در رتبه اول این فهرست قرار می‌دهد. این عدد فقط یک رکورد نیست؛ بلکه نشان می‌دهد مدل در مواجهه با مسائل منطقی، معادلات چندمرحله‌ای و پرسش‌های طولانی، دقیق‌تر و سریع‌تر عمل می‌کند.

در آزمون Last Human Test که سطح حل مسئله مدل‌ها را با معیارهای انسانی می‌سنجد، نسخه Pro بدون استفاده از ابزارهای کمکی به دقت ۳۷/۵ درصد رسیده است.

آزمون GPQA Diamond نیز همین روند را تأیید می‌کند؛ جایی که جمنای ۳ توانسته به ۹۱/۹ درصد برسد و نشان دهد در تحلیل مفاهیم علمی، دقت بیشتری نسبت به قبل دارد.

این پیشرفت‌ها باعث شده جمنای ۳ در بسیاری از مسائل پیچیده، از تحلیل‌های علمی گرفته تا حل مسائل ریاضی پیشرفته، رفتاری شبیه به یک «همکار فکری» داشته باشد. پاسخ‌ها اکنون کوتاه‌تر، دقیق‌تر و هدفمندتر هستند و از توضیحات غیرضروری و گسترده پرهیز می‌شود؛ موضوعی که در نسخه‌های قبلی کمتر دیده می‌شد.

ارتقای عملکرد در ریاضیات و علوم تخصصی

در حوزه ریاضیات پیشرفته، جمنای ۳ پرو عملکرد قابل توجهی داشته است. این مدل توانسته در معیار MathArena Apex امتیاز ۲۳/۴ درصد را ثبت کند؛ معیاری که تمرکزش روی مسئله‌های چندمرحله‌ای و پرسش‌هایی است که نیازمند استدلال نمادین و محاسبات دقیق هستند.

این بهبود نشان می‌دهد جمنای ۳ فقط در حد یک مدل زبانی بهتر نشده، بلکه در برخورد با داده‌های محاسباتی، دقت بیشتری دارد و خطاهای کمتری تولید می‌کند. همین موضوع آن را برای محیط‌های پژوهشی، آموزش عالی و حتی توسعه الگوریتم‌های تخصصی جذاب‌تر کرده است.

فراتر از متن: چندوجهی در سطحی بالاتر

نسخه جدید جمینی در بخش چندوجهی (Multimodal) نیز جهشی جدی داشته است. در آزمون MMMU-Pro امتیاز ۸۱ درصد به‌دست آورده و در نسخه ویدئویی همین معیار یعنی Video-MMMU نیز عملکرد آن به ۸۷/۶ درصد رسیده است.

این نتایج نشان می‌دهد هوش مصنوعی جمنای ۳ فقط «تشخیص تصویر» یا «توصیف ویدئو» انجام نمی‌دهد؛ بلکه بین اجزای مختلف اطلاعات ارتباط برقرار می‌کند. به‌عنوان مثال در یک ویدئو فقط روایت نمی‌کند؛ بلکه رفتارها، حرکت‌ها، اشیا و ارتباط میان صحنه‌ها را هم تحلیل می‌کند.

این سطح از درک چندرسانه‌ای، مدل را برای حوزه‌هایی مانند:آموزش تصویری، تحلیل داده‌های پزشکی، بررسی ویدئوهای امنیتی و تولید محتوای چندرسانه‌ای بسیار ارزشمند می‌کند.

در بخش «دانش واقعی و داده‌های factual» نیز پیشرفت قابل توجهی دیده می‌شود. جمنای ۳ در معیار SimpleQA Verified امتیاز ۷۲/۱ درصد کسب کرده که نشان‌دهنده افزایش دقت پاسخ‌ها در موضوعات واقعی است.

مجموع این قابلیت‌ها نشان می‌دهد هوش مصنوعی جمنای یک قدم دیگر فاصله بین «تحلیل انسانی» و «تحلیل ماشینی» را کم کرده است. این نسخه نه‌تنها متن را بهتر می‌خواند، بلکه تصویر و ویدئو را هم با درک بافت، محتوا و ارتباطات درونی تحلیل می‌کند؛ قابلیتی که برای بسیاری از صنایع کاربری کاملاً عملی دارد.

Gemini 3 می‌تواند یک تصویرسازی از جریان پلاسما در یک توکامک برنامه‌نویسی کند و همچنین شعری بنویسد که فیزیک همجوشی را به‌صورت هنرمندانه توصیف کند.

جمینی ۳ دیپ تینک؛ یک سطح بالاتر در استدلال

در کنار نسخه Pro، گوگل مدل دیگری از این نسل را با نام Gemini 3 Deep Think معرفی کرده است؛ نسخه‌ای که تمرکز اصلی آن بر استدلال مرحله‌به‌مرحله و تحلیل‌های پیچیده‌تر است. هدف گوگل از توسعه این نسخه، نزدیک‌تر شدن به شیوه‌ای است که انسان‌ها مسائل دشوار را بررسی می‌کنند؛ یعنی دقت در جزئیات، کشف الگوهای پنهان و رسیدن به پاسخی که نه فقط یک خروجی سریع بلکه پشتوانه منطقی دارد.

نتایج اولیه نیز این رویکرد را تأیید می‌کند. در آزمون Last Human Test، نسخه Deep Think بدون استفاده از ابزار به دقت ۴۱ درصد رسیده، رقمی که برای مدلی در این نسل قابل توجه است.

در آزمون تخصصی GPQA Diamond نیز این نسخه به ۹۳/۸ درصد دست یافته است؛ معیاری که سطح سختی آن نزدیک به تحلیل مسائل علمی و پژوهشی است. این عملکرد نشان می‌دهد Deep Think در مواجهه با پرسش‌های علمی یا مسئله‌های چندمرحله‌ای، توانایی بیشتری برای استدلال دقیق و معتبر دارد.

اما شاید مهم‌ترین معیار برای Deep Think، ARC-AGI-2 باشد؛ آزمونی که مدل‌ها را در حل مسائل کاملًا جدید می‌سنجد، مسائلی که قبلاً شبیه آن را ندیده‌اند. در این آزمون، Deep Think امتیاز ۴۵/۱ درصد کسب کرده که برای یک مدل زبانی جهشی مهم به‌حساب می‌آید. این یعنی:

  • این مدل فقط «خلاصه نمی‌کند»
  • تنها «پاسخ از قبل دیده‌شده» تولید نمی‌کند
  • بلکه بر اساس داده‌های تازه، راه‌حل‌های جدید و مبتنی بر منطق می‌سازد

این دقیقاً همان نقطه‌ای است که فاصله میان «پاسخ‌محور بودن» و «تحلیل‌محور بودن» را مشخص می‌کند.

در مجموع، روند عملکرد Deep Think نشان می‌دهد گوگل با این نسخه قصد دارد مرز توانایی مدل‌های زبانی را از سطح پاسخ‌گویی به سمت حل مسئله، تحلیل‌های دقیق و تصمیم‌گیری مرحله‌ای حرکت دهد.توانایی‌هایی که برای پژوهش‌های دانشگاهی، مسائل فنی، برنامه‌ریزی پیچیده و حتی سناریوهای دنیای واقعی ارزش زیادی دارند.

جمنای ۳ برای یادگیری؛ تجربه‌ای تعاملی‌تر از همیشه

توانایی ترکیب داده‌های مختلف همیشه یکی از ویژگی‌های اصلی خانواده جمنای بوده و جمنای گوگل این قابلیت را گسترده‌تر کرده است. حالا مدل می‌تواند متن، تصویر، ویدئو، صوت و کد را کنار هم قرار دهد و از مجموع آن‌ها به یک نتیجه منسجم برسد. همین ویژگی باعث شده این نسخه برای یادگیری موضوعات تازه و ورود به حوزه‌های پیچیده، نقش یک همراه واقعی را ایفا کند.

اگر کاربر مجموعه‌ای از یادداشت‌های پراکنده، عکس از صفحات کتاب یا اسناد چند زبانه داشته باشد، هوش مصنوعی جمنای ۳ می‌تواند همه این محتواها را کنار هم بچیند و خروجی‌هایی تولید کند که واقعاً قابل استفاده باشند؛ از یک خلاصه منظم گرفته تا یک کتابچه آموزشی یا فلش‌کارت‌هایی که بتوان راحت مرورشان کرد. این سطح از همراهی، یادگیری را برای دانشجویان، پژوهشگران یا افراد تازه‌وارد در هر حوزه‌ای ساده‌تر و روان‌تر می‌کند.

در کار با ویدئو نیز توانایی مدل یک مرحله کامل‌تر شده است. اگر کاربر ویدئوی تمرین یک مهارت، فعالیت عملی یا روند انجام یک کار را در اختیارش قرار دهد، جمنای ۳ نه‌تنها آن را بازخوانی می‌کند، بلکه حرکت‌ها را تحلیل می‌کند، نکته‌ها را برجسته می‌کند و حتی پیشنهادهای مناسب ارائه می‌دهد. این توانایی تا همین چند سال پیش بیشتر مختص ابزارهای تخصصی بود، اما اکنون به بخشی طبیعی از قابلیت‌های همین مدل تبدیل شده است.

AI Mode در جستجوی گوگل؛ جستجو شبیه یک استاد همراه

هم‌زمان با معرفی جمنای ۳، گوگل حالت AI Mode را در جستجو فعال کرده است. این حالت فقط یک پاسخ ساده نمایش نمی‌دهد؛ بلکه بسته به موضوع جستجو، توضیحات بصری، نمودار، توضیح مرحله‌به‌مرحله یا حتی شبیه‌سازی‌هایی تولید می‌کند که فهم موضوع را برای کاربر بسیار ساده‌تر می‌کند.

به این ترتیب جستجو از «نمایش اطلاعات» به «درک بهتر موضوع» تبدیل می‌شود. هنگام یادگیری مفاهیم علمی، تحلیل مدل‌های اقتصادی یا بررسی فرآیندهای فنی، این حالت شبیه یک مدرس همراه رفتار می‌کند و موضوعاتی که معمولاً سخت به نظر می‌رسند را به شکل روشن‌تری توضیح می‌دهد.

یادگیری عمیق‌تر با پنجره متنی یک‌میلیونی

ویژگی پنجره متنی یک‌میلیونی( one million token context window) یکی از قابلیت‌هایی است که جمینی گوگل را از بسیاری از مدل‌های دیگر متمایز می‌کند. این ویژگی باعث می‌شود مدل بتواند حجم زیادی از اطلاعات را یک‌باره پردازش کند، بدون اینکه کاربر مجبور باشد متن‌ها را تکه‌تکه ارائه کند. این امکان برای تحلیل گزارش‌های بلند، اسناد چندبخشی، متون پژوهشی یا پروژه‌های پیچیده ارزش بالایی دارد.

هوش مصنوعی جمنای گوگل می‌تواند ارتباط میان بخش‌های مختلف یک متن طولانی را بهتر ببیند و در نهایت تحلیلی ارائه دهد که تصویری کامل‌تر و دقیق‌تر از محتوا دارد. در عمل، این یعنی مدل می‌تواند نقش یک تحلیلگر، کمک‌پژوهشگر یا دستیار خواندن اسناد سنگین را برعهده بگیرد؛ آن‌هم بدون اینکه کاربر لازم باشد ساختار متن را برای مدل آماده‌سازی کند.

ساخت هر ایده با جمینای ۳

جمنای ۳ فقط یک مدل گفت‌وگوی پیشرفته نیست؛ مدلی است که برای «ساختن» طراحی شده است. گوگل از نسل دوم جمنای به‌تدریج مدل را از یک ابزار پاسخ‌گو به مدلی تبدیل کرد که بتواند اجرا کند، طراحی کند و حتی بخشی از مسیر توسعه را خودش پیش ببرد. نسخه جدید این مسیر را کامل‌تر کرده و توانایی اجرای دستورات پیچیده، ساخت پروژه‌های کوچک و بزرگ و تولید خروجی‌هایی بدون نیاز به نمونه اولیه را فراهم کرده است.

یکی از توانایی‌هایی که در این نسخه تقویت شده، تولید بدون نمونه قبلی (Zero-shot generation) است. این یعنی مدل می‌تواند حتی بدون آنکه قبلاً نمونه مشابهی دیده باشد، ساختار یک پروژه نرم‌افزاری را طراحی کند، ایده کاربر را به شکل یک محصول اولیه دربیاورد یا محتوایی ارائه دهد که هم از نظر ساختار و هم از نظر کیفیت قابل اتکا باشد. این ویژگی در طراحی وب، تولید محتوا، یا حتی ساخت ابزارهای داخلی سازمانی اهمیت زیادی پیدا می‌کند.

توانایی هوش مصنوعی جمنای در فهم دستورات چندمرحله‌ای نیز یک گام جلوتر رفته است. اگر کاربر یک مفهوم کلی ارائه کند، مثلاً طراحی یک رابط کاربری پویا، مدل فقط به یک پیشنهاد کلی بسنده نمی‌کند. می‌تواند ساختار را کامل کند، پیشنهادهای فنی بدهد، و حتی بخش‌هایی از کد را همان لحظه تولید کند. این یعنی روند توسعه، سریع‌تر، شفاف‌تر و قابل اعتمادتر پیش می‌رود.

جمینای ۳؛ بهترین مدل کدنویسی عاملانه گوگل

یکی از تمرکزهای اصلی گوگل در این نسل، ایجاد توانایی‌های «عاملانه» یا همان Agent-based بوده است. در این رویکرد، مدل فقط یک تولیدکننده متن یا کد نیست، بلکه می‌تواند مرحله‌ به‌ مرحله کار را پیش ببرد، تصمیم بگیرد، اصلاح کند و خروجی نهایی را کامل‌تر کند.

این توانایی در چند معیار کلیدی به‌خوبی دیده می‌شود. در WebDev Arena، جمنای ۳ امتیاز ۱۴۸۷ Elo را کسب کرده و در صدر جدول قرار گرفته است. این آزمون توانایی مدل در ساخت صفحات وب، درک HTML، CSS، جاوا اسکریپت و همچنین اجرای دستورهای پیچیده توسعه را می‌سنجد. عملکرد جمنای ۳ نشان می‌دهد که مدل می‌تواند به‌طور واقعی نقش یک توسعه‌دهنده کمکی را برعهده بگیرد.

در Terminal-Bench 2.0 نیز عملکرد مدل چشمگیر بوده است. این معیار بررسی می‌کند که مدل چقدر می‌تواند از ابزارهای ترمینال استفاده کند و مجموعه‌ای از دستورات پشت‌ سر هم را با دقت اجرا کند. این سطح از کنترل محیط کاری برای ساخت ابزارهای واقعی اهمیت زیادی دارد.

در SWE-bench Verified معیاری که توانایی حل مسائل واقعی برنامه‌نویسی را می‌سنجد نسخه Pro جمنای ۳ به ۷۶/۲ درصد رسیده که نسبت به نسل قبل جهش قابل توجهی است. این یعنی مدل نه فقط کد تولید می‌کند، بلکه مسئله را حل می‌کند و راه‌حل ارائه می‌دهد.

Google Antigravity؛ مرحله‌ای جدید در توسعه نرم‌افزار

هم‌زمان با معرفی جمنای ۳، گوگل پلتفرم جدیدی با نام Google Antigravity معرفی کرده که تجربه‌ای متفاوت از کار با مدل‌های هوش مصنوعی ارائه می‌دهد. در این محیط، مدل تنها نقش یک ابزار مکالمه ندارد، بلکه داخل محیط واقعی توسعه یعنی مرورگر، ادیتور، ترمینال حضور دارد و مثل یک هم‌تیمی در پروژه رفتار می‌کند.

در Antigravity، کاربر می‌تواند وظایف پیچیده را به شکل توصیفی و سطح بالا بیان کند. مدل سپس این وظایف را به مراحل کوچک‌تر تبدیل می‌کند، برای هر مرحله برنامه‌ریزی می‌کند، کد می‌نویسد، اجرا می‌کند، خطاها را رفع می‌کند و نتیجه را تست می‌کند. در بسیاری از موارد این روند بدون دخالت مستقیم کاربر پیش می‌رود و تنها نقش کاربر نظارت و هدایت است.

هسته این پلتفرم شبیه یک IDE پیشرفته است، با این تفاوت که عامل‌های هوش مصنوعی مانند یک توسعه‌دهنده واقعی در آن فعالیت می‌کنند. این سطح از خودکارسازی می‌تواند زمان توسعه را کاهش دهد و برای تیم‌هایی که روی پروژه‌های کوتاه‌مدت، MVPها یا ابزارهای داخلی کار می‌کنند ارزش بالایی ایجاد کند.

Antigravity همچنین با مدل تصویری Gemini 2.5 Image و مدل «استفاده از کامپیوتر» گوگل ترکیب شده تا یک جریان کاری کامل شکل بگیرد؛ مدلی که می‌تواند در مرورگر، ویرایشگر و سیستم عامل نقش یک دستیار حرفه‌ای را ایفا کند.

گوگل Antigravity از Gemini 3 برای اجرای یک جریان کاری کاملاً عامل‌محور در یک اپلیکیشن ردیاب پرواز استفاده می‌کند. این ایجنت به‌صورت مستقل برنامه‌ریزی می‌کند، اپلیکیشن را کدنویسی می‌کند و اجرای آن را از طریق استفادهٔ رایانه‌ای مبتنی بر مرورگر مورد تأیید و بررسی قرار می‌دهد.

برنامه‌ریزی بلندمدت با جمنای ۳

یکی از ویژگی‌هایی که جمینای ۳ را از بسیاری از مدل‌های قبلی متمایز می‌کند، توانایی برنامه‌ریزی طولانی‌مدت است. در آزمون Vending-Bench 2 که توانایی مدیریت یک کسب‌وکار شبیه‌سازی‌شده را بررسی می‌کند، این مدل توانسته عملکرد بالایی ثبت کند و یک سال کامل عملیات یک دستگاه فروش خودکار را مدیریت کند. این یعنی مدل می‌تواند تصمیم‌های سلسله‌مراتبی، استفاده از ابزارها و رفتارهای بلندمدت را حفظ و به‌طور منطقی دنبال کند.

در استفاده‌های واقعی، این توانایی می‌تواند در مدیریت ایمیل‌ها، تنظیم قرارها، پیگیری کارها و حتی انجام زنجیره‌ای از وظایف اداری یا فنی بسیار کمک‌کننده باشد. همچنین در پروژه‌های تجاری، مدیریت منابع و برنامه‌ریزی عملیاتی می‌تواند نقش مهمی داشته باشد. به این ترتیب، جمنای ۳ تنها یک مدل متن‌محور نیست، بلکه سیستمی است که می‌تواند وظایف پیچیده را بفهمد، برنامه‌ریزی کند و آن‌ها را تا پایان پیش ببرد در حالی که کنترل نهایی همچنان با کاربر است.

ساخت جمنای ۳ با رویکرد مسئولانه

یکی از نقاطی که گوگل در معرفی این ابزار بر آن تأکید کرده، موضوع ایمنی و توسعه مسئولانه است. این نسخه نسبت به مدل‌های قبلی مجموعه گسترده‌تری از آزمایش‌ها را پشت سر گذاشته و طبق اعلام گوگل، ایمن‌ترین مدل سری جمنای تا امروز به شمار می‌آید.

مدل تلاش می‌کند در برابر حملاتی مثل Prompt Injection، تولید خروجی‌های غیرقابل اعتماد یا رفتارهای پیش‌بینی‌نشده مقاوم‌تر باشد. پاسخ‌های طولانی، نامربوط یا بیش از حد مبهم کمتر دیده می‌شود و مدل سعی می‌کند خروجی‌هایی دقیق، کوتاه و متکی بر داده ارائه دهد.

گوگل برای ارزیابی ایمنی تنها به آزمایش‌های داخلی تکیه نکرده و جمنای ۳ توسط گروه‌های مستقل مانند Apollo، Vaultis، Dreadnode و همچنین نهادهایی مثل UK AISI نیز بررسی شده است. قرار است در «کارت مدل» جمنای ۳ نیز جزئیات بیشتری درباره نحوه آموزش، ارزیابی و محدودیت‌های مدل منتشر شود تا شفافیت بیشتری در اختیار کاربران و توسعه‌دهندگان قرار بگیرد.

دوران بعدی جمنای

معرفی جمنای ۳ آغاز مرحله جدیدی در مسیر مدل‌های چندوجهی گوگل است. این مدل از همان روزهای نخست در طیف گسترده‌ای از سرویس‌های گوگل فعال شده است، از اپلیکیشن جمنای و AI Mode در جستجوی گوگل گرفته تا Gemini API، Google Antigravity، Gemini CLI و سرویس‌های سازمانی Vertex AI و Gemini Enterprise.

این گستردگی نشان می‌دهد گوگل قصد دارد جمنای را به زیرساخت اصلی هوش مصنوعی خود تبدیل کند. نسخه Gemini 3 Deep Think نیز در مرحله بررسی‌های امنیتی است و قرار است برای مشترکان Google AI Ultra فعال شود. همچنین مدل‌های دیگری نیز به مجموعه جمنای ۳ اضافه خواهد شد؛ مدل‌هایی که هر کدام حوزه‌هایی مثل پردازش تصویر، استفاده از کامپیوتر یا برنامه‌ریزی بلندمدت را تقویت می‌کنند.

جمع‌بندی

جمنای ۳ یکی از مهم‌ترین گام‌های گوگل در مسیر ساخت مدل‌های چندوجهی است. این نسخه ترکیبی از توانایی‌های نسل‌های قبلی را با عملکردی دقیق‌تر مانند: 

استدلال عمیق‌تر، تحلیل بهتر داده‌های پیچیده، درک قوی‌تر از تصویر و ویدئو، توانایی انجام وظایف چندمرحله‌ای و امکان ساخت پروژه‌های نرم‌افزاری از ابتدا تا پایان را ارائه می‌دهد.

در کنار نسخه Pro، معرفی Deep Think مرز توانایی‌های استدلالی مدل‌های زبانی را جلوتر برده است. حضور جمنای ۳ در سرویس‌های کلیدی گوگل نشان می‌دهد این مدل قرار است نقشی جدی در آینده تعامل انسان و هوش مصنوعی ایفا کند.

جمنای ۳ تنها یک ابزار مکالمه نیست؛ سیستمی است که تحلیل می‌کند، یاد می‌گیرد، می‌سازد و برنامه‌ریزی می‌کند. همین ترکیب از قابلیت‌ها باعث شده این مدل یکی از مهم‌ترین عرضه‌های امسال در دنیای هوش مصنوعی باشد و احتمالاً مسیر بسیاری از ابزارها و محصولات آینده را شکل دهد.

منبع: https://blog.google/products/gemini/gemini-3

cropped-favicon2.png

نکسینو در شبکه‌های اجتماعی:

فهرست مطالب

جدیدترین مطالب