مدل هوش مصنوعی جمنای ۳ (Gemini 3) که کاربران فارسیزبان آن را بیشتر با نامهای «جمینی» میشناسند، یکی از مهمترین گامهای جمنای گوگل در مسیر توسعه مدلهای هوش مصنوعی است. این نسخه تازه با تمرکز بر استدلال دقیقتر، درک پیشرفتهتر محتوای چندرسانهای و توانایی عمل بهعنوان یک Agent، تجربهای متفاوتتر از نسلهای قبلی ارائه میدهد.
هوش مصنوعی جمنای گوگل حاصل تقریباً دو سال توسعه مداوم روی نسخههای پیشین این خانواده است. هر نسخه قبلی قابلیتهایی تازه به مجموعه اضافه میکرد و اکنون این مدل جدید، آن تواناییها را کنار هم قرار داده تا یک تصویر قدرتمند، یکپارچه و پختهتر از هوش مصنوعی ارائه دهد.
در این نسخه، مدل تنها «بهتر نمیفهمد»؛ بلکه عمیقتر تحلیل میکند، الگوهای پیچیدهتری را تشخیص میدهد و میتواند محتوای طولانی و چندوجهی را با دقتی نزدیکتر به استانداردهای AGI پردازش کند. فعالشدن جمنای گوگل در سرویسهای اصلی گوگل نیز نشان میدهد که این مدل قرار است نقشی مهم در تجربه روزمره کاربران و ابزارهای توسعهدهندگان داشته باشد.
معرفی جمنای ۳: هوشمندترین عضو خانواده Gemini
جمنای ۳ با هدف باز تعریف استانداردهای مدلهای بزرگ زبانی طراحی شده است. نسخه Pro اکنون در بسیاری از سرویسهای گوگل فعال میباشد و نسخه تخصصیتر آن یعنی Gemini 3 Deep Think نیز برای تحلیلهای عمیقتر معرفی شده است. حضور این دو مدل در ابزارهایی مثل AI Studio، Vertex AI و پلتفرم توسعهعاملانه جدید گوگل یعنی Google Antigravity نشان میدهد که گوگل تلاش دارد تجربه کاربران را از «پرسش و پاسخ ساده» به «همکاری و ساخت» ارتقا دهد.
تمرکز این نسل روی چند محور اصلی بوده است:
- افزایش عمق استدلال
- درک قویتر محتوای چندرسانهای
- برنامهریزی دقیقتر
- و ارائه پاسخهای هدفمندتر، کوتاهتر و قابلاستفادهتر.
این تغییرات باعث شده هوش مصنوعی جمنای گوگل در نقش یک «کمکفکر» واقعی ظاهر شود؛ ابزاری که میتواند در یادگیری، تولید محتوا، تحلیلهای تخصصی و حتی توسعه نرمافزار همراه کاربر باشد.
استدلال پیشرفته با عمق و ظرافت بیشتر
نسخه هوش مصنوعی جمنای ۳ پرو در بخش استدلال پیشرفت چشمگیری داشته و نتایج آن در آزمونهای رسمی نیز این موضوع را تأیید میکند. گوگل در این نسل تلاش کرده تا توان تحلیل چندمرحلهای، تشخیص الگوهای پیچیده و درک جزئیات پنهان را تقویت کند؛ مواردی که پیشتر برای مدلهای زبانی بهسادگی قابل انجام نبود یا با خطای بالا همراه بود.
نتایج نشان میدهد که هوش مصنوعی جمنای گوگل موفق شده در یکی از مهمترین معیارهای جهانی یعنی LMArena Leaderboard امتیاز ۱۵۰۱ Elo را بهدست آورد؛ رقمی که آن را در رتبه اول این فهرست قرار میدهد. این عدد فقط یک رکورد نیست؛ بلکه نشان میدهد مدل در مواجهه با مسائل منطقی، معادلات چندمرحلهای و پرسشهای طولانی، دقیقتر و سریعتر عمل میکند.
در آزمون Last Human Test که سطح حل مسئله مدلها را با معیارهای انسانی میسنجد، نسخه Pro بدون استفاده از ابزارهای کمکی به دقت ۳۷/۵ درصد رسیده است.
آزمون GPQA Diamond نیز همین روند را تأیید میکند؛ جایی که جمنای ۳ توانسته به ۹۱/۹ درصد برسد و نشان دهد در تحلیل مفاهیم علمی، دقت بیشتری نسبت به قبل دارد.

این پیشرفتها باعث شده جمنای ۳ در بسیاری از مسائل پیچیده، از تحلیلهای علمی گرفته تا حل مسائل ریاضی پیشرفته، رفتاری شبیه به یک «همکار فکری» داشته باشد. پاسخها اکنون کوتاهتر، دقیقتر و هدفمندتر هستند و از توضیحات غیرضروری و گسترده پرهیز میشود؛ موضوعی که در نسخههای قبلی کمتر دیده میشد.
ارتقای عملکرد در ریاضیات و علوم تخصصی
در حوزه ریاضیات پیشرفته، جمنای ۳ پرو عملکرد قابل توجهی داشته است. این مدل توانسته در معیار MathArena Apex امتیاز ۲۳/۴ درصد را ثبت کند؛ معیاری که تمرکزش روی مسئلههای چندمرحلهای و پرسشهایی است که نیازمند استدلال نمادین و محاسبات دقیق هستند.
این بهبود نشان میدهد جمنای ۳ فقط در حد یک مدل زبانی بهتر نشده، بلکه در برخورد با دادههای محاسباتی، دقت بیشتری دارد و خطاهای کمتری تولید میکند. همین موضوع آن را برای محیطهای پژوهشی، آموزش عالی و حتی توسعه الگوریتمهای تخصصی جذابتر کرده است.
فراتر از متن: چندوجهی در سطحی بالاتر
نسخه جدید جمینی در بخش چندوجهی (Multimodal) نیز جهشی جدی داشته است. در آزمون MMMU-Pro امتیاز ۸۱ درصد بهدست آورده و در نسخه ویدئویی همین معیار یعنی Video-MMMU نیز عملکرد آن به ۸۷/۶ درصد رسیده است.
این نتایج نشان میدهد هوش مصنوعی جمنای ۳ فقط «تشخیص تصویر» یا «توصیف ویدئو» انجام نمیدهد؛ بلکه بین اجزای مختلف اطلاعات ارتباط برقرار میکند. بهعنوان مثال در یک ویدئو فقط روایت نمیکند؛ بلکه رفتارها، حرکتها، اشیا و ارتباط میان صحنهها را هم تحلیل میکند.
این سطح از درک چندرسانهای، مدل را برای حوزههایی مانند:آموزش تصویری، تحلیل دادههای پزشکی، بررسی ویدئوهای امنیتی و تولید محتوای چندرسانهای بسیار ارزشمند میکند.
در بخش «دانش واقعی و دادههای factual» نیز پیشرفت قابل توجهی دیده میشود. جمنای ۳ در معیار SimpleQA Verified امتیاز ۷۲/۱ درصد کسب کرده که نشاندهنده افزایش دقت پاسخها در موضوعات واقعی است.
مجموع این قابلیتها نشان میدهد هوش مصنوعی جمنای یک قدم دیگر فاصله بین «تحلیل انسانی» و «تحلیل ماشینی» را کم کرده است. این نسخه نهتنها متن را بهتر میخواند، بلکه تصویر و ویدئو را هم با درک بافت، محتوا و ارتباطات درونی تحلیل میکند؛ قابلیتی که برای بسیاری از صنایع کاربری کاملاً عملی دارد.
Gemini 3 میتواند یک تصویرسازی از جریان پلاسما در یک توکامک برنامهنویسی کند و همچنین شعری بنویسد که فیزیک همجوشی را بهصورت هنرمندانه توصیف کند.
جمینی ۳ دیپ تینک؛ یک سطح بالاتر در استدلال
در کنار نسخه Pro، گوگل مدل دیگری از این نسل را با نام Gemini 3 Deep Think معرفی کرده است؛ نسخهای که تمرکز اصلی آن بر استدلال مرحلهبهمرحله و تحلیلهای پیچیدهتر است. هدف گوگل از توسعه این نسخه، نزدیکتر شدن به شیوهای است که انسانها مسائل دشوار را بررسی میکنند؛ یعنی دقت در جزئیات، کشف الگوهای پنهان و رسیدن به پاسخی که نه فقط یک خروجی سریع بلکه پشتوانه منطقی دارد.
نتایج اولیه نیز این رویکرد را تأیید میکند. در آزمون Last Human Test، نسخه Deep Think بدون استفاده از ابزار به دقت ۴۱ درصد رسیده، رقمی که برای مدلی در این نسل قابل توجه است.
در آزمون تخصصی GPQA Diamond نیز این نسخه به ۹۳/۸ درصد دست یافته است؛ معیاری که سطح سختی آن نزدیک به تحلیل مسائل علمی و پژوهشی است. این عملکرد نشان میدهد Deep Think در مواجهه با پرسشهای علمی یا مسئلههای چندمرحلهای، توانایی بیشتری برای استدلال دقیق و معتبر دارد.
اما شاید مهمترین معیار برای Deep Think، ARC-AGI-2 باشد؛ آزمونی که مدلها را در حل مسائل کاملًا جدید میسنجد، مسائلی که قبلاً شبیه آن را ندیدهاند. در این آزمون، Deep Think امتیاز ۴۵/۱ درصد کسب کرده که برای یک مدل زبانی جهشی مهم بهحساب میآید. این یعنی:
- این مدل فقط «خلاصه نمیکند»
- تنها «پاسخ از قبل دیدهشده» تولید نمیکند
- بلکه بر اساس دادههای تازه، راهحلهای جدید و مبتنی بر منطق میسازد
این دقیقاً همان نقطهای است که فاصله میان «پاسخمحور بودن» و «تحلیلمحور بودن» را مشخص میکند.
در مجموع، روند عملکرد Deep Think نشان میدهد گوگل با این نسخه قصد دارد مرز توانایی مدلهای زبانی را از سطح پاسخگویی به سمت حل مسئله، تحلیلهای دقیق و تصمیمگیری مرحلهای حرکت دهد.تواناییهایی که برای پژوهشهای دانشگاهی، مسائل فنی، برنامهریزی پیچیده و حتی سناریوهای دنیای واقعی ارزش زیادی دارند.

جمنای ۳ برای یادگیری؛ تجربهای تعاملیتر از همیشه
توانایی ترکیب دادههای مختلف همیشه یکی از ویژگیهای اصلی خانواده جمنای بوده و جمنای گوگل این قابلیت را گستردهتر کرده است. حالا مدل میتواند متن، تصویر، ویدئو، صوت و کد را کنار هم قرار دهد و از مجموع آنها به یک نتیجه منسجم برسد. همین ویژگی باعث شده این نسخه برای یادگیری موضوعات تازه و ورود به حوزههای پیچیده، نقش یک همراه واقعی را ایفا کند.
اگر کاربر مجموعهای از یادداشتهای پراکنده، عکس از صفحات کتاب یا اسناد چند زبانه داشته باشد، هوش مصنوعی جمنای ۳ میتواند همه این محتواها را کنار هم بچیند و خروجیهایی تولید کند که واقعاً قابل استفاده باشند؛ از یک خلاصه منظم گرفته تا یک کتابچه آموزشی یا فلشکارتهایی که بتوان راحت مرورشان کرد. این سطح از همراهی، یادگیری را برای دانشجویان، پژوهشگران یا افراد تازهوارد در هر حوزهای سادهتر و روانتر میکند.
در کار با ویدئو نیز توانایی مدل یک مرحله کاملتر شده است. اگر کاربر ویدئوی تمرین یک مهارت، فعالیت عملی یا روند انجام یک کار را در اختیارش قرار دهد، جمنای ۳ نهتنها آن را بازخوانی میکند، بلکه حرکتها را تحلیل میکند، نکتهها را برجسته میکند و حتی پیشنهادهای مناسب ارائه میدهد. این توانایی تا همین چند سال پیش بیشتر مختص ابزارهای تخصصی بود، اما اکنون به بخشی طبیعی از قابلیتهای همین مدل تبدیل شده است.
AI Mode در جستجوی گوگل؛ جستجو شبیه یک استاد همراه
همزمان با معرفی جمنای ۳، گوگل حالت AI Mode را در جستجو فعال کرده است. این حالت فقط یک پاسخ ساده نمایش نمیدهد؛ بلکه بسته به موضوع جستجو، توضیحات بصری، نمودار، توضیح مرحلهبهمرحله یا حتی شبیهسازیهایی تولید میکند که فهم موضوع را برای کاربر بسیار سادهتر میکند.
به این ترتیب جستجو از «نمایش اطلاعات» به «درک بهتر موضوع» تبدیل میشود. هنگام یادگیری مفاهیم علمی، تحلیل مدلهای اقتصادی یا بررسی فرآیندهای فنی، این حالت شبیه یک مدرس همراه رفتار میکند و موضوعاتی که معمولاً سخت به نظر میرسند را به شکل روشنتری توضیح میدهد.
یادگیری عمیقتر با پنجره متنی یکمیلیونی
ویژگی پنجره متنی یکمیلیونی( one million token context window) یکی از قابلیتهایی است که جمینی گوگل را از بسیاری از مدلهای دیگر متمایز میکند. این ویژگی باعث میشود مدل بتواند حجم زیادی از اطلاعات را یکباره پردازش کند، بدون اینکه کاربر مجبور باشد متنها را تکهتکه ارائه کند. این امکان برای تحلیل گزارشهای بلند، اسناد چندبخشی، متون پژوهشی یا پروژههای پیچیده ارزش بالایی دارد.
هوش مصنوعی جمنای گوگل میتواند ارتباط میان بخشهای مختلف یک متن طولانی را بهتر ببیند و در نهایت تحلیلی ارائه دهد که تصویری کاملتر و دقیقتر از محتوا دارد. در عمل، این یعنی مدل میتواند نقش یک تحلیلگر، کمکپژوهشگر یا دستیار خواندن اسناد سنگین را برعهده بگیرد؛ آنهم بدون اینکه کاربر لازم باشد ساختار متن را برای مدل آمادهسازی کند.
ساخت هر ایده با جمینای ۳
جمنای ۳ فقط یک مدل گفتوگوی پیشرفته نیست؛ مدلی است که برای «ساختن» طراحی شده است. گوگل از نسل دوم جمنای بهتدریج مدل را از یک ابزار پاسخگو به مدلی تبدیل کرد که بتواند اجرا کند، طراحی کند و حتی بخشی از مسیر توسعه را خودش پیش ببرد. نسخه جدید این مسیر را کاملتر کرده و توانایی اجرای دستورات پیچیده، ساخت پروژههای کوچک و بزرگ و تولید خروجیهایی بدون نیاز به نمونه اولیه را فراهم کرده است.
یکی از تواناییهایی که در این نسخه تقویت شده، تولید بدون نمونه قبلی (Zero-shot generation) است. این یعنی مدل میتواند حتی بدون آنکه قبلاً نمونه مشابهی دیده باشد، ساختار یک پروژه نرمافزاری را طراحی کند، ایده کاربر را به شکل یک محصول اولیه دربیاورد یا محتوایی ارائه دهد که هم از نظر ساختار و هم از نظر کیفیت قابل اتکا باشد. این ویژگی در طراحی وب، تولید محتوا، یا حتی ساخت ابزارهای داخلی سازمانی اهمیت زیادی پیدا میکند.
توانایی هوش مصنوعی جمنای در فهم دستورات چندمرحلهای نیز یک گام جلوتر رفته است. اگر کاربر یک مفهوم کلی ارائه کند، مثلاً طراحی یک رابط کاربری پویا، مدل فقط به یک پیشنهاد کلی بسنده نمیکند. میتواند ساختار را کامل کند، پیشنهادهای فنی بدهد، و حتی بخشهایی از کد را همان لحظه تولید کند. این یعنی روند توسعه، سریعتر، شفافتر و قابل اعتمادتر پیش میرود.
جمینای ۳؛ بهترین مدل کدنویسی عاملانه گوگل
یکی از تمرکزهای اصلی گوگل در این نسل، ایجاد تواناییهای «عاملانه» یا همان Agent-based بوده است. در این رویکرد، مدل فقط یک تولیدکننده متن یا کد نیست، بلکه میتواند مرحله به مرحله کار را پیش ببرد، تصمیم بگیرد، اصلاح کند و خروجی نهایی را کاملتر کند.
این توانایی در چند معیار کلیدی بهخوبی دیده میشود. در WebDev Arena، جمنای ۳ امتیاز ۱۴۸۷ Elo را کسب کرده و در صدر جدول قرار گرفته است. این آزمون توانایی مدل در ساخت صفحات وب، درک HTML، CSS، جاوا اسکریپت و همچنین اجرای دستورهای پیچیده توسعه را میسنجد. عملکرد جمنای ۳ نشان میدهد که مدل میتواند بهطور واقعی نقش یک توسعهدهنده کمکی را برعهده بگیرد.
در Terminal-Bench 2.0 نیز عملکرد مدل چشمگیر بوده است. این معیار بررسی میکند که مدل چقدر میتواند از ابزارهای ترمینال استفاده کند و مجموعهای از دستورات پشت سر هم را با دقت اجرا کند. این سطح از کنترل محیط کاری برای ساخت ابزارهای واقعی اهمیت زیادی دارد.
در SWE-bench Verified معیاری که توانایی حل مسائل واقعی برنامهنویسی را میسنجد نسخه Pro جمنای ۳ به ۷۶/۲ درصد رسیده که نسبت به نسل قبل جهش قابل توجهی است. این یعنی مدل نه فقط کد تولید میکند، بلکه مسئله را حل میکند و راهحل ارائه میدهد.
Google Antigravity؛ مرحلهای جدید در توسعه نرمافزار
همزمان با معرفی جمنای ۳، گوگل پلتفرم جدیدی با نام Google Antigravity معرفی کرده که تجربهای متفاوت از کار با مدلهای هوش مصنوعی ارائه میدهد. در این محیط، مدل تنها نقش یک ابزار مکالمه ندارد، بلکه داخل محیط واقعی توسعه یعنی مرورگر، ادیتور، ترمینال حضور دارد و مثل یک همتیمی در پروژه رفتار میکند.
در Antigravity، کاربر میتواند وظایف پیچیده را به شکل توصیفی و سطح بالا بیان کند. مدل سپس این وظایف را به مراحل کوچکتر تبدیل میکند، برای هر مرحله برنامهریزی میکند، کد مینویسد، اجرا میکند، خطاها را رفع میکند و نتیجه را تست میکند. در بسیاری از موارد این روند بدون دخالت مستقیم کاربر پیش میرود و تنها نقش کاربر نظارت و هدایت است.
هسته این پلتفرم شبیه یک IDE پیشرفته است، با این تفاوت که عاملهای هوش مصنوعی مانند یک توسعهدهنده واقعی در آن فعالیت میکنند. این سطح از خودکارسازی میتواند زمان توسعه را کاهش دهد و برای تیمهایی که روی پروژههای کوتاهمدت، MVPها یا ابزارهای داخلی کار میکنند ارزش بالایی ایجاد کند.
Antigravity همچنین با مدل تصویری Gemini 2.5 Image و مدل «استفاده از کامپیوتر» گوگل ترکیب شده تا یک جریان کاری کامل شکل بگیرد؛ مدلی که میتواند در مرورگر، ویرایشگر و سیستم عامل نقش یک دستیار حرفهای را ایفا کند.
گوگل Antigravity از Gemini 3 برای اجرای یک جریان کاری کاملاً عاملمحور در یک اپلیکیشن ردیاب پرواز استفاده میکند. این ایجنت بهصورت مستقل برنامهریزی میکند، اپلیکیشن را کدنویسی میکند و اجرای آن را از طریق استفادهٔ رایانهای مبتنی بر مرورگر مورد تأیید و بررسی قرار میدهد.
برنامهریزی بلندمدت با جمنای ۳
یکی از ویژگیهایی که جمینای ۳ را از بسیاری از مدلهای قبلی متمایز میکند، توانایی برنامهریزی طولانیمدت است. در آزمون Vending-Bench 2 که توانایی مدیریت یک کسبوکار شبیهسازیشده را بررسی میکند، این مدل توانسته عملکرد بالایی ثبت کند و یک سال کامل عملیات یک دستگاه فروش خودکار را مدیریت کند. این یعنی مدل میتواند تصمیمهای سلسلهمراتبی، استفاده از ابزارها و رفتارهای بلندمدت را حفظ و بهطور منطقی دنبال کند.
در استفادههای واقعی، این توانایی میتواند در مدیریت ایمیلها، تنظیم قرارها، پیگیری کارها و حتی انجام زنجیرهای از وظایف اداری یا فنی بسیار کمککننده باشد. همچنین در پروژههای تجاری، مدیریت منابع و برنامهریزی عملیاتی میتواند نقش مهمی داشته باشد. به این ترتیب، جمنای ۳ تنها یک مدل متنمحور نیست، بلکه سیستمی است که میتواند وظایف پیچیده را بفهمد، برنامهریزی کند و آنها را تا پایان پیش ببرد در حالی که کنترل نهایی همچنان با کاربر است.

ساخت جمنای ۳ با رویکرد مسئولانه
یکی از نقاطی که گوگل در معرفی این ابزار بر آن تأکید کرده، موضوع ایمنی و توسعه مسئولانه است. این نسخه نسبت به مدلهای قبلی مجموعه گستردهتری از آزمایشها را پشت سر گذاشته و طبق اعلام گوگل، ایمنترین مدل سری جمنای تا امروز به شمار میآید.
مدل تلاش میکند در برابر حملاتی مثل Prompt Injection، تولید خروجیهای غیرقابل اعتماد یا رفتارهای پیشبینینشده مقاومتر باشد. پاسخهای طولانی، نامربوط یا بیش از حد مبهم کمتر دیده میشود و مدل سعی میکند خروجیهایی دقیق، کوتاه و متکی بر داده ارائه دهد.
گوگل برای ارزیابی ایمنی تنها به آزمایشهای داخلی تکیه نکرده و جمنای ۳ توسط گروههای مستقل مانند Apollo، Vaultis، Dreadnode و همچنین نهادهایی مثل UK AISI نیز بررسی شده است. قرار است در «کارت مدل» جمنای ۳ نیز جزئیات بیشتری درباره نحوه آموزش، ارزیابی و محدودیتهای مدل منتشر شود تا شفافیت بیشتری در اختیار کاربران و توسعهدهندگان قرار بگیرد.
دوران بعدی جمنای
معرفی جمنای ۳ آغاز مرحله جدیدی در مسیر مدلهای چندوجهی گوگل است. این مدل از همان روزهای نخست در طیف گستردهای از سرویسهای گوگل فعال شده است، از اپلیکیشن جمنای و AI Mode در جستجوی گوگل گرفته تا Gemini API، Google Antigravity، Gemini CLI و سرویسهای سازمانی Vertex AI و Gemini Enterprise.
این گستردگی نشان میدهد گوگل قصد دارد جمنای را به زیرساخت اصلی هوش مصنوعی خود تبدیل کند. نسخه Gemini 3 Deep Think نیز در مرحله بررسیهای امنیتی است و قرار است برای مشترکان Google AI Ultra فعال شود. همچنین مدلهای دیگری نیز به مجموعه جمنای ۳ اضافه خواهد شد؛ مدلهایی که هر کدام حوزههایی مثل پردازش تصویر، استفاده از کامپیوتر یا برنامهریزی بلندمدت را تقویت میکنند.
جمعبندی
جمنای ۳ یکی از مهمترین گامهای گوگل در مسیر ساخت مدلهای چندوجهی است. این نسخه ترکیبی از تواناییهای نسلهای قبلی را با عملکردی دقیقتر مانند:
استدلال عمیقتر، تحلیل بهتر دادههای پیچیده، درک قویتر از تصویر و ویدئو، توانایی انجام وظایف چندمرحلهای و امکان ساخت پروژههای نرمافزاری از ابتدا تا پایان را ارائه میدهد.
در کنار نسخه Pro، معرفی Deep Think مرز تواناییهای استدلالی مدلهای زبانی را جلوتر برده است. حضور جمنای ۳ در سرویسهای کلیدی گوگل نشان میدهد این مدل قرار است نقشی جدی در آینده تعامل انسان و هوش مصنوعی ایفا کند.
جمنای ۳ تنها یک ابزار مکالمه نیست؛ سیستمی است که تحلیل میکند، یاد میگیرد، میسازد و برنامهریزی میکند. همین ترکیب از قابلیتها باعث شده این مدل یکی از مهمترین عرضههای امسال در دنیای هوش مصنوعی باشد و احتمالاً مسیر بسیاری از ابزارها و محصولات آینده را شکل دهد.