چت جی‌پی‌تی دو ساله شد؛ از آغاز طوفانی «هوش مصنوعی مولد» تا افق‌های رسیدن به «هوش جامع مصنوعی»

7 ساعت پیش

یورونیوز

چت جی‌پی‌تی در حالی که باعث افزایش رقابت در حوزه هوش مصنوعی مولد شده است، اما پیشرفتی آهسته‌تر از حد انتظارات داشت و کارشناسان در مورد احتمال وقوع یک تحول انقلابی دیگر در این حوزه، آن هم در بازه زمانی کوتاه مدت تردید دارند.

چت جی‌پی‌تی تنها در عرض چند روز پس از عرضه، هم حرفه‌ای‌ها و هم کاربران عمومی را مجذوب خود کرد. این ابزار به هر کسی که به اینترنت دسترسی دارد اجازه می‌دهد با دستگاهی گپ و گفتگو یا اصطلاحا چت کند که می‌تواند پاسخ‌های منسجم و مدون – هر چند نه همیشه دقیق – ارائه ‌دهد.

حتی بسیاری، این احساس را دارند که به جای یک ماشین، با یک شخص مکاتبه می‌کنند.

این شنبه دو سال از راه اندازی قابلیت «چت جی‌پی‌تی – ChatGPT» می‌گذرد. چت جی‌پی‌تی یک «هوش مصنوعی مولد – GAI» است که قادر به تولید محتوای به ظاهر اوریجینال بر اساس درخواست‌های انسان است.

این فناوری امروز کجا ایستاده است؟

در حال حاضر، هیجان اولیه جای خود را به نبرد شرکت‌ها برای تسلط در به کارگیری چنین ابزارهایی داده است. مایکروسافت به سرعت با شرکت «اُپن‌اِی‌آی – OpenAI» که توسعه‌دهنده هوش‌های مصنوعی «چت جی‌پی‌تی – ChatGPT» و «دال ئی – DALL·E» است قرارداد همکاری منعقد کرد. گوگل نیز از قافله عقب نماند و مدل‌های باز خود را ظرف دو ماه رونمایی کرد.

امروز، ما در مرحله‌ای هستیم که شرکت مشاوره‌ای گارتنر از آن به عنوان «مرحله توهم‌زدایی» یاد می‌کند؛ یعنی اینکه سرخوشی اولیه منجر به افزایش انتظارات شد و ناتوانی در برآورده کردن سریع آن‌ها باعث کاهش علاقه شد. این یک مرحله طبیعی در چرخه حیات روندهای فناوری است و به گفته گارتنر، شیب انتظارات در عرض چند سال دوباره افزایش خواهد یافت، هرچند نسبت به موج اول ضعیف‌تر خواهد بود.

جهش دوباره به چه چیزی نیاز دارد؟

آندری کارپاتی، یکی از خالقان مدل چت جی‌پی‌تی (که در ماه فوریه اُپن‌اِی‌آی را ترک کرد)، اخیراً به نشانه‌هایی از فرسودگی در هوش مصنوعی مولد اذعان کرده است. از آنجایی که نسخه‌های اولیه چت جی‌پی‌تیقبلاً روی تقریباً تمام متون موجود در اینترنت آموزش داده شده بودند، نسخه‌های جدیدتر نمی‌توانند از داده‌های بیشتری نسبت به نسخه‌های قبلی خود استفاده کنند. این بدان معنی است که مدل‌های جدید قادر به بهبود قابل توجهی نخواهند بود.

آلوارو باربرو، رئیس تجزیه و تحلیل داده‌ها در «موسسه مهندسی دانش»، توضیح می‌دهد که «برای انجام یک جهش بزرگ، به نوآوری در معماری الگوریتمی، مانند توسعه ترانسفورماتورها در سال ۲۰۱۷ [نوعی شبکه عصبی که در توسعه مدل‌های بزرگ زبانی کلیدی است] نیاز است.»

سودآوری همچنان نامطمئن است

چالش‌های تجاری همچنان ادامه دارند، زیرا سرمایه‌گذاران در مورد سودآوری هوش مصنوعی مولد نامطمئن هستند. شرکت OpenAI در ماه اکتبر ۱۰ میلیارد دلار علاوه بر ۱۳ میلیارد دلاری که مایکروسافت در سال ۲۰۲۳ متعهد شد، دریافت کرد. با این حال، این بودجه ممکن است کافی نباشد.

کما اینکه با وجود برنامه‌ریزی‌های اولیه برای عرضه نسخه «چت جی‌پی‌تی-۵» تا اواخر سال ۲۰۲۳، اما این مدل هنوز وارد بازار نشده است و باعث ایجاد شک و تردید در میان تحلیلگران در مورد پتانسیل آن برای برآورده کردن انتظارات تعیین شده توسط سم آلتمن، مدیر عامل این شرکت شده است.

اُپن‌اِی‌آی پیش‌بینی می‌کند که تا سال ۲۰۲۹ سودآور نخواهد بود، در حالی که هزینه‌های ماهانه تقریباً ۵۰۰ میلیون دلار را متحمل می‌شود.

هزینه‌های آموزشی برای مدل‌های چت جی پی‌تی نیز تا پایان سال ۲۰۲۴ به ۷ میلیارد دلار می‌رسد که احتمالاً تا تابستان آینده بودجه اُپن‌اِی‌آی را تمام می‌کند.

دوران تحول هوش مصنوعی

از نگرانی‌های مالی که بگذریم، شکی نیست که چت جی‌پی‌تی که در تاریخ ۳۰ نوامبر ۲۰۲۲ (نهم آذر ۱۴۰۱) راه اندازی شد، یک دستاورد پیشگامانه بود.

این هوش مصنوعی مولد به برنامه‌های کاربردی جالبی مانند خلاصه‌سازی متن، نوشتن نامه به زبان‌های خارجی و استخراج اطلاعات از اسناد منجر شده است، اما در کنار آن کاربردهای مشکل‌زایی مانند اتکا به آموزش‌های خود برای استخراج اطلاعات تاریخی به جای جستجوی دقیق، یا نتیجه‌گیری غیردقیق دارد.

هوش مصنوعی مولد با تولید تصویر و ویدیو، خطوط بین واقعیت و فریب را از طریق دیپ‌فیک محو می‌کند، ولی در عین حال هم اشکال پیچیده‌تر و مقرون‌به‌صرفه‌تر حملات سایبری را ممکن ساخته است.

هوش جامع مصنوعی چیست و افق رسیدن به آن کجاست؟

یکی از جدیدترین پیشرفت‌ها در هوش مصنوعی مولد، ظهور سیستم‌های چندوجهی است که انواع رسانه‌های مختلف از جمله متن، تصویر و صدا را با هم ترکیب می‌کنند.

به عنوان مثال، آخرین نسخه‌های به‌روز چت جی‌پی‌تی یا «جمینی – Gemini» می‌توانند عکسی از یخچال شما را تجزیه و تحلیل کنند و پیشنهاد دهند چه چیزی برای شام آماده کنید. با این حال، خروجی‌های آنها به جای استدلال واقعی، توسط پیش‌بینی‌های شهودی هدایت می‌شود.

در نتیجه می‌توان پیش‌بینی کرد که گام بعدی بررسی این موضوع است که آیا مدل‌های زبانی بزرگ (LLM) می‌توانند مستقل شوند یا خیر – به این معنی که آیا می‌توانند به طور مستقل از طرف ما با دیگران تعامل داشته باشند یا خیر. به عنوان مثال، آیا آنها می توانند بلیط هواپیما یا اتاق هتل را بر اساس دستورالعمل ما رزرو کنند یا نه.

به اعتقاد برخی کارشناسان، مدل‌های هوش مصنوعی مولد در حال رسیدن به محدودیت‌های خود هستند و باید عناصر دیگری مانند دانش واقعی، منطق قیاسی و در دراز مدت، عقل سلیم ‌به قابلیت‌های خود اضافه کنند. فقط در این صورت است که می توانیم در مورد دستیابی به استدلال واقعی بحث کنیم.