Chat GPT

علمی مرداد 15، 1402

در سال‌های اخیر هوش مصنوعی از یک رویا، هرچه بیشتر تبدیل به واقعیت شده است. یکی از آخرین پیشرفت‌ها در این صنعت، ChatGPT است. این تکنولوژی در زمان نگارش این مقاله، یعنی آوریل ۲۰۲۳ به‌عنوان آخرین دستاورد هوش مصنوعی تجاری درنظر گرفته می‌شود.

چت جی پی تی، یک پردازشگر هوشمند زبان است که برای اولین بار در دسامبر ۲۰۲۲ معرفی شد. این تکنولوژی AI، سریع‌تر از هر تکنولوژی مبتنی بر اینترنت دیگری محبوبیت یافت و در کمتر از دو ماه حدود ۱۰۰ میلیون کاربر فعال پیدا کرد. دستاوردی که رسیدن به آن برای اینستاگرام دو سال و برای تیک‌تاک ۹ ماه به‌طول انجامید.

اما برنامه ChatGPT چیست؟ چطور کار می‌کند؟ چگونه می‌توان از آن استفاده کرد؟ از همه مهم‌تر برای کاربران ایرانی این سوال مطرح است که آیا می‌توان از داخل ایران با آن کار کرد؟ در این مقاله به این سوالات به‌همراه بررسی جزئیات زیادی از این تکنولوژی پاسخ خواهیم داد. با ما همراه شده و با یکی از مهم‌ترین بازیگران تکنولوژی در دنیای امروز و آینده آشنا شوید.

ChatGPT چیست؟

به‌طورساده ChatGPT یک ربات چت هوش مصنوعی با زبان طبیعی است به این معنی که می‌توان از آن هر سوالی پرسید و جواب دریافت کرد. ChatGPT مخفف عبارت Chat Generative Pre-Trained Transformer است. عنوانی که به‌خودی‌خود تفاوت آن با دستیارهای صوتی مانند Siri و Alexa را نشان می‌دهد. کلمات Generative و Pre-Trained بیان‌کننده‌ی این مطلب هستند که ChatGPT از شبکه‌های عصبی توسعه‌یافته با مدل‌های دیپ لرنینگ یا یادگیری عمیق بهره می‌برد. این شبکه‌ها پاسخ‌های‌شان را در قالب الگوهای نوشتاری زبان انسان ارائه می‌کنند.

درحقیقت برنامه ChatGPT یک پروژه‌ی پردازش زبان طبیعی در مقیاس بزرگ یا Large Language Model و به‌اختصار LLM است. این ساختار از معماری GPT-3 به‌منظور غربال کردن حجم عظیم داده‌های به‌دست‌آمده از منابع اینترنتی استفاده می‌کند.

مزیت دیپ لرنینگ برای ChatGPT

الگوریتم‌های دیپ لرنینگ به ChatGPT کمک می‌کنند که با حجم عظیمی از داده‌های متنی در اینترنت در مدت‌زمان اندک کار کرده و جواب خود را آماده کند. درحقیقت ChatGPT در حالت ایده‌آل خود به‌دنبال درک ارتباطات انسانی در قالب نوشتار و به‌کارگیری ساختار ذهن انسان به‌منظور تولید پاسخ‌های مناسب متنی است. این برنامه با منابع بی‌پایانی از داده‌های متنی تغذیه می‌شود. ChatGPT به‌عنوان یک منبع کسب دانش و اطلاعات شناخته می‌شود؛ اما توانایی آن در برقراری ارتباط، ویژگی متمایزکننده‌اش از برنامه‌های مشابه است.

هدف اولیه ChatGPT چیست؟

اگر می‌پرسید که مهم‌ترین هدف ربات chatgpt چیست؟ باید بگوییم پاسخ به هر سوالی که درباره‌اش در اینترنت اطلاعاتی متنی وجود دارد. این اهداف می‌تواند گردآوری، تولید محتوای متنی، ترجمه، خلاصه‌نویسی، پرسش‌وپاسخ، تکمیل و توسعه‌ی دیکشنری‌های آنلاین و غیره باشد.

چند ویژگی مهم ChatGPT

از مهم‌ترین ویژگی‌های ChatGPT‌ نیز می‌توان به موارد زیر اشاره کرد:

  • شامل بیش از ۱۷۵ میلیارد پارامتر که آن را به یکی از بزرگترین مدل‌های هوش مصنوعی زبانی تبدیل کرده است.
  • تغذیه‌شده با الگوریتم‌های ازپیش آموزش‌داده‌شده
  • قابلیت انجام چندین وظیفه‌ی هم‌زمان
  • سرعت بسیار بالا و تقریبا درلحظه

تاریخچه توسعه ChatGPT

شرکت اصلی توسعه‌دهنده‌ی برنامه هوش مصنوعی چت جی پی تی، OpenAI‌ نام دارد. این شرکت در سال ۲۰۱۵ توسط ایلان ماسک، مالک کمپانی‌های تسلا و SpaceX، سم آلتمن (Sam Altman)، گرگ براکمن (Greg Brockman)، ایلیا سوتسکور (Ilya Sutskever) و وویچ زارمبا (Wojciech Zaremba) تاسیس شد. محل استقرار OpenAI در سانفرانسیسکوی آمریکاست.

درحال‌حاضر سم آلتمن مدیریت عامل OpenAI‌ را برعهده دارد. او یک سرمایه‌گذار، کارآفرین و متخصص برنامه‌نویسی آمریکایی متولد سال ۱۹۸۵ است. آلتمن مانند بسیاری دیگر از شناخته‌شده‌های دنیای تکنولوژی، تحصیل خود در دانشگاه بزرگی چون استنفورد را ناتمام رها کرد.

OpenAI خود را به‌عنوان یک سازمان تحقیقاتی هوش مصنوعی معرفی می‌کند. این شرکت ChatGPT را در سال ۲۰۱۸ معرفی و در اواخر سال ۲۰۲۲ از آن رونمایی کرد. OpenAI‌ از سال ۲۰۱۹ زیرساختی به نام Azure استفاده می‌کند که توسط مایکروسافت و پردازنده‌های گرافیکی Nvidia پشتیبانی می‌شود. در زمان نگارش این مقاله، پیشرفته‌ترین نسخه ChatGPT، از مدل Chat4 استفاده می‌کند که با نام تجاری ChatGPT Plus شناخته می‌شود.

ChatGPT چطور کار می کند؟

به‌طورخلاصه ChatGPT از یک شبکه‌ی عصبی گسترده برای تولید زبانی شبیه به زبان انسان و برقراری ارتباط از طریق آن استفاده می‌کند. شبکه‌ی عصبی به ChatGPT کمک می‌کند که پاسخ‌هایی هرچه مربوط‌تر، معنادارتر، دقیق‌تر و سریع‌تر در رابطه با پرسش مطرح‌شده توسط کاربر بیابد.

شبکه‌های عصبی، یکی از مهم‌ترین بحث‌های مطرح در هوش مصنوعی هستند و دامنه‌ی فعالیت آن را از محدوده‌ی ماشین لرنینگ و دیپ لرنینگ بسیار فراتر می‌برند. این شبکه‌ها درحقیقت الگوریتم‌هایی هستند که برای تقلید ارتباط نورون‌های مغز انسان با یکدیگر آموزش دیده‌اند. هدف آن‌ها نیز این است که روش مغز در یادگیری از تجربیات قبلی و داده‌های فعلی‌اش را تکرار کند. برای درک بهتر کارکرد شبکه‌های عصبی و الگوریتم‌های یادگیری باید بدانید که هوش مصنوعی چیست و چطور کار می‌کند؟

جالب توجه است که ChatGPT‌ می‌تواند حتی هدف ما از سوالاتمان را تشخیص دهد. به این معنی که اگر سوالات ناقص یا غیرشفافی نیز از سوی کاربر مطرح شوند، این برنامه منطقی‌ترین جواب‌ها را برای آن ارائه می‌کند. همین توانایی، سبب سرگرمی بسیاری از افراد شده است. به‌طوری‌که با پرسش سوالات عجیب و بعضا خنده‌دار نیز جواب‌هایی دریافت می‌کنند که حداقل ازنظر دستور زبان و ارتباط اطلاعات، منطق نسبتا خوبی دارند.

مراحل کار چت جی پی تی

اما مراحل کار ربات ChatGPT‌ چیست؟ این ربات کار خود را در پنج مرحله‌ی زیر انجام می‌دهد:

  • پردازش مقدار ورودی. در این مرحله، کاربر ChatGPT دستور یا سوال خود را در نوار متن این برنامه تایپ می‌کند.
  • توکنیزیشن. منظور از Tokenization نشانه‌گذاری متن ورودی با تجزیه‌وتحلیل و تقسیم آن به کلمات جداگانه است.
  • جایگذاری ورودی. در این مرحله، متن توکنیزه‌شده در ترانسفورماتورهای شبکه‌ی عصبی قرار می‌گیرد.
  • رمزگذاری و رمزگشایی متن. در این مرحله، ترانسفورماتور با راه‌اندازی مدل رمزگذار-رمزگشا (Encoder-decoder attention) متن ورودی را ابتدا رمزگذاری می‌کند. در ادامه، یک توزیع احتمال برای همه‌ی خروجی‌های ممکن تولید می‌شود. این توزیع احتمال نیز نتایج را تولید می‌کند.
  • تولید متن خروجی. در این مرحله، متن خروجی به‌صورت متن به کاربر نشان داده می‌شود.

فرآیند جستجوی ChatGPT در اینترنت

حتما می‌پرسید که ChatGPT چطور در اینترنت به‌دنبال جواب سوال ما می‌گردد و پاسخ‌هایش را غربال می‌کند. ازنظر فنی، این فرآیند، پیچیده است؛ اما به‌طورکلی باید گفت که این ربات، هر اطلاعاتی که می‌تواند به‌صورت آنلاین پیدا کند را بررسی می‌کند.

در یک منطق ساده، کار چت جی پی تی با اینترنت و موتورهای جستجو با حدس و آزمون‌وخطاست. به این معنی که ابتدا یک رشته کلمات را براساس جستجویش دریافت کرده و سپس کلمات پشت‌سرهم را یکی‌یکی پنهان می‌کند. در ادامه، تلاش برای حدس کلمه‌ی بعدی شروع می‌شود. اگر حدس برنامه اشتباه باشد، خودش را تا زمان رسیدن به کلمه‌ی درست بعدی به‌روزرسانی می‌کند. به‌منظور رعایت دستورزبان و جمله‌بندی درست نیز از یک مدل پاداش‌دهی استفاده می‌شود.

یادگیری تقویتی در ChatGPT

یکی از مهم‌ترین عوامل موفقیت و نیز ویژگی‌های متمایزکننده ChatGPT به‌کارگیری مکانیسم یادگیری تقویت‌شده در آن است. به‌طورکلی، ماشین‌های یادگیری در هوش مصنوعی، از سه روش یادگیری نظارت‌شده توسط انسان، غیرنظارتی و تقویتی استفاده می‌کنند.

روش تقویتی، ترکیبی از دو روش نظارتی و غیرنظارتی است. به این معنی که ماشین می‌تواند به‌طورخودکار یاد بگیرد و ایراداتش را اصلاح کند؛ اما همچنان از بازخوردهای انسانی به‌عنوان یک عامل تاییدکننده‌ی صحت و اعتبار پاسخ‌ها کمک بگیرد. به این روش یادگیری، RLHF‌ مخفف عبارت Reinforcement Learning from Human Feedback گفته می‌شود. مدل یادگیری RLHF و تقویت هرچه بیشتر آن، درحال‌حاضر تنها پاسخی است که OpenAI توانسته است به دغدغه‌ی کاربران درخصوص صحت و اعتبار پاسخ‌های ChatGPT بدهد.