در سالهای اخیر هوش مصنوعی از یک رویا، هرچه بیشتر تبدیل به واقعیت شده است. یکی از آخرین پیشرفتها در این صنعت، ChatGPT است. این تکنولوژی در زمان نگارش این مقاله، یعنی آوریل ۲۰۲۳ بهعنوان آخرین دستاورد هوش مصنوعی تجاری درنظر گرفته میشود.
چت جی پی تی، یک پردازشگر هوشمند زبان است که برای اولین بار در دسامبر ۲۰۲۲ معرفی شد. این تکنولوژی AI، سریعتر از هر تکنولوژی مبتنی بر اینترنت دیگری محبوبیت یافت و در کمتر از دو ماه حدود ۱۰۰ میلیون کاربر فعال پیدا کرد. دستاوردی که رسیدن به آن برای اینستاگرام دو سال و برای تیکتاک ۹ ماه بهطول انجامید.
اما برنامه ChatGPT چیست؟ چطور کار میکند؟ چگونه میتوان از آن استفاده کرد؟ از همه مهمتر برای کاربران ایرانی این سوال مطرح است که آیا میتوان از داخل ایران با آن کار کرد؟ در این مقاله به این سوالات بههمراه بررسی جزئیات زیادی از این تکنولوژی پاسخ خواهیم داد. با ما همراه شده و با یکی از مهمترین بازیگران تکنولوژی در دنیای امروز و آینده آشنا شوید.
ChatGPT چیست؟
بهطورساده ChatGPT یک ربات چت هوش مصنوعی با زبان طبیعی است به این معنی که میتوان از آن هر سوالی پرسید و جواب دریافت کرد. ChatGPT مخفف عبارت Chat Generative Pre-Trained Transformer است. عنوانی که بهخودیخود تفاوت آن با دستیارهای صوتی مانند Siri و Alexa را نشان میدهد. کلمات Generative و Pre-Trained بیانکنندهی این مطلب هستند که ChatGPT از شبکههای عصبی توسعهیافته با مدلهای دیپ لرنینگ یا یادگیری عمیق بهره میبرد. این شبکهها پاسخهایشان را در قالب الگوهای نوشتاری زبان انسان ارائه میکنند.
درحقیقت برنامه ChatGPT یک پروژهی پردازش زبان طبیعی در مقیاس بزرگ یا Large Language Model و بهاختصار LLM است. این ساختار از معماری GPT-3 بهمنظور غربال کردن حجم عظیم دادههای بهدستآمده از منابع اینترنتی استفاده میکند.
مزیت دیپ لرنینگ برای ChatGPT
الگوریتمهای دیپ لرنینگ به ChatGPT کمک میکنند که با حجم عظیمی از دادههای متنی در اینترنت در مدتزمان اندک کار کرده و جواب خود را آماده کند. درحقیقت ChatGPT در حالت ایدهآل خود بهدنبال درک ارتباطات انسانی در قالب نوشتار و بهکارگیری ساختار ذهن انسان بهمنظور تولید پاسخهای مناسب متنی است. این برنامه با منابع بیپایانی از دادههای متنی تغذیه میشود. ChatGPT بهعنوان یک منبع کسب دانش و اطلاعات شناخته میشود؛ اما توانایی آن در برقراری ارتباط، ویژگی متمایزکنندهاش از برنامههای مشابه است.
هدف اولیه ChatGPT چیست؟
اگر میپرسید که مهمترین هدف ربات chatgpt چیست؟ باید بگوییم پاسخ به هر سوالی که دربارهاش در اینترنت اطلاعاتی متنی وجود دارد. این اهداف میتواند گردآوری، تولید محتوای متنی، ترجمه، خلاصهنویسی، پرسشوپاسخ، تکمیل و توسعهی دیکشنریهای آنلاین و غیره باشد.
چند ویژگی مهم ChatGPT
از مهمترین ویژگیهای ChatGPT نیز میتوان به موارد زیر اشاره کرد:
- شامل بیش از ۱۷۵ میلیارد پارامتر که آن را به یکی از بزرگترین مدلهای هوش مصنوعی زبانی تبدیل کرده است.
- تغذیهشده با الگوریتمهای ازپیش آموزشدادهشده
- قابلیت انجام چندین وظیفهی همزمان
- سرعت بسیار بالا و تقریبا درلحظه
تاریخچه توسعه ChatGPT
شرکت اصلی توسعهدهندهی برنامه هوش مصنوعی چت جی پی تی، OpenAI نام دارد. این شرکت در سال ۲۰۱۵ توسط ایلان ماسک، مالک کمپانیهای تسلا و SpaceX، سم آلتمن (Sam Altman)، گرگ براکمن (Greg Brockman)، ایلیا سوتسکور (Ilya Sutskever) و وویچ زارمبا (Wojciech Zaremba) تاسیس شد. محل استقرار OpenAI در سانفرانسیسکوی آمریکاست.
درحالحاضر سم آلتمن مدیریت عامل OpenAI را برعهده دارد. او یک سرمایهگذار، کارآفرین و متخصص برنامهنویسی آمریکایی متولد سال ۱۹۸۵ است. آلتمن مانند بسیاری دیگر از شناختهشدههای دنیای تکنولوژی، تحصیل خود در دانشگاه بزرگی چون استنفورد را ناتمام رها کرد.
OpenAI خود را بهعنوان یک سازمان تحقیقاتی هوش مصنوعی معرفی میکند. این شرکت ChatGPT را در سال ۲۰۱۸ معرفی و در اواخر سال ۲۰۲۲ از آن رونمایی کرد. OpenAI از سال ۲۰۱۹ زیرساختی به نام Azure استفاده میکند که توسط مایکروسافت و پردازندههای گرافیکی Nvidia پشتیبانی میشود. در زمان نگارش این مقاله، پیشرفتهترین نسخه ChatGPT، از مدل Chat4 استفاده میکند که با نام تجاری ChatGPT Plus شناخته میشود.
ChatGPT چطور کار می کند؟
بهطورخلاصه ChatGPT از یک شبکهی عصبی گسترده برای تولید زبانی شبیه به زبان انسان و برقراری ارتباط از طریق آن استفاده میکند. شبکهی عصبی به ChatGPT کمک میکند که پاسخهایی هرچه مربوطتر، معنادارتر، دقیقتر و سریعتر در رابطه با پرسش مطرحشده توسط کاربر بیابد.
شبکههای عصبی، یکی از مهمترین بحثهای مطرح در هوش مصنوعی هستند و دامنهی فعالیت آن را از محدودهی ماشین لرنینگ و دیپ لرنینگ بسیار فراتر میبرند. این شبکهها درحقیقت الگوریتمهایی هستند که برای تقلید ارتباط نورونهای مغز انسان با یکدیگر آموزش دیدهاند. هدف آنها نیز این است که روش مغز در یادگیری از تجربیات قبلی و دادههای فعلیاش را تکرار کند. برای درک بهتر کارکرد شبکههای عصبی و الگوریتمهای یادگیری باید بدانید که هوش مصنوعی چیست و چطور کار میکند؟
جالب توجه است که ChatGPT میتواند حتی هدف ما از سوالاتمان را تشخیص دهد. به این معنی که اگر سوالات ناقص یا غیرشفافی نیز از سوی کاربر مطرح شوند، این برنامه منطقیترین جوابها را برای آن ارائه میکند. همین توانایی، سبب سرگرمی بسیاری از افراد شده است. بهطوریکه با پرسش سوالات عجیب و بعضا خندهدار نیز جوابهایی دریافت میکنند که حداقل ازنظر دستور زبان و ارتباط اطلاعات، منطق نسبتا خوبی دارند.
مراحل کار چت جی پی تی
اما مراحل کار ربات ChatGPT چیست؟ این ربات کار خود را در پنج مرحلهی زیر انجام میدهد:
- پردازش مقدار ورودی. در این مرحله، کاربر ChatGPT دستور یا سوال خود را در نوار متن این برنامه تایپ میکند.
- توکنیزیشن. منظور از Tokenization نشانهگذاری متن ورودی با تجزیهوتحلیل و تقسیم آن به کلمات جداگانه است.
- جایگذاری ورودی. در این مرحله، متن توکنیزهشده در ترانسفورماتورهای شبکهی عصبی قرار میگیرد.
- رمزگذاری و رمزگشایی متن. در این مرحله، ترانسفورماتور با راهاندازی مدل رمزگذار-رمزگشا (Encoder-decoder attention) متن ورودی را ابتدا رمزگذاری میکند. در ادامه، یک توزیع احتمال برای همهی خروجیهای ممکن تولید میشود. این توزیع احتمال نیز نتایج را تولید میکند.
- تولید متن خروجی. در این مرحله، متن خروجی بهصورت متن به کاربر نشان داده میشود.
فرآیند جستجوی ChatGPT در اینترنت
حتما میپرسید که ChatGPT چطور در اینترنت بهدنبال جواب سوال ما میگردد و پاسخهایش را غربال میکند. ازنظر فنی، این فرآیند، پیچیده است؛ اما بهطورکلی باید گفت که این ربات، هر اطلاعاتی که میتواند بهصورت آنلاین پیدا کند را بررسی میکند.
در یک منطق ساده، کار چت جی پی تی با اینترنت و موتورهای جستجو با حدس و آزمونوخطاست. به این معنی که ابتدا یک رشته کلمات را براساس جستجویش دریافت کرده و سپس کلمات پشتسرهم را یکییکی پنهان میکند. در ادامه، تلاش برای حدس کلمهی بعدی شروع میشود. اگر حدس برنامه اشتباه باشد، خودش را تا زمان رسیدن به کلمهی درست بعدی بهروزرسانی میکند. بهمنظور رعایت دستورزبان و جملهبندی درست نیز از یک مدل پاداشدهی استفاده میشود.
یادگیری تقویتی در ChatGPT
یکی از مهمترین عوامل موفقیت و نیز ویژگیهای متمایزکننده ChatGPT بهکارگیری مکانیسم یادگیری تقویتشده در آن است. بهطورکلی، ماشینهای یادگیری در هوش مصنوعی، از سه روش یادگیری نظارتشده توسط انسان، غیرنظارتی و تقویتی استفاده میکنند.
روش تقویتی، ترکیبی از دو روش نظارتی و غیرنظارتی است. به این معنی که ماشین میتواند بهطورخودکار یاد بگیرد و ایراداتش را اصلاح کند؛ اما همچنان از بازخوردهای انسانی بهعنوان یک عامل تاییدکنندهی صحت و اعتبار پاسخها کمک بگیرد. به این روش یادگیری، RLHF مخفف عبارت Reinforcement Learning from Human Feedback گفته میشود. مدل یادگیری RLHF و تقویت هرچه بیشتر آن، درحالحاضر تنها پاسخی است که OpenAI توانسته است به دغدغهی کاربران درخصوص صحت و اعتبار پاسخهای ChatGPT بدهد.