وبلاگ پل‌وینو بخش هوش مصنوعی

وبلاگ پل‌وینو
۲۶ آبان ۱۴۰۰ 0

استفاده از مدل GPT-3 در چت‌بات

این مدل زبانی پیشرفته، امکان پاسخ‌گویی به تقریباً هر سؤالی که از آن پرسیده شود را دارد.


 

توسط محمد سجاد اقادادی، مدیر پروژه چت‌بات مرکز نوآوری پل‌وینو

 

GPT-3 چیست؟

GPT-3 مخفف «generative pre-trained transformer-3»، یک مدل زبانی است که توسط شرکت OpenAI توسعه داده شده و بر روی حجم بسیار بزرگی از دیتاست‌های اینترنت آموزش[۱] داده شده است. GPT-3 همراه با API مربوط به خودش مورد استفاده قرار می‌گیرد. در حال حاضر برای استفاده از GPT-3 نیاز به ارسال درخواست به سایت توسعه‌دهنده است که پس از قرار گرفتن در یک لیست انتظار، درخواست بررسی شده و به آن ترتیب اثر خواهند داد[۲]. برخی ویژگی‌های مدل زبانی GPT-3 به شرح زیر است:

  • مدل GPT-3 از 175 میلیارد پارامتر تشکیل شده است حال آنکه مدل قبلی یعنی GPT-2 از 1.5 میلیارد پارامتر تشکیل شده است. منظور از پارامتر در این مدل‌ها، وزن‌های شبکه عصبی استفاده شده در آنها است که وظیفه تبدیل کردن ورودی به خروجی را برعهده دارند.
  • GPT-3 یک مدل مولد[۳] است به این معنا که قابلیت تولید یک جمله بلند و منسجم از کلمات در خروجی را دارد.
  • این مدل زبانی پیشرفته، امکان پاسخ‌گویی به تقریباً هر سؤالی که از آن پرسیده شود را دارد.
  • استفاده از میلیاردها کلمه، متن و کد در آموزش این مدل، آن را قادر به انجام خودکار عمل کدنویسی با انواعی از زبان‌های برنامه‌نویسی می‌کند.
  • یک پردازش متن چندزبانه است که امکان استفاده از آن در زبان‌هایی به جز زبان انگلیسی نیز وجود دارد.
  • بهترین جنبه از مدل GPT-3 استفاده از آن برای انجام کارهای مشخص از جمله به‌عنوان مترجم، چت‌بات و تولید‌کننده کد[۴] است که نیازی به شخصی‌سازی و یا تنظیم[۵] خاصی ندارد و تنها کافی است تعداد کمی داده آموزشی[۶] داشته باشیم.

باتوجه به ویژگی‌های GPT-3 امکان استفاده از آن در کاربردهای زیادی وجود دارد که همانطور که اشاره شد می‌توان چت‌بات‌ها، مترجم‌ها و موتور تبدیل متن به معادلات ریاضی را مثال زد. در این گزارش کاربرد GPT-3 در چت‌بات‌ها را بررسی خواهیم کرد.

 

کاربرد GPT-3 در چت‌بات‌ها

معماری چت‌بات‌های معمول و سنتی شامل دو قسمت اصلی درک زبان طبیعی (NLU)[۷] و مدیریت گفتار[۸] است.


معماری چت بات


قسمت NLU در چت‌بات‌ها وظیفه مشخص کردن مقصود[۹] و موجودیت[۱۰](به‌عنوان کلمات کلیدی) از میان ورودی کاربر به چت‌بات را برعهده دارد و قسمت گفتار وظیفه مدیریت نحوه پاسخ‌دهی و همچنین وضعیت مکالمه را برعهده دارد. GPT-3 به‌صورت کامل این ساختار را تغییر نداده است، از طرفی بستری برای توسعه دادن چت‌بات هم نیست؛ بلکه کاری که در اصل انجام می‌دهد بهبود بخشیدن و تکمیل کردن نحوه عملکرد یک چت‌بات موجود است. نمونه‌هایی از موارد کاربرد GPT-3 در چت‌بات در ادامه معرفی شده‌اند:

  • تصحیح گرامر[۱۱]: درحال حاضر یک‌سری APIهایی وجود دارند که وظیفه تصحیح کردن گرامر و غلط‌های املایی در متون را برعهده دارند ولی کافی نیستند. در چت‌بات‌ها هنگامی که نتوان مقصود و موجودیت‌ها را تشخیص داد می‌توان از API مربوط به تصحیح گرامر استفاده کرد.
  • خلاصه‌سازی متن[۱۲]: این قابلیت به این دلیل در چت‌بات‌ها کاربرد دارند که به‌عنوان مثال در کوتاه‌سازی ورودی کاربر به چت‌بات می‌توان از آن استفاده کرد، همچنین در پاسخ دادن کوتاه به کاربر نیز می‌تواند به‌کار رود. حالتی را درنظر بگیرید که پاسخ کاربر یک متن طولانی و بزرگ است و با این تکنیک می‌توان خلاصه متن و قسمت‌های با اهمیت آن را به کاربر نمایش داد.
  • استخراج کلید واژه‌ها[۱۳]: همانطور که اشاره شد استخراج مقصود و موجودیت از جمله وظایف اصلی یک چت‌بات است که با استفاده از این ویژگی می‌توان این کار را با کیفیت و دقت بالایی انجام داد.
  • تولید متن[۱۴]: یکی از قابلیت‌های بسیار مهمی که مدل GPT-3 دارد و از آن می‌توان در چت‌بات استفاده کرد ویژگی تولید متن است. در بیشتر چت‌بات‌ها، پاسخ‌های محتمل از قبل تعریف شده‌اند و باتوجه به سؤالی که کاربر مطرح می‌کند پاسخ به او نمایش داده می‌شود. حال آنکه با استفاده از این ویژگی می‌توان پاسخ کاربر را در لحظه تولید کرد و به او نمایش داد به‌طوری که با مطرح کردن هر سؤال، پاسخ متفاوتی تولید و به نمایش درآید.


در این گزارش سعی شد مدل GPT-3 و کاربرد آن در چت‌بات به اختصار معرفی شود. در گزارش‌های آینده با مدل‌های زبانی دیگر از جمله Bert آشنا خواهید شد.

 

 

 

منابع:

How To Implement GPT-3 In Your Chatbot

?How to Build Amazing AI Use Cases under 10 Mins using GPT-3

 

 



[1] train

[2]  به‌منظور دسترسی به GPT-3 API بایستی درخواستی از طریق لینک https://beta.openai.com ارسال شود

[3] generative model

[4] code builder

[5] tuning

[6] training example

[7] natural language understanding

[8] Dialog Management

[9] Intent

[10] Entity

[11] Grammar Correction

[12] Text Summarization

[13] Keywords

[14] Text generation

  

نظر دهید

* نام شما
* ایمیل شما
* نظر شما
تمامی حقوق مربوط به طراحی و توسعه وب سایت محفوظ می باشد Polwinno.ir
X

جستجوی سریع محتوای تخصصی پل‌وینو


v