پرسشی ساده که احتمالا جوابش را نمی‌دانید/ جی‌پی‌تی در «چت جی‌پی‌تی» چه معنایی دارد؟

یورونیوز نوشت: این روزها بعید است کسی اینترنت‌گردی کند و این طرف و آن طرف چشمش به «چت جی‌پی‌تی» و زلزله‌ای که به راه انداخته نیفتد. این پدیده در نام خود اشاره‌ای مختصر به فناوری پیشرفته‌ای دارد که پیش از این برای عموم چندان شناخته‌شده نبود.

علیرغم این محبوبیت اما شاید تعداد قابل توجهی از مردم نتوانند به شما بگویند که جی‌پی‌تی در «چت جی‌پی‌تی» چه چیزی را نشان می‌دهد. این کلمه در واقع مخفف «ترانسفورمر تولیدگر از پیش‌ آموزش‌ دیده» (Generative Pre-trained Transformer) است.

برای توضیح این عبارت ابتدا باید دانست که چت جی‌پی‌تی در اصل یک برنامه کامپیوتری مبتنی بر هوش مصنوعی است که مکالمات متنی تولید می‌کند. در واقع هر سوالی از آن بپرسید، چت جی‌پی‌تی بسیار طبیعی و همچون یک انسان برایتان یک متن آماده می‌کند و تحویل می‌دهد.

از نظر فنی‌تر اما اگر بخواهیم بگوییم، این ابزار مبتنی بر یک «مدل زبان» است. به این معنی که از مقادیر باورنکردنی از داده‌های متنی (نظیر کتاب‌ها، مقالات خبری و صفحات وب) تغذیه می‌کند و از آنها نحوه جمله‌سازی را می‌آموزد. وقتی یاد گرفت، آن وقت می‌تواند همان اطلاعات را دسته‌بندی کرده و به شما برگرداند (اگر سوال مرتبط بپرسید).

حالا می‌توانیم به همان اصطلاح اولیه برگردیم و برای دریافت مفهمومش حتی می‌توانیم از خود چت چی‌پی‌تی هم سوال بپرسیم. در اصل «ترانسفورمر تولیدگر از پیش آموزش‌دیده» اصطلاحی است که ویژگی‌های کلیدی معماری مدل زبان را توصیف می‌کند و اگر آن را بشکنیم می‌توانیم بهتر مفهومش را درک کنیم:

۱. تولیدگر: در مبحث پردازش زبان طبیعی، تولیدگر به این معنی است که مدل قادر به تولید متن جدیدی است که شبیه به زبان انسان باشد. این متن جدید می‌تواند شامل جمله‌ها، پاراگراف‌ها و یا عبارت‌های طولانی‌تر منسجم و مناسب باشد.

۲. از پیش آموزش‌دیده: این عبارت به مرحله اولیه آموزش‌دهی مدل زبانی اشاره دارد. در طول این پروسه، مدل زبانی با استفاده از مجموعه بزرگی از متون اینترنتی یا منابع دیگری که در اختیار دارد یاد می‌گیرد کلمه بعدی در یک جمله را بر اساس کلمات قبلی پیش‌بینی کند. این فرآیند مدل را قادر می سازد تصویرسازی درستی از الگوهای آماری و روابط موجود بین داده‌ها داشته باشد.

۳. ترانسفورمر: این کلمه اشاره به نوع خاصی از معماری یادگیری عمیق دارد. این معماری با استفاده از سازوکارهایی که از آن برخوردار است مدل را قادر می‌سازد تا به هنگام تولید خروجی، اهمیت کلمات مختلف در ورودی را بسنجد و در نظر بگیرد. ترانسفورمرها به دلیل توانایی‌شان در مدیریت داده و و قابلیت موازی‌سازی‌شان در پردازش زبان طبیعی محبوب شده‌اند.

در حال حاضر چت جی‌پی‌تی و شرکت سازنده‌اش اوپن ای‌آی شناخته‌شده‌ترین نام‌های حوزه «ترانسفورمر از پیش آموزش‌دیده» هستند، با این حال شرکت‌های متعددی وجود دارند که وارد گردونه رقابت با آن شده‌اند.

انتظار می‌رود در سال‌های آینده شرکت‌های تخصصی بیشتری در این زمینه فعال شوند، چرا که به اعتقاد بسیاری این حوزه فناوری آینده را تشکیل می‌دهد.

۵۸۵۸