ایراد بزرگی که ژاپنی‌ها در هوش مصنوعی مشهور پیدا کردند

ایسنا نوشت: برخی از محققان ژاپنی احساس می‌کنند که سیستم‌های هوش مصنوعی آموزش دیده بر اساس زبان‌های خارجی غیر ژاپنی نمی‌توانند پیچیدگی‌های زبان و فرهنگ ژاپنی را درک کنند، بنابراین اکنون می‌خواهند نسخه‌ای از چت جی‌پی‌تی مخصوص ژاپن را توسعه دهند.

ژاپن در حال ساخت نسخه‌های خود از چت جی‌پی‌تی (ChatGPT) است. این ربات هوش مصنوعی که توسط شرکت آمریکایی OpenAI ساخته شده است پس از رونمایی در کمتر از یک سال قبل، به طور جهانی مورد توجه قرار گرفت.

دولت ژاپن و شرکت‌های بزرگ فناوری مانند NEC، فوجیتسو و سافت‌بانک صدها میلیون دلار برای ایجاد سیستم‌های هوش مصنوعی صرف می‌کنند که بر اساس همان فناوری زیربنایی معروف به مدل‌های زبانی بزرگ کار می‌کنند، اما به جای ترجمه نسخه انگلیسی از زبان ژاپنی استفاده می‌کنند.

کیسوکه ساکاگوچی (Keisuke Sakaguchi)، محقق دانشگاه توهوکو در ژاپن که متخصص پردازش زبان طبیعی است، می‌گوید: مدل‌های زبانی بزرگ عمومی فعلی، مانند جی‌پی‌تی، در زبان انگلیسی برتری دارند، اما اغلب در زبان ژاپنی به دلیل تفاوت در سیستم الفبا، داده‌های محدود و سایر عوامل دچار کاستی هستند.

تعصب زبان انگلیسی

مدل‌های زبانی بزرگ به طور معمول از حجم عظیمی از داده‌ها و منابع در دسترس عموم برای یادگیری الگوهای گفتار و نثر طبیعی استفاده می‌کنند. آنها آموزش می‌بینند که کلمه بعدی را بر اساس کلمات قبلی در یک متن پیش‌بینی کنند. اکثریت قریب به اتفاق متنی که مدل قبلی چت جی‌پی‌تی یعنی جی‌پی‌تی -۳ (GPT-۳)، براساس آن آموزش داده شده بود، به زبان انگلیسی بود.

توانایی قابل توجه چت جی‌پی‌تی در برقراری مکالمات مشابه انسان، هم محققان را خوشحال و هم نگران کرده است. برخی آن را یک ابزار بالقوه برای صرفه جویی در نیروی کار می‌دانند در حالی که دیگران نگران هستند که از آن برای ساخت مقالات یا داده‌های علمی استفاده شود.

در ژاپن، این نگرانی وجود دارد که سیستم‌های هوش مصنوعی آموزش‌دیده بر روی مجموعه‌های داده به زبان‌های دیگر نتوانند پیچیدگی‌های زبان و فرهنگ ژاپن را درک کنند. ساختار جملات در زبان ژاپنی کاملا متفاوت از انگلیسی است. بنابراین چت جی‌پی‌تی باید یک درخواست ژاپنی را به انگلیسی ترجمه کند، پاسخ را بیابد و سپس پاسخ را به ژاپنی ترجمه کند.

در حالی که زبان انگلیسی تنها ۲۶ حرف دارد، زبان ژاپنی نوشتاری متشکل از دو مجموعه ۴۸ حرفی اصلی، به علاوه ۲۱۳۶ نویسه چینی یا کانجی است که به طور منظم استفاده می‌شود. اکثر کانجی‌ها دو یا چند تلفظ دارند و ۵۰ هزار کانجی دیگر وجود دارد که به ندرت استفاده می‌شود. با توجه به این پیچیدگی، جای تعجب نیست که چت جی‌پی‌تی نتواند با این زبان دست و پنجه نرم کند.

ساکاگوچی می‌گوید در زبان ژاپنی، چت جی‌پی‌تی گاهی اوقات نویسه‌های بسیار کمیابی تولید می‌کند که اکثر مردم هرگز آن‌ها را ندیده‌اند و در نتیجه کلمات ناشناخته عجیب و غریب به‌وجود می‌آید.

هنجارهای فرهنگی

برای اینکه یک مدل زبانی بزرگ مفید و حتی از نظر تجاری قابل دوام باشد، باید فرهنگ و همچنین زبان را به طور دقیق منعکس کند. برای مثال، اگر از چت جی‌پی‌تی خواسته شود که یک ایمیل درخواست شغل به زبان ژاپنی بنویسد، ممکن است عبارات استاندارد ادبی را حذف کند و نتیجه آن مانند ترجمه‌ای واضح از انگلیسی به نظر برسد.

برای سنجش میزان حساسیت مدل‌های زبانی بزرگ نسبت به فرهنگ ژاپنی، گروهی از محققان راکودا (Rakuda) را راه اندازی کردند. راکودا رتبه بندی است که نشان می‌دهد مدل‌های زبانی بزرگ تا چه اندازه می‌توانند به سوالات باز در مورد موضوعات ژاپنی پاسخ دهند.

سم پاساگلیا (Sam Passaglia)، بنیانگذار راکودا و همکارانش، از چت جی‌پی‌تی خواستند که روان بودن و تناسب فرهنگی پاسخ‌ها را با درخواست‌های استاندارد مقایسه کند.

پاساگلیا، فیزیکدان دانشگاه توکیو که مدل‌های زبان ژاپنی را مطالعه می‌کند، می‌گوید: مسلما مدل‌های زبانی بزرگ ژاپنی بهبود زیادی می‌یابند، اما در حال حاضر آنها بسیار عقب‌تر از جی‌پی‌تی -۴ هستند. او می‌گوید، اصولا دلیلی وجود ندارد که یک مدل زبانی بزرگ ژاپنی نتواند در آینده برابر با جی‌پی‌تی-۴ باشد یا از آن پیشی بگیرد. این از نظر فنی قابل حل است، اما مشکل منابع وجود دارد.

یکی از تلاش‌ها برای ایجاد یک مدل زبانی بزرگ ژاپنی استفاده از ابررایانه ژاپنی فوگاکو (Fugaku) است. فوگاکو که یکی از سریع‌ترین‌های جهان است عمدتا مدل زبانی را بر اساس ورودی ژاپنی آموزش می‌دهد.

با حمایت موسسه فناوری توکیو، دانشگاه توهوکو، فوجیتسو و گروه مراکز تحقیقاتی ریکن (RIKEN) با بودجه دولتی، انتظار می‌رود مدل زبانی حاصل در سال آینده منتشر شود.

این مدل زبانی بزرگ برخلاف جی‌پی‌تی-۴ و سایر مدل‌های اختصاصی، به سایر مدل‌های زبانی منبع باز ملحق می‌شود تا کد خود را در دسترس همه کاربران قرار دهد. به گفته ساکاگوچی، که در این پروژه مشارکت دارد، محققان امیدوارند دستکم ۳۰ میلیارد پارامتر به آن بدهد که بر خروجی آن تأثیر می‌گذارد و می‌توانند به عنوان معیاری برای اندازه آن عمل کند.

با این حال، مدل زبانی فوگاکو ممکن است توسط یک مدل حتی بزرگتر جانشین شود.

وزارت آموزش، فرهنگ، ورزش، علم و فناوری ژاپن بودجه ایجاد یک برنامه هوش مصنوعی ژاپنی را که مطابق با نیازهای علمی است، تامین می‌کند که با یادگیری از تحقیقات منتشر شده، فرضیه‌های علمی ایجاد کند و به شناسایی اهداف برای تحقیقات سرعت بخشد. این مدل می‌تواند با ۱۰۰ میلیارد پارامتر شروع به کار کند که کمی بیش از نیمی از اندازه جی‌پی‌تی-۳ است و به مرور زمان گسترش می‌یابد.

ماکوتو تایجی (Makoto Taiji)، معاون مرکز تحقیقات دینامیک بیوسیستم ریکن، در مورد این پروژه می‌گوید: امیدواریم چرخه تحقیقات علمی را به طور چشمگیری سرعت بخشیم و فضای جستجو را گسترش دهیم. توسعه مدل زبانی بزرگ دستکم ۳۰ میلیارد ین (۲۰۴ میلیون دلار آمریکا) هزینه خواهد داشت و انتظار می‌رود در سال ۲۰۳۱ به صورت عمومی منتشر شود.

گسترش قابلیت‌ها

دیگر شرکت‌های ژاپنی در حال تجاری سازی یا برنامه‌ریزی برای تجاری‌سازی فناوری‌های مدل‌های زبانی بزرگ خود هستند.

سازنده ابر رایانه NEC در ماه مه استفاده از هوش مصنوعی مولد خود را بر اساس زبان ژاپنی آغاز کرد و ادعا می‌کند که این مدل زبانی زمان مورد نیاز برای ایجاد گزارش‌های داخلی را ۵۰ درصد و کد منبع نرم افزار داخلی را ۸۰ درصد کاهش می‌دهد. در ماه ژوئیه، این شرکت شروع به ارائه خدمات هوش مصنوعی با قابلیت شخصی‌سازی به مشتریان کرد.

ماسافومی اویامادا (Masafumi Oyamada)، محقق اصلی در آزمایشگاه‌های علوم داده NEC، می‌گوید که می‌توان از آن در طیف وسیعی از صنایع مانند صنایع مالی، حمل‌ونقل و تدارکات، توزیع و ساخت استفاده کرد. او اضافه می‌کند که محققان می‌توانند آن را برای نوشتن کد، کمک به نوشتن و ویرایش مقالات و بررسی مقالات منتشر شده موجود استفاده کنند.

در همین حال، شرکت مخابراتی ژاپنی سافت‌بانک (SoftBank)، حدود ۲۰ میلیارد ین روی هوش مصنوعی مولد آموزش داده شده بر روی متون ژاپنی سرمایه گذاری کرده و قصد دارد سال آینده مدل زبانی بزرگ خود را راه‌اندازی کند. سافت بانک که ۴۰ میلیون مشتری دارد و با مایکروسافت سرمایه گذار شرکت OpenAI نیز شراکت دارد، می‌گوید که قصد دارد به شرکت‌ها کمک کند تا کسب و کار خود را دیجیتالی کنند و بهره‌وری خود را افزایش دهند. سافت بانک انتظار دارد که مدل زبانی بزرگ آن‌ها توسط دانشگاه‌ها، موسسات تحقیقاتی و سایر سازمان‌ها مورد استفاده قرار گیرد.

در همین حال، محققان ژاپنی امیدوارند که یک چت‌بات هوش مصنوعی دقیق، موثر و ساخت ژاپن بتواند به سرعت بخشیدن به علم و پر کردن شکاف بین ژاپن و سایر نقاط جهان کمک کند.

۵۸۵۸