امارات از مدل هوش مصنوعی به زبان عربی رونمایی کرد

زومیت نوشت: امارات در همکاری با یک شرکت آمریکایی، مدل زبانی جدیدی رونمایی کرده است که به دو زبان عربی و انگلیسی تسلط دارد.

یک گروه متمرکزبر هوش مصنوعی که با خانواده‌ی سلطنتی حاکم بر ابوظبی ارتباط دارد، ادعا می‌کند «باکیفیت‌ترین نرم‌افزار عربی هوش مصنوعی دنیا» را رونمایی کرده است. این مدل هوش مصنوعی جدید در حالی معرفی می‌شود که امارات متحده‌ی عربی سعی دارد استفاده از هوش مصنوعی مولد را در ناحیه‌ی خلیج فارس گسترده‌تر کند.

مدل زبانی بزرگ (LLM) جدید امارات که متن‌باز و دوزبانه است، جیس (Jais) نام دارد. این مدل زبانی بر پایه‌ی دیتاستی از داده‌های زبان عربی و انگلیسی توسعه داده شده و هم‌اکنون برای عموم عرب‌زبانان دنیا قابل‌استفاده است.

مدل زبانی جدید امارات نتیجه‌ی همکاری G42 (شرکت هوش مصنوعی تحت مالکیت مشاور امنیت ملی امارات)، دانشگاه هوش مصنوعی محمد بن زاید عربستان (MBZUAI) و شرکت آمریکایی Cerebras است.

جیس «باکیفیت‌ترین نرم‌افزار عربی هوش مصنوعی دنیا» است

به‌گزارش فایننشال تایمز، امارات و عربستان سعودی در هفته‌های اخیر هزاران گرافیک انویدیا H100 را که پیشرفته‌ترین و قدرتمندترین تراشه‌ی حوزه‌ی هوش مصنوعی محسوب می‌شود، خریداری کرده‌اند. این دو کشور درحالی موفق به خرید H100 شده‌اند که تراشه‌ی موردبحث انویدیا پردرخواست‌ترین محصول حال حاضر صنعت فناوری است و بسیاری از شرکت‌های بزرگ برای خریدش دست‌وپا می‌زنند.

امارات پیش‌تر مدل زبانی بزرگ متن‌بازی به نام فالکون (Falcon) را با بهره‌گیری از بیش‌از ۳۰۰ گرافیک انویدیا در مؤسسه‌ی نوآوری فناوری شهر مصدر توسعه داده بود. شرکت Cerebras که مقر مرکزی‌اش در کالیفرنیا قرار دارد، اوایل سال ۲۰۲۳ قراردادی ۱۰۰ میلیون دلاری امضا کرد تا ۹ ابرکامپیوتر در دسترس شرکت G42 قرار دهد. این یکی از بزرگ‌ترین قراردادها با محوریت هوش مصنوعی محسوب می‌شود.

اندرو جکسون، مدیرعامل Inception (واحد تحقیقاتی شرکت G42)، می‌گوید: «امارات متحده‌ی عربی در حوزه‌ی هوش مصنوعی پیشگام بوده است و ما از رقبا جلوتریم. اکثر مدل‌های زبانی بزرگ، بر انگلیسی متمرکزند. عربی یکی از بزرگ‌ترین زبان‌های دنیا است. چرا جامعه‌ی عرب‌زبان نباید مدل زبانی بزرگ داشته باشد؟»

هدف کشورهای حاشیه‌ی خلیج فارس برای رهبری در حوزه‌ی هوش مصنوعی، نگرانی غرب را به‌دنبال داشته است. آمریکا مشخص نگران سوءاستفاده‌ی احتمالی کشورهای نفت‌خیز از توانایی‌های هوش مصنوعی است.

پیشرفته‌ترین مدل‌های زبانی بزرگ حال حاضر دنیا یعنی GPT-4 و Google PaLM و Meta LLaMA همگی می‌توانند متن عربی را بفهمند و تولید کنند؛ بااین‌حال اندرو جکسون می‌گوید دقت آن مدل‌ها را در زبان عربی قبول ندارد.

خالقان جیس ادعا می‌کنند این مدل زبانی بزرگ در زمینه‌ی دقت زبان عربی عملکرد بهتری نسبت‌ به فالکون و سایر مدل‌های متن‌باز مثل LLaMA نشان می‌دهد. توسعه‌دهندگان فالکون گفته‌اند که آن مدل زبانی بر پایه‌ی زبان عربی تعلیم داده نشده بود.

جیس درمقایسه‌با فالکون، درک بهتری از فرهنگ منطقه‌ی خلیج فارس و کشورهای عرب‌زبان دارد. امارات می‌گوید جیس به‌گونه‌ای طراحی شده است «که از نظر حساسیت‌های فرهنگی و مذهبی، از محدوده‌ی معقول خارج نشود.»

توسعه‌دهندگان جیس، آزمایش‌های گسترده‌ای را انجام داده‌اند تا محتواهای «مضر و حساس» را از این مدل زبانی حذف کنند. این مدل زبانی که نامش را از مرتفع‌ترین کوه امارات گرفته، به‌مدت ۲۱ روز توسط ابرکامپیوتر هوش مصنوعی Condor Galaxy 1 تعلیم داده شده است.

۵۸۵۸