
گوگل با انتشار مدلهای زبانی جدید تحت عنوان T۵Gemma، امکان استفاده از معماری رمزگذار-رمزگشا را برای توسعهدهندگان فراهم کرده است؛ این مدلها با تغییر رویکرد نسبت به نسلهای قبلی و ارائه قابلیتهای تازه، در سکو HuggingFace برای استفاده در دسترس قرار گرفتهاند.
گوگل نسل تازهای از مدلهای زبانی خود را با نام T۵Gemma معرفی نمود. این مدلها بر پایه معماری رمزگذار-رمزگشا طراحی و عرضه شدهاند؛ معماریای متشکل از دو بخش، که به ترتیب ابتدا داده ورودی را تحلیل کرده و سپس پاسخ متناسب را تولید میکند. این طراحی تفاوت عمدهای با ساختار مدلهایی مانند سری GPT دارد که عموماً تنها بخش رمزگشایی را شامل میشوند.
در توسعه T۵Gemma، گوگل با بهرهگیری از تکنیک انطباقپذیری، مدلهایی که صرفاً دارای قابلیت رمزگشایی بودند را با افزودن بخش رمزگذار، به مدلهایی با توانایی پردازش دقیقتر تبدیل کرده است. در این شیوه، ابتدا کل جمله ورودی توسط رمزگذار تحلیل میشود و پس از آن رمزگشا کار تولید پاسخ را انجام میدهد. این فرآیند باعث افزایش دقت مدل در درک محتوا و تولید خروجی متناسب میشود.
به گزارش وبلاگ گوگل توسعهدهندگان، مدلهای T۵Gemma در اندازههای پارامتری مختلف ارائه شدهاند، به طوری که ترکیبی از مدلهایی با ۲ میلیارد و ۹ میلیارد پارامتر عرضه گردیده است. این تنوع به توسعهدهندگان فرصت میدهد تا با توجه به نیاز خود، از مدل مناسب بهره ببرند.
علاقهمندان و توسعهدهندگان میتوانند مدلهای جدید T۵Gemma را از طریق پلتفرم HuggingFace دانلود و در پروژههای خود مورد استفاده قرار دهند. گوگل هدف از این اقدام را ایجاد امکان بالاتر رفتن دقت و بهبود درک رایانهای زبان در کاربردهای مختلف عنوان کرده است.
source