امروزه Kinara با داشتن یک رویکرد مقرون به صرفه، پردازنده جدید هوش مصنوعی edge خود را که برای تحمل بارهای کاری سخت ایجاد شده و توسط هوش مصنوعی مولد طراحی شده است، عرضه می کند.
برنامه های کاربردی هوش مصنوعی، مانند ChatGPT، در 12 ماه گذشته در بسیار مورد توجه قرار گرفته اند.
ثابت شده است که این حجم های کاری بسیار گران و پرهزینه هستند، بنابراین به طور طبیعی، آنها عمدتاً خود را محدود به پردازش ابری و مراکز داده می دانند. با این حال، در حال حاضر صنعت شروع به مشاهده فشاری به سمت بالا بردن این حجم کاری مولد هوش مصنوعی کرده است. برای رسیدگی به این فضای بازار رو به رشد، امروز Kinara پردازنده جدید Ara-2 خود را منتشر کرد که به صراحت برای کاربردهای هوش مصنوعی طراحی شده است.
مجموعه دستورالعمل بهینه سازی عصبی پردازنده هوش مصنوعی Kinara Ara-2 یک تراشه پیشرفته است که برای کاربردهای هوش مصنوعی لبهای (edge) طراحی شده است و بر کارایی، کارایی و تطبیق پذیری تأکید دارد. این تراشه که در یک بسته کوچک 17x17 میلی متری EHS-FCBGA ارائه می شود، حول 8 هسته عصبی Gen-2 طراحی شده است. این هستهها موتورهای محاسباتی کاملاً قابل برنامهریزی با مجموعه دستورالعملهای بهینهشده عصبی هستند. یکی از مهمترین نکات طراحی این تراشهها، بهرهوری انرژی است. به این ترتیب، Kinara ویژگی جدیدی را در پشتیبانی از انواع داده های جدید، از جمله Integer 4 و MSFP16 به Ara-2 اضافه کرد. با پشتیبانی از این نوع داده های جدید، Ara-2 پشتیبانی از شبکه های پیش کوانتیزه TensorFlow Lite و PyTorch را اضافه می کند که کاربرد تراشه را در مدل های مختلف هوش مصنوعی گسترش می دهد و امکان پردازش داده های انعطاف پذیرتر و کارآمدتر را فراهم می کند.
بلوک دیاگرام سطح سیستم Ara-2 شاهد ارتقاء بزرگی در ظرفیت حافظه با حداکثر 16 گیگابایت LPDDR4/DDR4X در هر تراشه است.
این پیامدهای بزرگی برای پردازش لبه دارد و با 16 گیگابایت حافظه LPDDR4 DRAM، یک Ara-2 می تواند تا 30 میلیارد پارامتر را در int4 پشتیبانی کند، به این معنی که می تواند یک مدل زبان برنامه نویسی بزرگ را اجرا کند. از نظر عملکرد، این تراشه نسبت به نسل قبلی خود مزایایی نیز دارد. تراشه جدید که قادر به تولید یک تصویر انتشار پایدار در حدود 10 ثانیه در هر تصویر است، عملکرد هوش مصنوعی مولد را ارائه می دهد که 5× تا 8× بهتر از Ara-1 است. برای مدل های پردازش تصویر، Ara-2 می تواند Resnet50 را با تاخیر 2 میلی ثانیه اجرا کند.