شرکت Cognition Labs، استارت آپی با بودجه 21 میلیون دلاری، Devin را به عنوان اولین مهندس نرم افزار جهان را بر اساس هوش مصنوعی (AI) به نمایش گذاشت.
Devin قادر به پاسخگویی به دستورات متنی است و می توان وظایفی مانند ارزیابی عملکرد معیار یک برنامه کاربردی را به او محول کرد. سپس با استفاده از رابط خط فرمان (CLI)، ویرایشگر کد و مرورگر خود، یک طرح میسازد و ابزارهای مورد نیاز خود را پیکربندی میکند که از طریق آن میتواند به عنوان مثال به اسناد، با استفاده از یک موتور استدلال و بر اساس قابلیت برنامهریزی بلندمدت دسترسی داشته باشد، بخواند و درک کند، و خودش را آموزش و توسعه دهد.
این قابلیتها این امکان را برای Devin فراهم میکند که مثلاً یک وبسایت بسازد، به طور مستقل باگها را در پایگاههای کد شناسایی و رفع کند، برنامهها را مستقر کند و حتی سایر مدلهای هوش مصنوعی را آموزش دهد.
Cognition Labs میگوید ارزیابی معیار دوین، با استفاده از ابزار SWE-bench که از نمایندگان میخواهد وظایف را حل کنند، نشان میدهد که دوین 13.86 درصد از مسائل را بهدرستی حل کرده است، که بسیار بیشتر از آخرین وضعیت قبلی 1.96 است. حتی زمانی که فایلهای دقیق برای ویرایش داده میشد، بهترین مدلهای قبلی تنها 4.80 درصد از مشکلات را حل میکردند.
مارک هینکل، مدیر عامل شرکت مشاوره Peripety Labs، گفت که هنوز خیلی زود است که بگوییم چه زمانی ممکن است دوین برای استفاده در محیطهای IT سازمانی آماده باشد، اما این نمایشها نشان داد که پیشرفتهای سریع در هوش مصنوعی در حال تغییر نحوه ساخت و ساخت نرمافزار هستند. او خاطرنشان کرد: تجربه کاربری به طور قابل توجهی با تجربه GitHub Copilot یا CodeWhisperer از خدمات وب آمازون (AWS) متفاوت است، که بیشتر بر کمک به توسعهدهندگان برای نوشتن کد متمرکز هستند تا اجرای وظایف محول شده.
هینکل اضافه کرد: مشخص نیست چه مقدار زیرساخت برای اجرای Devin مورد نیاز است، که با توجه به کمبود مداوم واحدهای پردازشگر گرافیکی (GPU)، ممکن است ثابت شود که حداقل در کوتاه مدت این یک عامل محدودکننده است.
صرف نظر از قابلیتهای فعلی Devin، که مهندسان نرمافزار در حال حاضر فقط با دعوتنامه میتوانند به آنها دسترسی داشته باشند، واضح است که پیشرفت در قابلیتهای استدلال مدلهای هوش مصنوعی به تیمهای DevOps این امکان را میدهد تا وظایفی را به یک مدل هوش مصنوعی اختصاص دهند، مانند سایر اعضای تیم. تأثیری که این قابلیت بر تقاضا برای مهندسان نرم افزار خواهد داشت، هنوز مشخص نیست، اما هنوز نیاز به درک این موضوع وجود دارد که از دوین برای ساختن چه چیزی بخواهیم و بررسی کنیم که نرم افزاری که دوین می سازد چگونه ساخته شده است. تنها چیزی که مسلم است سرعت ساخت و استقرار نرم افزار است که در شرف شتاب گرفتن است.
بدون شک، مایکروسافت، AWS و سایر ارائه دهندگان ابزارهای مهندسی نرم افزار در حال تحقیق در مورد قابلیت های مشابه هستند، بنابراین ممکن است اکنون فقط زمان زیادی باشد که پیشرفت در استدلال و برنامه ریزی بلندمدت به طور گسترده در توسعه نرم افزار اعمال شود.
در همین حال، تیمهای DevOps ممکن است بخواهند برنامههای استراتژیک خود را برای سالهای آینده ارزیابی کنند زیرا ساخت نرمافزار آسانتر میشود. پروژه هایی که ممکن است برای تکمیل آنها به تیم های بزرگی از مهندسان نرم افزار نیاز داشته باشند، ممکن است به زودی با استفاده از تیم های بسیار کوچکتر انجام شوند. به نوبه خود، تعداد پروژههای توسعه نرمافزاری که میتوانند توسط سازمانهای بزرگ و کوچک راهاندازی شوند، افزایش مییابد، زیرا بیشتر زحمتهای تاریخی مورد نیاز حذف میشوند.