MIT کشف کرده است که چگونه با استفاده از هوش مصنوعی سرعت تولید تصویر را 30 برابر کند

محققان موسسه فناوری ماساچوست (MIT) توانستند با استفاده از هوش مصنوعی مولد، سرعت ایجاد تصاویر از توضیحات متن را به میزان قابل توجهی افزایش دهند. روش جدید به شما امکان می دهد تصاویر با کیفیت بالا را 30 برابر سریعتر از تصاویر موجود تولید کنید.

منبع تصویر: pixabay.com

به طور معمول، هوش مصنوعی مولد از تکنیکی به نام انتشار استفاده می‌کند، که تصویری تا حد امکان تار ایجاد می‌کند و سپس آن را به نتیجه نهایی تبدیل می‌کند که دقیقاً مطابق با آنچه که هوش مصنوعی می‌تواند در پاسخ به درخواست کاربر تولید کند، مطابقت دارد. انتشار زمان زیادی طول می کشد، بنابراین محققان MIT تصمیم گرفتند تا سرعت آن را افزایش دهند.

منبع تصویر: tianweiy.github.io

محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT تولید تصویر را به یک پاس کاهش داده‌اند و روش جدید «تقطیر تطبیق توزیع» نامیده می‌شود. واضح است که تولید یک تصویر در یک گذر به طور قابل توجهی سریعتر از 30-50 مرحله معمول برای مدل های انتشار است. بنابراین، در تجهیزات مدرن، Stable Diffusion 1.5 یک تصویر را در 1.5 ثانیه ایجاد می کند، در حالی که مدل جدید مبتنی بر DMD این کار را در 0.05 ثانیه انجام می دهد.

این اولین تلاش برای تقطیر مدل های انتشار برای سرعت بخشیدن به تولید تصویر نیست. Instaflow و LCM رویکرد مشابهی را امتحان کردند، اما نتایج چشمگیر نبود. هوش مصنوعی پایداری همچنین تلاش کرد تا مدل‌های انتشار را سرعت بخشد و با انتشار Stable Diffusion Turbo که تصاویری با وضوح حداکثر 1 مگاپیکسل در یک پاس ایجاد می‌کند، تا حدی موفقیت داشت، اما تصاویر تولید شده در چندین پاس همچنان به‌طور قابل توجهی بهتر بودند.

اگر متوجه خطایی شدید، آن را با ماوس انتخاب کرده و CTRL+ENTER را فشار دهید.