محققان موسسه فناوری ماساچوست (MIT) توانستند با استفاده از هوش مصنوعی مولد، سرعت ایجاد تصاویر از توضیحات متن را به میزان قابل توجهی افزایش دهند. روش جدید به شما امکان می دهد تصاویر با کیفیت بالا را 30 برابر سریعتر از تصاویر موجود تولید کنید.
به طور معمول، هوش مصنوعی مولد از تکنیکی به نام انتشار استفاده میکند، که تصویری تا حد امکان تار ایجاد میکند و سپس آن را به نتیجه نهایی تبدیل میکند که دقیقاً مطابق با آنچه که هوش مصنوعی میتواند در پاسخ به درخواست کاربر تولید کند، مطابقت دارد. انتشار زمان زیادی طول می کشد، بنابراین محققان MIT تصمیم گرفتند تا سرعت آن را افزایش دهند.
محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT تولید تصویر را به یک پاس کاهش دادهاند و روش جدید «تقطیر تطبیق توزیع» نامیده میشود. واضح است که تولید یک تصویر در یک گذر به طور قابل توجهی سریعتر از 30-50 مرحله معمول برای مدل های انتشار است. بنابراین، در تجهیزات مدرن، Stable Diffusion 1.5 یک تصویر را در 1.5 ثانیه ایجاد می کند، در حالی که مدل جدید مبتنی بر DMD این کار را در 0.05 ثانیه انجام می دهد.
این اولین تلاش برای تقطیر مدل های انتشار برای سرعت بخشیدن به تولید تصویر نیست. Instaflow و LCM رویکرد مشابهی را امتحان کردند، اما نتایج چشمگیر نبود. هوش مصنوعی پایداری همچنین تلاش کرد تا مدلهای انتشار را سرعت بخشد و با انتشار Stable Diffusion Turbo که تصاویری با وضوح حداکثر 1 مگاپیکسل در یک پاس ایجاد میکند، تا حدی موفقیت داشت، اما تصاویر تولید شده در چندین پاس همچنان بهطور قابل توجهی بهتر بودند.
اگر متوجه خطایی شدید، آن را با ماوس انتخاب کرده و CTRL+ENTER را فشار دهید.
منبع: https://3dnews.ru/1102206