از پاپ فرانسیسی که جلیقه به تن دارد تا تیزرهای فیلم تأثیر گرفته از وس اندرسون، تصاویر ساخته شده با هوش مصنوعی این روزها به موضوع داغی در فضای مجازی تبدیل شدهاند. چندان عجیب نیست که ابزارهای مدرن هوش مصنوعی برندهی جایزههای معتبر عکاسی شوند. صرفنظر از اینکه مولدهای تصویر هوش مصنوعی را دوست داشته باشید یا از آنها متنفر باشید، این ابزارها در سال گذشته به محبوبیت بالایی رسیدند و گویا قصد توقف هم ندارند.
در آغاز سال ۲۰۲۲، ابزارهای تبدیل متن به تصویر هوش مصنوعی بهندرت در دسترس عموم افراد قرار داشتند اما با فراهم شدن امکان دسترسی به نسخهی بتای DALL-E در جولای ۲۰۲۲ و همچنین انتشار استیبل دیفیوژن درست یک ماه پس از آن، ناگهان مجموعهی وسیعی از مولدهای تصویر هوش مصنوعی در دسترس همه قرار گرفتند. اگر نسبت به انتخاب مولد تصویر هوش مصنوعی در سال ۲۰۲۳ کمی گیج شدهاید، در این مقاله سعی کردیم بهترین و محبوبترین مولدهای تصویر این روزها و قابلیتهای آنها را معرفی کنیم تا بر اساس سلیقه، گزینهی محبوبتان را انتخاب کنید.
DALL-E 2
DALL-E اولین مولد تصویر هوش مصنوعی بود که در سال ۲۰۲۱ بر سر زبانها افتاد. جدیدترین نسخهی این مولد با عنوان DALL-E2 دارای سطح و قابلیتهای درک زبانی بالاتر و همچنین کیفیت تصویر بهتری نسبت به نسخهی قبلی است. این ابزار همچنین میتواند تصاویر موجود را ویرایش کند و امکان جایگذاری یا اضافه کردن اشیای کاملا جدید را میدهد.
OpenAI شرکت بنیانگذار چت جیپیتی، DALL-E را ساخته است. این شرکت از مدل زبانی عظیم GPT-3 به عنوان اساس کار خود استفاده کرده است که نشان میدهد این مولد تصویر چگونه دستورها را درک میکند. استفاده از DALL-E ساده است. تنها به یک حساب OpenAI نیاز دارید و پس از ورود به حساب کاربری میتوانید دستور متنی را وارد کرده و دکمهی Generate را برای ساخت تصویر فشار دهید.
متأسفانه DALL-E دیگر به صورت رایگان در دسترس کاربران قرار ندارد. اعتبار رایگان این سرویس در آوریل ۲۰۲۳ به پایان رسید و حالا کاربرها باید برای خود اعتبار خریداری کنند. به ازای ۱۵ دلار میتوان ۱۱۵ اعتبار خریداری کرد که برای هر بار استفاده برابر است با ۱۳ سنت. با اینحال هنوز میتوانید از DALL-E به صورت رایگان از طریق چت بینگ مایکروسافت استفاده کنید.
میدجورنی
با اینکه میدجورنی اولین مولد تصویر هوش مصنوعی نبود، خیلی زود به انتخاب اول خیلی از افراد تبدیل شد. یکی از دلایل اصلی این محبوبیت، نسخهی V5 میدجورنی است که توانست از بسیاری از رقبای خود سبقت بگیرد. در بعضی نمونهها، نتایج به نظر بسیار واقعگرایانه میرسند گرچه اشتباهاتی هم دارند.
برخلاف دیگر سرویسها نمیتوان از طریق وبسایت یا اپلیکیشن به میدجورنی دسترسی پیدا کنید. بلکه نیاز به دیسکورد دارید. دیسکورد اپلیکیشن چتی است که جوامع گیمینگ از آن استفاده میکنند. برای شروع کار با میدجورنی نیاز به حساب دیسکورد دارید.
اعضای جدید دارای محدودیت ساخت ۲۵ تصویر رایگان هستند. ارزانترین اشتراک این سرویس ماهانه ده دلار است. با اینکه میتوانید از دستورهای سادهی میدجورنی هم برای ساخت تصاویر زیبا استفاده کنید، قدرت واقعی این سرویس در پارامترهای آن است. برای مثال میتوانید نسبت تصویر 16:9 را با استفاده از پارامتر –ar تعریف کنید یا میتوانید تصاویر به سبک انیمه را با پارامتر –niji بسازید. راهنمای کامل کار با میدجورنی را میتوانید در پلاس وی بخوانید.
استیبل دیفیوژن
برخلاف دیگر مولدهای تصویر هوش مصنوعی، استیبل دیفیوژن (Stable Diffusion) کاملا متنباز و رایگان است. اگر کامپیوتر قدرتمندی با کارت گرافیک اختصاصی داشته باشید میتوانید مدل خود را دانلود و اجرا کنید. به علاوه، این سرویس به صورت آفلاین هم کار میکند. با اینحال همه نمیتوانند پیشنیازهای سختافزاری آن را فراهم کنند.
میتوانید از استیبل دیفیوژن برای ساخت تصاویر در مرورگر وب خود استفاده کنید. با کلیک روی وبسایت StableDiffusionOnline و تایپ دستور به خروجی دلخواهتان میرسید. برای کار با استیبل دیفیوژن نیازی به حساب کاربری ندارید اما نتایجتان برای بقیه قابل ذخیرهسازی و قابل نمایش است. برای افزایش حریم خصوصی میتوانید مدل را روی کامپیوتر شخصیتان اجرا کنید. پلتفرم استیبل دیفیوژن امکان مرور دستورها و نتایج قبلی را هم میدهد.
DreamStudio
با اینکه استیبل دیفیوژن سرویس رایگانی است اما امکانات کاملی ندارد. برای مثال نمیتوانید اندازهی تصویر را تغییر دهید یا آن را پس از تولید ویرایش کنید؛ اما خوشبختانه، Stability AI سازندهی استیبل دیفیوژن راهحل این مشکل را به شکل DreamStudio ارائه داده است.
با باز کردن DreamStudio میتوانید اپلیکیشنی جذاب با تعداد زیادی دکمه را مشاهده کنید. با این اپلیکیشن میتوانید چند تصویر را بهصورت یک جا بسازید، نسبت تصویر را تغییر دهید، عناصر مشخص را در اثر هنری خود تغییر دهید. همچنین DreamStudio دارای سبکهای مختلفی مثل فتورئالیسم تا اریگامی و طرحهای مشابه کتابهای کمیک است.
علاوه بر این میتوانید اشیا را در تصاویر هوش مصنوعی خود با استفاده از تب edit اضافه یا حذف کنید. برای مثال از ابزار eraser یا پاککن میتوانید برای حذف بخشهایی از تصویر استفاده کنید. سپس دستور را برای پر کردن فضاهای خالی تایپ کنید. متأسفانه برای استفاده از دریم استودیو باید هزینه بپردازید؛ اما هنگام ثبت نام، ۲۵ اعتبار رایگان یا ۱۲۵ بار تولید تصویر خواهید داشت. با پرداخت حداقل ۱۰ دلار میتوانید ۵۰۰۰ تصویر بسازید.
Bing Image Creator
موتور جستجوی بینگ مایکروسافت پس از انتشار چت جیپی تی به قابلیت جدید چت قدرتمندی مجهز شد. Bing Image Creator ابزار تولید تصویری تحت پشتیبانی DALL-E است. با استفاده از دستورها و فرمانها میتوانید آثار هنری دیجیتالی تولید کنید. این مولد تصویر رایگان است با اینحال برای دسترسی به آن نیاز به حساب کاربری مایکروسافت دارید. در حال حاضر این مولد فقط از دستورها و متنهای انگلیسی پشتیبانی میکند.
از آنجا که مایکروسافت همکاری نزدیکی با OpenAI شرکت سازندهی چت جیپیتی دارد، عجیب نیست که Image Creator بینگ از DALL-E استفاده میکند. به این ترتیب میتوانید روی پلتفرم بینگ بدون نیاز به پرداخت هزینه از DALL-E استفاده کنید.
بینگ ایمیج کریتیور دارای مجموعه ابزار متنوعی نیست. با این حال برای استفادهی شخصی میتواند سرگرمکننده باشد. تمام تصاویر این مولد با نسبت مربعی ۱: ۱ و ۱۰۲۴ در ۱۰۲۴ پیکسل تولید میشوند. رابط کاربری آسان است و همچنین میتوانید تصاویر تولیدشده را بدون واترمارک ذخیره کنید. این ابزار رایگان است.
Craiyon
مولد تصویر کرایون با اینکه در ابتدا DALL-E مینی نامیده شده بود، ربطی به شرکت OpenAI یا DALL-E2 ندارد. بلکه یکی از جایگزینهای متنباز آن است. با اینحال نام DALL-E2 mini بیشتر با این مولد تصویر سازگار است زیرا تقریبا تمام کارهای DALL-E2 را انجام میدهد.
برخلاف DALL-E2 خروجیهای کرایون کیفیت کمتری دارند؛ اما مزیت این مولد تصویر چیست؟ با کرایون میتوانید به صورت نامحدود تصویرسازی کنید و تا رسیدن به نتایج دقیق و دلخواه تصاویر را تغییر دهید. تفاوت کلیدی دیگر کرایون با DALL-E این است که به هیچ عنوان سانسور نمیشود و هر دستوری را میتوان در آن وارد کرد. همچنین میتوانید بر اساس سبکی خاص تصویرسازی کنید. علاوه بر این، رابط کاربری وبسایت بسیار ساده است و کاربران تازهکار میتوانند بهراحتی و بهصورت رایگان از آن استفاده کنند.
ArtBreeder
یکی از شناختهشدهترین اسمها در میان مولدهای تصویر هوش مصنوعی، آرت بریدر است. هدف اصلی این ابزار در واقع ارتقای کیفیت تصویر است و با استفاده از آن میتوانید انواع متنوعی از تصاویر را از طریق یادگیری ماشین تولید کنید.
آرتبریدر از ترکیب تصاویر برای ساخت یک تصویر واحد استفاده میکند به این شیوه میتوانید تصاویر کاملا منحصربهفرد و جدیدی را با استفاده از تصاویر موجود در گالری خود بسازید. رابط کاربری آرت بریدر ساده است و افراد تازهکار به راحتی میتوانند از آن استفاده کنند. استفاده از آرت بریدر برای تعداد محدود عکس رایگان است با این حال برای استفاده از امکانات نامحدود باید هزینه پرداخت کنید.
Picsart
پیکسآرت شاید یکی از در دسترسترین مولدهای متن به تصویر موبایل باشد زیرا اپلیکیشن آن بسیار محبوب است و قابلیت هوش مصنوعی هم در پایان سال ۲۰۲۲ به آن اضافه شد. این سیستم مبتنی بر کد متن باز استیبل دیفیوژن است اما شرکت سازندهی پیکسآرت میگوید کارهای زیادی را برای ارتقای این اپلیکیشن و تولید نتایج باکیفیتتر انجام داده است.
آنچه پیکسآرت را از دیگر گزینهها متمایز میکند، قرار گرفتن آن در یک اپلیکیشن ویرایش تصویر است. درواقع هرچیزی که ساخته میشود را میتوان بلافاصله با مجموعهی غنی از ابزارها ویرایش کرد. مولد تصویر هوش مصنوعی پیکسآرت روزانه برای تولید بیش از یک میلیون تصویر به کار میرود. شرکت سازندهی این اپلیکیشن همچنین قابلیتهایی مثل جایگذاری اشیا در تصاویر، ساخت پسزمینههای جدید، ساخت آواتارهای هوش مصنوعی بر اساس تصاویر افراد را به این پلتفرم اضافه کرده است. مولد تصویر پیکسآرت همچنین میتواند اسکچها و طرحهای اولیهی خام را به آثار کاملشدهی هنری تبدیل کند. مولد تصویر پایهی پیکسآرت رایگان است اما برای دسترسی به امکانات بیشتر باید هزینه پرداخت کنید.
Nightcafe AI
Nightcafe Studio امکان تولید تصاویر به سبکهای مختلف و جلوههای متفاوت را میدهد که از سبک کیهانی تا رنگ روغن و بسیاری از موارد دیگر را دربرمیگیرد. نام این اپلیکیشن برگرفته از نقاشی «کافه شب» اثری از ونسان ونگوگ، نقاش پرآوازهی هلندی است. این پلتفرم از روش VQGAN+CLIP برای تولید هنر هوش مصنوعی استفاده میکند. هنگان ثبت نام در NightCafe، پنج اعتبار رایگان دریافت میکنید. هر روز هنگام نیمه شب، پنج اعتبار دیگر دریافت میکنید. برای خرید اعتبارهای بیشتر باید هزینه بپردازید.
Fotor
فوتور، ویرایشگر تصویر آنلاین با میلیونها کاربر در سراسر جهان، به تازگی مولد تصویر هوش مصنوعی خود را منتشر کرده است. استفاده از این مولد تصویر بسیار راحت است و به راحتی میتوانید با تایپ دستورهای متنی، تنها در چند ثانیه تصویرسازی کنید. با این ابزار میتوانید تصاویر واقعگرایانه، سهبعدی، کاراکترهای انیمه، نقاشی، پسزمینه و بهطورکلی انواع هنر دیجیتال را خلق کنید. میتوانید بهصورت رایگان از این مولد تصویر استفاده کنید.
جمعبندی
از سال گذشته تعداد مولدهای تصویر با امکانات متعدد رو به افزایش هستند. برخی از این ابزارها مثل میدجورنی و DALL-E به دلیل ارائهی قابلیتها و امکانات متنوع و همچنین تولید تصاویر با کیفیت به محبوبیت بالایی رسیدهاند. برخی دیگر مثل Bing Image Creator و Craiyon هنوز جای پیشرفت زیادی دارند با اینحال میتوانند تا حدی نیازهای کاربران را برطرف کنند.