هوش های مصنوعی ساخت عکس تقریباً دو سالی هست که طوفانی ایجاد کرده اند. همه جا حرف از هوش مصنوعی است و به راحتی می توان دلیل آن را فهمید: ابزارهای لازم برای ساختن آنها اکنون خوب و در دسترس عموم هستند. در این مقاله قصد داریم 4 هوش مصنوعی تولید کننده تصویر برتر در سال ۲۰۲۴ را بررسی کنیم.
اما به صورت کلی ارزش آن را دارد که چند ساعت وقت بگذارید و با یکی از این برنامههای هوش مصنوعی تبدیل متن به تصویر بپردازید. چه بخواهید و چه نخواهید، احتمالاً در ماه ها و سال های آینده شاهد خروجی بسیار بیشتری از آنها خواهید بود.
هوش مصنوعی یک پیام متنی دریافت میکنند و سپس آن را – تا جایی که میتوانند – به یک تصویر منطبق تبدیل میکنند. درخواست شما می تواند هر چیزی باشد، از “نقاشی رنگ روغن امپرسیونیستی از یک مرد کانادایی که سوار بر گوزن در میان جنگلی از درختان افرا می شود” یا «عکس الاغی روی ماه».
بهترین سایتهای ساخت عکس با هوش مصنوعی
۱. هوش مصنوعی DALL·E 3 ، بهترین تولید کننده تصویر هوش مصنوعی برای سهولت استفاده
مزایای DALL·E 3:
فوق العاده آسان برای استفاده
همراه با ChatGPT Plus، بنابراین در ازای پول خود هوش مصنوعی زیادی دریافت می کنید
DALL·E 3 معایب:
کنترل های ChatGPT را می توان ضربه زد و از دست داد
20 دلار در ماه گران است اگر GPT را با آن نمی خواهید
DALL·E 3 مسلماً بزرگترین نام در تولیدکنندههای تصویر هوش مصنوعی است و DALL·E 2، اولین تولید کننده تصویر مبتنی بر هوش مصنوعی بود که به اندازه کافی خوب بود تا تصاویر بسیار جالبی ایجاد کند و به طور گسترده در دسترس مردم بود تا به صورت ویروسی تبدیل شود.
بزرگترین مزیتش این است که استفاده از DALL·E 3 به طرز مضحکی ساده است. آنچه را که می خواهید ببینید به ChatGPT یا Bing بگویید و در عرض چند لحظه، دو تا چهار نسخه تولید شده توسط هوش مصنوعی را برای انتخاب خواهید داشت. از درک زبان GPT-4 برای گسترش درخواستهای شما استفاده میکند، بنابراین هر نتیجه متمایز خواهد بود و همیشه میتوانید بیشتر درخواست کنید.
اما بهترین راه برای استفاده از DALL·E 3 از طریق ChatGPT است. اگر مشترک ChatGPT Plus هستید، میتوانید هر قدر که دوست دارید از آن استفاده کنید، مشروط به محدودیت GPT-4 40 پیام در هر سه ساعت.
DALL·E 3 دو راه برای ویرایش تصاویر شما دارد: میتوانید از ChatGPT بخواهید تغییراتی ایجاد کند، و آن دستورات را با اضافههای شما دوباره اجرا میکند. یا می توانید از ابزار انتخاب برای محدود کردن به روز رسانی ها به بخش های خاصی از تصویر استفاده کنید.
قیمت DALL·E: DALL·E 3 به عنوان بخشی از ChatGPT Plus با قیمت 20 دلار در ماه و به صورت رایگان از طریق Microsoft Copilot در دسترس است. DALL·E 2 برای 115 اعتبار تصویر 15 دلار هزینه دارد. قیمت گذاری API پیچیده تر است، اما از 0.016 دلار به ازای هر تصویر شروع می شود.
۲. هوش مصنوعی Midjourney ، مولد تصویر هوش مصنوعی با بهترین نتایج
مزایای Midjourney:
به طور مداوم بهترین تصاویر تولید شده توسط هوش مصنوعی را تولید می کند
راهی عالی برای الهام و ایده گرفتن است
معایب میان سفر:
فقط از طریق Discord قابل استفاده است – که بسیار عجیب است
تصاویری که تولید می کنید به طور پیش فرض عمومی هستند
بخش آزمایش رایگان در حال حاضر به حالت تعلیق درآمده است
Midjourney به طور مداوم نتایج مورد علاقه من را از همه تولید کننده های تصویر در این لیست تولید می کند. تصاویری که ایجاد میکند منسجمتر به نظر میرسند، با بافتها و رنگهای بهتر – و در کل، نتایج جالبتر و از نظر بصری جذابتر هستند. به طور خاص، افراد و اشیاء دنیای واقعی نسبت به سایر تولیدکنندههای تصویر هوش مصنوعی، حداقل بدون درخواستهای زیاد، واقعیتر و طبیعیتر به نظر میرسند.
در حال حاضر، Midjourney با یک نکته اصلی ناامید شده است: بتا فقط از طریق Discord قابل دسترسی است. هنگامی که به سرور Midjourney’s Discord ملحق شدید یا ربات Midjourney را به یکی از رباتهایی که کنترل میکنید دعوت میکنید، میتوانید با تایپ کردن /imagine [هر چیزی که میخواهید ببینید] یک اعلان وارد کنید. سپس ربات چهار نوع از درخواست شما را تولید می کند، که می توانید آن ها را دانلود کنید، ارتقا دهید، دوباره ویرایش کنید و موارد دیگر.
اگر همه اینها گیج کننده به نظر می رسد، نگران نباشید. اسناد کمکی Midjourney واقعاً خوب هستند و شما را در شروع کار و همچنین تمام ویژگیهای پیشرفته آن، مانند نسخههای مختلف مدل، ارتقاء مقیاس تصاویر، ترکیب چندین تصویر، و استفاده از پارامترهای مختلف برای کنترل چیزها، راهنمایی میکنند. هنگامی که گزینه های مختلف را درک کردید، نتایجی که می توانید به دست آورید واقعاً شگفت انگیز است.
برنامه پایه از 10 دلار در ماه شروع می شود و با 3.3 ساعت زمان GPU در ماه یا حدود 200 تصویر ارائه می شود. شما همچنین می توانید زمان بیشتری برای GPU خریداری کنید و می توانید از تصاویر خود به صورت تجاری استفاده کنید.
۳. هوش مصنوعی Stable Diffusion، بهترین تولید کننده تصویر هوش مصنوعی برای سفارشی سازی و کنترل
نکات مثبت Stable Diffusio:
DreamStudio (برنامه تحت وب Stable Diffusion) تنها تولید کننده اصلی تصویر هوش مصنوعی است که هنوز اعتبار رایگان ارائه می دهد.
این برنامه فوق العاده مقرون به صرفه و قابل تنظیم است. فوق العاده قدرتمند با نتایج به طور کلی عالی
معایب Stable Diffusio:
نیاز به یادگیری بیشتری از سایر تولیدکنندگان هوش مصنوعی دارد.
Stable Diffusion منبع باز است. این بدان معناست که هر کسی که مهارت های فنی لازم را داشته باشد می تواند آن را دانلود کرده و به صورت محلی در رایانه خود اجرا کند. همچنین به این معنی است که می توانید مدل را برای اهداف خاصی آموزش دهید و تنظیم کنید. تقریباً تمام سرویسهایی که از هوش مصنوعی برای تولید پرترههای هنری، پرترههای تاریخی، رندرهای معماری و هر چیز دیگری استفاده میکنند، از Stable Diffusion استفاده میکنند. اگر مهارتهای لازم را دارید و میخواهید چیزی عالی با هوش مصنوعی بسازید، Stable Diffusion بهترین راه برای انجام آن در حال حاضر است. حتی یک API و سرویسی به نام Clipdrop وجود دارد که آن را به یک سری ابزار تقسیم می کند.
DreamStudio بر روی یک سیستم اعتباری کار می کند. وقتی ثبت نام می کنید، 25 اعتبار رایگان دریافت می کنید که برای حدود 30 درخواست یا 120 تصویر با تنظیمات پیش فرض خوب است. استفاده از یک مدل قدرتمندتر، تولید تصاویر بزرگتر یا بیشتر، یا تکرار آنها در مراحل بیشتر، اعتبار شما را سریعتر مصرف می کند. وقتی کارتان تمام شد، باید بیشتر بخرید، از 10 دلار برای 1000 اعتبار شروع کنید.
در مجموع، DreamStudio و Stable Diffusion بیشترین سفارشی سازی و کنترل را روی کل فرآیند تولید تصویر هوش مصنوعی به شما می دهند.
۴. هوش مصنوعی Adobe Firefly، بهترین تولید کننده تصویر هوش مصنوعی برای ادغام تصاویر تولید شده با هوش مصنوعی در عکس ها
Adobe بیش از 15 سال است که ابزارهای هوش مصنوعی را در برنامه های خود ایجاد می کند، بنابراین جای تعجب نیست که یکی از قدرتمندترین تولیدکنندگان متن به تصویر را دارد – حداقل از نظر نحوه ادغام آن با ابزارهای دیگر. میتوانید مدل هوش مصنوعی آن، Firefly را به صورت رایگان یا از طریق Adobe Express در وب امتحان کنید، اما در آخرین نسخه فتوشاپ بهترین حالت را دارد.
فایرفلای چند ترفند در آستین خود دارد. علاوه بر توانایی تولید تصاویر جدید از توضیحات متنی دقیق، میتواند جلوههای متنی را از یک دستور نوشته شده ایجاد کند (فکر کنید، کلمه «TOAST» با حروفی که به نظر میرسد از نان تست شده نوشته شده است)، آثار هنری برداری را دوباره رنگآمیزی کند، یا عناصر تولید شده توسط هوش مصنوعی را به تصاویر خود اضافه کنید. می توانید همه اینها را از طریق برنامه وب آزمایش کنید، اما آخرین ویژگی است که Firefly در آن برجسته است.
اگر صرفاً به عنوان یک تولید کننده متن به تصویر در نظر گرفته شود، نتایج Firefly می تواند بسیار خوب باشد. برای برخی از دستورات میتواند با DALL·E یا Stable Diffusion مطابقت داشته باشد یا آن را شکست دهد، اما برای برخی دیگر، من سؤال میکنم که هدف آن چیست. از سوی دیگر، ادغام آن با Photoshop، ویرایشگر تصویر استاندارد صنعتی، در سطح بعدی قرار دارد.
ویژگی خاص به نام Generative Fill نامیده می شود. ایده این است که از ابزارهای معمولی فتوشاپ برای انتخاب ناحیه ای از تصویر خود استفاده کنید و سپس، فقط با کلیک کردن روی یک دکمه و تایپ یک دستور، می توانید آن را با چیز دیگری جایگزین کنید. بسیار مهم است که Generative Fill زمینه تصویر شما را درک می کند. در تصویر بالا، می بینید که فتوشاپ با تاری عمق میدان جنگلی که با استفاده از Generative Fill اضافه کردم، مطابقت دارد. منسجم به نظر می رسد.
قیمت Adobe Firefly: رایگان برای 25 اعتبار. از 4.99 دلار برای 100 اعتبار در ماه؛ فتوشاپ با قیمت 19.99 دلار در ماه به عنوان بخشی از طرح خلاقانه عکاسی ابری در دسترس است که با 500 اعتبار مولد ارائه می شود.