بلاگ

نحوه استفاده از DALL·E 3 برای ایجاد تصاویر هوش مصنوعی با ChatGPT

نحوه استفاده از DALL·E 3

آنچه در در این محتوا می‌خوانید...

DALL·E احتمالاً یکی از مهم‌ترین محصولات فناوری دهه 2020 در نظر گرفته می‌شود و به طور غیرقابل انکاری آغازگر شوق فعلی هوش مصنوعی مولد است. اما از زمانی که در سال 2022 راه اندازی شد، تولیدکننده های تصویر دیگر، مانند Stable Diffusion و Midjourney، به طور فزاینده ای هنر هوش مصنوعی چشمگیر ایجاد کرده اند. برای مدتی، واقعاً احساس می‌کردم که DALL·E دارد عقب می‌افتد.

اما اکنون با انتشار DALL·E 3 و آخرین دور به‌روزرسانی‌ها، این وضعیت تغییر کرده است.

DALL·E 3 چیست؟

DALL·E 3 آخرین نسخه مولد هنر هوش مصنوعی OpenAI است. این یک ارتقای عظیم نسبت به DALL·E 2 است، هم در نحوه استفاده از آن و هم در کیفیت آنچه که می تواند ایجاد کند. یک بار دیگر، می‌تواند با سایر تولیدکننده‌های تصویر هوش مصنوعی موجود، پا به پا شود.

از هر برنامه ای که استفاده می کنید تصاویر هوش مصنوعی ایجاد کنید
تولید تصویر هوش مصنوعی را خودکار کنید
یاد بگیرند که چگونه
بزرگترین تغییر این است که DALL·E 3 دیگر یک برنامه مستقل نیست، حداقل در حال حاضر. در عوض، با ChatGPT یکپارچه شده است. این کار استفاده از آن را آسان‌تر می‌کند، اما همچنان چند ابهام وجود دارد – همانطور که از هر ابزار مجهز به هوش مصنوعی انتظار داریم.

ابتدا در ChatGPT Plus ثبت نام کنید

در حال حاضر، DALL·E 3 فقط برای مشترکین ChatGPT Plus در دسترس است. برای دسترسی به آن، برای یک حساب ChatGPT ثبت نام کنید و سپس روی Upgrade to Plus در پایین نوار کناری سمت چپ کلیک کنید. طرح اشتراک 20 دلاری ChatGPT Plus را انتخاب کنید، جزئیات پرداخت خود را وارد کنید، و باید آماده باشید.

نحوه استفاده از DALL·E 3

تا کنون، DALL·E 3 به نظر می رسد که همان سقف GPT-4 را داشته باشد: می توانید هر سه ساعت 40 درخواست ارسال کنید. در تئوری، این بدان معنی است که شما می توانید چند صد تصویر در روز ایجاد کنید. این مقدار بسیار بیشتر از چیزی است که معمولاً با یک تولید کننده تصویر هوش مصنوعی مانند Dream Studio (که از Stable Diffusion استفاده می کند) یا Midjourney دریافت می کنید، اگرچه قیمت گذاری در سراسر صفحه یکسان نیست. و من گمان می‌کنم که اگر مرتباً از طریق این اعلان‌ها شروع کنید، OpenAI ممکن است چیزی برای گفتن داشته باشد.

اگر می‌خواهید DALL·E 3 را بدون ثبت‌نام در ChatGPT Plus امتحان کنید، می‌توانید آن را در Bing Image Creator نیز آزمایش کنید. شما سطح یکسانی از کنترل را ندارید، اما از همان مدل اساسی استفاده می کند. از نظر فنی، استفاده از آن رایگان است، اگرچه تصاویر دارای واترمارک هستند، و از سیستم اعتباری “افزایش” استفاده می کند. هنگامی که تخصیص خود را تمام کردید، ممکن است زمان بیشتری طول بکشد تا Image Creator درخواست های شما را ارائه دهد.

شروع کار با DALL·E 3

برای دسترسی به DALL·E 3، به ChatGPT بروید و DALL·E را از نوار کناری انتخاب کنید. یا روی ChatGPT 3.5 در بالای صفحه کلیک کنید و از منوی کشویی GPT-4 را انتخاب کنید.

نحوه استفاده از DALL·E 3

پس از آن، استفاده از DALL·E 3 درست مانند استفاده از ChatGPT است. می توانید یک پیام متنی معمولی را وارد کنید یا با استفاده از زبان طبیعی با آن تعامل کنید. اگر مستقیماً از طریق ChatGPT از DALL·E استفاده کنید، هر فرمان فقط یک تصویر تولید می کند. با این حال، اگر DALL·E 3 را از نوار کناری انتخاب کنید، دو تصویر متفاوت برای انتخاب خواهید داشت.

نحوه استفاده از DALL·E 3

برخی از چیزهایی که باید امتحان کنید عبارتند از:

“نقاشی کوبیست از یک گاو بزرگ در یک مزرعه کوچک”

“نقاشی رنگ روغن از میمون با لباس فضایی روی ماه”

“مرد کانادایی سوار بر گوزن از میان جنگل افرا به سبک نقاشی امپرسیونیستی”

“عکس استوک یک مرد ایرلندی که از راه دور کار می کند”

DALL·E اخیراً برخی از دستورات پیشنهادی و نسبت ابعاد را به رابط خود اضافه کرده است.

نحوه استفاده از DALL·E 3

یکی از کارهایی که DALL·E 3 به طور متفاوت انجام می دهد این است که به طور خودکار بهبود می یابد و در درخواست های شما تکرار می شود. همچنین برای هر یک از دو تصویری که تولید می کند از یک فرمان کمی متفاوت استفاده می کند.

به عنوان مثال، زمانی که من “گاو کنجکاو، نسبت ابعاد گسترده، اکسپرسیونیسم” را وارد کردم، یکی از دستوراتی که در واقع استفاده کرد این بود:

“گاوی کنجکاو به سبک اکسپرسیونیستی، با استفاده از رنگ های زنده و انتزاعی برای به تصویر کشیدن احساسات و فتنه های حیوان. گاو با ویژگی های اغراق آمیز، مانند چشمان درشت و گشاد و سر کمی کج شده، نشان دهنده کنجکاوی است. پس زمینه یک تصویر است. چرخشی از سکته های جسورانه و امپرسیونیستی که نمایانگر یک صحنه شبانی است و حس غریب و شدید اکسپرسیونیسم را تقویت می کند.

برای اینکه ببینید DALL·E 3 از چه چیزی برای هر تصویری استفاده می کند، روی آن کلیک کنید و سپس روی دکمه i کلیک کنید. آنچه که سعی در ایجاد آن دارد در کادر Prompt ظاهر می شود.

نحوه استفاده از DALL·E 3

برای دانلود یک تصویر، روی نماد دانلود در بالا سمت راست کلیک کنید.

چگونه یک تصویر را با DALL·E 3 در ChatGPT ویرایش کنیم

بهترین چیز در مورد استفاده از DALL·E 3 این است که می توانید درخواست های زبان طبیعی را از طریق ChatGPT پیگیری کنید. اگر چیزی است که دوست ندارید یا چیزی است که می‌خواهید با نتایج متفاوت تاکید شود، می‌توانید فقط آن را درخواست کنید.

نحوه استفاده از DALL·E 3

برخی از چیزهایی که من امتحان کرده ام عبارتند از:

درخواست تغییرات بیشتر از یک تصویر خاص

تغییر زاویه دید هر تصویر

تغییر مکان ظاهر شدن سوژه در هر تصویر

تغییر نسبت ابعاد هر تصویر

تغییر تعداد سوژه ها در هر تصویر

افزودن، حذف و اصلاح جزئیات موضوع، مانند رنگ و اندازه

افزودن و حذف جزئیات پس زمینه

آویزان کردن آثار تولید شده بر روی دیوارهای گالری

مهم است که توجه داشته باشید که اگر DALL·E 3 را از این طریق هدایت کنید، به جای اینکه مستقیماً ویرایش شود، یک اعلان جدید بر اساس درخواست شما ایجاد می کند و سپس مجموعه جدیدی از تصاویر را تولید می کند. گاهی اوقات تغییرات بین دو تصویر کوچک و دقیقاً همان چیزی است که شما می خواهید – وقتی این اتفاق بیفتد، مانند جادو به نظر می رسد. اما در مواقع دیگر، DALL·E 3 همچنین آنچه را که در مورد هر تصویری دوست داشتید، بیرون می‌آورد.

نحوه استفاده از DALL·E 3

اگر می‌خواهید کنترل مستقیم بیشتری داشته باشید، روی یک تصویر کلیک کنید و سپس بر روی ابزار Select در نوار منوی بالا کلیک کنید.

نحوه استفاده از DALL·E 3

روی ناحیه ای از تصویری که می خواهید ویرایش کنید نقاشی کنید. می توانید اندازه قلم مو را در بالای صفحه تغییر دهید تا این کار آسان تر شود.

نحوه استفاده از DALL·E 3

سپس در نوار کناری، DALL·E 3 را با آنچه که می‌خواهید تغییر کند، درخواست کنید.

نحوه استفاده از DALL·E 3

و تمام تلاش خود را برای اصلاح تصویر شما انجام خواهد داد.

نحوه استفاده از DALL·E 3

در حالی که این کنترل‌های ویرایش هنوز به اندازه DALL·E 2 پیش نمی‌روند – و زمانی که DALL·E 3 به طور کامل یک تصویر را تغییر می‌دهد، زمانی که شما فقط می‌خواهید چند ترفند کوچک را تغییر دهید می‌تواند آزاردهنده باشد – استفاده از آنها آسان است و می تواند بسیار موثر باشد شما فقط باید با DALL·E 3 کار کنید تا دستوری را که دقیقاً همان چیزی را که می خواهید به شما می دهد تنظیم کنید.

چگونه با DALL·E 3 بهترین نتایج را بدست آوریم

در حالی که DALL·E 3 هنوز به طور فعال در حال توسعه است، می‌توان نتایج فوق‌العاده‌ای را با آن در حال حاضر به دست آورد. به طور خاص، من متوجه شدم که DALL·E 3 در ایجاد نقاشی، نقاشی، و انواع دیگر آثار هنری به جای تصاویر فوتورئالیستی عالی بود. در اینجا مواردی وجود دارد که باید به خاطر داشته باشید تا به شما کمک کند بهترین نتیجه را بگیرید.

اعلان های دقیق بدهید

اگرچه DALL·E 3 با برون یابی بسیاری از چیزها، استفاده از دستورات ساده تر را آسان تر می کند، اگر تصویر خاصی می خواهید، جزئیات زیادی را به درخواست خود اضافه کنید. برای مثال، اسکرین شات زیر با درخواست من شروع شد:

“یک نقاشی رنگ روغن واقعاً دقیق از یک مالینویز بلژیکی که لباس دزد دریایی را پوشیده است و ناخدای کشتی خود را در جریان نبرد طاقت فرسای دزدان دریایی با کشتی دیگر. او کلاه سه شاخدار بر سر دارد و در حالی که به خدمه خود پارس می کند یک تپانچه در دست دارد. دریاها سنگین هستند، باران می بارد. در حال فروپاشی است، همه چیز کمی آشفته و تیره است.

خیلی خوبه، درسته؟

نحوه استفاده از DALL·E 3

DALL·E 3 اعداد و موقعیت را درک می کند

اگرچه هنوز ممکن است DALL·E 3 را با تعداد زیادی جزئیات مضحک در درخواست خود بارگذاری کنید، اما بسیار سخت تر از DALL·E 2 است. و در حالی که هنوز کامل نیست، DALL·E 3 به طور قابل توجهی درک بهتری از آن دارد. چیزهایی مانند اعداد و موقعیت عناصر مختلف در تصویر شما.

برای مثال، می‌توانید از آن بخواهید چیزی را در پیش‌زمینه یا سمت چپ تصویر ایجاد کند، و به احتمال زیاد این کار را انجام خواهد داد. به طور مشابه، اگر تعداد خاصی از چیزی را از آن بخواهید، بیشتر اوقات به درستی آن را دریافت می کند.

نحوه استفاده از DALL·E 3

تغییرات ظریف را بخواهید

اگر از DALL·E 3 بخواهید بر اساس یکی از نتایج خود تغییراتی ایجاد کند، گاهی اوقات می تواند تغییرات بسیار بزرگی در درخواست اولیه ایجاد کند. اگر ترجیح می‌دهید که چیزها را کمی شبیه‌تر نگه دارد، از آن بخواهید «تغییرات ظریف» ایجاد کند. در حالی که این مانع از تولید تصاویر کاملاً جدید نمی شود، متوجه شدم که فرمان های اولیه را کمتر تغییر می دهد.

40 درخواست در هر سه ساعت زیاد است
من DALL·E 3 را در طول دو روز برای نوشتن این مقاله بسیار آزمایش کردم و هرگز به حد مجاز نرسیدم. وقت بگذارید و به آن بگویید چه کاری باید انجام دهد و روی هر تصویر کار کنید. بعید به نظر می رسد که بدون تلاش واقعاً به کلاهک ضربه بزنید.

از آن لذت ببرید و در اطراف بازی کنید
به طور جدی، تنها راه برای درک واقعی آنچه که DALL·E 3 قادر به انجام آن است – و نیست – این است که خودتان با آن بازی کنید. ChatGPT می‌توانست درخواست‌هایی را انجام دهد که من واقعاً فکر می‌کردم با آن‌ها مشکل دارد، اما همچنین تغییرات ساده‌ای را که فکر می‌کردم کاملاً بهم ریخت.

دریافت بیشتر از DALL·E
DALL·E 3 یکی از بهترین تولیدکننده‌های تصویر موجود است، اما استفاده از آن از طریق ChatGPT با هر جریان کاری مناسب نیست.

اگر DALL·E را به Zapier متصل کنید، می‌توانید تولید تصویر هوش مصنوعی خود را برای ایجاد تصاویر مستقیماً از سایر برنامه‌هایی که بیشتر استفاده می‌کنید، خودکار کنید. درباره نحوه خودکارسازی تولید تصویر با هوش مصنوعی بیشتر بیاموزید یا با یکی از این گردش کارها شروع کنید.

دیدگاهتان را بنویسید