Kāpēc AI attēlu ģeneratori cīnās ar rokām

Kāpēc AI attēlu ģeneratori cīnās ar rokām
Tādi lasītāji kā jūs palīdz atbalstīt MUO. Veicot pirkumu, izmantojot saites mūsu vietnē, mēs varam nopelnīt filiāles komisiju. Lasīt vairāk.

AI ģeneratori attīstās mūsu acu priekšā biedējošā tempā, taču tiem joprojām ir trūkumi. Pamanīt dīvainas detaļas AI attēlos patiesībā ir diezgan smieklīgi. Tāpēc Midjourney rokas kļuva par karstu tēmu, kas ir izplatīta problēma daudzos dzinējos.





Noskaidrosim, kāpēc rokas tik ļoti izaicina AI attēlu ģeneratorus. Viņu programmētāji jau labo šo mēmu cienīgo problēmu, taču ir interesanti padomāt par to, kā mākslīgais intelekts mācās, nemaz nerunājot par to, kas tam traucē.





DIENAS VIDEO MAKEUSEOF RITINĀT, LAI TURPINĀTU AR SATURU

Kāpēc mākslīgā intelekta radītās rokas satricināja

Ikviens, kurš attēlu radīšanai izmanto mākslīgā intelekta dzinējus, iespējams, ir pamanījis, ka rokas reti iznāk pareizi, taču problēma kļuva aktuāla, kad Twitter parādījās daudz 'fotoattēlu'.





Ciešāk pārbaudot, cilvēku dīvainās rokas tos atdeva kā mākslīgā intelekta radītus attēlus. Situāciju interesantāku padarīja fakts, ka šis bija Midjourney mēģinājums pielikt roku.

Viens no labākajiem mākslīgā intelekta dzinējiem apkārtnē nespēja tikt galā ar cilvēka roku sarežģītību, tāpēc tika pārbaudītas Midjourney un tā konkurentu iespējas. Patiešām, pat DALL-E ir nosliece uz nereāliem pirkstiem un nagiem.



  cilvēku, kas sarokojas, izmantojot DALL-E

Ažiotāža bija nesamērīga, ņemot vērā, ka mākslīgā intelekta radītās rokas vienmēr ir bijušas problēma, taču papildu uzmanība pamudināja atbrīvot Midjourney v5, lai uzlabotu v4 .

Jaunajā versijā tika uzlabots roku dizains, skaidri norādot, ka AI inženieri pievērsa uzmanību jautrajai rosībai un nolēma uzlabot programmatūras iespējas.





Citi dzinēji lēnām seko Midjourney piemēram AI mākslas labošana ar Photoshop joprojām ir nenovērtējama prasme. Galvenais programmētāju šķērslis ir tas, cik sarežģīti ir apmācīt mākslīgo intelektu, lai viņš uzzīmētu pārliecinošas rokas.

Kāpēc AI attēlu ģeneratori cīnās ar rokām?

AI dzinēji attēlu iegūšanai izmanto ģeneratīvos pretrunīgos tīklus (GAN) vai stabilo difūziju. Abām tehnoloģijām ir nepieciešami plaši izejmateriāli, apmācība un apstrādes jauda, ​​lai izveidotu pat visvienkāršākos mākslas darbus.





Tā kā iepriekš esošie attēli ir galvenais AI apmācībā, programmētājiem ir jāievada programmatūrā tūkstošiem, ja ne miljoniem attēlu līdzās uzvednēm, atkārtojot procesu atkal un atkal, līdz dzinējs saprot, uz ko attiecīgais vārds attiecas un kā to attēlot. tas objekts.

Taču avota attēli, no kuriem AI mācās, galvenokārt ir 2D, kur rokas ir attēlotas dažādās pozīcijās. Neatkarīgi no tā, vai tie ir taisni vai saritināti, rāda piecus vai trīs pirkstus.

Galu galā mašīna faktiski nesaprot roku jēdzienu, un attēli, no kuriem tā mācās, ne vienmēr pietiekami skaidri vai konsekventi attēlo rokas. Tāpēc Midjourney rokas var būt tik neglītas: AI apjukums.

Tikpat derīgs kā Elona Muska bažas par AI attīstību Iespējams, dažām tehnoloģiju daļām vēl ir daudz jāmācās. Un viņu šķēršļi pārsniedz nepietiekamus roku piemērus.

Citi iemesli, kāpēc mākslīgā intelekta attēlu ģeneratori tiek lēni pilnveidoti

  Sieviete Kodē datorā

Skatoties uz Midjourney modeļi , v5 piedāvā uzlabotu saskaņotību starp teksta uzvednēm un radītajiem attēliem, kā arī augstāku izšķirtspēju un papildu rīkus. Taču šādi sasniegumi nav lēti.

Lai apmācītu mākslīgo intelektu, lai tas labāk strādātu ar rokām, ir nepieciešams nodrošināt labākus attēlus, īpaši 3D formātā. Tas nozīmē, ka procesiem tiek tērēts daudz laika un darbaspēka, sākot no izejmateriālu iegūšanas līdz kodēšanas uzlabošanai un apmācības atkārtošanai, līdz AI to nokārto pareizi.

Pat tad programmatūra var pieļaut kļūdas citādi satriecošos mākslas darbos. Papildus tam, ka tas ir milzīgs un sarežģīts darbs, tas ir dārgs. Tātad, negaidiet bezmaksas AI teksta-attēlu ģeneratori lai vēl sasniegtu Midjourney kalibru.

Vienkārši sakot, AI dzinēju problēma nav saistīta tikai ar šo datorprogrammu nespēju pilnībā izprast, kā izskatās vai darbojas tādas cilvēka funkcijas kā rokas un kājas. Tas ir atkarīgs arī no tā, cik tas maksā, un tehnoloģiju piekļuvi 3D attēliem un mašīnmācīšanās metodēm, kas var palīdzēt ģeneratoriem iegūt reālistiskāku izpratni par apkārtējo pasauli.

kā pārvietot lietotni uz ārējo SD karti

AI attēlu ģeneratori necīnīsies mūžīgi

Rokas ir viltīgs jēdziens mākslīgajam intelektam, lai apliktu savu bināro galvu, taču problēmas risinājumi jau darbojas. Midjourney, DALL-E 2 un citas platformas galu galā spēs pēc iespējas saglabāt dīvainus pirkstus, ja ne pilnībā tos izskaust.

Sasniegumi citās AI jomās nodrošina, ka tehnoloģija nepārtraukti attīstās, un tās izstrādātāji vienmēr apgūst jaunus veidus, kā to lietot un uzlabot.