DALL E2 nedir?

DALL·E 2, metinsel bilgileri görsellere çeviren bir CLIP sistemidir. Bu bir kodlayıcı-kod çözücü paradigmasıdır, yani giriş metni sağlandığında önce makine girişine dönüştürülür, ardından sistem tarafından işlenir ve son olarak kodlanmış verileri görüntülere dönüştüren kod çözücüye beslenir.

DALL·E 2 nedir?

Bu, yeni görseller oluşturmak için ifadeler kullanan üretken bir dil modeli olan DALL·E’nin en yeni neslidir. DALL·E 2, GPT-3 kadar büyük olmasa da, 3.5B parametreleriyle çok büyük bir modeldir. İlginç bir şekilde, selefinden (12B) de daha hafiftir. Açıklama ve fotogerçekçilik açısından iyi bir uyum içinde olan DALL E 2, daha büyük boyutuna rağmen insan yargıçlar tarafından DALL E yerine +%70 oranında tercih ediliyor.

DALL.E 2- Yeni Başlayanlar İçin Örneklerle Açıklandı

Özellikle, DALL E 2, doğal dil işleme için derin öğrenmeyi görüntü üretimi için bilgisayar görüşü ile birleştiren Hiyerarşik Metin -Koşullu Görüntü Sentezi Modelidir. Amaç iki model yetiştirmek olup, eğitim seti eşleştirilmiş resim ve açıklamalardan oluşmaktadır. İlki, ek açıklamalar verildiğinde gömülü CLIP görüntüleri oluşturmak için eğitilebilen önceliklerdir. Daha sonra, bir CLIP görüntü gömme işlemi (ve varsa ek açıklamalar) verildiğinde, eğitimli bir görüntü oluşturabilen bir kod çözücümüz var.

DALLE 2, web’den metin içeren yüz milyonlarca fotoğraf kullanılarak eğitildi ve modelin öğrendiklerini değiştirmek için bu görüntülerin bazıları kaldırıldı ve yeniden ağırlıklandırıldı. Görüntünün CLIP gömülmesinin çeşitli varyasyonlarını alır, ardından her varyasyonda ilerlemek için kod çözücüsünü kullanır. Ardından, kullanıcı tarafından sağlanan girişi akılda tutarak tüm bu bilgilerin ilginç bir bileşimini oluşturur. Bunu aşağıdaki üç adıma ayıralım.

Mavi gökyüzünde uçan gökkuşaklarını, bulutları ve tek boynuzlu atları hayal edin. Bu görüntünün aklınıza nasıl gelebileceğini hayal edin. İnsanlar, mükemmel bir görüntü yerleştirme analoğuna sahip olduğumuz en yakın şeydir ve az önce aklınıza gelen görüntü bunun mükemmel bir örneğidir. Nihai üründe yalnızca tahminde bulunabilirsiniz, ancak neleri dahil edeceğiniz konusunda iyi bir fikriniz var. Önceki Model, okuyucuyu cümledeki kelimelerden zihnindeki sahneye götürür. Şimdi eskiz yapmaya başlamakta özgürsünüz.

unCLIP’in yaptığı şey, sahip olduğunuz zihinsel görüntüyü gerçek bir taslağa dönüştürmektir. Artık aynı tanımdaki diğer karakterleri, aynı temel özelliklere ve tamamen yeni bir görsel stile sahip olarak tam olarak yeniden oluşturabilirsiniz. DALL·E 2, bu şekilde gömülü mevcut görüntülerden de benzersiz görüntüler oluşturabilir. Yaptığınız taslağa dikkat edin. “Bulutların arasında bir tek boynuzlu at, arka planda gökyüzüne karşı bir gökkuşağı beliriyor” tanımını çizdiğinizde olan budur. Şimdi resimleri ve metni inceleyerek hangisinin diğerini (güneş, ev, ağaç vb.) ve hangisinin öğe, stil, renk vb.’yi en iyi örneklediğini belirleyin.

CLIP’in yaptığı, metin ve görüntülerin özelliklerini kodlamaktır. Öğeyi, stili, rengi vb. en iyi örnekleyen CLIP’in yaptığı, metin ve görüntülerin özelliklerini kodlamaktır. ev, ağaç vb.) ve öğeyi, stili, rengi vb. en iyi örnekleyen CLIP’in yaptığı, metin ve görüntülerin özelliklerini kodlamaktır.
Artık DALL-E’nin ne olduğunu öğrendiğimize göre bir sonraki bölüme geçelim ve özelliklerini anlayalım.

Fitur DALL·E 2

İşte DALL·E 2’nin özellikleri. Onlardan ayrıntılı olarak bahsedelim.

1] Varyasyonlar

DALL·E 2 basit cümleden resme çevirinin ötesine geçer. OpenAI, güçlü CLIP gömme özelliği sayesinde belirli metinler için farklı sonuçlar üreterek üretici süreçlerle deneyler yapabilir. CLIP’in “zihninde” “gördüğü”, girdiden (görüntüler arasında aynı kalan) ve neyin değiş tokuş edilebileceğinden (görüntüler arasında değişen) önemli olduğunu düşündüğü şeydir. DALL E 2, mümkün olan her yerde “anlamsal bilgileri… ve estetik yönleri” koruyacaktır.

2] İç boyama

DALL·E 2, otomatik boyama kullanarak mevcut fotoğrafları dönüştürebilir. Aşağıdaki örneklerde, soldaki resim orijinalken, ortadaki ve sağdaki fotoğraflarda çeşitli konumlarda boyanmış öğeler var. DALL·E 2, ek öğeleri görüntü stiliyle eşleştirir. Ayrıca yeni öğeleri yansıtmak için dokuları ve yansımaları günceller.

3] Metin Farkları

DALL·E 2, metin farklarını kullanarak görüntüleri değiştirir. DALL·E 2 ayrıca nesne değişikliğine izin veren gelişmiş enterpolasyon yeteneklerine sahiptir. Bir Twitter kullanıcısı, iPhone’unu “Mordenize” etmeyi başardı, kontrol etmek için twitter.com’a gitti.

Bu özelliği beğendiyseniz tek yapmanız gereken openai.com’a gidip kaydolmak. Kaydolmak için yeni bir hesap oluşturabilir veya mevcut bir Microsoft veya Google hesabını kullanabilirsiniz. Bunu yaptıktan sonra bazı ücretsiz krediler alacaksınız, daha fazlasını istiyorsanız parasını ödemeniz gerekiyor.

Bunlar, DALL·E 2’nin özelliklerinden bazılarıdır, birçok harika kullanım durumu vardır, ancak her zaman yapay zeka araçlarına çok fazla güvenmemeniz önerilir. Sonunda, onlar sadece iş yapmak için kullanılan araçlardır, asla bir erkeğin duygusal zekasının yerini alamazlar.