- Published on
o1 Bir Sohbet Modeli Değil Altman Brockman İzliyor
o1: Tipik Bir Sohbet Modeli Değil
Makale, birçok kullanıcının başlangıçta öyle davranmasına rağmen, o1 modelinin bir sohbet modeli olarak tasarlanmadığını açıklayarak, o1 modeli etrafındaki son tartışmaları ele alıyor. Bu açıklama, "o1 bir sohbet modeli değil (ve önemli olan da bu)" başlıklı bir blog yazısının ilgi görmesi ve hatta OpenAI CEO'su Sam Altman ve Başkan Greg Brockman'ın dikkatini çekmesiyle geldi.
Yanılgılar ve Hayal Kırıklıkları
Eski bir SpaceX yazılım mühendisi ve Apple VisionOS için etkileşim tasarımcısı olan Ben Hylak, o1 ile ilgili hayal kırıklığı yaratan deneyimini paylaştı. Yanıtlarını yavaş, sık sık çelişkili ve istenmeyen mimari diyagramlar ve artı ve eksilerin listeleriyle dolu buldu. Hylak'ın ilk tepkisi, o1'in basitçe "çöp" olduğu yönündeydi.
- Hylak, yanıtlar için 5 dakikalık bekleme süreleri yaşadı.
- Yanıtlar sık sık kendi içinde çelişkili ve anlamsızdı.
- Model, istenmeyen diyagramlar ve listeler sağladı.
Hayal kırıklığı, sosyal medya paylaşımlarında hayal kırıklığını dile getirmesine yol açtı ve o1 pro'nun "gerçekten kötü" olduğunu ve çıktısının "neredeyse anlamsız" olduğunu belirtti. Modelin, dosya birleştirme önerisinde bulunduğu, dosya birleştirmeyen kod sağladığı ve ardından alakasız sonuçlara atladığı bir yeniden düzenleme tavsiyesi isteme örneğini verdi.
Bakış Açısında Bir Değişim
Hylak’ın deneyimi evrensel değildi. Bazı kullanıcılar, o1'in oldukça etkili olduğunu gördü ve bu da daha fazla tartışmaya yol açtı. Bu etkileşimler sayesinde Hylak, hatasını anladı: o1'i bir sohbet modeli olarak işlev görmesi amaçlanmadığı halde bir sohbet modeli olarak kullanıyordu.
Bu bakış açısındaki değişim, Altman tarafından memnuniyetle karşılandı ve "insanların o1'i (pro sürümü dahil) nasıl kullanacaklarını öğrenirken tutumlarının değişmesini izlemek ilginçti" dedi. Greg Brockman da o1'in farklı bir model olduğunu ve optimum performans için farklı bir yaklaşım gerektirdiğini belirterek bunu yineledi.
o1: Bir Rapor Oluşturucu
Makale, bir sohbet modeli yerine, o1'in bir "rapor oluşturucu" olarak görülmesi gerektiğini öne sürüyor. Yeterli bağlam ve net çıktı gereksinimleri verildiğinde, o1 etkili bir şekilde çözümler sağlayabilir. Önemli olan, modelin nasıl kullanıldığıdır.
İsteklerden Briflere
Tipik sohbet modellerini kullanırken, kullanıcılar genellikle basit sorularla başlar ve gerektiğinde bağlam ekleyerek, yinelemeli ileri geri etkileşimlere girerler. Ancak, o1 ek bağlam aramaz. Bunun yerine, kullanıcıların önceden çok fazla bağlam sağlamaları gerekir; bu, "tonlarca" bilgi veya standart bir istek için kullanacağınız bağlamın yaklaşık on katı olarak tanımlanır.
- Denenen çözümlerin tüm ayrıntılarını sağlayın.
- Eksiksiz veritabanı şema dökümlerini ekleyin.
- Şirkete özgü işleri, ölçeği ve terminolojiyi açıklayın.
o1'e yeni bir çalışan gibi davranılması, baştan tüm gerekli bilgilerin sağlanması önerilir.
İstenen Çıktıya Odaklanma
Kapsamlı bağlam sağladıktan sonra, kullanıcılar istenen çıktıyı açıkça tanımlamalıdır. Kullanıcıların kişiliği veya düşünce sürecini belirleyebileceği diğer modellerin aksine, o1 ile sadece "ne" istediğinize odaklanmalısınız, modelin "nasıl" yapması gerektiğine değil. Bu, o1'in gerekli adımları bağımsız olarak planlamasına ve yürütmesine olanak tanıyarak daha hızlı ve daha verimli sonuçlar elde edilmesini sağlar.
o1'in Güçlü ve Zayıf Yönleri
o1 çeşitli alanlarda öne çıkıyor:
- Tüm dosyaları işleme: Büyük kod bloklarını ve kapsamlı bağlamı işleyebilir, genellikle tüm dosyaları minimum hatayla tamamlar.
- Halüsinasyonları azaltma: o1, diğer modellerin sözdizimini karıştırabileceği özel sorgu dilleri (örn., ClickHouse ve New Relic) gibi alanlarda doğrudur.
- Tıbbi teşhis: o1, görüntülere ve açıklamalara dayanarak şaşırtıcı derecede doğru ön teşhisler sunabilir.
- Kavramları açıklama: Karmaşık mühendislik kavramlarını örneklerle açıklama konusunda yeteneklidir.
- Mimari planlar oluşturma: o1, birden fazla plan oluşturabilir, bunları karşılaştırabilir ve artı ve eksilerini listeleyebilir.
- Değerlendirme: Sonuçları değerlendirmek için etkili bir araç olarak umut vaat ediyor.
Ancak, o1'in de sınırlamaları vardır:
- Belirli tarzlarda yazma: Akademik veya kurumsal bir tarzda raporlar üretme eğilimindedir ve belirli tonlara uyum sağlamakta zorlanır.
- Tüm uygulamaları oluşturma: Tüm dosyaları oluşturmada yetkin olmasına rağmen, yineleme yoluyla tam bir SaaS uygulaması oluşturamaz. Ancak, özellikle ön uç veya basit arka uç işlevleri olmak üzere tüm özellikleri tamamlayabilir.
Gecikmenin Önemi
Makale, gecikmenin ürün algımızı temelde değiştirdiğini, e-posta ve kısa mesaj, sesli mesaj ve telefon görüşmeleri gibi örnekler vererek belirtiyor. Hylak, o1'i yanıtlarındaki gecikme nedeniyle bir sohbet modeli yerine e-postaya benzetiyor. Bu gecikme, yüksek gecikmeli, uzun süreli arka plan zekasından yararlanan yeni tür ürünlere olanak tanır. O zaman soru şu oluyor: İnsanlar hangi görevler için 5 dakika, bir saat, bir gün ve hatta 3-5 iş günü beklemeye razı?
o1-preview ve o1-mini'nin akışı desteklediği ancak yapılandırılmış oluşturma veya sistem istemlerini desteklemediği, o1'in ise yapılandırılmış oluşturma ve sistem istemlerini desteklediği ancak akışı desteklemediği unutulmamalıdır. Bu farklılıkları anlamak, geliştiriciler için 2025'te ürünler tasarlarken çok önemli olacaktır.