Published on

OpenAI'nin O3 Modeli: Akıl Yürütmede Sıçrama ve ARC AGI Atılımı

Yazarlar
  • avatar
    Ad
    Ajax
    Twitter

O3 Modelinin Temel Özellikleri

  • Çoklu Üretim Konsensüsü: O1 modellerinin en iyi performansı için çoklu üretim konsensüsü kritik öneme sahiptir. Bu, tüm akıl yürütme aşamalarındaki hesaplamalar için geçerlidir; en iyi sonuçlar için tek bir çıktı akışına güvenilmemelidir.
  • Ağaç Arama Mimarisinde Değişiklik Yok: O3'ün akıl yürütme mimarisine ağaç araması ekleyerek bir değişiklik yaptığına dair hiçbir kanıt bulunmamaktadır. Tüm iddialar sadece söylentiden ibarettir. Akıl yürütme ölçeklendirme yasasının temel kuralı, aynı tek akışlı üretimden daha fazla örnekleme yapmanın performans artışı sağlayabilmesidir.
  • Güçlendirilmiş Öğrenmenin Yükselişi: Bu yıl, güçlendirilmiş öğrenme (RL) ve ilgili yaklaşımların yapay zekanın merkezine yeniden yerleştiği bir yıl oldu.
  • O3 Modelinin Tanıtımı: OpenAI, O1 kullanarak akıl yürütme yeteneğine sahip dil modelleri eğitme konusunda kaydedilen son ilerlemeleri daha da geliştiren O3 modelinin önizlemesini duyurdu. Bu modeller, 2025 Ocak sonuna kadar kamuya açılması beklenen O3-mini ile başlayacak.
  • Yapay Zeka Entegrasyon Yılı: 2024'ün sonuna yaklaşırken, birçok gözlemci bu yılın yapay zeka entegrasyon yılı olduğunu ve birçok katılımcının GPT-4 seviyesine ulaştığını ve bu modellerin nasıl uygulanacağını araştırmaya başladığını düşünüyor.
  • O3'ün Beklenmedik Çıkışı: 2024, "GPT-4 lansmanı" gibi heyecan verici bir an yaşamadı. O3'ün ortaya çıkışı bunu değiştirdi, çünkü O1'den daha beklenmedikti ve akıl yürütme modellerinde hızlı bir ilerleme kaydetti. O1'in uzun bir hazırlık sürecinden geçtiği için gelişini zaten biliyorduk, ancak O3'ün hızlı ve verimli lansmanı 2025 yılı için beklentilerimizi artırdı.
  • Geniş Uygulama Alanları: Birçok kişi O1 sınıfı modellerin matematik, programlama, fizik ve temel bilimler dışındaki alanlarda uygulanabilirliğini sorgulasa da, bu modeller yakında tüm yapay zeka araştırma ekosisteminde yaygın olarak kullanılacak ve böylece ilerlemeyi önemli ölçüde hızlandıracaktır.
  • Yeni Bir Zirveye Tırmanış: OpenAI'nin O3 modeli, sektörün yeni bir zirveye tırmandığını gösteriyor, çünkü yalnızca internet metnine dayalı ön eğitimden elde edilen kazançlar azalıyor. O3, akıl yürütme değerlendirmelerinde önemli atılımlar gerçekleştirdi.

O3 Modelinin Başarıları

  • ARC AGI Ödülünde Rekor: ARC AGI ödülünde %85'in üzerinde tamamlanma oranına ulaşan ilk model (bu, test setinde değil, açık veri setinde tamamlanmıştır ve maliyet sınırlarını aşmıştır).
  • Frontier Math'ta Büyük İlerleyiş: Yepyeni Frontier Math kıyaslamasında performans %2'den %25'e sıçradı ve niteliksel bir atılım sağlandı.
  • Programlama Kıyaslamalarında Gelişme: SWE-Bench-Verified gibi önde gelen tüm programlama kıyaslamalarında önemli iyileştirmeler sağlandı.
  • Hızlı Gelişim: Tüm bunlar modelin ilk versiyonunun duyurulmasından sadece 3 ay sonra gerçekleşti. Bu değişiklikler, yapay zeka araştırmalarındaki ilerlemeyi hızlandırarak kısa sürede kendini gösterecektir.
  • Yazılım Mühendisliğinde Değişim: Akıl yürütme maliyetlerinin düşmesiyle birlikte, bu durum günümüzde bildiğimiz birçok yazılım mühendisliği rolünü değiştirecek bir adım daha olacaktır.

O3'ün Güvenlik ve Uyum Çalışmaları

  • Güvenlik ve Uyum: Aynı zamanda, OpenAI, O1 sınıfı modellerin güvenlik ve uyum araştırmalarını nasıl geliştirdiğini gösteren ihtiyatlı uyum üzerine bir blog yazısı ve araştırma makalesi yayınladı.
  • Akıl Yürütmenin Değeri: Bu, daha önce bahsedilen daha geniş bir açık soru için bazı ilk olumlu kanıtlar sunuyor: Gelişmiş akıl yürütme yetenekleri, doğrulanabilir alanların ötesinde değer sağlayabilir mi? Bu soru 2025'te birçok kez yeniden gözden geçirilecektir.

O3 Modeline Genel Bakış

  • OpenAI'nin 12 Günlük Lansmanı: OpenAI'nin O3 modeli, "OpenAI'nin 12 günlük lansman etkinliğinin" son gününde duyuruldu. Bu lansman, çeşitli alanlarda daha önceki en son modelleri (Gemini 1.5 Pro ve Claude 3.5 Sonnet New) geride bırakan şaşırtıcı başarılarla geldi.
  • Çoklu Üretimin Önemi: O1 serisi modellerle ilgili blog yazılarında ve ilgili tartışmalarda sıklıkla gözden kaçırılan bir ayrıntı, çubuk grafiklerdeki gölgelerin anlamıdır. O1'in ilk blog yazısında, ilk sonuç grafiğinin açıklamasında bu belirtilmişti: Dolu çubuklar pass@1 doğruluğunu, gölgeli alanlar ise 64 örnek kullanılarak yapılan çoğunluk oylaması (konsensüs) performansını temsil etmektedir.
  • Paralel Üretim: Bu ayrıntı, çoklu üretim konsensüsünün O1 modellerinin en iyi performansı için kritik öneme sahip olduğunu göstermektedir. Bu, tüm akıl yürütme aşamalarındaki hesaplamalar için geçerlidir; en iyi sonuçlar için tek bir çıktı akışına güvenilmemelidir. Bununla birlikte, bu, ağaç araması veya bir tür ara temsil kullanılması gerektiği anlamına gelmez. O1'in profesyonel modu ve tartışacağımız ARC ödül sonuçları, mutlak en yüksek puanı elde etmek için bu paralel üretimi kullanır.

Frontier Math Kıyaslaması

  • Zorlu Problemler: Frontier Math kıyaslaması hakkında niteliksel bir değerlendirme için, iki Fields Madalyası sahibi tarafından yapılan yorumlara bakılabilir. Yorumları kıyaslamanın en zor kısımlarına yöneliktir, ancak bu, niteliksel hedefini iyi bir şekilde yansıtır:
    • Terence Tao: "Bu sorular son derece zorlayıcı... Bence en azından önümüzdeki birkaç yıl içinde yapay zekayı çaresiz bırakacaklar."
    • Timothy Gowers: "Gördüğüm bu soruların hiçbiri benim araştırma alanıma girmiyor ve tamamen çözemeyeceğim gibi görünüyor... IMO (Uluslararası Matematik Olimpiyatı) problemlerinden bir seviye daha zor gibi görünüyorlar."
  • Yapay Zeka İçin Yeni Bir Sınır: Bu kıyaslama 7 Kasım'da tanıtıldı ve yapay zeka yeteneklerinde henüz aşılmamış az sayıdaki açık sınırlardan biri olarak listelendi. Bu lansman, OpenAI'nin O3'ünü çift haneli puanlara ulaşan tek model olarak konumlandırıyor ve doğrudan %25'e yükseliyor.

Programlama Alanındaki Başarılar

  • SWE-Bench Verified: İkinci önde gelen sonuç programlama alanında ortaya çıktı. Canlı yayında OpenAI, SWE-Bench Verified'da %71,7'lik bir puan (bu sonuç, bir dereceye kadar günümüzün en son seviyesidir) ve Codeforces'ta (bir programlama yarışması web sitesi) geniş sonuçlar gösterdi.
  • Uluslararası Büyük Usta Seviyesi: O3, açıklanmayan bir N değerinde konsensüs oylaması ile 2727 puan alarak Uluslararası Büyük Usta seviyesine ulaştı ve dünya çapındaki insan yarışmacı programcılarının ilk 200'ünde yer aldı.
  • O3-Mini'nin Avantajları: O3-mini, O1'den daha iyi performans gösterirken, maliyeti önemli ölçüde düşürüyor. 2024'te gözlemlediğimiz eğilimler göz önüne alındığında, bu, daha geniş bir kullanıcı kitlesi tarafından kullanılacak daha etkili bir model olabilir.

ARC AGI Zorluğuna Cevap

  • ARC AGI'nin Tanımı: Soyutlama ve Akıl Yürütme Veri Tabanı (ARC), François Chollet tarafından 2019 tarihli "Zekanın Ölçümü Üzerine" adlı makalesinde sunulan bir yapay zeka değerlendirme yöntemidir. ARC değerlendirmesi, insan zekasını değerlendirmeye daha yakın olacak şekilde tasarlanmıştır.
    • İnsan Zekasına Yakınlık: Algoritmik bilgi teorisine dayanarak yeni bir zeka biçimsel tanımı sunuyoruz, zekayı beceri kazanma verimliliği olarak tanımlıyoruz ve kapsam, genelleme zorluğu, ön bilgi ve deneyim kavramlarını vurguluyoruz. Bu tanıma dayanarak, genel yapay zeka kıyaslamasının tasarım yönergelerini sunuyoruz. Son olarak, bu yönergeleri kesinlikle takip eden bir kıyaslama sunuyoruz: Soyutlama ve Akıl Yürütme Veri Tabanı (ARC), mümkün olduğunca insan doğuştan ön bilgisine yakın bir dizi açık ön bilgiye dayalı olarak oluşturulmuştur. ARC'nin insana benzer genel bir akışkan zekayı ölçmek için kullanılabileceğine ve yapay zeka sistemleri ile insanlar arasında adil bir genel zeka karşılaştırması sağlayabileceğine inanıyoruz.
  • ARC AGI Ödülü: ARC AGI ödülü, 2024 Haziran'da başlatıldı ve belirli standartları karşılayan ve bir dizi özel ARC görevini çözen ilk çözüme 1 milyon dolar ödül verildi. Bu görevi "çözmüş" sayılmanın eşiği %85 doğruluk oranına ulaşmaktır.
  • O3'ün Başarısı: Bugün, OpenAI ve ARC Prize aşağıdaki sonuçları paylaştı:
    • GPT-4o: O1 sınıfı modellerden önce, OpenAI'nin en iyi modeli GPT-4o yalnızca %5 doğruluk oranına ulaşmıştı.
    • Hızlı İlerleme: OpenAI'nin yeni akıl yürütme modellerindeki hızlı ilerlemesi, ARC ödülünün kurucu ortağı Mike Knoop tarafından şu şekilde özetlenmiştir:
      • GPT-2 (2019): %0
      • GPT-3 (2020): %0
      • GPT-4 (2023): %2
      • GPT-4o (2024): %5
      • o1-preview (2024): %21
      • o1 high (2024): %32
      • o1 Pro (2024): ~%50
      • o3 tuned low (2024): %76
      • o3 tuned high (2024): %87
  • Beklenmedik Atılım: Daha Haziran ayında, ARC-AGI'yi çözmenin son derece zor olacağı yaygın olarak düşünülüyordu. Ancak, sadece birkaç ay sonra bu algı tamamen yıkıldı. Q* ve diğer akıl yürütme yöntemleri konusunda iyimser olanlar bile bu kadar başarılı olunacağını tahmin etmiyordu.

ARC AGI Veri Setleri ve Test Sonuçları

  • Veri Setleri: Chollet, ARC ödülünün resmi web sitesinde daha fazla ayrıntı paylaştı:
    • O3'ü iki ARC-AGI veri setiyle test ettik:
      • Yarı Özel Değerlendirme: Aşırı uyumu değerlendirmek için kullanılan 100 özel görev.
      • Açık Değerlendirme: OpenAI'nin rehberliğinde iki hesaplama seviyesinde testler yaptık, örnek boyutları değişkenlik gösteriyordu: 6 (verimli mod) ve 1024 (verimsiz mod, birincinin 172 katı hesaplama gücü).
  • Test Sonuçları:
    • O3 yüksek hesaplama maliyetinin kesin verileri henüz yayınlanmadı çünkü fiyatlandırma ve özellik kullanılabilirliği hala belirlenmeyi bekliyor. Hesaplama, düşük hesaplama yapılandırmasının yaklaşık 172 katıdır.

ARC Görev Örneği

  • Örnek Bir Çözülmemiş Görev:
    • Birçok sorun insanlar için çok sezgiseldir. Bu sorunları modele girdi olarak vermek için, renkler sayılar olarak kodlanır ve Greg Kamradt'ın vurguladığı gibi bağlamsal girdi olarak bir ızgara biçiminde sunulur:
  • Ödülün Durumu: Teknik olarak ödül henüz alınmadı çünkü çözümün maliyeti eşiği aşıyor ve açık kaynaklı değil. Yarışma devam ediyor. Birkaç yıl içinde bu tür bir zeka neredeyse ücretsiz hale gelecektir. Ücretsiz, akıl yürütmeyi çalıştırma maliyetinin kullanıcı reklam verilerinin parasal değerinden daha düşük olacağı anlamına gelir.

O3'ün Fiyatlandırması ve Mimari Detayları

  • O3'ün Maliyeti: Şu anda, ARC ödül blogunda belirtilen O3 fiyatı (OpenAI'nin iletişiminde O1'e göre göreceli bir fiyat olarak değiştirildi), O3 teknolojisinin nasıl çalıştığına dair birçok ayrıntıyı ortaya koyuyor.
  • ARC AGI Ekibi ve OpenAI İşbirliği: ARC AGI ekibi, modelin fiyat tahminlerini almak için doğrudan OpenAI ile işbirliği yaptı. O3'ün API'de resmi olarak piyasaya sürülmesinden sonraki nihai fiyatlandırması muhtemelen farklı olacaktır.
  • Çözüm Sunma Koşulu: Akıl yürütme ölçeklendirme yasasının önemi nedeniyle, ARC-AGI ekibi, özel değerlendirme için çözüm sunmaya ek bir gereklilik ekledi. Blog yazılarında, ekip toplam maliyeti ve görev başına maliyeti, FLOP'ların ve hesaplama kaynaklarının kullanımının doğrudan hesaplaması olarak kaydetti.
  • Maliyet Sınırı: Bu, ARC ödül duyurusundaki kamu liderlik tablosuyla ilgili bir kural ile tutarlıdır (bu kural 1 milyon dolarlık ödülle ilgili değildir):
    • 10.000 ABD doları, 500 görevi (kamu değerlendirme setindeki 400 görev ve yeni bir yarı özel değerlendirme setindeki 100 görev dahil) çözmek için harcanabilecek çalışma maliyeti üst sınırıdır; bu, ticari API'leri çağırma maliyetini içerir.
  • O3'ün Maliyetleri: O3'ün maliyeti, kamuya açık veya yarı kamuya açık değerlendirme setindeki 500 görevde bu sınırı çok aştı. ARC ödülü, O3'ün sorgu başına maliyetinin 1.000 doları aştığını gösteriyor.
  • O3'ün Doğası Hakkındaki Varsayımlar: Ayrıca modelin doğası hakkında varsayımlar yaptılar. Aşağıdaki içerikler, O3'ün O1'den farklı bir eğitim tekniği kullanıp kullanmadığına dair spekülasyonları gidermeyi amaçlamaktadır. Özellikle Chollet, spekülasyon yaptığını açıkça belirtti:
    • Şu anda, O3'ün nasıl çalıştığına dair yalnızca spekülasyon yapabiliriz. Ancak O3'ün temel mekanizması, belirteç alanında doğal dil programı arama ve yürütme gibi görünüyor; test sırasında model, görevleri çözmek için gereken adımları açıklayan olası düşünce zincirleri (CoT'ler) alanında arama yapar ve bu, AlphaZero tarzı bir Monte Carlo ağaç aramasına biraz benzer olabilir. O3 durumunda, arama bir tür değerlendirici model tarafından yönlendiriliyor olabilir.

O3'ün Arkasındaki Gerçekler

  • MCTS Yanılgısı: MCTS (Monte Carlo Ağaç Araması) referansının ve varsayımının yanıltıcı olduğunu, ancak birçok zeki insanın O1 ve O3'ün yalnızca tek bir dil modelinin ileri geçişi ile elde ettiği yetenek karşısında şaşkına dönmesi nedeniyle anlaşılabilir olduğunu belirtmek önemlidir.
  • Güçlendirilmiş Öğrenme: Son zamanlarda yazdığım bir makalede, bunun büyük ölçekli güçlendirilmiş öğrenme eğitimi yoluyla nasıl başarılabileceğini açıkladım ve OpenAI'nin bazı grafiklerinin akıl yürütme aşamasındaki hesaplama maliyeti konusunda neden yanıltıcı olduğunu gösterdim. OpenAI çalışanları da O3'ün "sadece güçlendirilmiş öğrenme ile eğitilmiş bir model" olduğunu vurguladı.
  • Token Maliyeti Analizi: Bununla birlikte, ARC ekibinin kaydettiği maliyetleri ve OpenAI'nin O1 için fiyatlandırmasını (1 milyon çıktı tokeni için 60,00 dolar) birleştirerek analiz yapmaya devam ediyoruz. ARC ödül sonuç grafiğine göre, tam O3'ün sorgu başına maliyeti yaklaşık 5.000 dolardır. Toplam maliyeti token başına fiyata böldüğümüzde, modelin yanıt başına 80 milyon token ürettiği sonucuna varıyoruz; bu, uzun bağlam modellerinde büyük bir iyileşme olmadan mümkün değildir. Bu nedenle, farklı arama mimarileri hakkında spekülasyonlar ortaya çıkmaktadır.

O3'ün Hesaplama Yapılandırmaları

  • Önemli Ayrıntılar: Anahtar nokta, ARC ödül blog yazısındaki bazı ayrıntılarda yatmaktadır:
    • OpenAI'nin rehberliğinde, iki hesaplama seviyesinde testler yaptık, örnek boyutları değişkenlik gösteriyordu: 6 (verimli mod) ve 1024 (verimsiz mod, birincinin 172 katı hesaplama gücü).
  • Konsensüs Yöntemleri: SemiAnalysis'e göre, O1 pro, aynı sorguya verilen birden çok paralel yanıt arasından en yaygın olan yanıtı seçerek performansı artırmak için kendini tutarlılık yöntemini veya basit bir konsensus@N kontrolünü kullanıyordu. Burada, N örnek boyutu consensus@N değerine karşılık gelebilir, bu da O3'ün değerlendirme yapılandırmasının müşterilerin kullanabileceği O1 pro yapılandırmasına yakın olduğunu, yani 6 kat hesaplama gücü ve her soru için 1024 kat hesaplama gücü olan ultra yüksek bir yapılandırma olduğunu gösterir.
  • Genel Kullanım İçin Uzun Bir Süre: Bu akıl yürütme ölçeği, uzun bir süre boyunca sıradan ücretli kullanıcılara açık olmayacaktır. Çoğu kullanıcı, O1 modelinin "profesyonel" sürümünün özelliklerine bağlı olarak yalnızca bir üretimden consensus@10 sonucuna kadar erişebilecektir.
  • Token Üretimi: Milyon çıktı tokeni başına fiyatın hala 60 dolar olduğunu varsayarsak, bunu 1024 akışa bölmek, modelin yanıt başına yaklaşık 78.000 token ürettiği anlamına gelir. Aslında, O3, OpenAI'nin canlı yayında gösterdiği tüm logaritmik hesaplama miktarı x ekseninden görüldüğü gibi, daha büyük bir temel modelden de yararlanıyor gibi görünüyor; O1'in hesaplama maliyeti önemli ölçüde arttı. Daha büyük bir temel model kullanıldığında, bu sayılar tamamen mantıklı ve ek bir "arama" öğesi eklendiğini ima etmiyor.

Derin Öğrenmedeki İlerlemeler

  • Potansiyel Alanlar: Son yıllarda derin öğrenmedeki ilerlemeleri yönlendiren temel hikaye, potansiyeli yüksek bir alan bulmak ve ona tırmanmaya devam etmektir. İlk ilerleme dalgası, internet ölçekli ön eğitimden geldi. Şimdi, OpenAI, güçlendirilmiş öğrenme eğitimini ve uzun bağlam akıl yürütmesini genişleterek yeni bir tırmanış yönü buldu. O3'ün OpenAI'nin O1'i yayınlamasından sadece yaklaşık üç ay sonra geldiği göz önüne alındığında, en basit açıklama, aynı mimariyi ve eğitim yöntemlerini kullandığı, sadece daha büyük ölçekte olduğudur.

O3 Hakkında Spekülasyonlar

  • Ağaç Arama Yok: O3'ün akıl yürütme mimarisine ağaç araması ekleyerek bir değişiklik yaptığına dair hiçbir kanıt bulunmamaktadır, tüm iddialar sadece söylentiden ibarettir. Akıl yürütme ölçeklendirme yasasının temel kuralı, aynı tek akışlı üretimden daha fazla örnekleme yapmanın performans artışı sağlayabilmesidir.
  • Temel Model: Temel soru, O3'ün temel modelinin Orion (OpenAI'nin dahili kod adı, muhtemelen GPT-5) olup olmadığı veya yeni temel modelin yalnızca eğitim sırasında Orion'dan yararlanıp yararlanmadığıdır. Temel modelin boyutu 2 ila 5 kat artarsa, ARC ödülünden bildirilen API fiyatlarına bakıldığında bu veriler tamamen beklentilerle uyumludur.
  • Belirsizlikler: O3'ün spesifik detayları hakkında hala belirsizlikler var. ARC ekibinin yayınladığı grafiklerde, O3 modelinin yanında "(ayarlanmış)" ibaresi yer alıyor, ancak O3 hakkında henüz detaylı bir açıklama yapılmadı. Ancak, ilerleme trendlerine baktığımızda, O1 seviyesindeki modellerin uzun vadede kalıcı olacağı açıktır.
  • Başarısız Bir Örnek: Son olarak, alçakgönüllülüğü korumak için, O3'ün çözemediği bir ARC ödül örneği bulunmaktadır. Oldukça basit bir örnektir.

Gelecek Beklentileri

  • Heyecan Verici Gelişmeler: Açıkçası daha gidecek çok yolumuz var, ancak heyecanlı olmalısınız ve bu modellerin yaygın olarak kullanılmasının çoğumuzun beklediğinden daha erken bir gerçeklik olmasını beklemelisiniz. Yapay zekanın sürekli olarak gelişeceğini varsaymak en güvenli seçenektir.
  • RL'nin Geri Dönüşü: 2024: RL'nin dönüşü.

RLHF'nin Önemi

  • Anthropic CEO'nun Açıklaması: Bugün erken saatlerde, Anthropic, birkaç kurucu ortağın katılımıyla Anthropic'in yaratılış süreci hakkında bir video yayınladı. Kurucu ortak ve CEO Dario Amodei tarafından paylaşılan beklenmedik bir ayrıntı var:
    • "... Bu modelleri ölçeklendirmenin tüm nedeni, zekalarının temelleri üzerinde RLHF (insan geri bildirimiyle güçlendirilmiş öğrenme) yapmamıza yetecek kadar olmamasıdır."
  • RLHF'nin Potansiyeli: Modern RLHF kavramının kurucularından biri olarak Dario, tüm ince ayar teknolojisindeki ilerlemelerin geleceğini çoktan sezmiş olabilir. Bu RLHF potansiyeli görüşü, çoğu uygulayıcının algısından daha geniş ve daha derindir.
  • RL'nin Yeniden Yükselişi: Bu yıl, şüphesiz güçlendirilmiş öğrenme (RL) ve ilgili yaklaşımların yapay zekanın merkezine yeniden yerleştiği bir yıl oldu.

Gelecek Planları

  • Kendi Modelini Eğitme: Bu makaleyi yazma süreci, 2025 yılında böyle bir akıl yürütme tabanlı dil modelini eğiteceğime kendimi ikna etmemi sağladı. Bu, 2024'te teknoloji şirketleri için standart ön eğitimin sektörün temel gereksinimi haline gelmesi gibi bir his. O1 tarzı modellerin gelecekte uzun bir süre yapay zeka araç kutusunda varsayılan araçlar olacağı tahmin edilebilir. Bu yeni dünya görüşünü benimsemeyi ve bu model eğitimlerinin çalışma prensiplerini bizzat öğrenmeyi dört gözle bekliyorum.