Published on

ও১ একটি সাধারণ চ্যাট মডেল নয়

লেখকগণ
  • avatar
    নাম
    Ajax
    Twitter

ও১: একটি সাধারণ চ্যাট মডেল নয়

এই নিবন্ধে ও১ মডেল নিয়ে আলোচনা করা হয়েছে, যা একটি চ্যাট মডেল হিসেবে ডিজাইন করা হয়নি। যদিও অনেক ব্যবহারকারী প্রথমে এটিকে চ্যাট মডেল হিসেবে ব্যবহার করার চেষ্টা করেছিলেন। "ও১ একটি চ্যাট মডেল নয় (এবং এটাই মূল বিষয়)" শীর্ষক একটি ব্লগ পোস্টের পর এই ধারণাটি স্পষ্ট হয়। এমনকি ওপেনএআই-এর সিইও স্যাম অল্টম্যান এবং প্রেসিডেন্ট গ্রেগ ব্রকম্যানের দৃষ্টি আকর্ষণ করে।

ভুল ধারণা এবং হতাশা

স্পেসএক্স-এর প্রাক্তন সফটওয়্যার ইঞ্জিনিয়ার এবং অ্যাপল ভিশনওএস-এর ইন্টারঅ্যাকশন ডিজাইনার বেন হাইলাক ও১ নিয়ে তার হতাশাজনক অভিজ্ঞতা শেয়ার করেছেন। তিনি এর প্রতিক্রিয়াগুলি ধীর, প্রায়ই পরস্পরবিরোধী এবং অযাচিত আর্কিটেকচার ডায়াগ্রাম এবং সুবিধা-অসুবিধার তালিকায় ভরা পেয়েছেন। হাইলাকের প্রাথমিক প্রতিক্রিয়া ছিল ও১ "আবর্জনা"।

  • প্রতিক্রিয়ার জন্য ৫ মিনিটের বেশি অপেক্ষা করতে হয়েছে।
  • প্রতিক্রিয়াগুলি প্রায়ই স্ববিরোধী এবং অর্থহীন ছিল।
  • মডেলটি অযাচিত ডায়াগ্রাম এবং তালিকা সরবরাহ করত।

তার হতাশা সামাজিক মাধ্যমে প্রকাশ করেন এবং বলেন যে ও১ প্রো "খুব খারাপ", এবং এর আউটপুট "প্রায় অর্থহীন"। তিনি রিফ্যাক্টরিং পরামর্শ চেয়ে উদাহরণ দেন, যেখানে মডেলটি ফাইল মার্জ করার পরামর্শ দেয়, এমন কোড সরবরাহ করে যা ফাইল মার্জ করে না এবং তারপর সম্পর্কহীন উপসংহারে পৌঁছে যায়।

দৃষ্টিভঙ্গির পরিবর্তন

হাইলাকের অভিজ্ঞতা সার্বজনীন ছিল না। কিছু ব্যবহারকারী ও১ কে অত্যন্ত কার্যকর মনে করেন, যা আরও আলোচনার জন্ম দেয়। এই আলোচনার মাধ্যমে, হাইলাক বুঝতে পারেন যে তিনি ও১ কে চ্যাট মডেল হিসেবে ব্যবহার করছেন, যেখানে এটি চ্যাট মডেল হিসেবে কাজ করার জন্য তৈরি করা হয়নি।

এই পরিবর্তনটি অল্টম্যান স্বাগত জানিয়েছেন, যিনি উল্লেখ করেছেন যে "লোকেরা ও১ (প্রো সংস্করণ সহ) ব্যবহার করতে শিখলে তাদের মনোভাব পরিবর্তন হওয়া দেখতে আকর্ষণীয়।" গ্রেগ ব্রকম্যানও একই কথা বলেছেন, ও১ একটি ভিন্ন ধরনের মডেল এবং এর থেকে সর্বোত্তম কর্মক্ষমতা পেতে ভিন্ন পদ্ধতির প্রয়োজন।

ও১: একটি রিপোর্ট জেনারেটর

নিবন্ধটি বলছে যে, ও১ কে চ্যাট মডেলের পরিবর্তে "রিপোর্ট জেনারেটর" হিসেবে দেখা উচিত। পর্যাপ্ত প্রেক্ষাপট এবং স্পষ্ট আউটপুট প্রয়োজনীয়তা দেওয়া হলে, ও১ কার্যকরভাবে সমাধান দিতে পারে। মূল বিষয় হল মডেলটি কীভাবে ব্যবহার করা হচ্ছে।

প্রম্পট থেকে ব্রিফ

সাধারণ চ্যাট মডেল ব্যবহার করার সময়, ব্যবহারকারীরা প্রায়শই সাধারণ প্রশ্ন দিয়ে শুরু করেন এবং প্রয়োজন অনুযায়ী প্রেক্ষাপট যোগ করেন। কিন্তু ও১ অতিরিক্ত প্রেক্ষাপট চায় না। ব্যবহারকারীদের শুরুতে প্রচুর প্রেক্ষাপট দিতে হয়, যা একটি স্ট্যান্ডার্ড প্রম্পটের তুলনায় প্রায় দশগুণ বেশি।

  • চেষ্টা করা সমাধানগুলির সমস্ত বিবরণ দিন।
  • সম্পূর্ণ ডেটাবেস স্কিমা ডাম্প অন্তর্ভুক্ত করুন।
  • কোম্পানি-নির্দিষ্ট ব্যবসা, স্কেল এবং পরিভাষা ব্যাখ্যা করুন।

ও১ কে নতুন কর্মচারী হিসেবে বিবেচনা করার পরামর্শ দেওয়া হয়, যেখানে শুরু থেকেই সমস্ত প্রয়োজনীয় তথ্য সরবরাহ করতে হবে।

কাঙ্ক্ষিত আউটপুটের উপর ফোকাস

বিস্তৃত প্রেক্ষাপট প্রদানের পর, ব্যবহারকারীদের অবশ্যই কাঙ্ক্ষিত আউটপুট স্পষ্টভাবে সংজ্ঞায়িত করতে হবে। অন্যান্য মডেলের মতো যেখানে ব্যবহারকারীরা ব্যক্তি বা চিন্তাভাবনার প্রক্রিয়া নির্দিষ্ট করতে পারে, ও১ এর ক্ষেত্রে, আপনার শুধুমাত্র "কী" চান তার উপর মনোযোগ দেওয়া উচিত, "কীভাবে" মডেলটি করবে তার উপর নয়। এটি ও১ কে স্বাধীনভাবে পরিকল্পনা করতে এবং প্রয়োজনীয় পদক্ষেপগুলি কার্যকর করতে দেয়, যা দ্রুত এবং আরও কার্যকর ফলাফলের দিকে নিয়ে যায়।

ও১ এর শক্তি এবং দুর্বলতা

ও১ বেশ কয়েকটি ক্ষেত্রে পারদর্শী:

  • পুরো ফাইল প্রসেসিং: এটি বড় কোড ব্লক এবং বিস্তৃত প্রেক্ষাপট পরিচালনা করতে পারে, প্রায়শই কম ত্রুটির সাথে পুরো ফাইলগুলি সম্পন্ন করে।
  • হ্যালুসিনেশন হ্রাস: ও১ কাস্টম ক্যোয়ারী ভাষাগুলির (যেমন, ক্লিকহাউস এবং নিউ রিলিক) ক্ষেত্রে নির্ভুল, যেখানে অন্যান্য মডেল সিনট্যাক্স গুলিয়ে ফেলতে পারে।
  • মেডিকেল ডায়াগনোসিস: ও১ ছবি এবং বর্ণনার ভিত্তিতে আশ্চর্যজনকভাবে সঠিক প্রাথমিক রোগ নির্ণয় করতে পারে।
  • ধারণা ব্যাখ্যা: এটি উদাহরণ দিয়ে জটিল প্রকৌশল ধারণা ব্যাখ্যা করতে দক্ষ।
  • আর্কিটেকচারাল প্ল্যান তৈরি: ও১ একাধিক প্ল্যান তৈরি করতে পারে, তাদের তুলনা করতে পারে এবং সুবিধা-অসুবিধা তালিকাভুক্ত করতে পারে।
  • মূল্যায়ন: এটি ফলাফল মূল্যায়নের জন্য একটি কার্যকর সরঞ্জাম হিসাবে প্রতিশ্রুতি দেখায়।

তবে, ও১ এর কিছু সীমাবদ্ধতাও রয়েছে:

  • নির্দিষ্ট শৈলীতে লেখা: এটি একটি একাডেমিক বা কর্পোরেট শৈলীতে রিপোর্ট তৈরি করে এবং নির্দিষ্ট টোনের সাথে মানিয়ে নিতে সমস্যা হয়।
  • সম্পূর্ণ অ্যাপ্লিকেশন তৈরি: পুরো ফাইল তৈরি করতে পারদর্শী হলেও, এটি পুনরাবৃত্তির মাধ্যমে একটি সম্পূর্ণ সাআস অ্যাপ্লিকেশন তৈরি করতে পারে না। তবে, এটি সম্পূর্ণ বৈশিষ্ট্য তৈরি করতে পারে, বিশেষ করে ফ্রন্ট-এন্ড বা সাধারণ ব্যাক-এন্ড কার্যকারিতা।

বিলম্বের গুরুত্ব

নিবন্ধটি উল্লেখ করে যে বিলম্ব মূলত পণ্যের প্রতি আমাদের ধারণাকে পরিবর্তন করে, যেমন ইমেল বনাম টেক্সট মেসেজিং, এবং ভয়েস মেসেজ বনাম ফোন কল। হাইলাক ও১ কে চ্যাট মডেলের পরিবর্তে ইমেলের সাথে তুলনা করেন, কারণ এর প্রতিক্রিয়ায় বিলম্ব হয়। এই বিলম্ব উচ্চ-লেটেন্সি, দীর্ঘ-চলমান ব্যাকগ্রাউন্ড ইন্টেলিজেন্স থেকে উপকৃত হওয়া নতুন ধরনের পণ্যের জন্য সুযোগ তৈরি করে। প্রশ্ন হল: মানুষ কোন কাজের জন্য ৫ মিনিট, এক ঘণ্টা, একদিন বা এমনকি ৩-৫ কর্মদিবস অপেক্ষা করতে রাজি?

এটা মনে রাখা গুরুত্বপূর্ণ যে, ও১-প্রিভিউ এবং ও১-মিনি স্ট্রিমিং সমর্থন করে কিন্তু স্ট্রাকচার্ড জেনারেশন বা সিস্টেম প্রম্পট সমর্থন করে না, যেখানে ও১ স্ট্রাকচার্ড জেনারেশন এবং সিস্টেম প্রম্পট সমর্থন করে কিন্তু স্ট্রিমিং সমর্থন করে না। ২০২৫ সালে পণ্য ডিজাইন করার সময় ডেভেলপারদের জন্য এই পার্থক্যগুলি বোঝা গুরুত্বপূর্ণ হবে।