Published on

OpenAI เปิดตัวโมเดลใหม่ล่าสุด o3 และ o3-mini พัฒนาก้าวกระโดดด้าน AI

ผู้เขียน
  • avatar
    ชื่อ
    Ajax
    Twitter

OpenAI เปิดตัวโมเดลใหม่ล่าสุด o3 และ o3-mini

OpenAI ได้เปิดตัวโมเดล AI ใหม่ล่าสุด o3 และ o3-mini โดยข้าม o2 ไปเนื่องจากปัญหาด้านเครื่องหมายการค้า o3 เป็นโมเดลที่มีประสิทธิภาพสูงใกล้เคียงกับ AGI มีความสามารถในการให้เหตุผลที่ซับซ้อน ในขณะที่ o3-mini เป็นตัวเลือกที่เบากว่า เร็วกว่า และประหยัดกว่าสำหรับงานประจำวัน โมเดลเหล่านี้แสดงให้เห็นถึงความก้าวหน้าอย่างมีนัยสำคัญในด้านความสามารถในการให้เหตุผลของ AI โดยเฉพาะอย่างยิ่งในด้านคณิตศาสตร์ การเขียนโค้ด และการแก้ปัญหาเชิงนามธรรม

ข้อมูลเบื้องต้น

  • AGI (Artificial General Intelligence): ระดับ AI สมมติที่สามารถทำงานทางปัญญาใด ๆ ที่มนุษย์สามารถทำได้
  • งานอีเวนต์ 12 วันของ OpenAI: ชุดของการประกาศที่แสดงความก้าวหน้าต่าง ๆ ในโมเดลและเครื่องมือ AI ของพวกเขา
  • ปัญหาเครื่องหมายการค้า: เหตุผลในการข้าม "o2" คือเพื่อหลีกเลี่ยงความขัดแย้งกับผู้ให้บริการโทรคมนาคมของอังกฤษ O2

เนื้อหาหลัก

1. O3: โมเดลการให้เหตุผลที่ทรงพลังที่สุด

  • ประสิทธิภาพ:
    • มีความเป็นเลิศในการให้เหตุผลทางคณิตศาสตร์ โดยทำคะแนนได้ 96.7% ในการแข่งขันคณิตศาสตร์ AIME ซึ่งเหนือกว่าโมเดลก่อนหน้าและแม้แต่ผู้เชี่ยวชาญที่เป็นมนุษย์
    • ทำคะแนนได้ 2727 ใน CodeForces ซึ่งอยู่ในอันดับ 200 โปรแกรมเมอร์ชั้นนำของโลก
    • ทำคะแนนได้ 87.5% ในเกณฑ์มาตรฐาน ARC-AGI ซึ่งสูงกว่าเกณฑ์ของมนุษย์ที่ 85%
  • คุณสมบัติหลัก:
    • แสดงให้เห็นถึงการปรับปรุงอย่างมีนัยสำคัญในด้านวิศวกรรมซอฟต์แวร์ คณิตศาสตร์ และการให้เหตุผลทางวิทยาศาสตร์
    • ทำงานได้ดีเป็นพิเศษในเกณฑ์มาตรฐาน FrontierMath ซึ่งเป็นการทดสอบทางคณิตศาสตร์ที่ท้าทายอย่างมาก
    • แสดงให้เห็นถึงความสามารถที่โดดเด่นในการให้เหตุผลเชิงนามธรรมและการสรุปความ โดยแสดงให้เห็นจากประสิทธิภาพในเกณฑ์มาตรฐาน ARC-AGI
  • ผลกระทบ:
    • แสดงถึงการก้าวกระโดดครั้งสำคัญในความสามารถของ AI เข้าใกล้ AGI มากขึ้น
    • เน้นศักยภาพของ AI ในการแก้ปัญหาที่ซับซ้อนในหลากหลายสาขา

2. O3-Mini: รวดเร็วและประหยัดกว่า

  • คุณสมบัติ:
    • เป็นรุ่นที่เล็กกว่า เร็วกว่า และประหยัดกว่าของ o3
    • มีโหมดเวลาอนุมานสามโหมด (ต่ำ ปานกลาง สูง) เพื่อการจัดการงานที่ยืดหยุ่น
    • เหมาะสำหรับสภาพแวดล้อมที่มีข้อจำกัดด้านทรัพยากรและงานประจำวัน
  • ความสามารถ:
    • ทำงานได้ดีในด้านคณิตศาสตร์พื้นฐาน การเขียนโค้ด และงานให้เหตุผลทั่วไป
    • แสดงให้เห็นถึงความสามารถในการสร้างและดำเนินการโค้ด รวมถึงการเรียก API และการรวมส่วนติดต่อผู้ใช้
    • สามารถทำการทดสอบตัวเองได้ ดังแสดงจากประสิทธิภาพในชุดข้อมูล GPQA
  • กรณีการใช้งาน:
    • เหมาะสำหรับโครงการขนาดกลางและขนาดเล็ก การเขียนโปรแกรมพื้นฐาน การวิเคราะห์ข้อมูล และวัตถุประสงค์ทางการศึกษา
    • เป็นตัวเลือกที่เข้าถึงได้ง่ายกว่าสำหรับผู้ใช้ที่มีทรัพยากรการคำนวณจำกัด

3. ไฮไลท์งานอีเวนต์ 12 วันของ OpenAI

  • วันที่ 1: โมเดล o1 รุ่นเต็มพร้อมปรับปรุงความฉลาด ความเร็ว และรองรับการป้อนข้อมูลหลายรูปแบบ แผนการสมัครสมาชิก ChatGPT Pro
  • วันที่ 2: การแนะนำ Reinforcement Learning Fine-Tuning (RFT) เพื่อปรับปรุงประสิทธิภาพของโมเดล
  • วันที่ 3: Sora Turbo โมเดลสร้างวิดีโอที่เร็วกว่าด้วยความละเอียดสูงและคุณสมบัติการแก้ไข
  • วันที่ 4: เครื่องมือ Canvas ที่อัปเกรดด้วยคุณสมบัติใหม่และส่วนต่อประสานที่ใช้งานง่าย
  • วันที่ 5: การรวม ChatGPT กับอุปกรณ์ Apple (iOS, iPadOS, macOS)
  • วันที่ 6: โหมดเสียงขั้นสูงของ ChatGPT ที่ได้รับการปรับปรุงพร้อมความเข้าใจวิดีโอแบบเรียลไทม์
  • วันที่ 7: การเปิดตัว "Projects" สำหรับการจัดการบทสนทนาและไฟล์
  • วันที่ 8: การเปิดตัว ChatGPT Search อย่างเต็มรูปแบบด้วยความเร็ว ความแม่นยำ และการค้นหาด้วยเสียงที่ได้รับการปรับปรุง
  • วันที่ 9: การเปิดตัว o1 API ด้วยการจดจำภาพที่มีประสิทธิภาพและการโต้ตอบด้วยเสียงแบบเรียลไทม์
  • วันที่ 10: การรวม WhatsApp กับบริการ 1-800-CHAT-GPT
  • วันที่ 11: ChatGPT เวอร์ชันเดสก์ท็อปพร้อมการเข้าถึงข้ามแอปพลิเคชัน
  • วันที่ 12: การเปิดตัวโมเดล o3 และ o3-mini

แนวคิดหลักที่อธิบาย

  • AIME (American Invitational Mathematics Examination): การแข่งขันคณิตศาสตร์ที่ท้าทายสำหรับนักเรียนมัธยมปลายในสหรัฐอเมริกา
  • CodeForces: แพลตฟอร์มยอดนิยมสำหรับการแข่งขันเขียนโปรแกรม
  • ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence): เกณฑ์มาตรฐานที่ออกแบบมาเพื่อวัดความสามารถของ AI ในการสรุปความและให้เหตุผลในสถานการณ์ใหม่
  • GPQA (General Purpose Question Answering): ชุดข้อมูลของคำถามปรนัยที่ท้าทายในสาขาวิทยาศาสตร์ต่างๆ
  • FrontierMath: เกณฑ์มาตรฐานทางคณิตศาสตร์ที่ยากมากซึ่งพัฒนาโดยนักคณิตศาสตร์ชั้นนำ

การขยายความ

การเปิดตัว o3 และ o3-mini ถือเป็นก้าวสำคัญในการพัฒนา AI โดยแสดงให้เห็นถึงความก้าวหน้าที่โดดเด่นในด้านความสามารถในการให้เหตุผล ในขณะที่ o3 ได้รับการออกแบบมาสำหรับงานที่ซับซ้อนและสภาพแวดล้อมที่มีประสิทธิภาพสูง o3-mini นำเสนอโซลูชันที่เข้าถึงได้ง่ายและประหยัดกว่าสำหรับการใช้งานในชีวิตประจำวัน งานอีเวนต์ 12 วันของ OpenAI เน้นย้ำถึงความมุ่งมั่นของพวกเขาในการผลักดันขอบเขตของ AI และบูรณาการเข้ากับชีวิตในด้านต่างๆ การเดินทางสู่ AGI ยังคงดำเนินต่อไป โดยมีโมเดลเหล่านี้เป็นก้าวสำคัญ