Alt text

เบื้องหลังการทำงานของ AI: เจาะลึก OpenThaiGPT AI Chatbot สัญชาติไทย

Apipoj Piasak
2 min readAug 17, 2024

เบื้องหลังการทำงานของ AI โดยเฉพาะอย่างยิ่ง OpenThaiGPT ซึ่งเป็น AI Chatbot สัญชาติไทยที่กำลังพัฒนาเพื่อให้มีความสามารถเทียบเท่ากับ ChatGPT นั้น มีหลายปัจจัยที่สำคัญที่ทำให้ AI สามารถทำงานได้อย่างมีประสิทธิภาพครับ

1. Large Language Model (LLM)

Large Language Model (LLM) เป็นหัวใจสำคัญของ AI Chatbot อย่าง OpenThaiGPT ครับ LLM เป็นแบบจำลองภาษาที่สามารถเรียนรู้และทำนายคำถัดไปในประโยคได้โดยอาศัยข้อมูลจำนวนมากที่ถูกฝึกฝนไว้ การใช้งาน LLM อย่าง ChatGPT และ OpenThaiGPT ใช้เทคนิคการเรียนรู้เชิงลึก (Deep Learning) เพื่อสร้างความเข้าใจในภาษาและสามารถตอบคำถามหรือโต้ตอบได้อย่างมีเหตุผล

ตัวอย่างเช่น OpenThaiGPT เรียนรู้จากข้อมูลภาษาไทยที่มีความหลากหลาย เช่น บทความ, คอมเมนต์, หรือกระทู้ใน Pantip.com เป็นต้น การที่มีแหล่งข้อมูลหลากหลายทำให้ AI เข้าใจและสามารถตอบคำถามได้เป็นธรรมชาติมากขึ้น

สถิติและตัวเลข

  • จำนวนพารามิเตอร์ใน OpenThaiGPT ปัจจุบันมีประมาณ 3.74 พันล้าน
  • OpenThaiGPT วางแผนเพิ่มจำนวนพารามิเตอร์อย่างต่อเนื่อง

2. ข้อมูลและ Dataset

การสร้าง LLM ที่มีความสามารถสูงต้องอาศัยข้อมูลจำนวนมากที่หลากหลายและคุณภาพสูง ข้อมูลเหล่านี้จะถูกใช้ในการฝึกฝนโมเดลให้สามารถเข้าใจภาษาได้อย่างถูกต้องและสามารถตอบคำถามได้อย่างแม่นยำ OpenThaiGPT ใช้ข้อมูลจากแหล่งต่างๆ รวมถึงข้อมูลที่เปิดเผยสู่สาธารณะจากเว็บไซต์อย่าง Pantip.com ซึ่งเป็นแหล่งข้อมูลที่หลากหลายและมีคุณภาพครับ

มากไปกว่านั้น การที่มี Dataset ขนาดใหญ่และครอบคลุมหลากหลายหมวดหมู่ เช่น บทความ, ความคิดเห็น, รีวิวสินค้า และอื่นๆ ทำให้ LLM สามารถเรียนรู้และทำนายคำถัดไปได้แม่นยำมากยิ่งขึ้น

3. พารามิเตอร์และโครงสร้างพื้นฐาน

พารามิเตอร์ (Parameter) ใน AI คือจำนวนเส้นประสาทในสมองของโมเดล ซึ่งจะส่งผลโดยตรงต่อความสามารถของ AI ในการเข้าใจและโต้ตอบภาษา OpenThaiGPT มีพารามิเตอร์ประมาณ 3.74 พันล้าน ซึ่งค่อนข้างมากทีเดียวครับ และมีแผนจะขยายจำนวนพารามิเตอร์นี้เพื่อปรับปรุงความเข้าใจภาษาและการโต้ตอบที่เป็นธรรมชาติมากขึ้น

นอกจากนี้ การเปลี่ยนสถาปัตยกรรมของ Language Model จากการเรียนรู้ไวยากรณ์ระดับตัวอักษรไปสู่การเรียนรู้ในระดับเศษคำ (Subword) หรือรากศัพท์เพื่อให้คำตอบเป็นภาษาธรรมชาติมากยิ่งขึ้นก็เป็นอีกหนึ่งปัจจัยสำคัญในการพัฒนา

ตัวเลขที่น่าประทับใจ

  • 3.74 พันล้านพารามิเตอร์ใน OpenThaiGPT ปัจจุบัน
  • วางแผนการขยายพารามิเตอร์ในเวอร์ชันถัดไป

4. การปรับปรุงและพัฒนา

การปรับปรุงและพัฒนา AI Chatbot เป็นกระบวนการที่ต่อเนื่อง OpenThaiGPT วางแผนไว้ 3 เวอร์ชันหลัก ได้แก่:

  • OpenThaiGPT 0.0.4: สามารถพูดคุย Chat ได้อยู่บ้าง แต่ยังไม่สามารถตอบคำถามได้ตรงและยังไม่สามารถทำ Few Shot Learning ได้
  • OpenThaiGPT 0.1.0: สามารถแปลภาษาไทย-อังกฤษได้และทำ Few Shot Learning ได้บางส่วน สามารถพูดคุย Chat ได้เต็มรูปแบบ
  • OpenThaiGPT 1.0.0: สามารถทำ Few Shot Learning ได้ แปลภาษาไทย-อังกฤษ พูดคุย Chat ได้เต็มรูปแบบ และมีแผนจะเปิดให้ใช้งานช่วงกลางปีนี้

จุดเด่นและข้อดี

การเพิ่มขีดความสามารถในแต่ละเวอร์ชันทำให้ผู้ใช้งานได้รับประสบการณ์ที่ดียิ่งขึ้น ทั้งนี้ยังมีการพัฒนาต่อเนื่องเพื่อทำให้ AI มีความสามารถตรงกับความต้องการของผู้ใช้งานมากที่สุดครับ

5. การนำไปใช้งาน

AI Chatbot อย่าง OpenThaiGPT มีศักยภาพในการนำไปใช้งานในหลายๆ ด้าน เช่น การตอบคำถามทั่วไป การแปลภาษา การอธิบายขั้นตอน การถอดความ การแปลงหน่วย และการเขียนโค้ด นอกจากนี้ยังมีการพัฒนา Multimodal ที่ไม่ได้มีเฉพาะเรื่องของภาษา แต่สามารถระบุ Physical Reference ได้ครับ ซึ่งจะช่วยให้ AI สามารถโต้ตอบได้อย่างมีเหตุผลและเข้าใจบริบทได้ดีขึ้น

ตัวอย่างใช้งานจริง

  • การแปลภาษาไทย-อังกฤษและอังกฤษ-ไทยได้ในทันที
  • การอธิบายขั้นตอนหรือกระบวนการต่างๆ อย่างละเอียด

6. การร่วมมือและการสนับสนุน

การสร้าง AI Chatbot ที่มีความสามารถสูงต้องอาศัยการร่วมมือและการสนับสนุนจากหลายฝ่าย ทั้งจากนักวิจัย ผู้เชี่ยวชาญ และผู้ให้ข้อมูล การร่วมมือเหล่านี้จะช่วยให้การวิจัยและพัฒนาง่ายขึ้น และสามารถสร้าง AI ที่มีคุณภาพและปลอดภัยให้สังคมยอมรับได้

ความสำคัญของการร่วมมือ

  • การร่วมมือระหว่างทีมวิจัย, ผู้เชี่ยวชาญ, และผู้ให้ข้อมูล
  • การสนับสนุนจากภาครัฐและเอกชนในการพัฒนาและทดสอบ AI

สรุป

การทำงานของ AI Chatbot อย่าง OpenThaiGPT ต้องอาศัยการผสมผสานระหว่างข้อมูลจำนวนมาก การลงทุนในโครงสร้างพื้นฐานที่ดี การปรับปรุงและพัฒนาอย่างต่อเนื่อง และการร่วมมือจากหลายฝ่าย เพื่อให้ AI สามารถทำงานได้อย่างมีประสิทธิภาพและเป็นประโยชน์ต่อสังคมครับ การพัฒนาอย่างต่อเนื่องและการใส่ใจในทุกๆ ด้านนั้นเป็นปัจจัยที่สำคัญที่ทำให้ AI มีความสามารถและตอบโจทย์ความต้องการของผู้ใช้งานจริงๆ ครับ

ขอขอบคุณที่ติดตามบทความนี้ หวังว่าจะเป็นประโยชน์กับทุกท่านที่สนใจในเบื้องหลังการทำงานของ AI Chatbot สัญชาติไทยอย่าง OpenThaiGPT และสามารถนำข้อมูลเหล่านี้ไปใช้ในการศึกษาหรือพัฒนาต่อในอนาคตครับ

Reference: เบื้องหลังการทำงานของ AI

--

--

Apipoj Piasak

Share thoughts, technology, the technique to build up the digital product that users love.