เป็นความเคลื่อนไหวน่าสนใจวงการปัญญาประดิษฐ์ เมื่อ Meta พัฒนาปัญญาประดิษฐ์ตัวใหม่ CICERO โดย Meta เคลมว่าเป็นปัญญาประดิษฐ์ตัวแรก ที่เล่นบอร์ดเกมแนวยุทธศาสตร์สงคราม Diplomacy ชนะมนุษย์ได้
นับจาก Deep Blue ปัญญาประดิษฐ์ของ IBM เอาชนะ Garry Kasparov แชมป์หมากรุกในปี 1997 และ AlphaGo ของ Google เอาชนะแชมป์หมากล้อมในปี 2015 และ Pluribus ของ Facebook เอาชนะโป๊กเกอร์ วงการเทคโนโลยีก็สำรวจ และพัฒนาปัญญาประดิษฐ์ให้ทำงานซับซ้อนมากขึ้น ทำภารกิจที่ยากขึ้นกว่าการเลื่อนหมากบนกระดาน และการเล่นไพ่
ซึ่ง Meta บอกว่านี่เป็นก้าวสำคัญ เพราะคนที่จะเล่นเกม Diplomacy ได้ดี ต้องเข้าใจแรงจูงใจและมุมมองของคน ต้องวางแผนที่ซับซ้อนและปรับกลยุทธ์ และใช้วิธีการพูดโน้มน้าวใจคนให้มาเป็นพันธมิตรกัน ซึ่งดูเป็นเรื่องที่ยากเกินกำลังปัญญาประดิษฐ์
ความท้าทายคือ ผู้เล่นต้องแสดงความเห็นอกเห็นใจ และใช้ศิลปะการโน้มน้าวใจ ในทางตรงกันข้าม ถ้าผู้เล่นเคลื่อนไหวอย่างรุนแรงหรือก้าวร้าวเกินไปก็จะแพ้เกม และถ้าปัญญาประดิษฐ์ไม่แสดงความเป็นมนุษย์ให้เห็นมากพอ ก็จะโน้มน้าวผู้เล่นคนอื่นไม่สำเร็จ
CICERO เล่นเกมผ่าน webDiplomacy.net ซึ่งเป็นเวอร์ชันออนไลน์ของ Diplomacy ซึ่ง CICERO ได้คะแนนเฉลี่ยมากกว่าผู้เล่นที่เป็นมนุษย์มากกว่าสองเท่า และติดอันดับ 10 % แรกของผู้เข้าร่วมที่เล่นเกมมากกว่าหนึ่งเกม
เทคโนโลยีพื้นฐานของ CICERO คือ natural language processing หรือ การประมวลผลภาษาธรรมชาติ เป็นกระบวนการช่วยให้ปัญญาประดิษฐ์เข้าใจภาษามนุษย์ ประมวลผล และสื่อสารออกมาได้ตรงจุด ยกตัวอย่างปัญญาประดิษฐ์ LaMDA ที่ดูเหมือนจะเข้าใจปรัชญาชีวิต (อ่านย้อนหลัง https://cms.workpointtoday.com/ai-google-lamda/)
ซึ่ง CICERO ต้องผ่านการฝึกอบรมจากข้อมูลสนทนาเป็นจำนวนมหาศาล และรวบรวมประสบการณ์การเล่นเกม webDiplomacy.net กว่า 40,000 เกมเพื่อให้ CICERO มีข้อมูลและคาดเดาบทสนทนาที่จะเกิดขึ้นได้
นี่คือวิธีการทำงานคร่าวๆ ของ CICERO ขั้นตอนที่ 1 ใช้ข้อมูลและสถานะของกระดานรวมถึงบทสนทนาที่เกิดขึ้นในตอนนั้น CICERO จะคาดการณ์เบื้องต้นว่าทุกคนจะทำอะไร
ขั้นตอนที่ 2 CICERO จะปรับแต่งการคาดคะเนนั้นซ้ำๆ เพื่อสร้างเจตนาสำหรับตัวมันเองและพันธมิตรในเกม
ขั้นตอนที่ 3 CICERO สร้างข้อความมาเผื่อเลือกหลายข้อความ ตามสถานะบนกระดานเกม เป็นข้อความบทสนทนา และจุดประสงค์ของบทสนทนา
ขั้นตอนที่ 4 CICERO จะกรองข้อความออก พื่อลดความไร้สาระ เพิ่มมูลค่าสูงสุด และให้สอดคล้องกับเจตนาของมันมากที่สุด
นักวิจัย Meta บอกว่า ตอนนี้ CICERO มีความเชี่ยวชาญในการเล่น Diplomacy ในเบื้องต้น แต่เทคโนโลยีที่อยู่เบื้องหลัง ต่อยอดได้อีกมากมาย เช่น ผู้ช่วย AI ที่สามารถสนทนาระยะยาว ได้มากกว่าตอบคำถามธรรมดา แต่ยังสามารถสอนทักษะใหม่ๆให้มนุษย์
นักวิจัย Meta ได้เปิดโค้ด CICERO เป็นโอเพ่นซอร์สให้นักวิจัยคนอื่นเข้าถึงได้ด้วย พร้อมตั้งความหวังว่านักวิจัยคนอื่นจะต่อยอดงานออกไปได้อีกหลากหลายกรณี และอยู่ในขอบเขตที่มีความรับผิดชอบ ไม่นำไปใช้ในทางที่ผิด










