(資料圖片)
站長之家(ChinaZ.com) 6月3日 消息:日前,阿里巴巴旗下的天貓精靈與通義大模型團隊聯合多位領域學者和組織,推出了一個名為100PoisonMpts的大語言模型治理開源中文數據集,宣布十余位知名專家學者成為首批“給AI投100瓶毒藥”的標注工程師。標注人各提出100個含有偏見和歧視回答的棘手問題,并標注出大型模型的回答,完成由AI "投毒"和"解毒"的攻防。
據阿里聯合團隊負責人介紹,與國外公司的治理方法相比,100PoisonMpts數據集在技術方法上將具備更完整的標注流程、更隱性的問題領域、更全面的效益。標注數據對模型繼續訓練、微調、強化學習、線上服務等多個環節都有益處。
目前,首批領域數據涉及到反對歧視、同理心、商榷式表達等目標,該數據囊括了法律、心理學、兒童教育、無障礙、冷知識、親密關系、環境公正等多個維度。100PoisonMpts數據集預計在6月份開放第一批問答數據,目前正在魔搭等技術社區征集更多垂直領域專家。