国产亚洲AV自拍|av中文字幕一区|资源在线观看一区二区|亚洲影视久久亚洲特级性交|一级做一级a做片爱免费观看|欧美另类亚洲色婷婷精品无码|亚洲青青草免费一区|青青草免费成人网|91久久国内视频|五月天丁香久久

0
點贊
0
評論
0
轉載
我要入駐

實驗室1篇文章被ICLR’24錄用

收錄于合集: # 快訊

近期,實驗室與MSRA合作的論文“DENEVIL: TOWARDS DECIPHERING AND NAVIGATING THE ETHICAL VALUES OF LARGE LANGUAGE MODELS VIA INSTRUCTION LEARNING”被國際學術會議ICLR’24錄用。該文提出了一個可以動態(tài)評估大語言模型價值觀的評估框架DeNEVIL。DeNEVIL通過迭代式的生成,誘導大語言模型生成違反特定價值觀的提示?;诘赖禄A理論(Moral Foundation Theory),論文利用DeNEVIL算法構建了Moral Prompt價值觀評估數據集,然后測試了27個主流的大語言模型,發(fā)現了語言模型與人類價值觀的不一致性。而后探索了基于上下文對齊的方式,嘗試對大語言模型進行了對齊。

ICLR是全球機器學習領域的頂級學術會議之一,享有很高的學術聲譽。本屆ICLR一共投稿7304篇,錄用論文2250篇,錄用率為31%。

 


返回頂部