快讯摘要
快讯正文
【大模型评测面临数据污染挑战,需求可靠检测技术】在近期举办的“知乎AI先行者沙龙”上,上海人工智能实验室司南大模型评测产品负责人葛佳烨发表了关于大语言模型评测的演讲。她指出,目前大模型评测过程中存在全面性、评测成本、数据污染、鲁棒性等挑战。在众多问题中,评测数十万道题目需消耗大量算力***,而基于人工打分的主观评测成本也相对较高。同时,海量语料导致评测集污染问题日益严重,迫切需要可靠的数据污染检测技术来应对。另外,大模型对提示词非常敏感,多次***样可能影响模型性能的稳定性。和讯自选股写手风险提示:以上内容仅作为作者或者嘉宾的观点,不代表和讯的任何立场,不构成与和讯相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。和讯竭力但不能证实上述内容的真实性、准确性和原创性,对此和讯不做任何保证和承诺。