上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术_资讯

上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术

创始人

2024-04-14 20:09:31

钛媒体App 4月14日消息，在“知乎AI先行者沙龙”上，上海人工智能实验室司南大模型评测产品负责人葛佳烨表示，大语言模型评测中面临全面性、评测成本、数据污染、鲁棒性等挑战。她表示，评测数十万道题需要大量算力资源，基于人工打分的主观评测成本高昂。同时，海量语料不可避免带来评测集污染，亟需可靠的数据污染检测技术。此外，大模型对提示词十分敏感，多次采样情况下模型性能不稳定。

上一篇：【活动】就在本周日！“以物换梦”儿童跳蚤市场等你来摆摊

下一篇：闹大了！山西临汾“惊魂”借款案：两男子欠款750万败诉后杀害债主

热门资讯

一箭9星！引力一号遥四运载火箭... 　　7月22日10时54分，我国太原卫星发射中心在上海东部海域使用引力一号遥四运载火箭，将搭载的东坡...

张雪峰女儿张姩菡再接手三家公司... 　　企查查APP显示，近日，张雪峰（张子彪）名下苏州峰学蔚来教育科技有限公司、苏州峰阅万卷文化图书有...

2026中国经济半年报丨让更多... 　　光明网讯（记者陶媛）医药工业是关系国计民生、经济发展和国家安全的战略性产业，是健康中国建设的重...

大战略牵引新开局丨一城蓄势“飞... 　　央广网天津7月23日消息2026年7月10日12时15分，在海南商业航天发射场，津产长征十号乙运...

一线调研丨一朵荷花“链”出夏日... 　　这个夏天，苏州传统的“六月荷花市”成了热门的旅游打卡地，每天吸引游客近4万人次。一束荷花如何成为...

牵手亚太数字伙伴，成都拿出哪些... 　　封面新闻记者赖芳杰杨霁月视频剪辑彭雨田　　牵手亚太数字伙伴成都拿出哪些 “家底”？　　...

暑期档票房破50亿观影热激发... 　　据网络平台数据　　2026年暑期档电影总票房（含预售）　　突破50亿元　　2026年度电影总票房...

一年后就是红海？三大阵营混战新... 　　新鲜零食风潮渐起，该业态正成为各大品牌争相涌入的新赛道。　　7月21日，记者走访上海两家首店——...

中国，不止清凉！丨开局之年看中...

外国视频博主拆穿西方涉疆指控惯... 　　来自哥伦比亚的视频博主高飞(Fernando Munoz Bernal)翻看了西方所谓的涉疆指控...

书香伴夏全民阅读点亮暑期生活　　央视网消息（新闻联播）：这个暑期，各地图书馆、城市书房和书店，以丰富的藏书资源、多元的文化活动...

2026世界互联网大会数字丝路...

2026年世界互联网大会数字丝... 　　2026年世界互联网大会数字丝路发展论坛在西安开幕，以“智汇丝路数启新程”为主题，聚焦数字技术赋...

痛心！奔赴广西灾区救援的四川小... 　　7月14日，自发赶往广西救灾的志愿者党鑫蕊，由于劳累过度导致心力衰竭，在贵港市覃塘区不幸离世，年...

“十五五”开局之年推进新一代通... 　　“我们要加强信息基础设施建设，强化信息资源深度整合，打通经济社会发展的信息‘大动脉’。”习近平总...

视频丨在这场大会，看到AI进化... 　　2026世界人工智能大会暨人工智能全球治理高级别会议7月17日—20日在上海举行。这场科技盛会聚...

襄阳高新刘集马营村开展“盛夏农... 荆楚网（湖北日报网）讯（通讯员施煵）7月27日，襄阳高新区刘集街道马营村开展“盛夏农闲读好书书香...

潜江市“暑期消防夏令营”活动火... 荆楚网（湖北日报网）讯（通讯员许倩陈凤）7月26日，潜江市消防救援局组织开展的“暑期消防夏令营”...

湖北在全国首批完成39类医疗服... 荆楚网（湖北日报网）讯（记者陈頔通讯员黄姗董政）看病缴费时，最怕碰到“雾里看花”的收费名目—...

台风“红霞”残涡今起影响宜昌，... 湖北日报讯（记者张泽牧、通讯员刘卫中）今年第12号台风“红霞”虽已减弱为热带低压，但其残余环流携丰沛...

上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术

相关内容

热门资讯