【资料图】
新技术的出现往往伴随着新的安全问题。大模型作为当前人工智能领域的热点之一,其强大的能力引发了学界和业界的关注和忧虑。近期,包括机密文件泄露、违法有害内容的生成以及对某些社群的偏见和歧视等安全问题,频频曝光。
如何助力大模型安全发展?清华大学人工智能研究院孵化企业瑞莱智慧RealAI,日前推出了一款人工智能安全平台。
7月7日,南都记者获悉,瑞莱智慧在2023WAIC世界人工智能大会发布了全新人工智能安全平台RealSafe3.0。
据称,RealSafe3.0为大模型提供了端到端的模型安全性测评解决方案。相较上一版本,RealSafe3.0在评测维度上进行了全面升级,涵盖了近70个评测维度,包括数据安全、认知任务、通用模型特有漏洞、滥用场景等。该平台的工作流程包括通用大模型的测评和优化,通过自研红队对抗模型和教练模型,从源头上修复模型中的问题,提升安全性能。
瑞莱智慧联合创始人、算法科学家萧子豪认为,大模型“落地难”的本质在于,当前仍处于“野蛮生长”阶段,还没有找到场景、风险和规范三者之间的平衡点。而在探寻这一平衡点的过程中,缺少易用和标准化的工具,即在技术层面上缺乏有力抓手,能够科学评判大模型在场景中能否同时满足规范和低风险,且能够进一步定位问题并给出优化建议,助力模型上线运行。
除了RealSafe3.0,瑞莱智慧RealAI还发布了能够防范生成式人工智能恶意滥用的DeepReal2.0。DeepReal可以检测Deepfake内容,并新增两个功能模块,用于检测Diffusion和LLM生成的数据,支持对图像、视频、音频和文本的伪造检测。该平台的应用场景包括打击网络诈骗和声誉侵害行为、检测网络内容合规性、检测音视频物证真实性等,可对生成式人工智能技术滥用行为进行管控和治理。
萧子豪表示,未来瑞莱智慧将继续致力于技术创新和产品优化,确保在人工智能安全的攻防战中始终处于领先地位,为人工智能的高质量发展贡献力量。
采写:实习生伍晓倩南都记者黄莉玲
新技术的出现往往伴随着新的安全问题。大模型作为当前人工智能领域的热
核心观点:中国电子云发布星智政务垂直领域大模型7月6日,在2023世界人
北京时间2023年7月9日19时00分,我国在酒泉卫星发射中心使用长征二号丙
据法新社7月7日报道,75名游客被困在厄瓜多尔首都基多的旅游缆车上,在
喝酒不开(骑)车,开(骑)车不喝酒!喝酒不开(骑)车,开(骑)车不
市民带着孩子在上海市历史博物馆内,观看“江海撷珍—长江口二号科...
中级经济师是专业技术职称,它的全称就是中级“经济专业技术资格”...
拥有不俗唱功的她,早年也是一名歌手,演唱过不少比较经典的歌曲。可能
近日,华为开发者大会2023(Cloud)在东莞华为总部举行,并正式发布人工
张兰与CVCCapitalPartners(以下简称CVC)的“爱恨情仇”出现了新进展
通用汽车特种车辆公司正在召回2022款雪佛兰克尔维特,因为其噪音太大。
在近日召开的浙江省制造业高质量发展大会上,地处浙南山区的丽水市缙云
『寒风中的重刀预警』这个在东北的春节,可以说是孔令麒记事以来过得最
徐荣明。孔生摄虽然骄阳似火,但记者采访扬州市劳模徐荣明时,他却头顶
今天,一北一南两片高温区持续发力。特别是河南热得突出,不仅差点...
1、用阿莫西林胶囊,一粒,融水,用注射器吸入,然后搬住狗狗的嘴,从
错误修复:发射一次后,激光霰弹枪进入一个循环并继续快速连续射击,直
中新网温州7月7日电(张益聪)“我们常说,体育健康不分家。但在民间...
市绿化市容局介绍,申城的夏天已被一抹“绝绝紫”刷屏,格桑花、百...
新华社客户端重庆7月8日电(张颖)共筑生态文明校地合作平台、打造教学
已经进入了下半年重要阶段,给大家盘点了下半年资产评估师考试千万别错
7月7日,A股三大指数集体收跌,沪指跌0 28%,深证成指、创业板指分别跌
吕蒙和薛谭的变化对你有什么启示,孙权劝学吕蒙的变化对你有什么启示这
松山区气象台2023年07月08日12时36分发布暴雨橙色预警信号:3小时内松
5日,87岁的法国传奇影星阿兰·德龙的子女发表声明,控诉父亲66岁的日
乌鲁木齐:崛起的经济巨头2023年,乌鲁木齐这座古老而充满活力的城市正
日本半导体制造装置协会(SEAJ)发布预测称,2023年度日本生产的半导体设
盛夏时节,沿着盘山公路记者登上贵州省紫云苗族布依族自治县坝羊镇平塘
日向理提出也要去沈阳鬼楼顿时让张兆京产生了强烈的好奇:“哦?你...
广东以侨为桥助高质量发展