给大模型系上“安全带”，瑞莱智慧发布全新人工智能安全平台

您当前的位置：首页 >> 要闻 >> 详情

来源: 同花顺财经时间：2023-07-10 00:23:11

【资料图】

新技术的出现往往伴随着新的安全问题。大模型作为当前人工智能领域的热点之一，其强大的能力引发了学界和业界的关注和忧虑。近期，包括机密文件泄露、违法有害内容的生成以及对某些社群的偏见和歧视等安全问题，频频曝光。

如何助力大模型安全发展？清华大学人工智能研究院孵化企业瑞莱智慧RealAI，日前推出了一款人工智能安全平台。

7月7日，南都记者获悉，瑞莱智慧在2023WAIC世界人工智能大会发布了全新人工智能安全平台RealSafe3.0。

据称，RealSafe3.0为大模型提供了端到端的模型安全性测评解决方案。相较上一版本，RealSafe3.0在评测维度上进行了全面升级，涵盖了近70个评测维度，包括数据安全、认知任务、通用模型特有漏洞、滥用场景等。该平台的工作流程包括通用大模型的测评和优化，通过自研红队对抗模型和教练模型，从源头上修复模型中的问题，提升安全性能。

瑞莱智慧联合创始人、算法科学家萧子豪认为，大模型“落地难”的本质在于，当前仍处于“野蛮生长”阶段，还没有找到场景、风险和规范三者之间的平衡点。而在探寻这一平衡点的过程中，缺少易用和标准化的工具，即在技术层面上缺乏有力抓手，能够科学评判大模型在场景中能否同时满足规范和低风险，且能够进一步定位问题并给出优化建议，助力模型上线运行。

除了RealSafe3.0，瑞莱智慧RealAI还发布了能够防范生成式人工智能恶意滥用的DeepReal2.0。DeepReal可以检测Deepfake内容，并新增两个功能模块，用于检测Diffusion和LLM生成的数据，支持对图像、视频、音频和文本的伪造检测。该平台的应用场景包括打击网络诈骗和声誉侵害行为、检测网络内容合规性、检测音视频物证真实性等，可对生成式人工智能技术滥用行为进行管控和治理。

萧子豪表示，未来瑞莱智慧将继续致力于技术创新和产品优化，确保在人工智能安全的攻防战中始终处于领先地位，为人工智能的高质量发展贡献力量。

采写：实习生伍晓倩南都记者黄莉玲

标签：

相关新闻

给大模型系上“安全带”，瑞莱智慧发布全新人工智能安全平台

新技术的出现往往伴随着新的安全问题。大模型作为当前人工智能领域的热

时间：2023-07-10
华西证券-深桑达A-000032-发布政务大模型，落地AI+政务-230709

核心观点:中国电子云发布星智政务垂直领域大模型7月6日，在2023世界人

时间：2023-07-09
我国成功发射卫星互联网技术试验卫星

北京时间2023年7月9日19时00分，我国在酒泉卫星发射中心使用长征二号丙

时间：2023-07-09
法媒：75名游客被困“世界最高缆车”

据法新社7月7日报道，75名游客被困在厄瓜多尔首都基多的旅游缆车上，在

时间：2023-07-09
兴义这12名“酒司机”被曝光，看看有你认识的没？

喝酒不开（骑）车，开（骑）车不喝酒！喝酒不开（骑）车，开（骑）车不

时间：2023-07-09
长江口二号古船出水文物在上海市历史博物馆内公开展出

市民带着孩子在上海市历史博物馆内，观看“江海撷珍—长江口二号科...

时间：2023-07-09
中级经济师属于专业技术职务吗？

中级经济师是专业技术职称，它的全称就是中级“经济专业技术资格”...

时间：2023-07-09
被误传离世！TVB知名老戏骨疑患病，身材消瘦体重仅70斤

拥有不俗唱功的她，早年也是一名歌手，演唱过不少比较经典的歌曲。可能

时间：2023-07-09
捷成股份与华为签署合作协议面向AIGC开展深度合作

近日，华为开发者大会2023(Cloud)在东莞华为总部举行，并正式发布人工

时间：2023-07-09
张兰上诉法院驳回！更多细节曝光→

张兰与CVCCapitalPartners（以下简称CVC）的“爱恨情仇”出现了新进展

时间：2023-07-09
雪佛兰科尔维特因噪音太大被召回

通用汽车特种车辆公司正在召回2022款雪佛兰克尔维特，因为其噪音太大。

时间：2023-07-09
浙江缙云推动制造业向高端发展——小县何以夺“天工”

在近日召开的浙江省制造业高质量发展大会上，地处浙南山区的丽水市缙云

时间：2023-07-09
【假日暖洋洋2＆蔓越莓曲麒】蔓联雪中捍麒行（上）

『寒风中的重刀预警』这个在东北的春节，可以说是孔令麒记事以来过得最

时间：2023-07-09
这位“农民工劳模”背后故事不简单

徐荣明。孔生摄虽然骄阳似火，但记者采访扬州市劳模徐荣明时，他却头顶

时间：2023-07-09
下周，全国两片高温区将连成一大片

今天，一北一南两片高温区持续发力。特别是河南热得突出，不仅差点...

时间：2023-07-09
狗狂犬病潜伏期多久（狗病了用什么药）

1、用阿莫西林胶囊，一粒，融水，用注射器吸入，然后搬住狗狗的嘴，从

时间：2023-07-09
【小型更新/补丁说明】太空谍影2 SpaceBourne 2 7月7日抢先体验版本 2.2.1修补程序

错误修复：发射一次后，激光霰弹枪进入一个循环并继续快速连续射击，直

时间：2023-07-08
台籍教授常驻“大陆老家”：“说媒”温州体育与健康促两岸融合

中新网温州7月7日电(张益聪)“我们常说，体育健康不分家。但在民间...

时间：2023-07-08
格桑花、百子莲、紫薇……申城的夏天，让我们一起邂逅这一抹小清新吧

市绿化市容局介绍，申城的夏天已被一抹“绝绝紫”刷屏，格桑花、百...

时间：2023-07-08
生物多样性保护实践基地落户重庆大巴山国家级自然保护区

新华社客户端重庆7月8日电（张颖）共筑生态文明校地合作平台、打造教学

时间：2023-07-08
资产评估师下半年重要时间节点！提前关注！

已经进入了下半年重要阶段，给大家盘点了下半年资产评估师考试千万别错

时间：2023-07-08
净流入大减速！7月首周吸金15亿

7月7日，A股三大指数集体收跌，沪指跌0 28%，深证成指、创业板指分别跌

时间：2023-07-08
吕蒙和薛谭的变化对你有什么启示（孙权劝学吕蒙的变化对你有什么启示）

吕蒙和薛谭的变化对你有什么启示，孙权劝学吕蒙的变化对你有什么启示这

时间：2023-07-08
内蒙古自治区松山区发布暴雨橙色预警

松山区气象台2023年07月08日12时36分发布暴雨橙色预警信号：3小时内松

时间：2023-07-08
知名男星被曝遭女友长期控制！家属称已起诉

5日，87岁的法国传奇影星阿兰·德龙的子女发表声明，控诉父亲66岁的日

时间：2023-07-08
乌鲁木齐：崛起的经济巨头

乌鲁木齐：崛起的经济巨头2023年，乌鲁木齐这座古老而充满活力的城市正

时间：2023-07-08
日本半导体设备销售额2023年度预期降23％

日本半导体制造装置协会(SEAJ)发布预测称，2023年度日本生产的半导体设

时间：2023-07-08
贵州紫云释放绿色红利

盛夏时节，沿着盘山公路记者登上贵州省紫云苗族布依族自治县坝羊镇平塘

时间：2023-07-08
扬升21——鬼的世界（下）

日向理提出也要去沈阳鬼楼顿时让张兆京产生了强烈的好奇：“哦？你...

时间：2023-07-08
广东以侨为桥助高质量发展

广东以侨为桥助高质量发展

时间：2023-07-08