多视角看大模型安全及实践.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

计算机研究与发展DOI:10.7544/issn1000-1239.202330955

Journal

of

Computer

Research

and

Development61(5):1104−1112,2024

多视角看大模型安全及实践

王笑尘张坤张鹏

(北京智谱华章科技有限公司北京100086)

(xiaochen.wang@)

LargeModelSafetyandPracticefromMultiplePerspectives

Wang

Xiaochen,

Zhang

Kun,

and

Zhang

Peng

(BeijingKnowledgeAtlasTechnologyCo.,Ltd.,Beijing100086)

AbstractWith

the

widespread

application

of

big

models

in

the

field

of

artificial

intelligence,

the

security

issues

of

large

models,

especially

large

language

models,

have

received

attention.

As

an

emerging

technology,

the

security

situation

analysis

of

large

models

and

the

construction

of

security

systems

need

further

exploration.

We

analyze

the

overall

trend

of

large

model

security

from

two

perspectives:

society

and

technology

application.

Based

on

the

characteristics

of

large

models,

we

sort

out

the

practice

of

large

model

security

building,

and

provide

a

reference

plan

for

building

a

security

system

for

large

model

development

and

large

model

application

construction.

The

large

model

security

practice

plan

introduced

in

this

article

includes

three

parts:

security

benchmark

construction,

model

values

alignment

method,

and

model

online

service

security

system

construction.

Keywords

large

model;large

model

online

service;security

system;artificial

intelligence

ethics;large

model

security

situation

analysis

摘要随着人工智能领域大模型(large

model)的广泛应用,大模型,尤其是大语言模型(large

language

model,LLM)的安全问题受到了广泛关注.

大模型作为一种新兴技术,与之相关的安全态势分析以及安

全体系建设均亟待挖掘与探索.

从社会关系以及技术应用2个视角,分析了大模型安全的整体趋势.

同时,

基于大模型自身的特点,梳理了大模型安全能力建设的实践思路,为大模型研发、大模型应用构建提供了

安全体系构建的参考方案.

介绍的大模型安全能力实践方案包括安全评估基准建设、模型价值观对齐方

法、模型线上服务安全系统建设3个部分.

关键词大模型;大模型线上服务;安全系统;人工智能伦理;大模型安全形势分析

中图法分类号TP183

随着深度学习技术的不断发展和应用,大模型视角看待大模型安全,将重点介绍技术应用方面,并

逐渐成为学术界和工业界研究的热点.

这些模型具主要讨论3个参与方的安全管理问题

文档评论(0)

百强名校试卷 + 关注
实名认证
内容提供者

百强名校试卷

1亿VIP精品文档

相关文档